IP属地:江苏
NLP中数据预处理主要是为文本数据的处理过程。文本处理的一般步骤:分词、构建词汇表、向量化。 单词分割(分词):Tokenization(Tex...
Transformer是一种基于注意力机制的深度学习模型,它在NLP领域取得了革命性的进展。该模型的主要特点(可以说一些关键术语):1、自注意力...
词(汇)表与词向量 词(汇)表是指给每个单词(或字)编码,即用数字来表示单词(或字)。比较简单的词表是为每个单词(或字)按顺序进行编号,或将这种...
自然语言处理( Natural Language Processing, NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人...
2017年Ashish Vaswani等人发表论文《Attention is all you need》介绍了一种新的架构,称为带有编码器和解码...
POW:Proof of Work,工作量证明。俗称挖矿,比特币在Block的生成过程中使用了POW机制,一个符合要求的Block Hash由N...
线性结构的两种存储方式:数组(顺序存储)和链表(链式存储)。
数据结构指的是数据的逻辑结构和存储结构,而算法则是对数据运算的描述。 数据结构是研究非数值计算的程序设计问题中计算机的操作对象以及它们之间的关系...
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。 区块链是一种,通过共识机制发动节点来共同记账。为防止共识信息...