之前两天也写了word2vec和Transformer,其实都是在为今天的内容做铺垫。最近正好使用bert做了命名实体识别项目,借这个契机分享出...
1. 自然语言的表示 在word2vec出现之前,自然语言通常以词作为基本单位,进行one-hot encoding,这样做最大的弊端是完全不能...
前段时间在做命名实体识别项目,用到了Bert模型,最终的效果非常好。看了Bert的论文,知道Bert用到了双向Transformer作为特征提取...
简述决策树的原理决策树的实质就是一系列的if-else,根据决策条件,从根节点走到叶子节点。对于分类问题,根据叶子结点的标签进行投票决定;对于回...
LR适用场景LR适用于需要求解二分类概率的场景,例如CTR预估,金融风控等场景,CTR预估中,工业界常使用GBDT+LR进行在线的rank 优点...
1.基本概念 brokerkafka由一台或多台机器组成,每一台机器都是一个broker topic每条发布到Kafka集群的消息都有一个类别,...
相信做某本地生活平台网站爬虫的同学,饱受手势验证码的困扰,这类验证码相比滑块验证码,识别难度更大。 看到这种验证码,你是否第一反应是想到打码平台...
检查页面元素,WHAT!!!,什么时间把价格这些关键字段变成这些鬼字符了。查阅了相关资料,发现这是CSS3的一个新特性,允许在页面中使用自己定义...
MongoDB技术分享 MongoDB简介 1.1 基本介绍MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提...