[TOC] 动机 现有的 PTM 有以下缺点: 以预训练的语言模型为例,它们很好地学习频繁词的语义,但在受长尾数据分布限制的稀有词上表现不佳。同样,这种数据分布也限制了 CV...
[TOC] 文本生成任务的基本定义 从给定的输入序列生成预期的输出序列,称为序列到序列 (Seq2Seq)。 Seq2Seq 任务和模型于 2014 年首次引入 [117]。...
Python正则表达式,请不要再用re.compile了!!! - 知乎[https://zhuanlan.zhihu.com/p/70680488] 驳 《Python正则...
当我们有多个选项,根据不同值调用不同对象时,不想写很多if—else,就用反射,达到了动态访问、不写死的效果,高内聚、松耦合 反射涉及四个函数:hasattr: 通过 “字符...
line_profiler function前标上 @profile kernprof -l -v aaa.py Line:文件中的行号。Hits:性能分析时代码执行的次数。...
涉及两个包:官方fasttext包gensim 官方可以下载各种语言的预训练好的文件但是并不支持finetune,所以下载vec文件后用gensim加载作为静态词向量使用即可...
References: 图解Word2vec 经典再读之Word2Vec word2vec Parameter Learning Explained Word2Vec Tut...
偏态是什么意思?
准确率(accuracy)和AUC的内在关系http://www.dataguru.cn/article-12379-1.html https://www.zhihu.com/question/313042288/an...
大佬,这个配色你看的清楚吗😨
ch1 我要做:具体的事 我不要:具体的事 我想做:想打成的目标 意志力就是控制这三种。 我要做,是前额灰质控制的,晚睡,分心,都会让你选择做更容易的事 冥想5分钟,专注呼吸...
机遇 10000小时理论,在自己专业练习一万小时则大成,良好的机会给有准备的人,才能抓住机会。良好的机会也促进10000小时的达成。 富裕家庭更会教导孩子怎么重视权利,在权威...