240 发简信
IP属地:福建
  • 这段代码功力深厚。数据预处理用了流式处理的思想;连续文本替换用链式产生object的范式,是当今最流行的代码组织方式;gensim训练处只用了一个positional_argument,传参写的清清楚楚,从没用过gensim的人也能看明白这句代码的含义;查看相似度的部分用到了过程抽象;整段代码令人叹为观止。

    【实验】中文分词word2vec实践

    网上下一份倚天屠龙记的小说txt 下述代码分词后的txt文件 代码解释 用gensim做word2vec,用jieba做中文分词 为jieba分词提供一些名词类的分词参考 删...

  • 这段代码功力深厚。用了数据预处理用了流式处理的思想;连续文本替换用链式产生object的范式,当今最流行的代码组织方式;gensim训练处只用了一个positional_argument,传参写的清清楚楚,从没用过gensim的人也能看明白这句代码的含义;查看相似度的部分用到了过程抽象;整段代码令人叹为观止。

    【实验】中文分词word2vec实践

    网上下一份倚天屠龙记的小说txt 下述代码分词后的txt文件 代码解释 用gensim做word2vec,用jieba做中文分词 为jieba分词提供一些名词类的分词参考 删...

  • 120
    【实验】中文分词word2vec实践

    网上下一份倚天屠龙记的小说txt 下述代码分词后的txt文件 代码解释 用gensim做word2vec,用jieba做中文分词 为jieba分词提供一些名词类的分词参考 删...

  • 煎饼老师带带我

    【实验】中文分词word2vec实践

    网上下一份倚天屠龙记的小说txt 下述代码分词后的txt文件 代码解释 用gensim做word2vec,用jieba做中文分词 为jieba分词提供一些名词类的分词参考 删...

  • 时间序列规则法快速入门

    前言 大家好~我是drop-out(GitHub)。今年我参加了IJCAI-17数据挖掘竞赛和KDD CUP 2017,分别获得了第三名和第九名。两个比赛都是时间序列数据。我...

个人介绍
上帝忘了给人翅膀,科学家带我们飞翔。
访问个人GitHub请点击下面的链接: