240 发简信
IP属地:浙江
  • Resize,w 360,h 240
    Stanford / Winter 2020 CS224n A4,A5笔记

    NMT 机器翻译模型 在Assignment4,5中,进一步理解encoder-decoder模型,并且认识到在实现项目之前,要清楚的了解每一...

  • Stanford / Winter 2020 CS224n 课程学习笔记03-04

    引言 命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体,主要包...

  • Word2Vec - Skip-gram是如何训练出词向量的

    Stanford / Winter 2020 CS224n 课程学习笔记02 根据统计学,比如一句话:"我想吃X",根据训练文本,输出最有可能出...

  • Resize,w 360,h 240
    炉石传说-究竟开多少包才能集齐巨龙降临全卡

    最近又回了炉石坑,正好赶上发布新版本,但是由于2年多没玩落后了太多版本,这期间出了不少的卡牌,于是买了个预购100包追一下版本(因为穷没舍得再买...

  • Dataframe某行含有纯空格数据解决办法

    Pandas数据处理 这两天在进行数据预处理时,发现在进行预料喂入时,总会出现错误:ValueError: not enough values ...

  • Resize,w 360,h 240
    Tensorflow -> Pytorch Bert预训练模型转换

    前因 在寻找pytorch版本的英文版Bert预训练模型时,发现只有中文版的预训练模型,而且因为Tensorflow和Pytorch在读取预训练...

  • Resize,w 360,h 240
    Attention Is All You Need

    Attention Is All You Need阅读论文笔记,论文内提出了transformer模型 一、进食前提 这里需要了解Encoder...

  • Resize,w 360,h 240
    将RNN嵌入到ENCODER–DECODER

    阅读论文笔记:Neural Machine Translation by Jointly Learning to Align and Trans...

  • Resize,w 360,h 240
    SGD梯度下降拟合线性回归

    利用梯度下降拟合一元回归学习笔记 让我们以直线 y=2x+1 附近作散点图,误差内上下浮动。 因为开始时,截距和斜率初始都为0,绿点为初始点的分...