240 发简信
IP属地:陕西
  • 120
    BERT泛读系列(一)——《Attention is All You Need》论文笔记

    谷歌最近的一篇BERT取得了卓越的效果,为了研究BERT的论文,我先找出了《Attention is All You Need》,看看里面的Transformer模型作为基础...

  • PAT甲级(1001:A+B Format)

    计算a+b并以标准格式输出和——也就是说,数字必须用逗号分隔成三组(除非数字个数少于四位)。 输入规格: 每个输入文件包含一个测试用例。每种情况都包含一对整数a和b,-100...