240 发简信
IP属地:不列颠哥伦比亚
  • 刺杀骑士团长

    一转眼来温哥华三个多月了。 买了整块的臀腰肉盖,把形状不适合牛排的臀尖薄切了做烧肉,味道甚是不错,于是晚餐就开了瓶红酒。本着不浪费的原则大半瓶下了肚,表达欲爆炸,就一个一个找...

  • 120
    RL(1)-Proximal Policy Optimization (PPO)

    1.Policy Gradient 1.1.Excepted reward : reward: actor(parameter):trajectory which: 1.2....

  • 120
    结合Autoencoding和Autogressive同时预训练语言模型

    文献链接及详解见 文献阅读(1)-UniLMv2[https://www.jianshu.com/p/67e67915d9b4] 1. 背景 BERT的出现将NLU问题的SO...

  • 120
    文献阅读(1)-UniLMv2

    0. 背景 论文名称:UNILMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Traini...