240 发简信
IP属地:北京
  • 大模型相关

    使用Transformers加载大模型, 并使用流式输出进行文本生成 使用Transformers加载大模型, 并使用流式输出进行对话 这种有简...

  • Resize,w 360,h 240
    强化学习

    一个强化学习的入门者,仅用于自己学习的记录 强化学习 OpenAI出品的强化学习 (RL) 入门教程,Spinning Up[https://s...

  • Resize,w 360,h 240
    读书《新摄影笔记》

    取景 焦距 焦距(50mm, 70~200mm 等, 分为固定和可变焦距)决定我们的视角,确定取景的范围。 焦距的数字越小表示焦距越短, 拍摄的...

  • Resize,w 360,h 240
    一些数学知识的记录

    机器学习菜鸟,记录一些数学笔记,方便自己阅读和理解。 期望E的下标 地址一[https://www.zhihu.com/question/305...

  • pytorch-lightning的一些记录

    收集每个GPU上的输出在分布式训练时,每个GPU都会有一部分数据,当我们需要使用全部的数据进行计算时,我们需要收集所有GPU的tensor。比如...

  • Resize,w 360,h 240
    机器学习一些代码记录

    计算多分类时的每个类别的F1 接口 示例: pytorch 使用K-折交叉验证 pytorch 使用K-折交叉验证[https://github...

  • Resize,w 360,h 240
    pytorch的一些操作

    取出标签对应的样本特征 第一种操作 第二种操作 取出预测置信度大于预测置信度阈值的数据 取出预测置信度大于熵阈值的数据 torch.Tensor...

  • Slrum 分布式训练+提交作业

    创建分布式+采样 模型部署 由于模型已被包装,这时候直接调用模型组件会报错,比如:model.fc, 会显示没有属性, 因此一下操作 损失los...

  • 加载训练好的BERT参数

    将预训练模型中的bert部分取出来加载上去 base_model = BaseModel(config)base_model_dict = ba...