240 发简信
IP属地:北京
  • 《秘密》

    本篇是我的读书笔记《秘密》,大多也是摘录。 读完后,书中的部分观点与其他书大同小异,但是这本书操作性强。自我总结成以下几点: 明确自己的目标(好...

  • 《影响力》

    这篇文章其实更多讲的是,有哪些方面会影响我们作出决策。作者总结了6大影响力武器: 互惠 承诺和一致 社会认同 喜好 权威 稀缺 1. 互惠 ——...

  • 《活出生命的意义》

    本篇是一些摘录: 1. 生活态度 我们期望生活给予什么并不重要,重要的是生活对我们有什么期望。 我们真正需要的,是在生活态度上来个根本的转变。我...

  • Resize,w 360,h 240
    特征归一化/标准化

    1. 为什么要做特征归一化/标准化? 数据预处理中,通常会用到特征归一化,为什么要做归一化呢?一般有两点: 消除特征间单位和尺度差异的影响特征间...

  • Resize,w 360,h 240
    Bert细节整理

    本文是对bert的细节进行整理,分成3个部分的问题: 目录 输入 与transformer相比输入有什么不同? bert的3种embedding...

  • Resize,w 360,h 240
    L1、L2正则化

    正则化(Regularization)是机器学习中一种常用的技术,其主要目的是控制模型复杂度,减小过拟合。最基本的正则化方法是在原目标(代价)函...

  • Resize,w 360,h 240
    Transformer细节整理

    本文是对transformer的细节进行整理,主要有以下问题: Transformer为什么Q和K使用不同的权重矩阵生成,为何不能使用同一个值进...

  • pyspark: sql.functions以及udf函数

    大纲 选取列 select 常数列 lit 条件分支 when otherwise 数学函数 时间函数 窗口函数 row_number 自定义函...

  • 交叉熵损失函数

    目录 二分类 多分类 为什么sigmoid激活函数,使用交叉熵损失函数更好? 1. 二分类 激活函数sigmoid这里要注意的是是最后一层的输出...

个人介绍
小目标:代码与论文齐飞