240 发简信
IP属地:广东
  • Resize,w 360,h 240
    Vanilla VAE

    Vanilla VAE(Variational Autoencoder) 一、AutoEncoder 回顾 生成模型 最理想的生成就是知道输入样...

  • mysql事务隔离级别的实现原理

    mysql事务隔离级别的实现原理 mysql innodb中的四种事务隔离级别[https://www.jianshu.com/p/1fc97a...

  • Java 泛型

    java 泛型 很多朋友对java的泛型不是很理解,很多文章写的已不是很清楚,这篇博客对java泛型进行 一个总结。 1.泛型的转换 List<...

  • Resize,w 360,h 240
    机器学习基础之交叉熵与均方误差

    机器学习基础之交叉熵与均方误差 我们都知道,对于分类任务,可以选用交叉熵做为模型的损失函数;对于回归任务,可以选用MSE来作为模型的损失函数。那...

  • 机器学习基础之参数估计

    机器学习基础之参数估计 一、参数估计 对所要研究的随机变量,当它的概率分布的类型已知,但是参数未知,比如服从正太分布。但是这两个参数未知。那么这...

  • Resize,w 360,h 240
    Transformer in pytorch

    一 Transformer overview 本文结合pytorch源码以尽可能简洁的方式把Transformer的工作流程讲解以及原理讲解清楚...

  • Resize,w 360,h 240
    机器学习基础之反向传播

    机器学习基础二-反向传播 神经网络之所以可以训练,得益于与Hinton在1986年提出的反向传播算法。反向传播背后的数学原理就是链式法则。本文会...

  • Resize,w 360,h 240
    Transformer研究综述

    一、基础部分   2017年google发表了一篇All Attention Is All You Need论文, 在机器翻译任务中取得了SOT...

  • Resize,w 360,h 240
    梯度下降优化方法概述

    梯度下降是优化神经网络和机器机器学习算法的首选优化方法。本文重度参考SEBASTIAN RUDER[https://ruder.io/optim...