IP属地:甘肃
博客文章搬迁至CSDN
作为程序员一枚,长期混迹在各种社交app上面,想要找到一个心仪的对象(老实人,没啥好遮掩的,哈哈哈哈)。 用过soul, 陌陌,探探和珍爱网的a...
gradient descent 的方法介绍和自适应步长的使用,加速优化速度 gradient descent 方法总结 方法容易理解,迭代容易...
凸集合 今天,定义一下凸集合(convex set)C: 假设凸集合C: C, 有两个向量 x,yC, 使得 tx+(1-t)yC 对于t[0,...
Pytorch保存模型的两种方式: 1 模型结构和模型参数都保存下来 优点:不需要预初始化模型,直接加载,就可以获得模型和参数,只要把数据放进去...
迁移学习的两种基本应用场景: 1 模型初始化又叫做 finetuning, 一般的模型初始化是一个随机初始,但是使用训练好的参数作为初始化,可能...
nn.Dropout ---- input 可以是任何形状和尺寸,一般是用在全连接线性映射之后(紧跟着)。nn.Dropout2d ---- i...
学习率走廊 lr_scheduler.LambdaLR(optimizer,lr_lamda,last_epoch=-1,verbose=Fal...
如何有效监控深度学习的训练过程,即便是在服务器突然宕机的情况下? 第一种 使用python的logging库函数,比较方便,当然需要书写一部分代...