IP属地:上海
最近ICLR2019接受论文已经公布,最佳论文也跟着亮相了,这篇是两篇最佳论文中的其中一篇,另外一篇是《The Lottery Ticket H...
转自知乎https://zhuanlan.zhihu.com/p/32230623 首先定义:待优化参数:,目标函数:,初始学习率 : 而后,开...
文章提出了将批处理作为模型本身的一部分。 批处理的平均损失是对整个数据集的估计;批处理可以利用数据并行提高训练速度。深度学习需要谨慎调整模型参数...
17年暑假看过的《机器学习实战》发现挺不错的,最近拿来继续翻一翻,总结一下数据挖掘里经典的方法,敲一敲代码。 简述: 1、K-NN: 优点:精度...
昨天重新看了一下之前没怎么看懂的《attention is all you need》,感觉其实挺简单的,可以说是 product is all...
论文《Zoom to learn,Learn to zoom》。 本以为是一篇非常有意思的CV中讲用深度学习实现变焦的文章,结果论文的主要贡献是...