240 发简信
IP属地:江苏
  • 从图片相似度学习图片的表示

    很多时候带分类标注的图片样本是很难获得的,但是图片之间的相似度却不难获得。最简单的方式有几个: 视频里相邻的帧是相似的。见论文Unsupervi...

    0.1 8720 9 30 2
  • Tensorflow 的NCE-Loss的实现和word2vec

    这两天因为实现mxnet的nce-loss,因此研究了一下tensorflow的nce-loss的实现。所以总结一下。 先看看tensorflo...

    0.6 39160 9 18 1
  • word2vec/lstm on mxnet with NCE loss

    Softmax是用来实现多类分类问题常见的损失函数。但如果类别特别多,softmax的效率就是个问题了。比如在word2vec里,每个词都是一个...

  • 基于DC/OS建立分布式机器学习系统

    之前基于ps-lite实现了word2vec。下一步就是让这个算法能够分布式的跑起来。最简单的分布式方案大概是如下几步:把二进制文件copy到你...

  • 基于ps-lite实现分布式的word2vec

    ps-lite是一个参数服务器(ps)的实现。在有参数服务器之前,其实也就5年前,大部分分布式机器学习算法都是靠定期同步来实现的,比如MPI的a...

  • 用Mxnet实现矩阵分解

    在《关于LDA, pLSA, SVD, Word2Vec的一些看法》一文中我们提到了SVD的算法。之前TensorFlow刚出来时,就听说可以很...

  • 端到端的OCR:LSTM+CTC的实现

    前面提到了用CNN来做OCR。这篇文章介绍另一种做OCR的方法,就是通过LSTM+CTC。这种方法的好处是他可以事先不用知道一共有几个字符需要识...

  • 端到端的OCR:基于CNN的实现

    OCR是一个古老的问题。这里我们考虑一类特殊的OCR问题,就是验证码的识别。传统做验证码的识别,需要经过如下步骤: 这里最难的就是分割。如果字符...

  • 离散特征和连续特征同时存在,同时解决回归和分类的问题

    有些同学对于mxnet的自定义Iter不是很熟悉,对多输出也不熟悉,因此我用一个比较复杂的例子来说明这个问题: 本着End-to-End的精神,...