240 发简信
IP属地:北京
  • 120
    论文笔记 - Show and Tell: A Neural Image Caption Generator

    摘要 本文提出了一种基于深度循环网络架构的图片描述生成架构, 在COCO数据集上取得SOTA的水平. 1. 介绍 自动生成图像文本描述是非常有意义的同时也是十分具有挑战性的,...

  • 120
    论文笔记 - Iterative Visual Reasoning Beyond Convolutions

    论文地址:https://arxiv.org/abs/1803.11189v1 摘要 我们提出一种创新的视觉迭代推理框架,超越了现在只有卷积堆叠而无推理能力的识别系统。我们的...

  • 120
    论文笔记 - OSVOS: One-Shot Video Object Segmentation

    项目地址:http://www.vision.ee.ethz.ch/~cvlsegmentation/osvos/ 摘要 本论文解决了半监督视频物体分割的问题,即只给第一帧的...