240 发简信
IP属地:安徽
  • 总结

    VIDEO (LANGUAGE) MODELING: A BASELINE FOR GENERATIVE MODELS OF NATURAL V...

  • 解决的问题

    难点: 1、模型必须理解如何传播运动以及处理遮挡。 2、短期预测:从模型改进(从预测像素值改为预测动作) 3、模糊:从代价函数改进(加入GAN)...

  • 9/30

    计划:上午调试prednet的代码,完成refine net的训练,以及多帧的训练。 下午: 看有关光流估计的paper, 以及在Caltech...

  • GENERALIZABLE FEATURES FROM UNSUPERVISED LEARNING

    问题:无监督学习到的特征更好的泛化到监督训练分布之外的样例上。 任务:通过视频预测,将预测的帧作为分类器的输入,从而提高行为预测的精度。 通过视...

  • Hybrid Learning of Optical Flow and Next Frame Prediction to Boost Optical Flow in the

    问题:CNN-based光流预测在合成的数据上表现很好,但是在真是的场景中表现不好 方法:训练中加入真实数据,进行自监督的视频预测任务。 改进方...

  • Dual Motion GAN for Future-Flow Embedded Video Prediction

    问题: 视频预测需要捕捉:1、pixe-wise appearance. 2、motion change。然而现在的方法并不对pixel-wis...

  • Pose Guided Person Image Generation

    1、给定两帧的关节点位置信息,学习到类似光流的转换,应用到第一帧的图像上,生成下一帧? 2、身份信息并没有保留? 生成过程:通过合理地表示生成的...

  • Resize,w 360,h 240
    Predicting Deeper into the Future of Semantic Segmentation

    任务: 预测未来帧的场景分割,给定视频帧的输入序列,预测未观察到的帧的场景图。 动机: 预测像素值与预测高层次的场景相比过于复杂,然而后者对于大...

  • Resize,w 360,h 240
    DEEP PREDICTIVE CODING NETWORKS FOR VIDEO PREDICTION AND UNSUPERVISED LEARNING

    编码-解码框架不同于: 1、先解码再编码。 2、每次对groundtruth和预测的帧之间的差进行编码,进行下一次预测。 3、多帧预测时对相邻两...