作者:HaigLee
https://www.jianshu.com/u/67ec21fb270d
本文由 HaigLee 发布。未经许可,禁止转载。
规模
目前已有的一些有效推荐算法在YouTube大规模视频推荐上没有起到相应的效果。因此,采用大规模的分布式学习算法来处理YouTube庞大的用户群和语料库是至关重要的环节。
新鲜度
YouTube 具有动态性很强的语料库,每秒钟上传的新视频很多。推荐系统应该能在有新视频上传或者用户有新行为的时候及时响应。平衡新内容与成熟的视频可以从探索/开发的角度去理解。
噪声
由于受稀疏性和不可观察等各种因素的影响,不易从YouTube 上的历史用户行为获得基本真实的用户满意度,获得的更多是隐式反馈噪声信号。此外,由于视频内容数据为非结构化数据,这使得与内容相关的数据质量不高。
YouTube 目前主要使用深度学习来解决机器学习问题。YouTube 推荐系统目前建立在Tensorflow 平台之上。
作者:HaigLee
https://www.jianshu.com/u/67ec21fb270d
本文由 HaigLee 发布。未经许可,禁止转载。