承接前两篇《推荐系统系列之初识》及《推荐系统系列之基于人口统计学的推荐》
一、基本思想
基于物品内容的推荐算法仅利用物品或内容的基本信息,衡量物品之间或内容之间的相似度,再根据用户的历史偏好记录,将相似的物品或内容推荐给当前用户。
二、举例说明
我们以下图为例进行简要说明
用户A偏好音乐A,该音乐是由贝多芬作曲的轻音乐;用户B偏好音乐B,也是由贝多芬作曲的轻音乐;用户C偏好音乐C,音乐C是由Prince作曲的 摇滚曲;基于各音乐的基础信息,衡量音乐之间的相似度;在该例中我们发现音乐A和音乐B是同一种类型的,可将音乐A推荐给偏好音乐B的用户,将音乐B推荐 给偏好音乐A的用户,也就是将音乐A推荐给用户B,将音乐B推荐给用户A。
三、存在的问题
数据质量要求高:该推荐算法依赖于物品或内容的描述数据,描述得越全面、完整,推荐得就越精确;即该算法对物品内容的数据质量要求较高;
考虑不全面:该算法仅从物品内容本身的特征出发,没有考虑到用户对物品内容的态度;
新用户问题:需要基于用户的历史偏好信息,所有对新用户无法进行推荐;