一种构造推荐系统的方法 :“基于内容的推荐”
举例:每一部电影都用一些特征来描述,假设每部电影有两种特征,分别用x1和x2代表,x1表示这部电影,属于爱情电影的程度;x2表示这部电影是动作电影的程度,然后用一个特征矩阵表示,加一个额外的特征变量截距特征变量 x0 其值为1。用 n 表示特征变量数,但是不包括 x0
把对每个观众打分的预测当成一个独立的线性回归问题(实际上就是对每个用户应用不同的线性回归模型 ),具体来说比如每一个用户j,我们都学习出一个参数θ(j),在这里是一个三维向量(θ(j) 表示用户j对应的参数向量;x(i)是某部电影i的特征向量)。更一般的情况是θ(j)为一个n+1维向量,n是特征数,不包括截距项x0,然后根据参数向量θ与特征x(i)的内积来预测用户j对电影i的评分。
m(j)来表示用户j评价过的电影数。另外就是选择一个参数向量θ(j)使得预测的结果尽可能接近训练集中的观测值。
求和序列的读法是对所有满足 r(i,j)=1的这些i进行求和运算,求出了所有用户j所评价过的电影。对于推荐系统,为了让数学更简单,要去掉这个m(j)。这就一个常数,可以去掉这一项不改变θ(j)的最优化结果。