1.推荐系统概述tips
(1)产生原因:在大数据时代,信息冗余,推荐系统帮助过滤信息。
(2)推荐系统与搜索不同的地方:
搜索是带有目的性的,结果和用户的搜索词有很大的关系;
推荐系统不具有目的性,个性化的推荐系统往往依赖于丰富的用户行为数据。
2.评价指标
常见的评价指标有,准确率、精准率和召回率、均方根误差、对数损失函数等
(1)Accuracy=N(correct)/N(total)
其中N(correct)表示被正确分类的样本个数,N(total)为总样本个数
明显缺陷:当不同类别的样本比例不平衡时,占比大的类别往往成为影响准确率的最主要因素。如负样本占99%,那么分类器把所有样本都预测为负样本,准确率也为99%
(2)精准率和召回率
(待补充所有公式)
(3)均方根误差
(4)对数损失函数
P-R曲线、ROC曲线、平均精度均值
(1)P-R曲线
(2)ROC曲线
(3)平均精度均值
3.召回
召回与排序比较
多路召回
召回方法
4.思考:
为什么使用AUC曲线