主要内容
·推荐系统简介
·传统的推荐算法
·非个性化推荐:热度排行(Popularity)
·协同过滤(collaborative filtering)
·Memory-based(aka neighborhood-based)方法:Item-based/User-based CF
·Model-based方法:频繁项集挖掘/聚类/分类/回归/矩阵分解/RBM/图模型
·基于内容/知识的推荐(Content-based/Knowledge-based)
·混合方法(Hybird Approaches)
·推荐算法的最新研究
·学习排序(Learning to Rank)
·页面整体优化(Page Optimization)
·情景推荐:张量分解/分解机(Factorization Machine)
·深度学习(Deep Learning)
推荐系统的评价标准
·用户满意度(User Satisfaction):调研或者用户反馈;点击率、转化率等
·准确率(Accuracy):precision/recall/F-score
·覆盖率(Coverage):照顾到尾部物品和用户
·多样性(Diversity):两两之间不想死
·新颖性(Novelty):没听过、没见过的物品
·惊喜性(Serendipity):如何评价?
·用户信任度(Trust)/可解释性(explanation):推荐理由
·鲁棒性/健壮性(Robustness):哈利波特现象;抗攻击、反作弊
·实时性(real-time/online):新加入的物品;新的用户行为(实时意图)
·商业目标(business target):一个用户带来多少盈利
影响推荐效果的因素
·用户交互界面
·用户对推荐系统第一感知,很重要
·案例:Teitter的“favorate”图案由star换成heart
·数据
·数据收集:有效性、全面性
·数据处理:清晰、挖掘(算法工程师值得投入的地方)
·领域知识
·产品定位、具体推荐需求的理解
·算法迭代
·锦上添花(10%~20%)、量变引起质变