Collaborative Filtering for Implicit Feedback Datasets阅读笔记

二、Collaborative Filtering for Implicit Feedback Datasets阅读笔记

1.介绍

  • 推荐系统分类——基于策略

    • 基于行为的策略:信息冗余且难以收集
    • 协同过滤:冷启动问题
  • 推荐系统分类——基于输入类型

    • 显示反馈
    • 隐式反馈
  • 隐式反馈的特点

    • 没有负反馈,也就是说即使用户没有行为也并不意味着用户不喜欢
    • 隐式反馈本质上是含有很多噪音的,并不能真正反映出用户的偏好
    • 显示反馈的数值反映了用户的偏好;而隐式反馈的数值反映了置信度(也就是用户有多大可能性对该物品感兴趣)
    • 隐式反馈的推荐需要合适的方法来进行评估

2.准备工作

  • 准备了用户数据矩阵$R$,这里的$R_{ui}$不是偏好值,而是对用户行为的观察。论文中$R_{ui}$是用户$u$全程观看电影$i$的次数。如果用户$u$观看了电影$i$的70%,那么$R_{ui}$就被设置为0.7

3.以前的研究

  • 近邻模型
  • 潜在因子模型(即PPT中的显式反馈)

4.我们的模型

$$p_{ui} = \left{ \begin{array}
\overline 1 & r_{ui} > 0 \ 0 & r_{ui} = 0 \
\end{array}\right.$$

  • 使用$置信度C_{ui}来为偏好度$P_{ui}$加权$
    $$C_{ui}=1+αR_{ui}$$
  • $λ(\sum_u|x_u|^2 + \sum_i|y_i|^2)$防止过拟合
  • 交替最小二乘过程,前文已经叙述
  • 每次迭代时间开销$O(f2N+f3M)$,其中$N$是非0观察值的数量,$M$是用户数量,$f$是特征数量
  • 特点
    • 转换直接观察值($r_{ui}$)到两个解释数值:偏好度$p_{ui}$和置信度$r_{ui}$
    • 输入规模线性倍数的时间开销

5.推荐解释

  • 好的推荐需要有理论解释 —— 文献10[Well Accepted]
  • 通过对于${P_{ui}}\prime=X_uT\times Y_i$的推导,证明推荐的数学合理性
    • $W^u$被看做是用户$u$的权重矩阵
    • 物品$i$和物品$j$在用户$u$眼中的加权相似度为$S_{ij}u=Y_iTW^uY_j$
      $$
      \begin{align}
      {P_{ui}}^\prime & =Y_i^T\times X_u\
      & =Y_i^T\times (YTCuY + λI)^{-1}\times YTCup(u)\
      & =Y_i^T\times W^u\times YTCup(u)\
      & =\sum_{j:r_{ui}>0}S_{ij}^uC_{uj}\
      \end{align
      }
      $$

6.实验

  • 实验数据处理
    • 预处理
    • 评估方法
    • 对比策略
      • (1) 按照节目流行度进行推荐排序
      • (2) 基于物品的邻域模型$ P_{ui} = \sum_j \frac{ r_i^T r_j } { ||r_i|| ||r_j|| } r_{uj} $
    • 评估结果
      • 使用$r_{ui}$效果不佳,改为使用$p_{ui}$
      • Dense SVD算法用于协同过滤参考文献18

7.讨论

这篇论文主要做了哪些工作,创新点在哪里

  • (1) 隐式用户观察值分解为偏好值和置信度(对于显示用户行为无效)
  • (2) 使用了潜在因子(特征向量)算法,将所有User-Item矩阵中的数值作为输入(即使没有观察值)
  • (3) 优化算法,使迭代的时间开销只随输入数量线性增长
  • (4) 使用代数演算转换为基于物品的邻域公式,从而进行推荐解释

未来的工作

  • (1) 使用一个随时间变化的变量来确定用户在特定时间观看特定节目的可能
  • (2) 特定节目在不同时间段的吸引度
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,189评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,577评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,857评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,703评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,705评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,620评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,995评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,656评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,898评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,639评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,720评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,395评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,982评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,953评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,195评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,907评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,472评论 2 342

推荐阅读更多精彩内容

  • 一、spark-meetup阅读笔记 1.显式矩阵分解(Explicit Matrix Factorization...
    一只小青鸟阅读 546评论 0 2
  • sì 支zhī茶chá 对duì 酒jiǔ,赋fù 对duì 诗shī,燕yàn子zi 对duì 莺yīng 儿é...
    每个人的孟母堂阅读 1,192评论 0 6
  • 谁是你经历过电闪雷鸣的人? 你们一起经历过多少个电闪雷鸣? 你们现在还来电吗? 2017-6-19 ❤ 22:33
    甜心少年阅读 131评论 0 0
  • 孩子的第一任老师是父母这话一点不假,你可以观察,如果孩子暴躁,那父母一定有一个暴躁;如果刚学会说话的孩子总是说一些...
    长弓心悦阅读 460评论 4 3
  • 热浪闷煞知了,烤得啼声渐少。 枝叶尽枯黄,哪得清新芳草。 谁晓,谁晓,何处纳凉方好。
    峰韵9023阅读 636评论 1 1