基于用户兴趣的商品推荐算法--DIN论文解读

0. 写在前面

前面我们分别讲了alibaba在电商推荐场景下的两大工作,分别是DIEN和DSIN。 其实,这两个模型均基于最初的模型DIN(Deep Interest Network)发展优化而来。这次,我们就来看看DIN相比于其他模型而言,到底有哪些优化点。

个人心得:

  1. 用户的历史行为与每个候选物品的相关性权重不是一定的,可以用attention来建模
  2. 激活函数的优化--适应数据分布的激活函数Dice

论文地址:

https://arxiv.org/abs/1706.06978

论文代码:

https://github.com/zhougr1993/DeepInterestNetwork

1. 背景

当前主流的深度学习推荐算法模型基本可以表示为如图所示的通用架构。

image

其中,模型的输入包括:用户特征、待推荐物品特征、上下文特征及用户与物品的交互历史特征。不论是wide&deep也好,还是DeepFM,一旦模型训练完毕,在推理过程中,用户的历史行为特征与待推荐物品的权重以及对推荐结果的影响就不会发生改变。举个例子,用户在历史中买了篮球和花,那么对于待推荐物品为篮球鞋和花盆的情况,篮球和花在推理过程中权重并不会发生变化。然而,直观上,篮球对于篮球框的权重(相关性)是要明显大于花盆的。因此,能不能利用用户的历史行为特征,动态的计算用户对当前待推荐物品的兴趣呢?基于这个出发点,alibaba提出了DIN深度推荐模型。

2. DIN模型

本节主要介绍DIN建模思路。将从模型架构和激活函数两个方面来对DIN进行介绍。DIN模型架构图如图所示。

image

2.1 模型架构

我们先看DIN的输入层。DIN的输入层其实与其他网络没有明显的区别,同样包含用户特征、用户历史行为特征、上下文特征及待推荐物品特征。在电商推荐场景下,物品特征可能包含有物品分类,物品的店铺,物品自身id等特征。然后,再对这些特征进行Embedding向量化的操作从而压缩维度。这些都是深度推荐网络输入层的常规做法,相信大家也都能想到。
那么,DIN又在哪里做了优化呢?既然提到“兴趣”网络,前面我们也说过,用户的兴趣在不同的物品上权重一定是不一样的。既然如此,如何度量用户的历史行为序列(即用户的兴趣)在当前待推荐物品上的权重呢?答案就是:Attention。DIN设计了一种attention模块来计算用户历史行为与待推荐物品间的相关性,进而将历史行为进行相关性加权,从而得到用户对带推荐物品的综合兴趣。

2.2 Attention Module

DIN的attention模块如图所示。

image

可以看到,Attention模块接受用户历史行为物品embedding及待推荐物品embedding作为输入,经过外积、拼接等一些列操作后,经过PRelu/Dice激活函数后,输出attention weight,即用户历史行为与当前待推荐物品的相关程度。然后,用attention weight对用户历史行为embedding进行加权,通过sum pooling得到综合了所有历史行为了的用户对待推荐物品的兴趣,与其他特征进行拼接后,送入PRelu/Dice激活函数,并做最后的2分类softmax。

2.3 Dice激活函数

上文中,两次提到激活函数Dice,分别用于attention模块以及全连接层后。下面我们来介绍Dice激活函数。
我们都知道,ReLU系列是目前常用的激活函数,例如ReLU,Leaky ReLU, PReLU等。这些激活函数均有在零点处发生阶跃的特点,并且对于任何分布的数据,这种激活方式是维持不变的。论文提出,面对不同分布的数据,采用同样的策略可能是不合理的。因此,DIN设计者提出了一种新的激活函数Dice,能够随着数据的分布来动态改变激活的策略,提高模型整体的学习和表达能力。Dice的数学表达如下所示,

image

其中,E[s]表示数据的均值,Var[s]表示数据的方差,\epsilon 表示值很小的常量。

Dice会随着数据的分布进行自适应的调整,如下图所示。

image

3. 效果

论文对比了业界主流的推荐模型,例如wide&deep/DeepFM等。DIN的效果还是优于其他模型的,也进一步验证了引入用户兴趣的有效应以及对推荐效果的促进作用。

image

4. 总结

本文主要介绍了深度兴趣网络DIN的一些技术点,包括基于attention机制并结合用户历史行为的用户综合兴趣表征,能够自适应数据分布的激活函数DICE以及其他一些技术细节。DIN整体建模思路清晰简洁,能够为推荐算法工程师的日常工作与学习提供有价值的参考。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容