推荐系统论文阅读(十五)-阿里巴巴:多任务学习模型 ESMM2

论文原文:

论文地址:https://arxiv.org/abs/1910.07099

论文题目:《Entire Space Multi-Task Modeling via Post-Click Behavior Decomposition for Conversion Rate Prediction 》

一 、背景

在第十二篇文章里面我们介绍了阿里巴巴针对cvr的多任务学习模型,在ESMM第一篇文章里面,阿里用多任务学习模型解决了两个问题,数据稀疏和样本选择偏差两个问题。作为ESMM的升级版,本论文做了什么样的改进呢?我们来看看吧。

我们先看看推荐系统的总体架构:

从图中,我们可以很清楚的看到,推荐系统分为match(召回)和(rank)两个阶段,在上一篇多任务学习的模型中,我们已经介绍了这两个阶段的工作,就不再赘述了。

推荐系统给用户推荐的物品成为曝光(impression)物品,但是对于曝光物品,用户不一定都会进行点击(click),即使稍微感兴趣点,也不会进行购买(purchase),用户行为阶段的一般过程是Impression - Click - Purchase。

推荐系统是现代电子商务的重要组成部分,由两个基本模块组成,即点击率(CTR)和转化率(CVR)预测。尽管CVR对购买量有直接影响,但由于样本选择偏差(SSB)和数据稀疏性(DS)问题,其预测是众所周知的挑战。

对于这两个问题,我们在上一篇文章里面也提到了,这篇文章就再提一遍:

样本选择偏差(sample selection bias,SSB):传统的推荐系统仅用click中的样本来训练CVR预估模型,但训练好的模型是在整个样本空间去做推断的。由于点击事件相对于曝光事件来说要少很多,因此只是样本空间X的一个很小的子集,从click中的样本上提取的特征相对于从所有样本中提取的特征而言是有偏的,甚至是很不相同。在机器学习中,我们知道训练集的样本跟测试集的样本要服从同一个分布,否则训练出来的模型会有很大的偏差,使得模型的泛化性能很差。这种训练样本从整体样本空间的一个较小子集中提取,而训练得到的模型却需要对整个样本空间中的样本做推断预测的现象称之为样本选择偏差。

数据稀疏(data sparsity,DS): 推荐系统展现给用户的商品数量要远远大于被用户点击的商品数量,同时有点击行为的用户也仅仅只占所有用户的一小部分,因此有点击行为的click样本空间相对于整个样本空间来说是很小的,通常来讲,量级要少1~3个数量级。这就是所谓的训练数据稀疏的问题,高度稀疏的训练数据使得模型的学习变得相当困难。

ESMM模型已经尝试的解决这两个问题了:

ESMM模型用pCTCVR和pCTR两个值来计算pCVR,pCTCVR = pCTR*pCVR,我们很容易知道pCVR的计算方式,通过embedding的共享机制,使得pCVR子任务也能够从只有展现没有点击的样本中学习,从而能够极大地有利于缓解训练数据稀疏性问题。

尽管通常基于用户顺序行为过程为“曝光→点击→购买”的现有方法可以有效地处理SSB问题,但由于购买的训练样本很少,因此他们仍然难以解决数据稀疏问题。观察到用户在点击后始终会进行与购买相关的若干操作,具体地,在点击和购买之间会发生一些额外的动作,比如加入购物车这种行为。

加入购物车的数据相较购买数据还是比较多的,因此可以基于这部分数据,通过多任务学习模型来求解CVR模型。如图所示,文中把加入购物车此类行为称作Deterministic Action (DAction) ,而其他对购买相关性不是很大的行为称作Other Action(OAction) 。此时原来的 Impression→Click→Buy过程变成了更加丰富的Impression→Click→DAction/OAction→Buy过程。

在ESMM1中,我们在训练pCVR模型时并没有区分这部分的数据,只用到了购买的数据来训练pCVR子模型,相比于把加入购物车中的物品也作为训练CVR的样本来说还是很少的,从直觉上来看,一般加入购物车中的物品,用户的购买欲望是很高的,因此我们不能忽略这部分数据。

对于这部分数据来说,阿里巴巴提出了ESMM2模型,下面我们就来看看这篇论文的工作吧。

二、ESMM模型结构


我们先从直觉上看ESMM2的模型结构,整个网络分为四个子模型:

1. Impression -> click子模型,这个子模型预测的是CTR,y1

2.click->DAction 子模型,这个子模型预测的是click到DAction的概率,y2

3. DAction -> purchase  子模型,这个子模型预测的是从确定性的行为到购买的概率,y3

4. OAction  ->puchase 子模型,这个子模型预测的是从不确定的行为到购买的概率,y4

我们来看看通过这几个子模型,能组合成什么任务模型:

1.CTCVR  = y1 [(1-y2)y4 + y2y3],简单解释一下就是CTR*CVR,用CTR*(确性行为购买的概率 + 不确定行为购买的概率),这里有一个细节就是DAction和OAction的概率之和为1,即这两个事件是对立事件。

2.CTAVR = y1y2,这个没什么好说的

3.CVR = (1-y2)y4 + y2y3 这个在前面也说过了,也可以看上面这张图,CVR通过两条路径得来:

DAction/OAction -> purchase,所以就是简单的概率相加了。

有了上面说的三个组合模型,自然也有三个loss函数:

1.Loss1  impression->click 就是CTR预估的损失函数

2.Loss2 impression->DAction 从Impress到DAction的损失函数,预估的是CTAVR

3.Loss3  impression->purchase 这个是CTCVR的损失函数

这三部分的损失函数通过加权得到最终的损失函数:

跟ESMM1模型还是有相同的部分的,那就是他们也是共享embedding的,这个其实在很多推荐系统中都是这么做的,一来是可以减少模型的规模,二来是可以充分的学习到embedding信息。

三、实验结果

其中GAUC为对每个用户的AUC进行加权的结果:


可以看到ESMM2的CVR预估效果比其他baseline都好,跟ESMM1来说三个指标都有较好的提升。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容