用户微观行为在推荐系统中的应用

业内人士都清楚特征工程在推荐系统中的重要性。要想开发出高质量的特征,必须要弄清楚其来源,用处,对用户的刻画等等方面。这篇文章对于微观行为特征的数据分析很详细,值得借鉴。

论文题目:<<Micro Behaviors: A New Perspective in E-commerce
Recommender Systems>>
论文地址:http://184pc128.csie.ntnu.edu.tw/presentation/18-03-13/Micro%20Behaviors%20A%20New%20Perspective%20in%20Ecommerce%20Recommender%20Systems.pdf

摘要

现阶段大部分传统的推荐系统都侧重于研究users与items之间的宏观交互(Micro Interactions),如消费者的历史点击、购买等等。然而在这些宏观行为下其实还存在着一些微观行为(micro behaviors)。微观行为主要分为三类:用户如何定位到当前商品;用户对商品实施的具体行为(如用阅读评论,加入购物车等等)以及用户在商品上停留了多长时间。这些微小行为往往反映了用户更深层次和更细粒度的兴趣,对于提高推荐效果有重大的意义。然而现有的研究对于这类微观行为的利用较为少见,本论文就针对以上提到的三种微观行为进行了研究,提出了一个对微观行为进行建模的推荐系统框架(RIB, Recommendation framework from the mIcro Behavior perspective).

1. 简介

该论文中举了如下的例子来说明用户的微观行为,如图1所示。


图1 用户宏观和微观行为的例子

该图展示了一个用户在特定时间内的足迹:

  • 首先该用户通过搜索进入了iPhone7的商品页面,阅读了产品的详细信息和评论并加入了购物车;
  • 然后又通过搜索进入了iPhone6的商品页面并阅读了评论;
  • 接着又通过促销页面进入了iPhone7商品页并下了单;
  • 最后该用户又从电商网站首页进入了Samsung Galaxy的商品页。

图1的上下两部分分别展示了该用户的宏观行为和微观行为,可以看出每个宏观行为都是由一系列的微观行为组成的。这些微观行为体现了用户的兴趣强弱不同,例如用户通过搜索页面查看某商品,其兴趣比通过主页点击查看商品更强。

2. 问题描述

假设P = \{p_1, p_2, ..., p_N\}, A = \{a_1, a_2, ..., a_M\}, D = \{d_1, d_2, ..., d_K\}分别是商品集合、用户行为集合和停留时长集合。这里N商品池总数,M是用户可以采取的不同行为个数,K是对停留时长进行离散化之后的份数。这样一条样本就可以由一个tuple(p_i, a_j, d_k)来表示,代表了该用户在商品p_i上进行了动作a_j,并维持了d_k的时间。

在定义了样本的数据结构后,推荐系统的任务就是利用用户过往的行为来为其推荐下一个商品。

3. 微观行为分析

3.1 微观行为特征定义

论文采用了传统的电商数据,将特征分为了以下几个类型,如表1所示


表1 数据相关定义
  • Click Source(点击源)
    用户通过什么场景进入到当前的商品页面,包括首页(Home),购物清单(ShopList) ,促销(Sale),购物车(Cart),搜索列表(SearchList)等等。不同的点击源代表了用户兴趣的强弱,如通过首页点击的商品,用户往往只是想随便看看;而通过搜索点击的商品,用户的购买意图通常偏大。
  • Browsing Module(浏览模块)
    指用户浏览了商品的哪一模块,包括简介(Brief Information),评论(Detail_comments),商品参数(Detail_specifictaion),商品底部(Detail_bottom)等。如果用户只看了简介,其购买意图偏低;相反如果用户阅读了大量评论,商品参数并滑到了商品底部,则其购买意图更加强烈。
  • Cart and Order(加入购物车和下单)
    这两者都是和购买强相关的特征。这里要注意商品性质,如果是消耗型商品如卫生纸,食品等,用户下单之后复购的概率更大;但如果是电子产品等则复购率较小。
  • Dwell time(停留时长)
    一般来说停留时间越长,用户对该商品的兴趣越大,越有可能发生购买行为。

3.2 微观行为效用分析

本小节对于不同微观行为见的关系进行了数据分析,结果如图2-6所示。


图2 下单 vs 其他微观行为

图3 点击源 vs 浏览模块

图4 下单 vs 停留时长

图5 停留时长 vs 点击源

图6 停留时长 vs 浏览模块
  • Ordering
    为了研究下单与其他行为的关系,此处统计了转化率和具体微观行为见的关系,如图2所示。这里转化率由式(1)计算,即在该行为下的样本中有多少是用户最终购买的。
    Conversion\ rate = \frac{ \# \ behavior\ of\ a_i\ ended\ with\ ordering}{\# \ behaviors\ of\ a_i} \tag1
    统计结果如图2和图4所示。由图2可以看到,“加入购物车(Cart)”这一行为对于转化率的影响最大;除此之外,阅读评论(Detail_comments)、阅读参数(Detail_specification)、滑到商品底部(Detail_bottom)、通过购物车点击商品(Cart2Product)以及通过促销点击商品(Sale2Product)这几种行为对应的转化率也较高,这也是符合我们直观认知的结果。
    图4中,可以看到在一定范围内随着停留时间的增加,转化率也相应增加;当停留时长增加到一定范围之外,转化率会下降,这表明如果用户在商品页面停留过就其注意力和兴趣可能会转移到别处。
  • Dwell Time
    图5中展示了停留时长与点击来源(Click Source)的关系。可以看出没停留时长与用户的点击来源也是相关的。例如用户通过搜索发生的点击,其停留时长往往会更久。图6说明了停留时长与浏览模型(Browsing Module)之间的关系。停留时间越长,用户越进行阅读评论等行为的可能性越大
  • Click Source
    图3中给出了点击来源和浏览模型间的关系。与停留时长的结果类似,通过搜索发生的点击行为,用户产生阅读评论、参数等行为的概率越高。

最后做个总结:首先,不同的微观行为之间是相互关联的;然后不同的微观行为是对于其他行为的影响是不同的。

4. RIB模型

模型结构没有特别创新的地方,主要由Embedding Layer, RNN Layer, Attention Layer组成,如图7所示。


图7 模型结构
  • Input Layer
    首先输入数据由用户un个微观行为S_u=\{x_1, x_2, ..., x_n \}组成,这里每个x_i可以表示为
    x_t = (p_v, a_m, d_k)\tag2
    其中p_v, a_m, d_k都是one hot向量,作为embedding layer的输入。
  • Embedidng Layer
    将输入的用户特征分别通过embedding操作转化为低维向量,再将p_v, a_m, d_k转化后的embedidng vector拼接起来作为后续的输入。
  • RNN Layer
    论文中采用了GRU来刻画用户微观行为序列的时序信息,具体过程就不展开了,有兴趣的朋友可以参考论文4.2节。
  • Attention Layer
    这里使用了一个self attention结构来刻画不同微观行为的作用,同样也不展开叙述。
  • Output Layer
    Loss函数选取了cross-entropy函数。

5. 总结

用户的微观行为往往可以更细致地刻画用户的兴趣。本论文总结了四种不同的微观行为(点击来源,浏览模块,购物车&下单,停留时长),分析了它们的内在联系,并利用这些微观行为构建了基于embedding+RNN的推荐系统模型。其中对于微观序列的利用值得我们进一步思考。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342