UniformML Paper3-MLR《Learning Piece-wise Linear Models from Large Scale Data for Ad Click》

1 Introduction

线性模型在实际应用中虽然高效,但是实际很多特征空间的分界面未必都是线性的,为了适应这样的场景,我们一般会通过两种方法:
1、复杂的特征工程(人工制造出非线性组合的特征)

To help LR model catch the nonlinearity, feature engineering technique is explored, which is both time and humanity consuming

2、通过模型组合(引入非线性模型)

Another direction, is to capture the nonlinearity with well-designed models. Facebook (He et al. 2014) uses a hybrid model which combines decision trees with logistic regression. Decision tree plays a nonlinear feature transformation role, whose output is fed to LR model. However, tree-based method is not suitable for very sparse and high dimensional data

除了树模型+LR,还有factorization machine (FM),但是一般只能解决2阶问题,没办法解决更高阶的非线性组合。

为了解决上述问题,本文提出了一个新的模型Large Scale Piece-wise Linear Model(LS-PLM)

In this paper, we present a piece-wise linear model and its training algorithm for large scale data.

这是一个分而治之的策略算法(divide-and-conquer strategy):先对空间进行划分出多个区域,然后对每个区域采用线性模型

first divides the feature space into several local regions, then fits a linear model in each region, resulting in the output with combinations of weighted linear predictions.

这里的非线性就看多个区域的划分机制,如果划分越细,那非线性的表征能力就越强。

在学习曲线导数的时候,我们知道,在一个极短的线段里,可以近似为直线。

本文提出的模型具有以下优点:

  1. 非线性
  2. 支持大规模并行训练
  3. 稀疏性

model sparsity is a practical issue for online serving in industrial setting. We show LS-PLM with L1 and L2,1 regularizer can achieve good sparsity.

我们先看个例子,本文提出的模型对非线性的拟合能力

Example

2 模型细节

2.1 模型结构

前面已经提到,我们为了表征非线性关系,会把空间进行划分,用多个线性模型表征非线性模型。模型的公式如下:
p(y=1|x)=g(\sum_{j=1}^m\sigma{(u_j^Tx)}\eta(w_j^Tx))
这里g里用了两个函数来分别表征分而治之(dividing and fitting)的概念。
这里模型的参数
\theta={u_1, u_2, ...,u_m, w_1, w_2, ..., w_m},其中{u1, u2, ..., um}参数是dividing function
\sigma(.)的;{w1, w2, ..., wm}参数是fitting function \eta(.) 的。
当给定自变量x,我们的预测模型包含两部分:第一部分是dividing函数,负责把特征空间划分成m个区域;第二部分fitting函数是给出各个区域空间的概率预测。外层的g()保证我们的输出结果满足概率定义。
本文对上述三个函数的定义如下:

define of function

个人理解:感觉这里借鉴了non-parametric algorithm,然后和参数学习组合,比如算法局部加权线性回归算法,但是局部加权线性回归算法的在线计算复杂度会随着样本数量增加而增加,这了用了m固定区域来限制,保证了在线计算复杂度,而且也在一段区域内进行参数化
如果我们再对这个函数拆成两步,第一步是先通过m个logistic regression计算,第二步是根据第一步的计算结果再进行一次softmax。这个过程是不是和一个标准的2层神经网络一样?

本文还指出该模型和如下模型是如出一辙的形式。


image

有了模型定义,下面我们来说下损失函数的定义:

image

这里loss同样采用 经验误差+结构误差的模式,经验误差同LR采用的是交叉熵,模型结构误差采用的是L1和L2组合

||\theta||_{2,1}=\sum_{i=1}^{d}\sqrt{\sum_{j=1}^{2m}\theta_{i,j}^2}
||\theta||_1=\sum_{ij}|\theta_{i,j}|

2.2 模型优化求解方法

正是由于引入了模型结构误差,导致模型非凸非平滑

However, both L1 norm and L2,1 norm are non-smooth functions. This causes the objective function of Eq.(4) to be non-convex and non-smooth, making it difficult to employ those traditional gradient-descent optimization methods

作者为了他解决这个问题,提出新的求解方法(根据梯度方向来更新)

2.3 trick

本文模型在训练的时候采用了一个common feature trick,我们在广告曝光的时候,对于同一个用户在同一个页面展示不同的广告,这里曝光的每条训练数据集的user、context的feature都是一致的,只有item的feature不一致,所以在悬链的时候可以进行预计算公用特征,然后在计算不一致特征即可,能够高效提升计算效率。当然对训练数据集分组的时候就有要求,尽可能把带有公共特征的数据放在一台机器上。
如下,我们把feature空间分乘两部分: xc表示common feature, xnc表示非公共特征


feature重写

3 实验

从试验结果来看,模型超参数m如果越多能够提升模型的效果,但是对训练复杂度也会加大


image
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343