什么是广告归因问题
单渠道的广告归因问题,其实就是用户识别问题,上一篇已经讲过,不再赘述。
广告归因问题,一般指多屏或多渠道的情况下,产生的广告转化的归属问题。
用场景举例:
广告公司在微信和今日头条都投了某产品的广告,然后用户在微信上看到了这个广告,没有下单;过几天在今日头条上也看到了这个广告,觉得东西挺好,还是没有买;过几天用户正好需要这个产品的时候,想起来这个商品了,去京东搜索了这个商品,然后下单购买了,那么这个购买是广告转化吗?如果是广告转化那是谁带来的广告转化呢?
其实归因这个问题没有固定的答案,因为广告归因其实不只是技术问题,更是一个运营问题,因为运营的策略来决定的这个广告归属。
一个好的归因模型,可以告诉运营,广告主的钱花在哪些地方去了,哪些渠道的效果更好,哪些渠道ROI不高,但是能覆盖大量的人群,哪些渠道的复参很好... 诸如此类的问题,都是由归因模型来决定的。
归因的方式
这里的渠道可以是多个流量平台,也可以是多个广告位。
多流量平台归因通常需要借助第三方DMP平台来完成。原因是多渠道间的数据孤岛需要通过第三方DMP平台来建立关联关系,第三方DMP平台可以通过用户识别的方式来将多渠道间的用户关联起来,统一按照归因模型来分析转化数据。
当然,这不是说广告平台自己做不行,只是说效果没有那么好,而且广告参与方越多,投放平台越多,自己来归因的效果会越差,这是显而易见的道理;但是多个广告位的归因就没这种烦恼了。
几种常见的归因模型
先假设一下广告投放的场景:
广告主在平台ABCD等很多渠道上都投放了广告,可能是效果广告,也可能是品牌广告;然后其中一个用户的广告访问路径是:A渠道点击 -> B渠道点击 -> C渠道点击 -> D渠道点击,然后发生了转化行为;
最终我们需要通过模型来分析效果广告或者品牌广告在这些渠道上归因后的效果数据;那么每个渠道对这次转化的贡献我们用归因系数来描述。
最终互动模型
最终互动模型的归因系数列表如下:
最终互动模型无疑是最简单,最直接可以衡量,直接将所有的广告转化效果归功与最后一次广告触达。
这种方式的好处就是:简单直接容易衡量,技术实现上最简单;只需要记录最后一次用户广告触达即可,不需要去记录并存储每一次用户广告访问,在广告业务场景下能节省巨量的存储资源和服务器资源。
但是弊端也很明显,过于关注最终成交的渠道,导致区域渠道的对用户兴趣的建立都忽略了,短期内会导致部分非成交渠道的广告投放数据过低,从长远来看,会导致渠道在投放广告时,过于倾向诱导、作弊、强制客户等行为,对广告主的品牌形象和广告投放效果都是负面影响。
一般来说,在采用最终互动模型时,会加上最终互动的有效期,举个栗子:用户在去年点过一个产品广告,直到今年才下单,那么从常理来分析,这次广告点击对广告的转化作用基本可以忽略不计。所以这种方式需要提供7日转化、15日转化、30日转化等不同维度的数据来综合分析。
这种归因模型很适合转化路径短、转化行为直接、广告投放周期短的效果广告使用,尤其是电商广告这类直接已成交来评价广告效果的广告形式。
最终非直接点击
这种归因方式是对上一种最终互动模型的弥补;
举个栗子:在同一个站内,可能ABCD渠道对应的不同的推荐位、购物车、收藏架等模块,那么在评估这些模块的转化效果时,如果用户之前在首页推荐中看到了商品广告,然后加入了收藏夹,最终用户在收藏夹中点击了该商品下单了,根据最终归因的模型,这次转化是要归因给收藏夹的,但是收藏夹在系统中并没有广告数据,而且电商场景下,很多商品成交都发生在收藏夹中,这样去归因并没有什么参考价值,那么剔除掉这种类似的直接渠道是比较合适的。
线性归因
这种是比较佛系的归因模型,平等对待所有流量,平等去分配每次转化的功劳,这是多推广平台渠道归因的一种模型;
先说一下这种模型的天然的缺陷:在互联网广告的场景中,每个渠道的作用很难均衡,例如我们可能会在电视上看到某个产品的广告,但是我们通过互联网了解新信息的入口大部分是搜索引擎,那么很有可能是你通过搜索了解到详细信息才决定成交的,那线性模型对于搜索引擎就是不公平的。
这种广告也有优势,线性归因的模型让流量渠道可以不用过于关注转化效果,而进一步去加强广告的品牌效应,那么对于那些同流量渠道有长期稳定的合作关系的品牌方而言,可以帮助他们把流量平台的注意力转向加强广告的各个过程,而不会太过功利。
时间衰减归因
时间衰减归因模型是一种倾向把功劳划分给最接近转化的触点的多触点模型。该模型基于一个假设,该假设认为触点越接近转化,对转化的影响力就越大。
这种归因思路是脱胎于最终互动模型,又没有最终互动那么绝对,一样适用于最终互动模型的业务场景:投放周期短、转化路径直接的广告类型。
但是这种模型的弊端也是对于引流类型的渠道而言很不公平,举例我们在一些公众号上投放非效果广告时候,用户会在电商或实体店这类购买渠道产生转化,如果使用这种模型来归因的话,对于公众号渠道是很不友好的。
马尔科夫模型
先解释下马尔科夫模型:是一种离散统计模型,主要应用于离散数学统计中,例如语音识别、文法分析等领域。马尔科夫模型认为,现在的状态只由过去的行为决定,而未来的状态只由现在的行为决定。
马尔科夫模型中发生的一系列时间和状态都是离散的过程成为马尔科夫过程,对于摩尔科夫过程中的每个当前状态的可能取值的条件概率,都可以通过之前的状态来统计得出。
说人话:在我们之前假设的广告场景中,假设ABCD四个渠道是四个互相关联的页面,A可以跳到B,B可以跳C,以此类推:
那么当我们大规模的统计ABCD四个页面的跳转行为之后,可以使用马尔科夫模型来建模,这样假设我们知道用户浏览了B页面时,那么就可以得出用户跳转到C页面的概率;
通过这种方式,我们就可以给所以广告投放链路上的渠道一个经过统计的系数,来标注该渠道对最终转化的贡献。
谷歌的Page Rank模型就是基于马尔科夫模型来计算的,需要长时间统计所有页面的跳转行为,经过计算分析,为每个页面生成一个PR值,来标识页面的质量。
而马尔科夫模型更适合的场景是语音识别,由Page Rank推而论之,我们说出来的句子中的每个词的顺序其实也是离散的,例如“我”后面跟着“们”这个字的概率,可以通过统计来得出。
选择最适合的而不是最好的
广告归因的方式和算法多种多样,核心的思路都是依赖用户识别之后的点击数据来分配转化贡献。
在我们实际应用中,还是开头的话,在我们实际广告归因场景中,不必要去追求更精准,更完美的归因方式,而是根据运营需要去选择最符合业务特性的方式,来达成业务目标。再这个基础上再从技术层面上做到更精准,更完美。