我们可能因为相信虚假而受骗,自然,我们也会因为相信真实而受骗
互联网数据最重要的部分是用户的行为分析,挖掘用户偏好能更好的实现商业的价值,同时,异常的行为分析也是对用户的一种安全防护措施。用户行为简单的可以分为五个要素:时间、地点、人物、交互和内容。在获得网站或APP等平台访问量基本数据的情况下,对有关数据进行统计、分析,从中发现用户访问网站或APP等平台的规律,并将这些规律与网络营销策略等相结合,从而发现目前网络营销活动中可能存在的问题,并为进一步修正或重新制定网络营销策略提供依据。
只有做了用户行为分析才能知道用户画像、才能对用户各种行为做一个初步的预判,进而对行为产生一个长效的统计分析。分析目的的一种是关注流失,尤其是对转化有要求的网站。用户行为分析帮助分析用户怎么流失、为什么流失、在哪里流失。当你有了很多用户行为数据、定义事件之后,你可以把用户数据做成一个按小时、按天,或者按用户级别、事件级别拆分的一个表,从而为后期的商务行为做一个参考。
正常行为分析
正常行为分析的目的在于数据驱动增长,数据驱动增长的关键在于指标。
硅谷公司用数据去实现驱动业务增长,主要有三个目标:
1)提升关键指标
2)改变产品体验
3)优化运营流程
如果细分,还可以分为:拉新、转化、促活、留存和变现。
拉新的场景在于分析SEM(search engine marketing) 和 SEO (search engine optimizing) 的每个关键词的 ROI(投资回报率:return on invest)。同时还有 各个合作伙伴的渠道导流情况。尤其是搜索引擎,关键词带来的流量是可观的。这些流量只能带来用户,至于是否达成商务行为,还要结合自身的数据进行统计。
转化率是一个数据分析的重要指标,与之相对应的一个词是流失率。定义入口,统计事件只是一个起点,对于最终的结果只是一个借鉴,落地的还是决策。一种提高转化率的决策是,分析用户从进入-注册-验证-登陆-使用的整个过程,通过漏斗分析,检验每个环节的流失率,优化流程,提高用户转化。
促活是对产品内容及流畅度的一个检验。通过分析用户行为,统计用户页面停留,完善用户画像,进而精准分析定位,从而个性化推荐愈加精准。
用户流失,在时间的长河中是一种自然而然的事情。每个产品都有自己的寿命,我们所做的只是延缓或者重生。这也是分析留存的一个主要的目的。通过对用户行为的一个长期的追踪,有了这些数据的支撑,分析哪些使用造成了流失,哪些使用更好的维护了用户关系,便能更好的维护一个商业的变现。
商业变现是检验一款产品是否成功的一个重要指标,当然非盈利机构除外。一款产品会有它独特的盈利点,找到并有效的接入才能维护产品的正常迭代。商业变现有直接变现和间接变现之分,直接变现以直接打成交易为主,例如O2O等。间接变现通过广告、导流等产生可观资金流。
至于手段,我们后面会说。
增长黑客
数据驱动增长,关键在于提升关键指标、改善产品体验、优化运营流程。如果没有长期的数据统计分析,对于这些无异于盲人摸象。这也即是我们常说的,数据是一切的基石。
提升关键指标,最好是一个转化率,而不是UV、PV这种简单的数字,因为这些肯定会提升;改变用户体验,主要在于细节的把控,人以貌相,除非是大家不得不用的工具型垄断软件,大部分软件,UI是留住客户的第一步,然后是产品使用体验,流畅度、响应速度等;优化运营流程,重点在于简化,如无必要,勿增实体,把那些太过于复杂的功能重新梳理,有些事直接一点反而更好。
产品决定了你获取用户数据的基本面。不同的用户层面和产品形态也可能导致不论怎么努力就是无法快速获取用户的结果。那么,什么样的产品或者功能能快速获取用户呢?
1)用户使用频率高
2)用户密度大
3)一个动作所覆盖的人数
满足了以上条件的产品,想要快速获取用户就很容易了,下面是一个互联网产品的用户增长模型:AARRR模型。
所谓AARRR用户模型其实就是“获取(Acquisition)”、“激活(Activation)”、“留存(Retention)”、“传播(Referral)”、“收入(Revenue)”。从上面的AARRR模型图我们也可以看到,其实它是一个漏斗,从用户获取到激活到留存,留存到传播和收入就是一个自上而下的漏斗,越往下越窄。理想的境况下,我们都希望这是一个圆柱体,但显然这是比较困难的,而我们要做的就是精细化分析用户获取到收入的整个过程。
常用手段简单介绍如下:
创造更多的着陆页
付费广告应该有针对性的链接到相应的着陆页上,而不是主页
建立定向的LINK-TRACKING(链路跟踪)
删除着陆页上不重要的链接
使用qualaroo等调查工具得到客户反馈
购买统计数据的工具
拆分用户需求
大量的A/B Test
CTA(Call to Action 期望用户进行的操作)使用更强的对比色
将CTA放在右侧
在页面的最下方重复你的CTA
在页面上写上你对用户做出的保证(不会透露用户信息等)
立刻显示验证(如填写表单时)
……
增长黑客,简单来说就是建立一个增长黑客的坐标系。增长黑客是通过快速的迭代试验找到实现产品增长的有效方法。我们的终点是实现产品有效增长,为了到达这个终点,我们需要在三个方面努力,第一点是找到努力的起点,第二点是找到努力的方向,第三点是加快努力的程度。
用一个等式表示就是:起点+方向+行动=终点。增长黑客的革命性方法就在行动上。增长黑客的核心实际上类似于敏捷开发,只不过增长黑客是以运营人员为中心,敏捷开发是以产品经理为中心。
异常行为分析
基于深度学习的Action Recognition(行为识别)是目前AI研究的一个方向,也是当下发表论文比较多的一个领域。
目前谈论比较多的大概有以下几个方向:
混合代理方法检测拥挤场景中异常行为
老年人动作识别和异常行为检测
基于视频的异常检测
行人检测和路径分析
导航,包括监控行为和检测异常
医疗健康和其他相关领域异常行为的识别
人类活动识别(HAR)
智能家居行为预测
笼统的概括可分为:Structure、Inputs和Connection。
行为可分为个人行为和群体交互行为,在真实情境下,异常行为的发生经常伴随猛烈的动作,例如,突然速度加快;或是在恐慌情境下,在一个局限的区域中混乱的运动,与周围人动作的对比。将人群行为作为一个Bag-of-words模型,通过静态和动态代理的信息整合,来确定人群行为的异常。静态代理用来处理某个特定的点,用来分析该点周围的动作信息。动态代理用来处理一个移动的目标,分析目标运动和周围人的动作信息。即是所谓的混合代理模型。
其他如活动识别被认为是一个序列标签问题,而异常行为是基于与正常模式脱离标记的。
基于视频异常检测最基本的方面,即视频特征表示。大部分研究工作都是在寻找一种合适的表示方法,以便在视频流中,以可接受的误报率,准确的检测异常。然而,由于环境和人类动作的大量变化,这是个巨大的挑战,由于高维度的数据特征带来了较高的空间时间复杂度。深度学习算法的弱监督特性可以帮助从视频数据本身中学到表示方法,而不用手动地从某个特定场景下设计合适的特征,以此对视频表示建模。
关于导航,深度学习这方面最近的研究已经证实了从数据中直接学习特征的能力,并且循环神经网络相关的研究已经表明了序列到序列问题的典型结果,例如神经机器翻译和神经图像标题生成。受到这些方法的激励,在给定一段较短的关于某个行人的历史数据、其周围的人和过去的行为,来预测行人的下一步动作。这个方法的创新点在于其结合了关注模型,这种模型使用了软关注和硬关注,来映射从局部邻域到关注的行人的未来位置的轨迹信息。关注权重(如硬连线)的一个简单的近似值是如何与软关注权重混合一起,在有着几百相邻人的真实世界情境下使得模型更可靠。此外,这个架构可以直接应用于异常事件检测中而不需要手工特征。
异常行为识别在医疗健康和其他相关领域也引起了很大的关注,特别是对老年人的身心健康,坠落及其他疾病、衰老等方面引起了越来越多的关注。基于坠落检测技术的设备可以有效实时地监控坠落事件的发生,并帮助受伤人员接受急救。然而,对于坠落检测和监控,传统方法的内置分类器尽管可以达到一个相对高的检测正确率,但是其误报率过高,进一步地,由于异常行为的传感器数据在真实应用中很稀少,这种方法必须面对这种不平衡问题。为了处理这个难题,使用一种对于眼睛、手表等可穿戴物品的two-stage adaptive weighted extreme learning machine(AWELM)的方法来检测和监控坠落。这种方法,通过两阶段识别计划,实现了高检测准确度和误检率之间的平衡;其次,通过两阶段自适应权重方法,使得对于稀少的异常行为数据的不平衡学习方法变得有效;第三,使用极值学习机,提出一种轻型的分类方法,处理可穿戴设备的资源限制,来加速训练和更好的泛化,这使得大范围的健康应用成为可能,特别是最终帮助老年人减少坠落事件的风险。
人类活动识别(HAR)在健康和社会保健领域也是一个相对活跃的研究课题。基于HAR的深度摄像机,从人类深度轮廓,通过传统的分类器,比如Hidden Markov Model (HMM),Conditional Random Fields等抽取的特征,识别人类活动。另外,使用循环神经网络(RNN,深度学习算法的一种)的HAR系统,利用多个随时间变化的关节角度,来表示时空特征矩阵(即时间上的多个身体关节角度),能够可靠地识别12种人类活动,并且比HMM和DBN的性能要好。
行为识别是深度学习还未完全攻克的领域,虽然现在已经有了一些特殊的手段来统计分析,但还有很大的空间。在没有找到更好的模式去表达时,最妥帖的方式是真实记录。