数据收集

1、数据运营的步骤规划

数据化运营步骤


2、常见的数据获取方式

当我们从各种网站分析的报表中解读各种指标和数据时,需要去了解他们的定义和计算规则,其中必须具备的基础知识便是在网站中通常以何种形式获取数据。

2.1 数据的来源

网站的日志文件

网站的应用服务器输出的日志所记录的其实是用户终端为了满足用户的访问需要,对服务期发起的所有的资源请求,这些资源不仅包括页面请求,页面展现的所有相关元素请求也会被记录。如图片、CSS、文件,另外一些iframe也会被当成请求记录。

Web Beacons

在需要统计的网站页面或者模块上嵌入一个1*1 像素的透明图片,用户完全察觉不到,当用户访问该网页的同时会请求透明图片,并完成页面访问的记录工作,就像是在纸上画了一个不易看到的小点。

JS页面标记

JS页面标记同样需要在页面端处理,只是嵌入的不再是图片,而是JS标记代码。

2.2 日志格式解读

Apache 日志格式解读

3、数据采集内容介绍

3.1 动作事件介绍

Web平台:用户通过在网站应用的一个页面上:点击了一个页面元素;浏览了一个页面元素;

提交了一个表单;修改了某个输入框

移动平台:用户在移动应用中:点击了一个控件元素;浏览了一个控件元素

小程序平台:用户在微信中访问了小程序的一个页面上:点击了一个页面元素;提交了一个表单;修改了某个输入框

3.2 动作事件内容

用户信息:描述用户的信息,如:用户ID(访问 or 登录)

时间信息:事件发生的时间

行为信息:用户做了什么样的行为,比如,浏览、点击、输入了文本框

行为对象信息:用户的行为作用在哪些对象上,比如:点击了按钮 A;浏览了页面 B;修改了文本框 C,那么 A, B, C分别就是用户行为作用对象。

行为内容信息,比如是哪个产品?下的订单号是多少?

4、数据采集的来源

4.1  无埋点属性

4.1.1 访问事件的属性

用户设备信息、操作系统及版本、设备品牌、设备型号、设备类型(手机/平板)、设备制造商、浏览器及版本、系统语言、屏幕大小、设备方向、用户位置信息、国家、地区、城市名称、国家代码、用户访问的应用信息、网站/手机应用、App版本、用户落地页信息、域名、

页面、访问来源、页面来源

4.1.2 页面事件的属性

用户当前访问的页面信息、域名/包名、页面、查询、页面来源、动作事件的定义

4.2 埋点事件的分类

一个埋点事件由以下几个部分构成:

用户信息;时间信息;埋点事件标识;埋点事件属性

按照埋点事件的发送位置不同,埋点事件可以分为 客户端埋点和服务端埋点两大类:

客户端埋点:

服务端埋点:


4.3 外部访问来源的采集

对于PC端来说,常见的访问渠道有直接访问、搜索引擎和外部链接。浏览器会记录下访问来源,从而判断出用户的访问渠道。

UTM是一套标准的跟踪渠道流量的参数,全名是Urchin Tracking Module,设定好UTM参数,即可追踪网站/活动的流量来源,不同流量来源所占的比例等。你可以通过它来跟踪访问你网站的流量来自于哪些渠道、哪些媒介等。

UTM有五大参数,详情介绍如下:

● 来源(utm_source) :用来标识流量来源网站、搜索引擎或其他来源。示例:utm_source=baidu

● 媒介(utm_medium) :用来标识媒介,比如电子邮件或每次点击费用。示例:utm_medium=cpc

●名称(utm_campaign):用来标识特定的产品推广活动。示例:utm_campaign=summer_spread

● 关键字(utm_term):常见于付费关键字广告所使用的字词或是连结名称/图片的替代文字。示例:utm_term = web+analysis

● 内容(utm_content) :使用utm_content区分指向同一个网址的广告或链接。示例:utm_content=logolink或utm_content=textlink

UTM参数包括了utm_source在内的5个参数,分别是:

参数名称描述

比如,我们做了一个主题为「免费试用」的市场活动,针对这个活动,我们还做了A、B两个版本用于测试,然后我们将这个活动信息通过朋友圈进行自传播。 那么,这个活动的链接就是:

   http://zhugeio.com/tryfree?

    utm_source=pengyouquan&  //来源:朋友圈

    utm_medium=SNS&  //媒介:社交网络

    utm_campaign=tryfree&  //活动:免费试用

    utm_content=A  //内容:A

常用问题的解答:

https://www.ichdata.com/guidelines-for-the-use-of-utm-parameters-for-google-analytics.html

网址构建器:

https://ga-dev-tools.appspot.com/campaign-url-builder/

3.2 用户识别

网站分析的主体对象是用户,用户的一次下单或访问,一笔业务的谈成。

对于用户的识别,分网页和APP、访客和注册用户。

访问用户

网页的访问用户识别依据为cookie,APP的访问用户识别为设备ID。

其次还有IP,但IP识别存在着公用IP的情况,所以对于用户的识别并不那么精准,可作为参考。

登录用户

一旦成为注册用户,就能获取到用户的邮箱、电话、手机、身份证号等。相对来说,这些身份信息更为精准。

偏效果的分析,可使用注册账号来分析;偏行为的分析,可使用cookie和设备ID等。数据采集中关键在于不同日志

车牌也是线下的身份识别依据。

3.3 点击流模型

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,590评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,808评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,151评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,779评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,773评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,656评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,022评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,678评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,038评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,756评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,411评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,005评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,973评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,053评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,495评论 2 343

推荐阅读更多精彩内容