数据分析师业务模型基础篇

一、数据分析的定义:

数据分析的目就是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。


二、数据分析过程:

第一步、以事实为基础提出假设,界定问题

第二步、将问题细分,形成互不重叠的子问题

第三步、进行数据收集与分析,证实或者证伪假设的问题

第四步、提出方案,推进问题的解决

第五步、执行方案,验证数据分析。


三、数据的种类:


统计学上把数据分为三类,分类数据,顺序数据,数值数据

分类型数据:主要是对事物的类别进行描述,比如电商网站中的品类,社交系统中用户的等级

顺序型数据:顾名思义,就是按照顺序排列的数据,这种数据也是文字的,如时间顺序,空间顺序,优先等级

数值型数据:最常见的数据类型,用数字或文字描述事物,是 数据分析的主要来源


四、数据分析的种类有三种:


1,描述性数据分析:常用对比分析法,平均分析法,交叉分析法。

算数平均数:算数平均法和加权算术平均法简单方便,容易受异常值影响。

几何平均数:主要用于 对比率,指数进行平均,用来计算平均发展速度,用来计算复利下的平均年利率,在变量可能为负数和零的时候,不能使用,当数据呈倍数关系或者不对称分布时适用性强。

调和平均数:也叫倒数平均数,主要是用来解决无法掌握总体单位数的情况下,只有每组的变量值和相应的标志总量,而需要得到平均数的问题,通常在遇到需要计算平均速度,平均利润,平均成本指标时使用,尤其是观测值是阶段性变异的资料。

2,探索性数据分析:相关分析法,因子分析法,回归分析法

3,验证性数据分析:同上


五、数据分析的作用


主要三作用:现状分析,原因分析,预测分析


六、数据分析操作过程:


1.明确目标:搜集和明确数据分析上下游需求,资源,能力和表达形式,时间节点等。

2.数据获取:从数据库,公开出版物,互联网,市场调查等方面搜集数据。

3.数据清洗:数据清洗,数据转化,数据提取,数据计算,具体包括数据整理入库,去除无效  数据,填充缺失信息,选择变量

  第一阶段:预处理,数据导入,元数据分析,观察数据,一般来说100万条以下用excel,单机大量  100万条以上MYSQL+Navicat,单机海量1000万条以上,文本文件+python

  第二阶段:去除补齐有缺失的数据

  第三阶段:去除修改格式和内容错误的数据

  第四阶段:去除不需要的数据

  第五阶段:去除不需要的数据

  第六阶段:关联性验证

4.数据整理:数据离散化,数据标准化,对数据进行重新编码,对数据表进行统计计算,生成各级指标,主要的目的是将清洗后的数据进行统一格式,集中存储。

5.数据分析:数据分析是将处理后的数据进行建模分析,描述分析,模型测试,价值提取,高层次的分析方法也叫数据挖掘,数据挖掘侧重解决四类问题,分类,聚类,关联,预测

6.数据展现:饼图,柱状图,条形图,折线图,雷达图等等

7.报告撰写:将模型加载,对数据分析过程总结和呈现‘


七、数据分析报告逻辑


结论先行,数据跟上,逻辑自恰,描述观点,一般以总分总模式为主;


八、数据分析模型:


事实上是使用常见的企业分析方法论,设计数据分析的维度和范围,常用的方法包括

1、思考模型

5W+2H:为什么,什么目的,谁,那个领域,什么时候,怎么做

金字塔模型

鱼骨图模型

事实--解释--行为

水平思考,事实,感情,批判,乐观,创造,宏观

2、战略分析工具

战略-3C 公司,对手,顾客

战略规划,横轴表示竞争要素,纵轴表示竞争水平

对业务进行优先排序,纵轴表示公司优势,横轴表示市场价值

SWOT矩阵,优势,弱点,机会,危机

影响要素,五个力分析,供应链的变化,需求链变化,技术冲击,新进入者,有无替代者

组织7S,保持战略,共同价值,结构,体制,员工,技能,组织文化


3.市场营销分析模型


市场4P,产品,价格,渠道,广告

销售漏斗模型

根据收入分类的家庭数量的相对度分布,

人口分布曲线,

意愿能力矩阵

用户发布,技术革新者,有号召力的人,早期用户,后期跟风,滞后采用的

服务营销三角形,服务营销的渗透的过程中,最初关注功能,然后转移到渠道,最后由品牌影响力

PPM分析,纵轴表示成长率,市场占有率,分为,儿童业务,明星业务,瘦狗业务,现金牛

VRIO分析,价值,稀缺性,跟进难度,组织能力

4.常见管理模型


六西格玛

PDCA循环,计划,实施,改善,验证,

价值链,横轴表示研究,开发,采购,生产,流通,销售,售后,纵轴表示竞争对手

紧迫性和重要性的矩阵,重要性和紧迫性


九、数据挖掘模型


聚类:kmeans、系统层次聚类

分类:相似度计算、决策树

回归:逻辑回归,线性回归

降维:主成分分析、因子分析,对应分析/mds

文本挖掘:Word2vec、DOC2ver/LDA、文本相似度计算

时间序列等等

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,839评论 6 482
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,543评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 153,116评论 0 344
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,371评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,384评论 5 374
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,111评论 1 285
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,416评论 3 400
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,053评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,558评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,007评论 2 325
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,117评论 1 334
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,756评论 4 324
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,324评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,315评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,539评论 1 262
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,578评论 2 355
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,877评论 2 345

推荐阅读更多精彩内容