关于正态分布
正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution)。正态分布是统计学中一个重要的概率分布方法,在数学、物理及工程等多领域有着广泛的应用场景。
日常分析工作中,我们对企业业务进行数据分析时,常常需要监测数据的分布情况。让数据实现正态分布是很有效的监测方式。
正态分布图表横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率分布。
图片来自网络
那么,在 Tableau 数据分析中,如何实现正态分布呢?我们今天来分享两种方法吧!
本期《举个栗子》,阿达要给大家分享的 Tableau 技巧是:两种方法实现 正态分布 Normal distribution。
————————————————————————————》》
为方便学习,我们使用Tableau 自带的超市数据源。找不到自带数据源的数据粉,可以私信联系我。
我们分享两种实现正态分布的方法,数据粉可根据自己的能力选用。
具体步骤如下:
方法一 使用计算字段
STEP 1 : 连接数据源
首先,我们连接 Tableau 自带的超市数据源。
STEP 2 : 创建计算字段
接着,我们创建计算字段:正态分布
([利润]-{fixed:AVG([利润])})/{fixed:STDEV([利润])}
STEP 3 : 修改字段格式
然后,我们把度量改成维度,将连续改为离散;将记录数放在详细信息,如下图。
STEP 4 : 创建数据桶
建立数据桶,大小为1(实际工作中可自行调整);
最后,完成图形制作即可。
方法二 连接 R 语言
STEP 1 : 准备工作 安装 R
首先,做准备工作:安装R。
可以提前在网上下载好 R 的 安装包,注意安装和电脑系统匹配的 R 版本。
然后,打开 R 语言工具。
STEP 2 : 安装 R 语言包
接着,我们安装正态分布需要的 R 语言安装包,加载并开启以备 Tableau 工具连接。
命令为:
install.packages('Rserve') , library(Rserve) ,Rserve(),具体如下图:
当显示 StartingRserve...
"D:\R-35~1.1\library\Rserve\libs\x64\Rserve.exe" 表示开启成功。
此时,Tableau 就可以连接了。
STEP 3 : 连接 R
我们用 Tableau 连接 R,如下图。
STEP 4 : 创建计算字段
创建计算字段:正态分布 R
INT(SCRIPT_REAL('scale(.arg1)',SUM([利润])))
加载 R 中已经封装好的正态分布计算。
STEP 5 : 调整计算字段
最后,调整计算字段,完成图形制作。
今天的 Tableau 技巧,你 Get 到了吗?赶快试试看吧!
下一期《举个栗子》,再会~
文章部分信息来源于网络,如有侵权请告知!