数据分析工具箱不自带任何数据,所以一打开是一片空白;需要自己上传excel数据(不要太大,否则很卡;而且会有文件大小上限)。
上传数据
上传excel数据之后(本文中的数据为模拟的随机数据),可以在【数据处理】TAB中即时看到预览数据;数据存在内存中,可快速计算——同时不会上传太大数据,否则内存会爆;另外刷新数据就没了。
上传完数据之后,会自动根据一些算法来对维度和度量进行划分。一般默认字符串是维度,数字是度量——不过如果日期是数字,也会被划入维度,数字是字符串也会被划入度量。
筛选数据
同时还可以在筛选文本框中输入dplyr
语法来进行数据筛选、切片、切块。
比如筛选channel为channel_1或channel_2的,则输入(channel == 'channel_1') | (channel == 'channel_2')
比如在此基础上想继续筛选同时is_new = 'new'的,则输入((channel == 'channel_1') | (channel == 'channel_2')) & is_new == 'new'
聚合数据
可基于筛选后的数据(也可以不筛选),选定任意的维度和度量,进行聚合(暂时只支持累加)。
比如想看每天的DAU:
比如想看每天分渠道、品牌和活跃度的DAU:
总之,通过上传数据,可进行筛选和任意维度的聚合计算;这一步的数据处理结果,将会是后续的每一个模块的主要的输入数据源。