睡前看到了群里的消息,就想着写写这篇文章。主要是因为公司的虚拟机突然断线了,没法工作了,所以就有时间干点其他事。
主要是这样一张表,非常简单,只要计算频数频率就可以了。
我们写一个简单的程序解决这个table。
看一下算出来的统计量:
做到这,一种做法是取每个组别的最后一个观测,最后转置一下就可以了
看下输出,col4就是合计列了,col1从上到下就是我们经常看到的N,平均值(标准差),中位数,最大值,最小值
还有一种做法就是在输出统计量的时候都用同一个变量代替,这样就不用排序取最后一个观测,能少写一段代码,但是得加上排序变量,否则转置不了:
求这种描述性统计量差不多就是步骤,但是要注意,我只是提供一个思路!
里面的统计量保留的小数位数要跟SAP要求的保持一致,而且一般一开始要求原始数据中的最大小数位数,然后再进行平均值标准差的那些统计量的计算!