1 数据分类
1.1 数据类型
统计数据是采用计量尺度对事物进行计量的结果,不同的计量尺度会得到不同类型的数据。统计数据可分为以下四种类型:
1、定类数据
表现为类别,不区分顺序,是由分类尺度计量形成的。即将观察单位按照属性或分类分组,清点各组的观察单位数。如性别数、班级数、产品按合格和不合格进行计数等。定类数据只能计算频数,不能进行大小比较。
2、定序数据
表现为类别,但有顺序,由定序尺度计量形成。如产品按照一等品、二等品、三等品计数。
3、定距数据
表现为数值,可进行加减运算,由定距尺度计量形成。如身高、体重、收入等。
4、定比数据
表现为数值,可进行加减乘除运算,是由定比尺度计量形成。
定类和定序数据说明的是事物的品质特征,不能用数值表示,结果均表现为类别,因此被称为定性数据(Qualitative data);而定距和定比数据说明的是现象的数量特征,可以用数值表示,因此被称为定量数据(Quantitative data)。
不同类型的数据将采用不同的统计方法来处理和分析。
1.2 农业统计数据类型
在农业田间试验中,数据一般分为数量性状资料(Quantitative trait)和质量性状资料(Qualitative trait)两类。
1、数量性状资料
数量性状是指能够以量测或计数的方式表示其特征的性状。数量性状资料又包括计量资料和计数资料两种。
1)计量资料:用量测方式获得的数量性状资料。具体数值不一定是整数。也被称为连续性变量资料,数据之间的变异是连续的。如小麦株高(株高可以是92cm、94cm,也可以是93.5cm)、千粒重等。
2)计数资料:用计数方法获得的数量性状资料。只能以整数表示。如单位叶面积病斑数等。也被称为不连续性变量资料。
2、质量性状资料
质量性状又称属性性状,是指能观察到而不能直接测量的性状。这类性状不能直接用数值来表示,要想获得数据资料,需要对其观察结果作数量化处理。如小麦芒的有无,颖壳等器官的颜色等。
1)统计次数:根据某一质量性状的类别统计其次数,以次数作为质量性状数据。比如统计100株玉米植株中,发生锈病植株的株数。
2)评分法:用数字级别表示某种现象在表现程度上的差别。比如小麦感染锈病的严重程度分为0(免疫)、1(高度抵抗)、2(中度抵抗)、3(感染级)。
参考文献
王斌会,《数据统计分析及R语言编程》,北京大学出版社,2014.
明道绪,《田间试验与统计分析》,科学出版社,2005.