中位数和众数是根据《数学课标》的要求新增加的教学内容。在平均数不能有效地反映出一组数据的基本特点时,往往选用众数或中位数来表达数据的特点。
平均数、中位数、众数这三个统计量虽然都代表一组数据典型水平或集中趋势的量,但是它们反映数据的特征有所不同。
下面谈谈这三种统计量之间的异同点:
一、平均数、中位数、众数的相同点.
平均数、众数和中位数都叫统计量,它们在统计中,有着广泛的应用。平均数、中位数、众数都是描述数据的集中趋势的 “特征数”,平均数、中位数和众数从不同侧面给我们提供了同一组数据的面貌,平均数和中位数都有单位 (众数如果表示的是数时,也有单位);它们的单位和本组数据的单位相同。三者都可以作为一组数据的代表。
二、平均数、中位数、众数的不同点
(一) 三者的定义及优缺点不同。
1.平均数。
①平均数的定义及特点。
小学数学里所讲的平均数一般是指算术平均数,也就是一组数据的和除以这组数据的个数所得的商。
在统计中算术平均数常用于表示统计对象的一般水平,它是描述数据集中程度的一个统计量。既可以用它来反映一组数据的一般情况 (用平均数表示一组数据的情况,有直观、简明的特点),也可以用它进行不同组数据的比较,可以看出组与组之间的差别。平均数反映一组数据的平均水平,与这组数据中的每个数都有关系;用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,所有的数据都参加运算,对这些数据所包含的信息的反映最为充分,因而应用最为广泛,特别是在进行统计推断时有重要作用,但计算较繁琐,并且易受极端数据的影响。在平均数中有一种去尾平均数,它是将一组数据的其中一个最大值和一个最小值去掉后其余数值的平均数.它保留了平均数的集中趋势代表性强的优点,又具有中位数的可排除个别数据变动较大所带来的影响的特点,因而当一组数据的个数较少、且可能个别数据变动较大时,常用去尾平均数去描述一组数据的集中趋势.例如,体操比赛时给每个运动员评分,实际上用的就是去尾平均数:若干个裁判员同时给一个运动员完成的动作评分;然后在去掉其中一个最高分和一个最低分后,将其余分数的平均数作为该运动员的得分。
②平均数的优点。
反映一组数的总体情况比中位数、众数更为可靠、稳定,它也是学生今后学习计算离差、相关和统计推断的基础。
③平均数的缺点。
平均数需要整批数据中的每一个数据都加人计算,因此,在数据有个别缺失的情况下,则无法准确计算。一组数据的每一个数据都要参加计算才能求出,特别是当一组数量较大的数据,其计算的工作量也较大。平均数易受极端数据的影响,从而使人对平均数产生怀疑。这也就是为什么在许多竞赛场合下对评委亮分后的成绩分数,要去掉一个最高分和一个最低分,尔后再计算平均数的一种考虑。
2.中位数。
①中位数的定义及特点:一组数据按大小顺序排列,位于最中间的一个数据 (当有偶数个数据时,为最中间两个数据的平均数) 叫做这组数据的中位数。用中位数作为一组数据的代表,可靠性不高,但受极端数据影响的可能性小一些,有利于表达这组数据的 “集中趋势”。
②中位数的优点。
简单明了,很少受一组数据的极端值的影响。
③中位数的缺点。
中位数不受其数据分布两端数据的影响,因此中位数缺乏灵敏性,不能充分利用所有数据的信息。当观测数据已经分组或靠近中位数附近有重复数据出现时,则难以用简单的方法确定中位数。
3.众数。
①众数的定义及特点。
几组数据中出现次数最多的那个数据,叫做这批数据的众数。用众数作为一组数据的代表,可靠性较差,但众数不受极端数据的影响,并且求法简便,当一组数据中个别数据变动较大时,适宜选择众数来表示这组数据的 “集中趋势”。一组数据中某些数据多次重复出现时,众数往往是人们尤为关心的一个量,但各个数据的重复次数大致相等时,众数往往没有特别意义。如果一组数据中出现频数 (一组数据中每个数据出现的次数成为频数) 最多的是并列的两个数,不是用这两个数的平均数做它们的众数,而是说这两个值都是它们的众数。如果一组数据中没有哪一个数值出现的次数比别的多,我们就说它们没有众数。没有众数,不能说众数为 O。众数也可能不是数。
例如:2002 年 8 月,某书店各类图书销售情况如下图:8 月份书店售出各类图书的众数是 ——。
回答应该是:8 月份书店售出各类图书众数是文化艺术类。
②众数的优点。
比较容易了解一组数据的大致情况,不受极端数据的影响,并且求法简便。
③众数的缺点。
当一组数据变化很大时,它只能用来大略地估计一组数据的集中趋势。
(二) 三者的计算方法不同。
1.求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。
2.求中位数时,首先要先排序 (从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。
3.众数由所给数据可直接求出,出现次数最多的数据就是众数。
(三) 三者的适用范围不同。
1.平均数的计算中要用到每一个数据,因而它反映的是一组数据的总体水平,选择特征数表示一组数据的集中趋势时,我们用得最多的是平均数,用它作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数据都有关系,能够最为充分地反映这组数据所包含的信息,在进行统计推断时有重要的作用,但容易受到极端数据的影响。在大多数情况下人们喜欢使用平均数这一指标来代表一批数据或用它来反映大量事物的整体水平。
例如:用平均分反映一个班级学生的某项能力测验结果;用平均分来集中概括一些竞赛场合下各位评委对参赛选手进行评分的总结果等等。
2.中位数是一组数据的中间量,代表了中等水平。中位数在一组数据的数值排序中处于中间位置,在统计学分析中扮演着 “分水岭” 的角色,由中位数可以对事物的大体趋势进行判断和掌控。在个别的数据过大或过小的情况下,“平均数” 代表数据整体水平是有局限性的,也就是说个别极端数据是会对平均数产生较大的影响的,而对中位数的影响则不那么明显。
所以,这时用中位数来代表整体数据更合适。即:如果在一组相差较大的数据中,用中位数作为表示这组数据特征的统计量往往更有意义。
例如:甲乙两学生射击的环数如下:甲:10 环、10 环、9 环、3 环。乙:9 环、5 环、3 环、2 环。请你试一试如何评价他们的射击成绩。这里甲有 2 个 10 环,1 个 9 环,一个意外的 3 环,对于这个 3 环,可以看作是一个奇异值或极端数据,如用平均数来评价甲的总成绩就不能客观反映甲的射击环数主要是 9 环与 10 环的事实。由于数据中有一个极低数值出现,故计算平均数时就一下子把分数降下来了。采用中位数 9.5 环较合适。乙的射击成绩中 5 环以下有 3 次,还有一次是意外的 9 环,对这组数据,如计算平均数后是 5 环,但用 5 环来代表乙的成绩在一定程度上偏高估计了乙的总体成绩,所以采用中位数 4 环比较合宜。
3.众数代表的是一组数据的多数水平,若一组数据中众数的频数比较大,并且与其他数据的频数相差较大时,我们一般选用众数。众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
例如:,某班 42 名同学,年龄 11 岁的有 24 个人,年龄 10 岁的有 8 个人,年龄 12 岁的有 6 个人,年龄超过 12 岁的有 4 个人。则该班同学年龄分布的众数为 11 岁,它表明该班年龄为 11 岁的同学最多。(注意众数不是 24 人)
总之,平均数、中位数和众数从不同的侧面向我们提供了一组数据的面貌,我们可以把这三种特征数作为一组数据的代表,但它们所表示的意义是不同的。
选用它们表示一组数据的集中趋势时,一般是遵循 “多数原则”,即哪种特征数能代表这组数据的绝大多数,正确选用合适的特征数来说明、评价、分析实际问题,避免误用和滥用。关于平均数、中位数、众数的知识我们可以总结为:
分析数据平中众,比较接近选平均,相差较大看中位,频数较大用众数;
所有数据定平均,个数去除数据和,即可得到平均数;大小排列知中位;
整理数据顺次排,单个数据取中问,双个数据两平均;频数最大是众数。