【摘要】:图4.1众数、中位数和均值的关系图2)众数、中位数和均值的特点与应用场合众数、中位数和算术平均数各自具有不同的特点,掌握它们之间的关系和各自的不同特点,有助于在实际应用中选择合理的测度值来描述数据的集中趋势。因此,当数据为偏态分布,特别是偏斜的程度较大时,可考虑选择众数或中位数等位置代表,这时它们的代表性要比平均数好。
1)众数、中位数和均值的关系
图4.1 众数、中位数和均值的关系图
2)众数、中位数和均值的特点与应用场合
众数、中位数和算术平均数各自具有不同的特点,掌握它们之间的关系和各自的不同特点,有助于在实际应用中选择合理的测度值来描述数据的集中趋势。
①虽然对于顺序数据以及数值型数据也可以计算众数,但众数主要适合于作为分类数据的集中趋势测度值,而且众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。
②中位数以及其他分位数主要适用于作为顺序数据的集中趋势测度值,虽然对于顺序数据也可以使用众数,但以中位数为宜。
③算术平均数适合用于数值型数据的集中趋势测度值,特别是当分布比较规则,不存在极端值比较偏离现象时,用算术平均数代表集中趋势最合适,但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性差。因此,当数据为偏态分布,特别是偏斜的程度较大时,可考虑选择众数或中位数等位置代表,这时它们的代表性要比平均数好。
④算术平均数包含的信息是最多的、最丰富的,算术平均数具有两个重要的数学性质:所有观测值与算术平均数差的离差和等于零,如式(4.9)所示;所有观测值与算术平均数的离差平方和为最小,如式(4.10)所示。即(www.xing528.com)
表4.3列出了数据的类型和所适用的集中趋势测度值。
表4.3 数据类型和所适用的集中趋势测度值
注:∗表示该数据类型最适合用的测度值。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。