上面我们谈到了均值、众数、中位数和取值范围。科学家描述直方图和一般数据图像的另一个常用词是对称(symmetry)。图像对称意味着什么?它意味着图像的右边是左边的镜像(当然,反之亦然)。
在木匠丽莎的木桩例子中,横坐标的数字代表木桩的长度,纵坐标的数字代表不同长度木桩的数量。
如果我们在丽莎的木桩直方图中间竖起一面镜子,我们会看到一张与原先图形十分相像的图(除了木桩长度)。
丽莎的木桩例子中绘制的直方图是对称的。
通过观察直方图,我们很容易看到数据集的众数和取值范围。当直方图对称时,我们能获得更多的信息。丽莎的木桩直方图能告诉我们什么?
首先,我们很容易看到数据的取值范围,即集合单元的最高值和最低值(在丽莎的木桩中,集合单元为长度。在水管渗漏例子的直方图中,集合单元为小时)。木桩的长度范围是7—9,我们不需要经过对称操作就可以获得这个信息。(www.xing528.com)
第二,我们很容易看出数据集的众数,它就是对应集合单元出现频率最高的数值。在丽莎的木桩中,长度为8的图像最高,因此我们知道木桩长度的众数是8。在水管渗漏的实验中,众数是7:00—7:59的时间段。我们不需要经过直方图对称操作就可以得到这个信息。
第三,我们能得出数据集的均值。因为直方图是以长度为8的木桩的图形为中心对称的,木桩长度的均值是8。
第四,我们能看到数据集的中位数。因为直方图是对称的,中间以上的数据点数量和以下的数据点数量是相同的。因此,在直方图中间的值是8(在这里,表示木桩长度),它不但是均值,还是中位数。
碰巧丽莎的木桩中间的最高,这就是众数与中位数和均值相同的原因。不是所有对称的直方图都有这种情况,但是对于一种非常重要的直方图是成立的,它叫钟形曲线(bell curve)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。