频数是指对某一随机事件进行重复观察时,其中某变量值出现的次数。了解数值变量的分布规律,当观察单位较多时可通过资料整理编制频数分布表(简称“频数表”)。
(一)频数分布表的编制
例7.1 某地101例健康男子血清总胆固醇值(mmol/L)测定结果如下:
1.编制步骤
(1)计算全距:一组变量值最大值和最小值之差称为全距,亦称极差,常用R表示。本例最大值为6.78,最小值为2.80,全距R=6.78-2.70=4.08(mmol/L)。
(2)确定组数和组距:组数一般根据研究目的和观察单位的个数确定,组数过多,计算繁琐;组数过少,误差加大。一般取8~15个组为宜。
组距=全距/组数,一般用i表示,本例组距=4.08/10=0.408(mmol/L),取整数为0.4(mmol/L)。
(3)划分组段:即确定各组的上下限,每个组段的起点称组下限,终点称组上限。第一组要包含最小值,最后一组要包含最大值。在编制频数表时,为避免相邻组段变量值归组混乱,一般只写出各组段的下限,不写出其上限,用“本组段下限~”表示,但最后一组要同时写出其下限和上限。(www.xing528.com)
(4)列表划记:将原始数据采用划记法或计算机汇总归入各相应的组段,计算各组段中观察值的个数即频数,如表7-1。
表7-1 某地101例健康男子血清总胆固醇值(mmol/L)的频数分布
(二)频数分布图
为了更直观了解频数分布情况,可以频数分布表中的数据为基础,绘制频数分布图来表达数据的分布情况见图7-1。
图7-1 某地101例健康男子血清总胆固醇值(mmol/L)的频数分布
(三)频数分布特征
从表7-1和图7-1可以看出频数分布的两个重要特征,即集中趋势和离散趋势。如上例中101名健康男子血清总胆固醇值虽然高低不等,但大多数集中在中央部分,为集中趋势;其余各组段分布较少,为离散趋势。
根据频数分布的两大特征可进一步确定频数分布的类型,一般分为对称分布和偏态分布两种。对称分布是指集中位置在中间,左右两侧频数分布大体对称。偏态分布是指集中位置偏向一侧,频数分布不对称。若集中趋势偏向于数值小的一侧,称为正偏态分布;若集中趋势偏向于数值大的一侧,称为负偏态分布。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。