(一)正态分布的概念
正态分布也称高斯分布,是医学和生物学最常见的连续性分布,如身高、体重、红细胞数、血红蛋白等。
正态分布以频数分布为基础,随着组段不断细分,频数分布图中的直条逐渐变窄,呈现中间高、两侧逐渐降低的完全对称的特点,接近于一条光滑的曲线(图7-2)。
图7-2 频数分布逐渐接近正态分布示意
正态分布的曲线高峰位于中央,两侧逐渐下降并且完全对称(图7-3)。高斯用数学函数表达正态曲线,表达式为:
π为圆周率,e为自然对数的底,μ和σ为不确定常数,分别代表总体均数和总体标准差。
图7-3 正态分布曲线示意图
(二)正态分布的特征
1.集中性 正态曲线的高峰位于正中央,即均数所在的位置。
2.对称性 正态曲线以均数为中心,左右对称。
3.正态分布有两个参数 即均数μ和标准差σ。μ决定曲线中心对应在横轴上的什么位置;σ决定曲线的形态。当σ不变,μ变小,曲线中心左移,反之,曲线右移;当μ不变,σ越小,则数据分布越集中,曲线越高耸,反之,则曲线分布分散,曲线平坦(图7-4)。
图7-4 不同均数与自由度下的正态分布曲线
4.标准正态分布 当总体均数μ=0,总体标准差σ=1时的正态分布称为标准正态分布,亦称z分布。
式中:μ为标准正态变量;x为原正态分布变量。(www.xing528.com)
(三)正态曲线下面积有一定的分布规律
无论μ、σ取什么值,正态分布都具有一定的面积规律(图7-5)。
1.μ±σ范围内的面积是正态曲线下总面积的68.27%。
2.μ±1.96σ范围内的面积是正态曲线下总面积的95.00%。
3.μ±2.58σ范围内的面积是正态曲线下总面积的99.00%。
图7-5 正态曲线下的面积分布规律
(四)正态分布的应用
正态分布在医学领域中应用很广。
1.制定医学参考值范围 参考值范围也称为正常值范围。医学上常把绝大多数正常人的某指标范围称为该指标的正常值范围。这里的“绝大多数”可以是90%、95%、99%,最常用的是95%。参考值的表达式为±zαs。
双侧95%的界限值为: ±1.96s
单侧95%的上限值为:+1.645s
单侧95%的下限值为:X-1.645s
例7.13 某地调查了360名成年男子的平均血红蛋白,发现呈近似正态分布,得X—=13.54g/100ml,s=0.71g/100ml。如何估计该地成年男子血红蛋白95%的参考值范围?
该地成年男子血红蛋白95%的参考值范围为:
即该地成年男子血红蛋白95%的参考值范围为(12.06~14.84)g/100ml。
2.质量控制 常以±2s作为上、下警戒值,以±3s作为上、下控制值。
3.正态分布是很多统计分析方法的理论基础。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。