首页 理论教育 概率与分布-实验设计与R语言应用

概率与分布-实验设计与R语言应用

时间:2023-11-24 理论教育 版权反馈
【摘要】:概率反映了随机事件出现的可能性大小。要全面了解一个随机变量,不但要知道它取哪些值,而且要知道它取这些值的规律,即要掌握它的概率分布。概率分布可以由分布函数刻画。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。

概率与分布-实验设计与R语言应用

概率反映了随机事件出现的可能性大小。随机事件是指在相同条件下,可能出现也可能不出现的事件。例如,从一批有正品和次品的商品中,随意抽取一件,“抽得的是正品”就是一个随机事件。在一定条件下,重复做n次实验,n_A为n次实验中事件A发生的次数,如果随着n逐渐增大,频率n_A/n逐渐稳定在某一数值p附近,则数值p称为事件A在该条件下发生的概率,记作P(A)=p。这个定义称为概率的统计定义。从概率的统计定义可知,对任意事件A,皆有0=<P(A)=<1,P(Ω)=1,P(Φ)=0。其中Ω、中分别表示必然事件(在一定条件下必然发生的事件)和不可能事件(在一定条件下必然不发生的事件)。

要全面了解一个随机变量,不但要知道它取哪些值,而且要知道它取这些值的规律,即要掌握它的概率分布。概率分布可以由分布函数刻画。若知道一个随机变量的分布函数,则它取任何值和它落入某个数值区间内的概率都可以求出。有些随机现象需要同时用多个随机变量来描述。例如,子弹着点的位置需要两个坐标才能确定,它是一个二维随机变量。类似地,需要n个随机变量来描述的随机现象中,这n个随机变量组成n维随机向量。常见的离散型随机变量包括以下几种:0~1分布(也叫两点分布或伯努利分布)、二项分布、几何分布、泊松分布、超几何分布。常见的连续型随机变量包括以下几种:均匀分布指数分布正态分布。其中正态分布是最常见、最重要的一种连续分布,在生物实验中应用广泛。

正态分布(Normal distribution),又名高斯分布(Gaussian distribution),是一个在数学物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态曲线呈钟形,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X服从一个数学期望为μ、方差为σ2的正态分布,记为N(μ,σ2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ=0,σ=1时的正态分布是标准正态分布。在R中有四个常用的正态分布函数如表5-1所示。

表5-1 四个常用的正态分布函数(www.xing528.com)

中心极限定理。概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。它是概率论中最重要的一类定理,有广泛的实际应用背景。当总体分布服从正态分布时,任意一个样本,无论样本容量多大,样本均值的抽样分布都服从正态分布。当总体分布不服从正态分布时,只要样本容量足够大(n>=30),即使样本的取值分布不是正态分布,样本均值的抽样分布也会近似服从正态分布。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈