例B.2.1 在例1.2.3中的有关画图和计算.
图B-1 N(0,1)的密度函数和分布函数曲线
说明在B-1中,“◦”表示标准正态分布的密度函数,“*”表示标准正态分布的分布函数.
例B.2.8 中国改革开放30年来的经济发展,使人民的生活水平得到了很大的提高,不少家长都觉得孩子这一代的身高比上一代有了明显变化.表B-5是近期在一个经济比较发达的城市中学收集到的17岁的男生身高数据(单位:cm).若表B-5中的数据来自正态分布,请根据表B-5中的数据,计算学生身高的均值和标准差的点估计(极大似然估计)和置信水平为0.95的区间估计.
解 输入命令
x1=[170.1,179.0,171.5,173.1,174.1,177.2,170.3,176.2,163.7,175.4];
x2=[163.3,179.0,176.5,178.4,165.1,179.4,176.3,179.0,173.9,173.7];
x3=[173.2,172.3,169.3,172.8,176.4,163.7,177.0,165.9,166.6,167.4];
x4=[174.0,174.3,184.5,171.9,181.4,164.6,176.4,172.4,180.3,160.5];
x5=[166.2,173.5,171.7,167.9,168.7,175.6,179.6,171.6,168.1,172.2];
x=[x1,x2,x3,x4,x5];
[mu sigma muci sigmaci]=normfit(x,0.05)
运行结果为
mu=172.7040,sigma=5.3707,muci=(171.1777,174.2303),sigmaci=(4.4863,6.6926)
表B-5 学生的身高
说明 把表B-3中pdf换成fit即为相应总体参数估计的函数.如对于正态总体,其命令格式为[mu sigma muci sigmaci]=normfit(x,alpha).
其中,x是样本观察值,1-alpha是置信水平(alpha的默认值时设定为0.05),输出mu和sigma是总体均值μ和标准差σ的点估计(极大似然估计),muci和sigmaci是总体均值μ和标准差σ的区间估计.
例B.2.9 (1)检验例B.2.8中男生身高的数据(见表B-5)是否来自正态分布.(2)已知30年前同一所学校同龄男生的平均身高为168cm,为了回答学生身高是否发生了变化,作假设检验:H 0∶μ=168,H 1∶μ≠168(显著性水平α=0.05).
解 (1)若已经输入了例B.2.8中男生身高的数据x.
输入命令
h1=jbtest(x)
运行结果为h1=0
注 h1=jbtest(x)是数据x服从正态分布检验的输入命令,h1=0表示通过了数据的正态性检验.
这也说明了在例B.2.8中“男生身高的数据来自正态分布”是合理的.(www.xing528.com)
(2)输入命令
[h,sig,ci]=ttest(x,168,0.05)
运行结果为
h=1,sig=1.1777e-007,ci=(171.1777,174.2303)
以上结果表明,拒绝了H 0,表明学生的平均身高比30年前发生了显著变化.
说明 在总体方差σ2未知时,用t检验法,其命令格式为
[h,sig,ci]=ttest(x,mu,alpha)
其中,h为一个布尔值,h=0表示在显著性水平为alpha下可以接受H 0,h=1表示在显著性水平为alpha下可以拒绝H 0;sig是t统计量在H 0成立时的概率;ci是均值的置信水平为1-alpha的置信区间;x为样本数据,mu为H 0中的μ0,alpha为显著性水平.
联系第8章中“检验的p-值”,sig即为p.所以,当α=0.05>1.1777e-007=sig时,拒绝H 0(其中1.1777e-007=1.1777×10-7).
根据第8章中“置信区间与假设检验的关系”,由于168∉(171.1777,174.2303),所以,在显著性水平α=0.05时,拒绝H 0.
例B.2.10 在例5.1.5中的有关计算.
运行结果为0.34132910997617.
同样,在以上程序中,n取100000,其计算结果见例5.1.5.
例B.2.11 在例1.2.1中曾给出了一些学者关于抛硬币试验的结果.从例1.2.1中我们知道,抛一枚质地均匀硬币的试验,出现正面的次数是0.5.如果做n次抛硬币试验,出现正面的次数是k,则出现正面的频率是k/n.根据伯努利大数定律,出现正面的频率k/n依概率收敛于0.5(出现正面的概率).这是理论上的结果,那么如何通过模拟抛硬币试验来计算呢?现在我们用MATLAB软件模拟抛硬币试验,并观察随着试验次数的增加,出现正面的频率如何变化?
解 模拟抛硬币试验的MATLAB程序如下
运行结果为0.491 0.
以上是对n=1 000进行的计算,同样地可以得到n取其他值的结果.
对于n=50,100,1 000,10 000,100 000,可得k/n和|k/n-0.5|的计算见表B-6.
表B-6模拟抛硬币试验结果
从上表可以看出,随着n的增大,k/n越来越接近于0.5,|k/n-0.5|越来越接近于0.
例B.2.12 在例7.1.5中,用MATLAB软件产生容量n=50时P(λ)(λ=5)的随机样本x 1,x 2,…,x 50,并求参数λ的极大似然估计值.
解 用MATLAB软件产生容量n=50时P(λ)(λ=5)的随机样本x 1,x 2,…,x 50,并求参数λ的极大似然估计值,其MATLAB程序如下:
说明 由于样本的随机性,每次运行的结果可能会有差异.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。