首页 理论教育 教育科学研究方法:总体参数估计及置信度评估

教育科学研究方法:总体参数估计及置信度评估

时间:2023-11-02 理论教育 版权反馈
【摘要】:总体的描述性数量叫参数。估计正确的概率称为置信系数或置信度。因而,大样本平均数标准误的计算公式为样本总体平均数区间估计的计算公式为式中,Ua为置信区间的临界值。结论:总体平均数在[25.706,26.294]区间,其估计可靠性为95%;总体平均数在[25.613,26.387]区间,其估计可靠性为99%。

教育科学研究方法:总体参数估计及置信度评估

统计分析常用描述统计和推断统计。由样本数据求得的描述性数量叫统计量,如集中量、差异量、相关量。总体的描述性数量叫参数。

样本的平均数、标准差、相关系数分别用符号X、S、r表示,可通过样本求得;总体参数用μ,σ,ρ表示,分别代表总体的平均数、标准差和相关系数,总体参数不能通过直接计算求得,是通过对样本统计量进行推断得出的。

1.点估计

点估计是一个数值作为样本统计量去估计总体的参数。通常是用一次估算的数据去估计总体的参数。例如,估计某市10 000名高三学生数学会考平均成绩,抽样500份试卷,平均成绩为65分。这一次抽样的样本平均成绩可以作为总体10 000名学生的平均数值。这种方法就是点估计。点估计是一种很不精确的粗略的估计方法。只有样本容量越大,估计才能越精确。

2.区间估计

总体参数的区间估计有总体平均数区间估计、总体百分数区间估计。例如,估计某市高一学生语文平均成绩,估计平均成绩在80~86分之间。如果估计100次,95次在此区间,则正确概率95%。

估计正确的概率称为置信系数或置信度

置信系数一般为95%和99%两种。

式中,σ为总体标准差;n为样本容量。

SEX越小,表明样本平均数与总体平均数越接近。计算时,总体平均数σ值往往是不知道的。当n≥30时,只能用样本标准差S代替σ。

因而,大样本(n≥30)平均数标准误的计算公式为

样本总体平均数区间估计的计算公式为

式中,Ua置信区间临界值(理论μ值)。通常,当样本n≥30时,Ua为置信区间的理论Z值;当样本n≤30时,Ua为置信区间的理论t值;多样本检验时,Ua为置信区间的理论F值;间断性数据检验时,Ua为置信区间的理论x2值。

大样本总体平均数区间估计的计算公式为

置信度为95%的置信区间:

置信度为99%的置信区间:

【例10-6】随机抽取某年高考100份作文试卷,平均数为26,标准差为1.5,试估计其总体平均数。

当置信系数为95%时,代入公式得出:25.706≤μ≤26.294。

当置信系数为99%时,代入公式得出:25.613≤μ≤26.387。

结论:总体平均数在[25.706,26.294]区间,其估计可靠性为95%;总体平均数在[25.613,26.387]区间,其估计可靠性为99%。

(2)小样本(n≤30)的总体平均数区间估计。样本n≤30时,标准误计算公式(10-10)中,通常以n-1代替n,则公式变为(www.xing528.com)

当样本n≤30时,样本平均数区间估计计算公式(10-12)中的Va为置信区间的理论t值。

小样本平均数区间估计的计算公式如下:

置信度为95%的置信区间:

置信度为99%的置信区间:

【例10-7】随机抽取某校二年级学生17名,测其平均身高为120 cm,标准差为10 cm,估计该校二年级学生平均身高。

当置信系数为95%时,查t值表,df=17-1=16,t(16)0.05=2.11

代入公式(10-16),求得结果:114.725<μ<125.725

当置信系数为99%时,查t值表,df=17-1=16,t(16)0.01=2.92

代入公式(10-17)求得结果:112.7<μ<127.3

结论:总体平均身高在[114.725,125.725]区间时,这个估计的可靠性为95%,总体平均身高在[112.7,127.3]区间时,这个估计的可靠性为99%。

(3)总体百分数的区间估计

计算公式为

样本百分数标准差为

【例10-8】某县调查学生流失率,以某校753名学生为样本,结果流失18名学生,问该县学生流失率的置信区间(置信度为95%)。

n=753;p=18/753=0.024;q=1-p=0.976

样本百分数标准差:SEp=0.00558

因此,置信度为95%的总体比率的置信区间:

0.024-1.96×0.00558~0.024+1.96×0.00558,即1.3%~3.5%

所以,该县学生流失率的置信区间为[1.3%,3.5%]。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈