基于R的数理统计学-点估计方法

时间：2026-01-27 理论教育晴浪版权反馈

【摘要】：下面结合例子介绍最大似然估计法的基本思想和方法。这种求估计量的方法称为最大似然估计法，也称为极大似然估计法。这往往比直接用式求来得方便。式称为似然方程；式称为对数似然方程。，xn）为X的一个样本观测值，以f代替式中的p，得似然函数再按离散分布情形中的方法和步骤便可求得θ的最大似然估计值及最大似然估计量。例3.1.9 设正态总体X具有分布N，其中μ和σ2是未知参数，试求μ和σ2的最大似然估计量。

1.矩估计法

所谓矩估计法，概括来说，就是用样本矩估计总体的相应的矩，用样本矩的函数作为总体相应矩同一函数的估计量。

例3.1.2 设某种罐头的重量X～N（μ，σ2），其中参数μ及σ2都是未知的，现随机地抽测8盒罐头，测得重量（单位：g）为

453 457 454 452.5 453.5 455 456 451

试求μ及σ2的矩估计值。

解因为μ是全部罐头的平均重量，而是样本的平均重量，因此自然会想到用样本均值去估计μ。同样，用样本方差s2去估计总体方差σ2，即有，由测得重量值可算得和s2的值分别是=454，s2=3.78，故有

基于R的求解过程如下：

例3.1.3 设总体X在[a，b]上是均匀分布的，其概率密度函数为

试求未知参数a和b的估计量。

解这时参数a和b并不是总体分布的矩，但是总体矩却都与a和b有关，例如总体分布的一阶、二阶原点矩分别为

由上面二式可解得

当我们用样本矩估计总体矩，即取时，就得到

例3.1.4 设总体X服从参数λ的指数分布，求λ的矩估计量。

解由题意得：f（x）=λe-λx（x＞0，λ＞0），则

即

设X1，X2，…，Xn是来自总体X的样本，A1的估计量为

故

一般来讲，设总体X的分布函数F（x；θ1，θ2，…，θm）的类型已知，但其中包含m个未知参数θ1，θ2，…，θm，则总体X的k阶矩也是θ1，θ2，…，θm的函数，记

qk(θ1,θ2,…,θm)=E(Xk),k=1,2,…,m

假定从方程组

可以解出

设X1，X2，…，Xn是总体X的一个样本。用来估计Ak，其中k=1，2，…，m，然后代入上式的hk中，得到θk的估计量，其中k=1，2，3，…，m。

我们看到，矩估计法直观而又便于计算，特别是在对总体的数学期望及方差等数字特征作估计时，并不一定要知道总体的分布函数，但是矩估计法要求总体X的原点矩存在，若总体X的原点矩不存在，那就不能用矩估计法。

2.最大似然估计法

当总体的分布类型已知时，常用最大似然估计法估计未知参数。下面结合例子介绍最大似然估计法的基本思想和方法。

例3.1.5 设有一大批产品，其不合格率为p（0＜p＜1）。现从中随机地抽取100个，其中有10个不合格品，试估计p的值。

解若正品用“0”表示，不合格品用“1”表示。此总体X的分布为

P{X=1}=p,P{X=0}=1-p

即

P{X=x}=px(1-p)1-x,x=0,1

取得的样本记为（x1，x2，…，x100），其中10个是“1”，90个是“0”。出现此样本的概率为

这个概率随p不同而变。自然应该选择使此概率达到最大的p的值作为真正不合格率的估计值。记L（p）=p10（1-p）90。用高等数学中求极值的方法，知

解得

此例求解的方法是：选择参数p的值使抽得的该样本值出现的可能性最大，用这个值作为未知参数p的估计值。这种求估计量的方法称为最大似然估计法，也称为极大似然估计法。显然，在上例中取一个容量为n的样本，其中有m个不合格品，用最大似然估计法可得

下面分离散和连续两种总体分布情形介绍最大似然估计法。

（1）离散分布情形

设总体X的分布律为P{X=xi}=p（xi；θ），i=1，2，…。其中θ为未知参数，（X1，X2，…，Xn）为X的一个样本，（x1，x2，…，xn）是样本的观察值。则

当样本观测值（x1，x2，…，xn）给定后，它是θ的函数，记作

并称它为似然函数。使似然函数L取得最大值的，即满足

的，称为θ的最大似然估计值。

怎样求θ的最大似然估计值呢？当L是θ的可微函数时，要使L取得最大值，则θ必须满足方程

从此方程解得θ，再把θ换成即可。

由于L与ln L在同一处取得最大值，所以可由方程

求得。这往往比直接用式（3.1.2）求来得方便。式（3.1.2）称为似然方程；式（3.1.3）称为对数似然方程。显然，用最大似然估计法得到的参数θ的估计值与样本观测值（x1，x2，…，xn）的取值有关，故可记作称为θ的最大似然估计量。

综上所述，求参数θ的最大似然估计的步骤归纳如下：

第一步，根据总体概率分布（若是连续型变量，则根据概率密度）构造似然函数：L（xi；θ）=

第二步，对似然函数取对数；

第三步，对数似然函数ln L对θ求导数（若同时估计总体的m个未知参数θi（i=1，2，…，m），则对数似然函数ln L分别对θi求偏导数），并令

第四步，从上式中解出θ，由于θ是样本的函数，所以是θ的估计量，记为；

第五步，将样本观测值代入，得到总体参数θ的估计值。

例3.1.6 设总体X服从泊松分布，其分布律为（X1，X2，…，Xn）是X的一个样本，试求λ的最大似然估计量。(https://www.xing528.com)

解按式（3.1.1），似然函数为

取对数得

对λ求导得对数似然方程

由此得λ的最大似然估计值为

λ的最大似然估计量为

（2）连续分布情形

设总体X的分布密度为f（x；θ），θ为未知参数，（x1，x2，…，xn）为X的一个样本观测值，以f（xi；θ）代替式（3.1.1）中的p（xi；θ），得似然函数

再按（1）离散分布情形中的方法和步骤便可求得θ的最大似然估计值及最大似然估计量。

需要指出，似然函数与联合概率密度函数的区别在于，在式（3.1.4）中，若θ是已知的，则为联合概率密度函数；若θ是未知的，则为似然函数。

例3.1.7 设某种电子元件的寿命服从指数分布，其分布密度为

今测得n个元件的寿命为x1，x2，…，xn，试求λ的最大似然估计值。

解按式（3.1.4），似然函数为

取对数得

对λ求导得对数似然方程

由此解得λ的最大似然估计值

例3.1.8 设总体X具有均匀分布，其密度为

其中，未知参数θ＞0，试求θ的极大似然估计量。

解样本值为（x1，x2，…，xn），而

似然函数

选取θ的值使L达到最大，只要取

改写成

一般来说，设总体X的分布中含有m个未知参数θ1，θ2，…，θm，其似然函数为

L=L(x1,x2,…,xn;θ1,θ2,…,θm)

则似然方程组为

对数似然方程组为

由式（3.1.5）或式（3.1.6）解得的分别称为参数θ1，θ2，…，θm的最大似然估计量。

例3.1.9 设正态总体X具有分布N（μ，σ2），其中μ和σ2是未知参数，试求μ和σ2的最大似然估计量。

解因为

似然函数为

取对数得

求导得对数似然方程组为

解方程组得

改写为

需要指出，最大似然估计法不仅利用了样本所提供的信息，同时也利用了总体分布的表达式所提供的关于参数θ1，θ2，…，θm的信息。因此最大似然估计法得到的估计量的精度一般比矩估计法高，而且它的适用范围也比较广，到目前为止，在理论上它仍是参数点估计的一种最重要的方法。

3.顺序统计量法

实际上，常用的顺序统计量是样本中位数和样本极差。顺序统计量法直观地来讲就是用样本中位数Me估计总体中位数，用样本极差R估计总体标准差。在总体为连续型且分布密度为对称的情形，总体中位数也就是期望值。特别对正态总体N（μ，σ2），关于样本中位数的下面结果能使我们更好地认识这种估计法。

定理设（X1，X2，…，Xn）是来自正态总体N（μ，σ2）的样本，Me是样本中位数，则有

证明略。

此定理表明：渐近标准正态分布N（0，1），从而当n充分大时，Me近似服从，n越大，Me落在μ的附近的概率就越大。所以，当n充分大时，可用样本中位数Me作为均值μ的估计，即=Me。

例3.1.10 设某种灯泡寿命X～N（μ，σ2），其中参数μ和σ2未知，为了估计平均寿命μ，随机抽取7只灯泡测得寿命（单位：h）为

1575 1503 1346 1630 1575 1453 1950

（1）用顺序统计量法估计μ；

（2）用矩估计法及最大似然估计法估计μ。

解（1）顺序统计量（X（1），X（2），…，X（n））的观测值分别为1346，1453，1503，1575，1575，1630，1950。因为n=7，所以

（2）当总体X～N（μ，σ2）时，用矩估计法及最大似然法去估计μ都得

当总体均值μ能够用样本中位数Me估计时，用Me估计有以下优点：只要E（X）存在而不需要利用总体X的分布；计算简便；样本中位数Me的观测值不易受个别异常数据的影响。

例如，在寿命试验的样本值中，发现某一数据异常小（譬如，在例3.1.10中，由于粗心，把数据1 346误记录为134），在进行统计推断时一定会提疑问：这个异常小的数据是总体X的随机性造成的，还是受外来干扰造成的呢？如果原因属于后者（如记录错误），那么用样本均值估计E（X）显然就要受到影响，但用样本中位数Me估计E（X）时，由于一个（甚至几个）异常数据不易改变中位数Me的取值，所以估计值不易受影响。特别在寿命试验中，个别样本寿命很长，这是常有的现象，若等待n个寿命试验全部结束，然后计算作为平均寿命的估计值，花的时间就较多；如果用Me估计总体均值E（X），那么将n个试验同时进行，只要有超过半数的试验得到了寿命数据，无论其余试验结果如何，都可得到样本中位数的观测值Me，因此得=Me，若没有别的需求，寿命试验即可结束。

类似的，可用极差R=x（n）-x（1）作为总体标准差的估计量，即

这种估计称为极差估计法。

用样本极差R来估计，计算很简单，但不如用S来得可靠。一般情况下，这种估计仅在n≤10时使用。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作计划

年度工作

工作规划

教学计划

实施方案

工作方案

教学工作

发展计划

德育工作

管理工作

发展规划

工作总结

教育工作

体育教师

年度计划

后勤工作

安全教育

工作思路

教育计划

小学教师

幼儿教师

数学教师

食品安全

英语教学

基于R的数理统计学-点估计方法

相关推荐

基于R的数理统计学-点估计方法

相关文章：

相关推荐