首页 理论教育 区间估计及其影响因素

区间估计及其影响因素

时间:2023-07-03 理论教育 版权反馈
【摘要】:区间估计也有两种类型:一是置信区间估计;二是预测区间。计算个别值的预测区间,首先必须知道用于估计的方差。根据例8.4所求的估计方程,建立贷款余额为72.8亿元的那个分公司不良贷款95%的预测区间。图8.12给出了置信区间和预测区间的示意图。表8.725家分公司不良贷款的置信区间和预测区间图8.12置信区间和预测区间示意图从图8.12中可知,影响区间宽度的因素:①置信水平(1-α)。

区间估计及其影响因素

利用估计的回归方程,对于x的一个特定值x0,求出y的一个估计值的区间就是区间估计。区间估计也有两种类型:一是置信区间估计;二是预测区间。◎定义8.16:对x的一个给定值x0,求出y的平均值的估计区间,这一区间称为置信区间(confidence interval estimate)。◎定义8.17:对x的一个给定值x0,求出y的一个个别值的估计区间,这一区间称为预测区间(confidence interval estimate)。1)y的平均值的置信区间估计

【例8.9】 根据例8.4所求的估计方程,取x0=100,建立不良贷款95%的置信区间。

解 根据前面的计算结果,已知n=25,se=1.9799,查表得tα/2(n-2)=t0.025(25-2)=2.0687。

当贷款余额为100亿元时,不良贷款的点估计值为2.96亿元,即

E(y0)=-0.8295亿元+0.037895×100亿元=2.96亿元

根据式(8.28)得E(y0)的置信区间为

即2.1141≤E(y0)≤3.8059。也就是说,当贷款余额为100亿元时,有95%的置信水平估计不良贷款的平均值在2.1141亿~3.8059亿元。

2)y的个别值的预测区间估计

若不再是估计贷款余额为100亿元时所有分公司的平均不良贷款,而只希望估计贷款余额为72.8亿元的那家分公司的不良贷款的区间是多少,这个区间则称为预测区间。

因此,y的一个个别估计值y0的标准差估计量为

因此,对于给定的x0,y的一个个别值y0在1-α置信水平下的预测区间为

与式(8.28)相比,式(8.31)的根号内多了一个1。因此,即使是对同一个x0,这两个区间的宽度也是不一样的,预测区间要比置信区间宽些。

表8.7 25家分公司不良贷款的置信区间和预测区间

图8.12 置信区间和预测区间示意图

从图8.12中可知,影响区间宽度的因素:

①置信水平(1-α)。区间宽度随置信水平的增大而增大。

②数据的离散程度s。区间宽度随离散程度的增大而增大。

样本容量。区间宽度随样本容量的增大而减小。

学习指导与小结】

相关与回归是研究数值型变量之间关系的统计方法。该方法广泛应用于自然科学和社会科学的各个领域。本章首先介绍相关分析方法,然后介绍一元线性回归分析方法。见表8.8。

表8.8 本章各节的主要内容和学习要点

续表

注:“加粗”部分为重点学习要点,应当重点学习并掌握。

【常用术语】

相关关系 相关分析 相关系数 回归分析 回归模型  回归参数  估计标准误差  判定系数 置信区间估计 预测区间估计

【案例讨论】

三角洲线缆的强大武器[4]

三角洲线缆公司于1978年成立于密西西比的克拉克斯代尔,公司为全球市场提供高碳钢线缆。目前,职工约100人,最近几年销售业绩一直呈上升趋势。

不过,就在几年前,三角洲线缆的前途似乎不怎么光明,原因是它们受到了可能毁灭前途的阻碍。随着美元的贬值,来自国际市场的竞争使三角洲的市场地位不断受到威胁。随着国际市场竞争的加剧,行业品质的要求也在逐年提高。三角洲的管理层认识到有些因素,如美元贬值是不受他们控制的,但是,有一个方面他们可以做出改善,那就是员工培训。公司与密西西比州携手与一本地社区大学联合建立了自己的学校。三角洲的职员在那里学习了统计的过程控制及其他保证品质的方法。同时,三角洲向其用户一再保证公司正致力于品质及竞争力的提高,客户也被邀请到培训现场旁听。通过这些努力,三角洲终于拨开乌云,捍卫了自己在激烈竞争的钢质线缆中的领先地位。

【讨论】

①三角洲线缆为自己在员工培训方面作出的努力而自豪,员工培训可以获得多方面的好处,对他们中的一部分进行讨论。其中一个好处是可以重新燃起对工作和公司的兴趣和兴奋度。有人提出一个理论:由于对补充知识的学习态度更积极、兴趣更大,员工受到的培训越多,他/她缺勤的可能性越小。假定表8.9的数据反映的是上一年度20个员工的病假天数和相应培训合同时数,用本章学习的方法对数据进行分析,包括回归分析和相关分析,讨论相关强度以及建立的任何模型。

表8.9 上一年度20个员工的病假天数和相应培训合同时数

②许多公司发现,全面质量管理的执行最终会使销售额增长,很多例子表明,公司如果不致力于质量的管理,最终会失去市场份额甚至退出市场。公司改善质量的努力成果可用客户满意度来衡量。假定三角洲线缆公司雇用某个公司来调查每年的客户满意度,调查公司将客户满意度设定了一个范围,完全满意为50分,完全不满意为0分,通过对不同行业的调查得出分数,然后取平均数得到年客户满意度平均分地。随着客户满意度分数的升高,销售额会上升吗?为研究这一问题,假定有了15年中三角洲线缆每年客户满意度平均分以及相应年度的销售额数据,对这些数据进行了回归分析,假定表8.10的Excel输出表就是回归分析结果。如果你被三角洲线缆公司邀请对数据进行分析并对结果进行小结,你会得到什么结论?

表8.10 回归分析结果

【思考与练习】

一、思考题

1.解释相关关系的含义,说明相关关系的特点。

2.相关分析主要解决哪些问题?

3.简述相关系数的性质。

4.为什么要对相关系数进行显著性检验?

5.在回归模型中,为什么要加入误差项ε?

6.简述参数最小二乘估计的基本有理。

7.解释总平方和、回归平方和和残差平方和的含义,并说明它们之间的关系。

8.简述判定系数的含义和作用。

9.在回归分析中,F检验和t检验各有什么作用?

10.简述线性关系检验和回归系数检验的具体步骤。

二、练习题

1.从某一行业中随机抽取12家企业,所得产量与生产费用数据见表8.11。

表8.11 所得产量与生产费用数据

(1)绘制产量与生产费用的散点图,判断两者之间的关系形态。(2)计算产量与生产费用之间的相关系数。

(3)对相关系数的显著性进行检验(α=0.05),并说明两者之间的关系强度。

2.学生在期末考试之前用于复习的时间和考试分数之间是否有关系?为研究这一问题,一位研究者抽取了由8名学生构成的一个随机样本,得到的数据见表8.12。

表8.12 所得的数据结果

(1)绘制复习时间和考试分数的散点图,判断两者之间的关系形态。

(2)计算相关系数,说明两个变量之间的关系强度。

3.一家物流公司的管理人员想研究货物的运输距离和运输时间的关系,为此,抽取了公司最近10辆卡车运货记录随机样本数据见表8.13。

表8.13 运货记录随机样本数据

(1)绘制运送距离和运送时间的散点图,判断两者之间的关系形态。(2)计算线性相关系数,说明两个变量之间的关系强度。

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

4.表8.14是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据。

表8.14 2000年的人均国内生产总值(GDP)和人均消费水平的统计数据

(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明两者之间的关系形态。

(2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。(www.xing528.com)

(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(α=0.05)。

(6)如果某地区的人均GDP为5000元,预测其人均消费水平。

5.某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到表8.15和表8.16的有关结果。

表8.15 方差分析

表8.16 参数估计

(1)完成上面的方差分析表。

(2)汽车销售量的变差中有多少是由于广告费用的变动引起的?

(3)销售量与广告费用之间的相关系数是多少?

(4)写出估计的回归方程并解释回归系数的实际意义。

(5)检验线性关系的显著性(α=0.05)。

6.一家公司拥有多家子公司,公司的管理者想通过广告支出来估计销售收入,为此他抽取了8家子公司,得到广告支出和销售收入的数据见表8.17。

表8.17 广告支出和销售收入的数据/万元

建立线性回归模型,并求出当x=40万元时,销售收入95%的置信区间。

7.表8.18是10个品牌啤酒的广告费用和销售量的数据。

表8.18 10个品牌啤酒的广告费用和销售量的数据

(1)用广告费支出作自变量x,销售额作因变量y,求出估计的回归方程。

(2)用残差分析检测是否存在异常值和有影响的观测值。

(3)简要概括一下你的发现。

8.某集团所属10个企业近年来平均研究费用和利润额资料见表8.19。

表8.19 平均研究费用和利润额资料

试分析研究费用与利润额之间是否存在相关关系?计算相关系数并加以检验(α=0.05)。

9.随机抽取某企业15户职工家庭,并对月人均收入恩格尔系数进行调查。其结果见表8.20,试用Excel进行回归分析,计算其相关系数并进行显著性检验、判定系数、估计标准误差,建立一元线性回归方程并解释回归系数的意义,对回归模型和回归系数进行检验(α=0.05)。

表8.20 调查结果

【注释】

[1]DavidR.Anderson,DennisJ.Sweeney,ThomasA.Williams.商务与经济统计学精要[M].大连:东北财经大学出版社,2000:424.

[3]平均值的点估计实际上是对总体参数的估计,而个别值的点估计则是对因变量的某个具体取值的估计。

[4]肯·布莱克,等.以Excel为决策工具的商务与经济统计[M].张久琴,等,译.北京:机械工业出版社,2003:378.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈