首页 理论教育 实用SAS基础:用reg进行多元线性回归

实用SAS基础:用reg进行多元线性回归

时间:2023-08-10 理论教育 版权反馈
【摘要】:像8.1.1那样直接解方程或用公式算出参数估计值太麻烦了,SAS有多个过程可以作线性回归,估计这些参数的值,进行分析和预测。proc reg语句的一般形式是:其功能是调用reg过程。例8.2对于例8.1用SAS估计参数。与前面采用解线性方程组法所得的结果一致。但是还有许多问题需要考虑:因为任意给出调查数据,都能用reg过程作回归,但所得经验回归方程是否合适?试建立由x1,x2,x3预报y的线性回归方程。

实用SAS基础:用reg进行多元线性回归

像8.1.1那样直接解方程或用公式算出参数估计值太麻烦了,SAS有多个过程可以作线性回归,估计这些参数的值,进行分析和预测。这些过程各有其特点,感兴趣的读者们可以通过菜单“帮助”→“SAS帮助与文档”→“SAS Products”→“SAS/STAT”→“AS/STAT User's Guide”→“Introduction to regression”查到这些过程及其简介,本书仅使用reg过程。reg(regression的前3个字母)过程的介绍可以通过菜单“帮助”→“SAS帮助与文档”→“SAS Products”→“SAS/STAT”→“SAS/STAT User's Guide”→“The Reg Procedure”找到。reg过程的必要语句有两条:proc reg语句和model语句。

proc reg语句的一般形式是:

其功能是调用reg过程。

model语句的一般形式是:

其功能是告诉SAS:“=”前的变量因变量,“=”后的变量是自变量

例8.2 对于例8.1用SAS估计参数。

解 采用如下程序:

提交程序后得到如下两张数表:

(www.xing528.com)

第一张是方差分析表(表头为Analysis of Variance),第二张表是参数估计表(表头为Parameter Estimates)。在参数估计表中,第1列是变量名(Variable),该列的每行元素为变量,所在行信息属于该变量估计值的系数。本例所得表中该列第1行是Intercept即截距,表明该行的信息是截距的信息;第2和第3行分别是x1和x2(目标人口和人均可支配收入),表明该行的信息是x1的系数b1和x2的系数b2的估计值。第4列是参数估计值(Parameter Estimate)列,说明本列的值是参数估计值。本例中该列可见0=4.30412,1=0.50407,2=0.00811。与前面采用解线性方程组法所得的结果一致。

这种方法适用于一般的回归模型,由此可见只要找到参数估计表的这两列就能得到经验回归方程了。但是还有许多问题需要考虑:因为任意给出调查数据,都能用reg过程作回归,但所得经验回归方程是否合适?为了讨论这一问题统计学家做了许多研究,甚至有整本书都在讨论这些问题,SAS 9.3和9.4也给出许多图形、数表用来分析此问题。这里只介绍其中最最基础的方法。对模型是否适合数据的较详细分析,可以参考本书相关章节或吴诚鸥等人所编著的《近代实用多元统计分析》一书的4.7节。

方差分析表的第一行最后一个值(Pr>F)称为P值,它可以用来判定自变量的最优线性组合与因变量是否线性相关(最优线性组合意指自变量的线性组合,它与因变量相关性最好),线性相关程度越大经验方程越好,如果该概率小于0.05(称为显著),说明自变量最优线性组合与因变量线性相关,经验方程是好的,否则经验方程不好。本例中Pr>F的值小于0.0001,因而本例的经验方程是很好的(当P值小于0.01就称为高度显著)。

参数估计表的最后一列(Pr>|t|)称为对应于该参数的P值,它可以用于判断该行自变量的系数的估计值是否可以忽略:如果Pr>|t|的值小于0.05,则该参数不能被认为是0(参数或自变量的作用显著);如果Pr>|t|的值大于0.05,则该参数可能被认为是0(参数或自变量的作用不显著)。社会科学和生物医学问题中P值常常不与0.05比,而是与0.1比:如果Pr>|t|的值小于0.1,则该参数不能被认为是0(参数或自变量的作用显著);如果Pr>|t|的值大于0.1,则该参数可能被认为是0(参数或自变量的作用不显著)。本例中x1所在行Pr>|t|的值小于0.0001,x1的作用是显著的;x2所在行Pr>|t|的值小于0.0001,x2的作用是显著的;截距所在行Pr>|t|的值为0.1252,大于0.05,可见截距的作用是不显著的,但是为了拟合的精确性,不显著的截距并不舍弃掉。所以经验方程仍是

练习题1 研究某一地区土壤中可给态磷的情况:设y是摄氏35度时土壤中可给态磷的浓度,x1是土壤中所含无机盐浓度,x2是土壤中溶于K2CO3溶液并受溴化物水解有机磷浓度,x3是土壤中溶于K2CO3溶液但不受溴化物水解的有机磷浓度。经18次测量得到表8-2。试建立由x1,x2,x3预报y的线性回归方程。

表8-2 土壤中可给态磷数据

续表8-2

练习题2 今有8名学生的考试成绩数据如表8-3所示。建立复习时间与智商预报考试得分的经验回归方程。某学生智商为115,如果他复习15小时,预测他将得多少分,并说明参数估计值的含义。

表8-3 8名学生考试成绩数据

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈