以上各节介绍的模型中限定自变量只取一次方,也就是说经验回归方程是自变量的线性函数,有没有可能自变量的二次方或交叉积,甚至更高次幂也应当作为新的自变量而被考虑?也就是说经验回归方程右边是否是自变量的二次函数或更高次多项式函数?实际问题中确实有这种需要。这样的回归模型称为多项式回归。地质学上的趋势法可能用到五次甚至更高次多项式回归。本书仅以二次多项式回归为例说明一般多项式回归原理。
例8.5 为了高效益地生产土豆,需要选择氮、磷、钾(分别记为n、p、k)三种类型化肥的合理施用量。在30块土地上,使用不同量化肥做试验。每块地的化肥用量及土豆产量见表8-6。农学家指出土豆的产量可以近似看成三种化肥的使用量(n、p、k)的二次函数,试建立用n、p和k的二次多项式预报土豆产量的经验回归方程。
表8-6 30块地的化肥用量及土豆产量
续表8-6
解 以n、p、k、w表示氮、磷、钾化肥的使用量和土豆产量。n、p、k的二次多项式中包含形为n、p、k的项,令nn、pp、kk、np、nk、pk表示氮、磷、钾化肥用量的平方以及交叉积。
采用如下程序:
提交后得到许多数表,筛选的前5步顺序选入nk、nn、k、np、kk,其信息略而不谈。第6步的数表如下:
Stepwise SeIection:Step 6 VariabIe pp Entered:R-Square=0.9191and C(p)=7.0000 AnaIysis of Variance
以上是筛选因子第6步的信息。SAS先检查已选入的变量nk、nn、k、np、kk是否应当被剔除,经检验都不能被剔除。在已保留nk、nn、k、np、kk为自变量的条件下,未选入的自变量n、p、kp、pp中pp最符合选入条件,将pp选入模型,以nk、nn、k、np、kk、pp为自变量建立回归模型,给出方差分析表和参数估计表。
Stepwise SeIection:Step 7 VariabIe k Removed:R-Square=0.9162and C(p)=5.8260 AnaIysis of Variance
(www.xing528.com)
以上是筛选因子第7步的信息。先检查已选入的变量nk、nn、k、np、kk、pp是否应当被剔除,经检验k最符合剔除条件,将k剔除。以nk、nn、np、kk、pp为自变量建立回归模型,给出方差分析表和参数估计表。因为所有未被选入模型的变量都不符合被选入条件,所有被选入模型的变量都不符合被剔除条件,筛选过程到此结束。
Summary of Stepwise SeIection
以上是逐步筛选过程的概括表。
查找提交后得到的最重要数表,其过程应当倒过来,先查找逐步筛选过程的概括表,发现共进行了7步,选得的自变量是nk、nn、np、kk和pp。只要找出逐步筛选到最后一步的以nk、nn、np、kk、pp为自变量的回归模型,查看第7步筛选所得的方差分析表和参数估计表。
由此可见最好的经验回归方程是:
练习题 为了考察某种青铜的拉力强度z(单位为千克/毫米)怎样受退火时间x(单位为分钟)和退火温度y(单位为摄氏度)的影响,做16次实验,x从30分钟到60分钟,间隔10分钟,y从150摄氏度到300摄氏度,间隔50摄氏度。实验结果如表8-7所示,使用合适的x和y的三次多项式来预测z。
表8-7 青铜拉力强度数据
提示:对于这样的表格型数据,设数据集名为cu,x为退火时间,y为退火温度;x、y的三次多项式中应当考虑形为x,y,x2,xy,y2,x3,x2 y,xy2,y3的项。可以采用如下简便程序:
或者
读者可自己解释程序中每一步有什么用处。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。