首页 理论教育 回归分析在社会统计学中的应用

回归分析在社会统计学中的应用

时间:2023-08-05 理论教育 版权反馈
【摘要】:回归分析无论在自然科学中还是在社会科学中都得到了广泛的运用。首先因变量的测量误差,可以导致估计中标准差的增加,其结果是减少显著性差异,但不会导致回归系数的偏估。而实际自变量测量误差的存在,可以导致回归系数的低估。但如果是回归系数的比较,那么由于变量测量误差的不同,会导致回归系数比较的错误结论。同时在回归假定中,要求误差项e 与自变量是相互无关的。

回归分析在社会统计学中的应用

回归分析无论在自然科学中还是在社会科学中都得到了广泛的运用。 但应该看到,在非实验性设计中,例如社会调查,它的变量在测量中是无法控制的。 所谓控制只是用笔和纸进行分类。 而在自然科学中,由于变量可以通过实验条件的控制和反复测量,因此变量测量的精度是比较高的。 但在社会调查中,由于变量本身的概念,以及社会、心理等因素的影响,其可靠性只能达到真值的0.5~0.8。 那么,这些变量测量中的误差是怎样影响回归分析的呢?

首先因变量测量误差,可以导致估计中标准差的增加,其结果是减少显著性差异,但不会导致回归系数的偏估。

对于自变量的测量,根据回归假定是要求没有测量误差的。 而实际自变量测量误差的存在,可以导致回归系数的低估。 这对单总体来说,问题还不大,因为至多只是估计得保守一些而已。 但如果是回归系数的比较,那么由于变量测量误差的不同,会导致回归系数比较的错误结论。 同样,如果自变量不止一个,而每个自变量的测量误差又不同的话,其结果也会变得十分复杂。(www.xing528.com)

同时在回归假定中,要求误差项e 与自变量是相互无关的。 这一点在实验性设计中也比较容易满足,但对社会调查收集的资料来说,必须慎重考虑其独立性是否得到了满足。 特别是那些判定系数R2 很小的情况,例如只有10%,那就很难保证剩下90%的误差确与自变量无关。 正如国外社会学家所指出,应该清醒地看到,目前很多基于回归的因果分析,其结论很可能是歪曲了实际情况的。 这向人们敲起了警钟,在运用回归分析的同时,必须注意自己的假定和测量。

以上是从使用回归方法本身来看,另外还可以从更广泛的非实验性研究的角度来看,社会调查属非实验性设计,其特点是研究现象的形成过程是研究者无法干预的,这点与实验性设计有很大不同。 且不说自然科学中的实验,社会科学中的实验性研究,除了要研究的因素外,其他干扰因素要统统控制掉,或随机化掉,然后干预所要研究的因素,看它对因变量的影响。 例如要研究不同教学方法的效果,但认为不同的年龄、性别、智商、家庭背景也会影响或干扰教学效果,那可以选择相同的年龄、性别、智商、家庭背景,或者采用随机抽取的方法确定每组的人选,以期使干扰因素随机化掉。 最后让各组采用不同的教学方法,观察教学效果是否有所不同。 但遗憾的是,在社会研究中,这样的实验设计往往是不可行的。 例如不能像实施不同教学方法那样,指定一部分人吸烟、另一部分人不吸烟,以便进行吸烟对健康危害研究。 研究者只能从既成的、不同健康水平的人群中了解他们是否抽烟。 类似的非实验性设计在社会研究中比比皆是。 例如研究婚姻问题,只能在已经是婚姻美满或不美满的人群中寻找哪些因素影响婚姻的美满。 同样也只能在长寿老人中探索长寿的奥秘。 由于这是回溯性的探讨,不免见仁见智,从而出现同样的资料会有不同的模型和不同的解释。 而各种模型的解释力(判定系数R2)又都不很高,一般都在30%。 难怪有国外的社会学大师都感叹社会研究要找到真正的因果关系是很难的。 或许有人说,这都是搞定量的人搞出来的,但这种看法是不对的。 应该看到,这是研究中的一大进步,正如社会学大师布莱洛克来华讲学时所指出的,定性研究实际也同样存在这类问题,只是还没有意识到罢了。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈