一元假设只能带来孤单独立的描述或推论,即使罗列出多个维度的数据,最多只能提供多些参考推断,不能直接判断出事象间的关系。然而很多时候,我们对关系的兴趣还超过对个别事象的特性。例如某工厂对于产品原料的成本、门市成本、广告成本、维修服务、行政成本、产品销量和价格、利润等项目的总数,都做了精确的记录。对于分红和缴税,这样的记录大抵足够了。可是,如果出现了竞争,怎样才能继续提升销量呢?降低货价?增加服务?降低利润或薪酬?降低某类成本?还是几种方法同时进行?要知道哪种措施最有效,最好能够找出变量间关系,看看如果改变某一变量,其他的相应变动有多大?我们可能发现该产品销量随广告费用起跌的关系,不及它跟门市部平均薪酬的关系来得密切,而广告费最多的时节,低薪的门市部销量竟然下跌。若能得到这类型的数据,可以启发出很不同的竞争对策。
这些反映变量之间关系的数据,必须能够沿着有关的变量去分析。比如说想了解不同门市部的销售量时,搜集到的数据必须容许我们辨认出各个门市部,而非各大分销区(每区有两个以上的门市部)或各个售货员(售货员来自哪个门市部却不详)的销量。如果研究目的在于找出不同“年级”学生看电视的时间,则以“学校”为单位搜集到的数据(每校平均数)便完全起不了作用。除非这些数据能够拆散回“班级平均值”,否则不能用来检证年级跟看电视时间之间的关系。当然这并不是说这份数据不能用于其他多元假设的验证,如果有兴趣知道“不同类型学校”或“不同地区学校”跟学生看电视时间的关系,仍是可以做的,但是低于学校层次的便不可以了。(www.xing528.com)
这种搜集数据和分析数据时层次的不对称,是初做多元分析的资料搜集时最易大意而铸成大错的。多元定量假设的资料,可以通过多种途径搜集,如果已有档案或文献适用,最好不过,简单表格亦成。当然,采用现成数据时,要特别留意其定义和代表性。充分而又适当的数据,通常是可遇而不可求的。何况还有以下一层顾虑:即使遇到的数据能够充分而又适当地反映待验变量之间的关系,也难保这些关系不受别的因素干扰。例如拿到某地居民“是否有医疗保健”及“看西医次数”的数据后,我们仍不能很有信心地对这两者的关系盖棺定论,除非我们也能找到另一些可能有重要作用的因素的资料,例如“是否采用中医中药”和“收入”等。社会科学中单因单果的关系远比自然科学中的少见,为了排除或控制其他因素的影响,多元定量假设的检验,更多时候是通过“实验”(experiment)或“抽查”(survey)进行。前者的控制比较紧密,结论比较具有决断性,但在现实社会环境中应用的机会较少(第10章)。后者提供了在比较自然的环境下控制干扰的可能,结论的或然意味较重(第11章)。两者的效果,都受到其研究对象的代表性的影响(8.6节及第9章)。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。