一、抽样终端:从“单独个人”走向“社会基本单位”
目前中国几乎所有社会调查中的随机抽样,其终端都是具体的个人,就是一个人一个人地抽取样本。只要我们严格按照各种随机抽样方法操作,那么抽取的结果就足以代表某个总体。这一点在社会科学界从未遭到过质疑(陈膺强,1993;Joseph Maxwell,1996:69~73;谢俊贵,2000;车文辉,2002;边燕杰、李路路、蔡禾,2006:58~60)。
这一统计学论断的背后的元假设是:每个个人都可以而且应该是孤立地存在的,因此把其中的一些人分别地抽取出来之后,并不会影响他们的特质。这些“单独的人”的相加结果仍然可以代表总体。这其实就是还原论的突出标本。
这当然符合以物为主要对象的统计学的道理与逻辑。可是,它符合我们社会科学主张的“人是处于环境、关系与历史之中的”这个基本信念吗?
因此,笔者的疑问是:明明不可能孤立存在的个人却被当做单独存在的物体来分别地抽取,那么无论抽样的结果如何随机,它所代表的,究竟是一个在生活中足够真实的、只能存在于“环境、关系与历史之中”的“社会人”的总体,还是一个具有无法测定的抽象性与虚拟性的“总人口”?即使我们不厌其烦地进行了无数次的随机抽样调查,恐怕我们对“社会人”的了解也不会增加。
进一步说,定量研究的社会科学家最应该关心的,恐怕既不是“总人口”,也不是“社会人”的总体,而是“中国社会”(刘少杰,1998;王小章,2002;骆玲,2005)。可是目前中国社会科学界通行的随机抽样的方法,却恰恰无法反映更无法代表这样一个总体,这是因为它的终端根本就不是任何一个层次上的“社会”,更是因为“生物人”的简单相加无论如何也不是一个“社会”。
再进一步来说,我们使用随机抽样调查数据进行相关分析所获得的结果,恐怕既不是社会之间的关系,也不是社会中人与人的关系,而是单独人之间的关系。
国内新近流行起来的多层次统计分析的技术(H.Goldstein,1995;Judith D.Singer &John B.Willett,2003),虽然可以帮助我们更多地了解环境对个人行为的影响,但是它仍然把个人作为抽样终端,所以它仍然解答不了上述疑问。换而言之,如果不发展现有的随机抽样方法,那么无论多么高级的统计技术都无法弥补把“单独个人”错当做“社会中人”、把人的简单相加错当成“社会”这两大失误。(www.xing528.com)
这其实是统计学的一个缺失,它还没有给我们社会科学家提供一个适用的工具,来反映我们所需要的“社会中人”与“社会”的可量化的抽样手段。反过来说,这也是因为我们社会科学的主流长期以来一直跟在统计学的屁股后面跑[5],过于迷信随机抽样这个技术手段及其所谓的代表性,丧失了我们的主体性。结果,这两个学科共同陷入了固步自封的境地。
我们为什么不可以按照家庭、亲友圈、社区、群体、阶层、民族等人类社会的其他单位来进行随机抽样呢?或者说,作为社会科学家,我们认为究竟是什么样的基本单位共同组成了“中国社会”这个总体呢?至少在社会科学界,笔者没有看到“所有个人直接组成社会”这样的论述,因此如果我们坚持随机抽样到个人,实在是没有什么意义。
国际上有一些学者在调查家庭情况的时候,把家庭作为抽样终端,然后抽取其中的一个人来表述整个家庭(而不是仅仅他自己)的情况。他们之所以这样做并非只是由于他们的研究目标是家庭,还因为他们认为“家庭是社会的细胞”。这启发我们应该努力去寻找更加合适的终端,并寻找它们的随机抽样方法。
就此,笔者贸然提出自己的一些建议,尽管这些建议目前还做不到操作化。
我们可以考虑把随机抽样的终端从“个人”扩大到各种层次上的“社会基本单位”,对某些“社会的总体”进行测量。沿着这样的思路,相信我们社会科学可以促进统计学去发展随机抽样的理论与方法,甚至社会科学自己领先一步也是有可能的。
例如,如果我们希望调查“中国人的流动机制”这样一个问题,那么我们完全可以把随机抽样的终端确定为全国的数百个社区。在每个社区里不再随机抽取任何个人,也不再使用仅仅针对个人情况的问卷,而是使用专门为此而设计的问卷,找到数个“关键知情人”,请他们来讲述作为一个整体的这个社区的人口流动机制。
这样,通过统计分析这数百个社区的资料,我们同样可以得出具有代表性的量化认知。只不过这时候的总体已经不再是“中国总人口(所有个人)”,而是“中国的所有社区”。显然,后一个总体更加符合我们社会科学的研究需要。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。