二、抽样框:从追求代表性走向力争信息无限丰富
众所周知,中国目前现存的、足以作为划分人群的依据的统计资料非常缺乏,再加上许多人群都是分散的或者隐蔽的,因此我们也就无法得到他们的抽样框,无法对他们进行随机抽样(边燕杰等,2001:28~31)。我们现在所说的任何范围内的随机抽样,实际上都只不过是跟着现有的统计资料(例如人口普查数据)所拥有的那些指标走,其抽样结果及其代表性都是人口学意义上的“总人口”,而不是社会学意义上的阶层、群体、人群。
这种情况往往被视为随机抽样方法的局限性,甚至被认为是社会学家的局限性。他们认为社会学家应该努力去建立这样的按照人群来制定的抽样框。
可是,除了特定的人口学指标所代表的“总人口”之外,我们真的能够建立起一种符合社会科学定义的人群的抽样框吗?作为中国社会学的主要分支学科之一的社会分层研究,重要的任务之一就是要确定各种人群的分类指标,而这些新指标一定是各种现存的人口学资料里所没有的。所以,如果我们希望使用随机抽样的方法来调查任意一种社会人群,那么在逻辑上就讲不通。也就是说,虽然我们可以在人口学的抽样框中使用随机抽样调查来确定我们希望了解的某个人群的分类标准,但是却无法根据这样的分类标准去建立一个抽样框,然后再进行随机抽样去调查这个人群。例如,我们可以随机抽样地调查出“当今中国的工人”究竟应该如何划分,却无法随机抽样地去调查我们所划分出来的“当今中国的工人”。
即使将来的总人口统计资料中的可分类指标无限地丰富了,也仍然解决不了这个逻辑上的矛盾。其中的道理只有一个:社会科学所要研究的一切目标人群,都不是天然地、客观地存在着的,也不是自发地产生出来,然后等着我们去调查的。它们其实只不过是我们社会科学的研究成果建构出来的。
因此,现有的统计资料其实根本无法给我们提供任何可用的抽样框。或者反过来说,只要我们仍然沿用目前的随机抽样的方法,那么社会科学就会永远跟着社会既有框架亦步亦趋。
最近在国际上出现而且正在引进中国的“受访者推动抽样方法”[6],就是试图解决“在没有抽样框的情况下如何抽取有代表性的样本”这个根本问题。(www.xing528.com)
笔者不讨论这个具体抽样方法,而是从该方法出发,提出一个相反的思路:既然没有抽样框,那么我们社会科学家为什么一定要去追求“代表性”这个目标,为什么不去寻求“某个研究对象的信息的无限丰富性”呢?对于我们社会科学来说,最重要的认知是什么?是各种已知的情况在总体中究竟占了多大的比例,还是在总体中究竟存在多少种未知情况,这些未知情况都有哪些?[7]
前一个目标的本质仅仅是“测量”,后一个目标的本质却是“发现”。笔者以为,“发现”才是社会科学家更擅长完成的任务,也是社会科学区别于统计学的安身立命之本。
如果这一命题足以成立,那么我们社会科学家也许就可以这样做:在随机抽样的各个抽样层次中,坚持寻找抽样框,坚持使用随机抽样的方法。但是在末端抽样层次上,我们改为使用“信息饱和”的抽样方法。[8]
随着电脑辅助调查方法的日臻成熟,这种抽样方法的可操作性也极大地提高了。[9]
例如,在全国调查中,我们可以坚持随机抽样到社区,但是在社区内却并不一定要随机抽样到个人,而是使用“最大差异”抽样法[10]来寻找被访者。如是,我们在数百个社区里所获得的信息,就足以汇总为具有全国地理分布代表性的“最丰富的信息”或者“相对饱和的信息”,而不仅仅是各种绝对数与比例。这,可能才是社会科学最需要的。
笔者在这里仅仅提出一个新的思路,就不在操作的层次上展开了。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。