一、问题的提出与研究方法
(一)提出问题的背景
在互联网上,由某个网站发布、由上网者主动登录该网站并且主动回答的定量问卷调查[19](网站调查,web survey,web-based survey),至晚从2005年开始就在我国呈几何式增加的趋势[20]。其调查结果往往被大众传媒广泛地、放大地传播(董瑞丰、杨桃源,2006),这不但已经在相当大的程度上影响了公众的认知与价值判断倾向(调查组,2008),而且影响到政府的行政与立法(盛宇、刘俊熙,2008;孙云龙,2008)。就连科学性要求最强的医学领域,也有人堂而皇之地使用起这样的网站调查的结果[21]。
在“性”方面最典型的例子是,生产避孕套(安全套)的杜蕾斯公司2004年公布其网站调查结果,说中国人的性伴侣人数达到平均19.3个,是世界上最多的。经大众媒体广泛传播之后[22],这一说法引发了中国公众的极大困惑与争论。[23]尽管该公司的网站调查负责人信誓旦旦地说:“我们就是想尽一些社会责任,了解人们的性生活全景,并和社会来分享信息。这个报告和商业没有任何关系,也不会为商业而用。”[24]但是从其社会效果来看,人们仍然很有理由认为,这个网站调查其实从一开始就可能是该公司的一种促销手段。[25]
虽然国际上已有研究[26],虽然我国的一些学者在泛论式的研究成果中也涉及过这方面的问题,但是我国学术界[27]到目前为止仍然没有专门针对这种大行其道的网站调查的论文。[28]
(二)问题的提出
网站调查既没有一个调查总体,也不可能进行随机抽样,因此其结果不具有任何意义上的代表性。这是学术界一直坚持的共识(徐浪、向蓉美,2006;方国斌、陈年红,2009),某些网站调查的主张者也敢于公开承认这一点。[29]
但是,网站调查的这种非随机抽样方法究竟在多大程度上产生了样本偏差,这种偏差又在多大程度上造成了调查结果的失误?关于这一点,我国学术界目前尚缺乏实证的研究成果。这不利于对网站调查方法及其结果进行科学的评价,不利于引导公众正确看待各种网站调查的结果,客观上可能造成学术界放弃引导公众之社会责任。
笔者尤其希望论述的是:网站调查的这种样本偏差为什么值得学术界高度重视?其方法论层面(而不是操作层面)的意义是什么?笔者又主张什么,建议什么?
为此,笔者设计了一个研究方案。
(三)研究方法
首先,在福特基金会的资助下,笔者于2006年8月到12月完成了一项全国18~60岁总人口的多阶段抽样问卷调查。(以下简称为“总人口调查”)
其次,笔者从2007年8月开始,将同样的问卷,在保留所有基本提问、删除细节追问之后(题量大约是原来的一半),以Web格式挂在一个公共网站上(http://www.omni3w.net/omnisurvey/)。到2008年12月1日为止,共获得18岁到60岁的2 593人的有效回答。(以下简称为“网站调查”)(www.xing528.com)
最后,将两组数据进行对比分析,以便发现其差异。其中总人口调查的数据已经按照抽样方案,使用2005年百分之一人口普查数据进行加权。本节下列所有的统计表格中的所有变量均进行了交叉表的卡方检验(Pearson Chi Square,Asymp.Sig.2-sided)与独立样本的T值检验(independent sample Ttest),其统计量均为0.0000。下文中不再一一列出。
(四)可比性论证
由于笔者进行的是对比分析,因此将两种调查方法的可比性进行论证如下。
2006年笔者所进行的全国总人口问卷调查,采用的是笔记本电脑辅助的调查方法(computer survey),也就是把问卷设计成电子格式,显示在调查员随身携带的笔记本电脑的屏幕上。由被访者来按键回答。这是目前国际上效果最佳的实地社会调查方法。[30]
这种方法与网站调查实际上已经具有完全的同质性,当然可以作为评价网站调查结果的对照标准。其具体表现为:
(1)笔者在总人口调查中,事先给每位被访者送交一封预约信,说明笔者的调查目的与调查的大概内容,邀请他们到预定的地点来接受调查。因此被访者具有完全的自由与相应的能力来选择是否接受调查。这与网站调查所采用的招募志愿者的方法,在自愿回答这一点上不存在任何性质的差异。
(2)笔者把被访者请到完全封闭的独立的访谈室,让其独自面对电脑屏幕,自己作答。访谈室内只有与被访者同性别的访谈员。访谈员坐在笔记本电脑的对面,由于有电脑屏幕(盖子)的遮挡,所以访谈员完全看不到被访者的回答结果,他们只在被访者需要的时候提供适当的说明与电脑操作上的帮助。这与网站调查所最着力标榜的独立回答(因此最能保密),具有完全相同的性质。
(3)在被访者能够“真实表述”这一点上,笔者认为,既然笔者的调查在动员与回答的各个环节上都与网站调查的性质相同,那么其回答也就会具有相同性质的真实。[31]
(五)笔者的调查内容对于本论题的特殊意义
笔者的这两个调查都是针对性行为与性关系这种高度敏感的问题的。调查这样的内容,网站调查往往被认为具有高得多的真实性。姑且不论这一点是否正确,笔者的假设是:如果网站调查的样本偏差程度在统计学上是显著的,那么众多的个体的真实回答汇集起来的恰恰就是总体认知上的谬误。
(六)问题的提炼
综上所述,笔者所进行的笔记本电脑辅助的实地社会调查,在操作方法上与网站调查并不存在性质上的差异,那么对于调查结果来说,唯一的差异只能来自是否进行了随机抽样。也就是说,笔者所设计的对照研究,不仅足以检验网站调查的样本偏差程度及其后果,而且是检验的最佳途径。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。