社会学调查问卷设计的一般流程,是在选定一个理论之后,把它转化为问卷中的具体的相关假设(袁方,1997:92~127;风笑天,2009:162~177;艾尔·巴比,2009:120~156;郝大海,2009:124~152)。
在自然科学界流行一句话:一个好的假设就是成功的一半。社会学问卷调查与自然科学一样,一个好的假设也是问卷设计的灵魂。也就是说,我们想获得的那个结论,实际上早已经渗透在我们所设计的问卷里面了。因此,问卷设计的缺陷,无法用统计学来弥补。
笔者在社会学调查方法的教学实践中常常发现这样一个问题,有些问卷设计者往往一上来就直接提出各种具体的假设,也就是自己希望直接加以检验的那些问题。可是,对于一个好的问卷设计来说,哪怕仅仅集中于一个研究目标,也至少需要具有五种假设而且缺一不可。
(一)“元理论假设”
由于问卷调查一般都是应用中层理论,所以我们经常容易忽视这样一个问题:中层理论一般都是建立在某个更加宏观的元理论的基础上的,我们的问卷是否符合这个元理论的基本设定,这是我们必须加以检验的。因此,我们在应用中层理论提出假设的同时,还必须提出对于元理论进行检验的假设,哪怕是仅仅一个。否则,我们就无法证明我们应用某个中层理论的恰当性,整个问卷也就失去了合理性。这就是我们所谓的“元理论假设”。
以笔者的问卷设计[5]为例,交换理论、脚本理论和社会网络理论是笔者的性调查中应用的三个中层理论。它们来自一个共同的宏观的元理论——性的社会化。这是国际学术界从20世纪初就已经开始论述的理论。它是“性”作为社会学研究对象的根本前提和条件。如果没有经过性的社会化过程,性假如不是以社会因素为主的而是由生物因素决定的,那么这三个中层理论就全垮台了,笔者的整个调查也就毫无意义了。换言之,只有笔者的所有的检验结果都符合“性是社会的”这一命题,它们才有可能在更深的层次上成立。
“元理论假设”的必要性,并不是仅仅来自于笔者的调查目标是“性”这样一个经常被混同于生物现象的人类行为,它是一切社会学调查的首要前提。
例如,最近这些年涌入中国的理性选择理论、博弈论与交往互动论都是中层理论。它们的元理论是“天赋人权论”(假设人人生而平等)。即使不是“天赋人权”,至少也是假设人人都有决心有能力有准备进行博弈或者交往。
如果我们要在当今中国运用这样的理论来设计问卷,那么就不得不设置至少一个指标来检验一下我们所调查的那些中国人是不是真的处于人人平等的情境之中,至少也需要检验一下他们是不是有可能进行博弈或者交往。例如,如果没有这样的“元理论假设”,直接就运用“博弈论”提出一些假设,去调查分析农民工与老板、小贩与城管之间的关系和运行机制,那么这个问卷就会成为空中楼阁,其统计结果就会引导我们误读社会。因为生活不断地告诉我们,很多农民工或者小贩,根本就没有任何资本、能力与机会去跟老板或者城管进行所谓的“博弈”。
(二)核心假设
一般来说,一个社会学问卷里不会只有一个假设。这就需要我们把自己的各个假设进行分层,找出并且紧紧抓住最根本的足以牵一发而动全身的那个假设,然后以它为中心来建设自己的假设体系。这就是核心假设。
这一点,说起来容易做起来难。笔者在调查方法教学实践中经常发现,有的问卷设计者虽然可以确定自己的核心假设,但是却忽视了据此去构建“假设之树”,结果那个核心假设就降级为首要假设了。
在笔者的问卷设计的经验中,核心假设是来自于交换理论的“般配”假设。因此笔者经过不断的调试,把来自脚本理论与社会网络理论的各个假设,都尽量设计为“般配”假设的派生假设。例如,脚本中的“对于男女在性生活中的角色的认同”与社会网络中的“双方相识之初的各自社会归属”,都是被有意识地设计为足以对核心假设进行扩展的检验。(www.xing528.com)
(三)操作假设
我们准备使用哪些概念、哪些指标、哪些变量来检验我们的假设呢?表面上看来,这不外乎就是假设的卷面实现。我国现在通行的教科书一般都把问卷调查作为指标与变量的设计来论述(袁方、王汉生,1997:173~183;洪小良,1998:51~71;风笑天,2009:87~115;郝大海,2009:21~32)。可是正如笔者在前文所述,我们每提出一个指标、变量、问题、备选答案,其实都是在做出一个假设。因为只有我们认为它们与调查目标的相关性最大,我们才会舍弃也许是无穷多的其他选择。
(四)控制因素的假设
控制因素对于问卷设计来说是必不可少的。控制因素不会自己跑到问卷上面去,统计分析也无法在事后帮我们把它们找出来,因此我们必须提前在问卷中对这些因素进行精心设计。
此外,在任何一个调查报告里,问卷设计者都应该明确地写出在自己的这个问卷里究竟有哪些控制因素。这并不是说,不写出来就会影响数据分析结果,而是说,非如此不足以表明作者的学术水平,也不足以让读者进行评价。笔者希望这能够逐步成为中国社会学界的规范之一。
在问卷设计中,一个必不可少的控制因素就是时空假设。它在问卷中无处不在,几乎每一个提问都应该加上“在什么时间段”、“在什么情况下”这两个条件。也就是说,我们最终所得到的每一个统计学的相关关系或者检验结果,都仅仅是由于我们在这样一个随机抽样总体中,在这样一个时空范围内,调查了这样一个时期内发生于这样一种情况下的那些现象。如果我们懒得把这些边界说清楚,那么引起别人误解与质疑的可能性就会大大增加。
每一个调查目标都必然会有其控制因素。例如,在调查一切与劳动相关的现象(收入、流动等)的时候,至少要设置“健康状况”这个控制因素,而且要提出对于它的作用的假设。当然,对于专家来说,各个假设之间互为控制因素是完全可以做到的,那么就请把这些相互关系写出来,以方便后来者求教。
(五)分析方法的假设
在设计问卷的时候,如果没有确定将来要使用什么样的统计方法来进行分析,那么就像米下锅了还不知道要烧饭还是熬粥,其恶果不仅仅是最后做出夹生饭来,而是很可能中途就把锅烧坏了。
笔者的性调查,由于问卷中大多数提问都是定类变量甚至仅仅是定性变量,不得不准备采用Logistic回归来分析,因此笔者必须把这些提问的备选答案尽可能地转化为两极选择(是不是、有没有),哪怕这会被外行人认为是太简单了。反过来看,如果笔者已经确定了要使用Logistic回归进行分析,那么问卷中就没有必要更多地设置定比的或者定量的备选答案,因为很少有被调查者有能力、有意愿进行哪怕是最简单的计算,备选答案多了反而容易使他们乱答。
如果准备进行时间序列分析或者多层次分析[6],那么在问卷中就必须设计出所需要的各种专门的变量、其限定条件与特殊的备选答案。反之,如果事先没有进行过这样的设计,那么统计学是无能为力的,除非“强行分析”。
当然,笔者必须说清楚一点:分析方法的假设并不意味着问卷设计一定要跟着任何一种统计方法的具体要求跑。如果我们从社会学自己学科的需求出发,需要设计出某种统计学方法目前尚且无法分析的调查问卷,那么就应该大胆设计,而不应该削足适履。
综上所述,在问卷设计中,如果说对于确定人的社会归属存在着“五朵金花”(年龄、性别、文化程度、职业、收入),那么在提出假设的时候同样也有上述“五朵金花”,而且五花齐放才是春。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。