二、观念调查的问卷设计的原则
如果我们必须进行观念调查,那么在设计问卷的时候,首先需要考虑以下各点。
(一)观念的持续期
所谓“观念”,其实就是人的想法。人的想法也是会变的,不但一生中的不同阶段会有所变化,而且一天中的不同时间也会有变化;不但会小变,还有可能会剧变。因此我们使用问卷调查到的任何一种观念的状况,其实都是被访者此时此刻的想法。彼时彼刻他们的想法会不会改变,会变成什么样,我们不可能知道,也没有什么手段去预测或者修正。
这就要求我们必须在此前研究的基础上,慎重地思考与检验一下,我们准备调查的那些观念的“持续期”究竟有多长,与我们预计要说明的问题的“存在期”是否配套。例如,对于任何一种具体的社会现象的类似民意测验那样的观念调查,不仅在操作上必须“短平快”,而且在设计问卷的时候就应该意识到,它的意义往往只能用“月”来计算。如果我们希望了解的是类似“社会态度”那样的基本观念,那么就应该设计出足以按照“年”甚至“代”来计算的问题与问卷。
笔者在三次调查中充分考虑到这一点,因此在“性脚本”(性观念)部分的所有提问所针对的观念,都是笔者预计至少在“5岁的年龄段”内不大会出现剧变的。当然,目前中国社会学界对于“观念的持续期”的研究尚不多见,这制约了笔者的设计。笔者渴望尽快见到这方面的可操作成果。
(二)观念的层次
即使是对同一个问题或者现象,人们的观念也一定是多层次的。笔者相当武断地提出(以期引起讨论)如下的最低限度的分层。
最大的观念是意识形态或者信仰,也可以叫做“元观念”。一般来说,它是清晰的、坚定的、持续的。它离一般人的日常生活比较远,也很不容易表述清楚,但它却是人们做出选择时的主要根据之一。无论在什么方面,成年人其实都有这样的意识形态,所谓“无信仰者”或者“活得不明不白的人”其实并不存在。
第二个层次叫“外指观念”,就是中国语境中一般人常说的“道德观念”。之所以说它是“外指观念”,是因为它一般是人们针对各种社会现象所产生的一些看法、评价等,往往并不直接针对自己。
第三个层次是“内指观念”,大体上相当于中国人说的“生活态度”。它主要反映的是人们在可能涉及自己的时候对比较具体的问题的看法。
第四个层次则是“生活策略考虑”,相当于人们的“实际打算”。它往往是人们在遇到某些非常具体的事务时的选择倾向。
在一个人的头脑里,这四个层次的想法不一定会划分得很清楚,但是在这个人的生活实践中,大多数情况下是可以从其实践结果上看出这种区分来的。以笔者的性调查的结果为例,确实有些人在意识形态的层次上信仰某种宗教,在“外指观念”上反对非婚性行为,但是在“内指观念”的层次上却同意“有爱就可以有性”,在“策略考虑”的层次上又认为自己的个人魅力比较大,结果他们就有过一个以上的性伴侣。也就是说,不同层次的观念对人的行为的影响不仅是不同的,而且可以是相互矛盾的。或者说,人们的行为实际上都是经过选择的,只不过往往是不自觉的选择而已。
那么,对于问卷设计者来说,即使仅仅是调查单纯的“观念状况”,也不得不首先想清楚我们究竟准备调查哪一个层次上的观念,不得不想清楚哪一个层次对我们想说明或者揭示的问题更加具有解释力。
一般来说,“短平快”的类似民意测验的观念调查,应该局限在同一个层次的范围之内。如果希望进行全面的观念调查,就需要精细地分层(不一定按照笔者的说法),只有这样才能考察到不同层次的观念之间的不同关系与相互作用,才能事半功倍,扩大自己的观念调查的价值与意义。如果准备把观念与行为联系起来,考察其相互关系,那么就需要慎之又慎,因为我们对观念的任何一种分层都会直接影响到统计分析结果。
如果缺乏了或者没有解决好这个设计环节,如果把这四个层次混在一起提问,那么观念调查的结果就很可能变成“以其昏昏,使人昭昭”,观念与行为的交互分析更是可能把我们引入歧途。
在这方面,笔者的性调查既有经验又有教训。
在问卷中,笔者基本上是按照上述四个层次来设置各个提问的,每个层次有两个提问,而且在统计分析中也获得了很好的检验效果。但是在2000年的问卷中,在考察“社会性别观念”的时候,笔者设置的两个提问却不够理想,它们与笔者的几个目标变量的相关关系没有得到充分的检验。虽然笔者在2006年再次进行调查的问卷中对这一部分加以修订了,但是其效果仍然不够理想。究其原因,最根本的还是因为笔者对“社会性别观念”的分层不很清晰,没有很好地界定这个方面的四个层次及其相互关系。
(三)观念调查结果的意义
谈到观念调查,人们经常举出西方对选举结果的民意预测作为其可行性的例证。但是我们一定不要忽视这样一点,即那种观念调查的结果是可以及时地得到验证的,而且可以通过一次又一次的选举结果来不断地修正原始问卷,因此它才是有效的。
可是中国目前所见到的大多数观念调查,其结果都是无法验证的,至少也是很少有人真的去验证。例如,“就业观念”与“就业结果”之间当然存在许多“中间因素”,但是如果我们社会学还没有把观念与结果这一头一尾进行对照调查,那么我们不仅无法提出对于那些“中间因素”的相关假设,而且也无法知道观念调查的结果究竟有多少意义。
虽然我们不可能要求每一个观念调查都用行为的结果来加以验证,但是在观念调查问卷的设计中,我们却可以而且应该增设一些“测谎题”。虽然它们不能告诉我们真实的观念是什么,但是它们可以告诉我们哪些回答是不可信的,从而减少调查误差。虽然它们不一定总是能够测出真正的“谎答”,却足以帮助我们发现一些我们原来并不知道的各种观念之间的矛盾之处,从而促使我们进一步发掘这方面的研究素材,乃至提出新的相关假设。
(四)观念调查的主要用途
笔者认为,作为社会学的调查,观念调查应该主要用于考察在一定的相关假设中的观念与行为之间的相互关系。
在这样的调查中,一方面作为百分比调查或者分布调查,我们完全可以获得相当多的“观念”的调查结果;另一方面,我们又可以在分析“行为”与“观念”的相互关系中,极大地加深对于“观念”的理解。例如,笔者在性调查中发现,年轻男性的所谓“处女情结”的百分比虽然确实比较高,但是这与他们选择女性性伴侣的实际结果之间其实并不存在显著的相关。这样,笔者就可以理解,被表达出来的“外指观念”层次上的“处女情结”,其实并不像表面上那样强大与有效。这样笔者就可以进一步思考为什么“处女情结”会被如此气势汹汹地表达出来,它背后的客观社会背景与主体建构过程又是怎样的。这样,笔者的思考就发展了,笔者的研究也才会发展。
因此,笔者建议即使是单纯的观念调查,即使不需要考察行为,也以增加一两个关键行为的测定提问为好。
三、操作建议
无论是否需要达到社会学的调查的层次,凡是观念调查都必须注意一些基本问题。有关这个方面的问题,许多教科书与学术文献中都有过论述(W.Foddy,1993;G.B.Willis,2005),笔者就不再重复。此处,笔者根据自己的切身经验,仅仅提出最有心得的几点建议。
(一)高层观念,要能够问得出来
在意识形态或者信仰这个最高层次上,除非社会上已经有一个达到广泛共识的说法[5],否则要把我们的提问说清楚,还真不是一件容易的事情。
例如,在笔者的性调查中,“男主外,女主内”这样一个传统的社会性别观念是非常重要的,笔者也假设它与人们的行为有相关关系。可是,如果笔者仅仅简单地提问:“您同意‘男主外,女主内’这种说法吗?”那么就会有相当一部分城市青年或者低文化的人不明白笔者在问什么,或者他们对于“男主外,女主内”可能有着笔者所不知道的理解。
笔者在问卷中是这样询问被访者的:“有人说,对于妻子来说,应该以家庭为重;对丈夫来说,应该以事业为重(就是‘男主外,女主内’)。您同意这种说法吗?”
可是统计分析结果表明,这个变量对于笔者的几个目标变量的解释力仍然不够强。除其他的可能原因外,笔者不得不怀疑,笔者的如上提问,仍然存在着表达不清楚或者不贴切的可能性。
(二)道德观念,最好讲故事
对于“外指观念”(道德观念),泛泛的提问是效果最差的方式,因为人们对于事情发生的背景、过程与结果知道得越多,做出的道德判断才能越准确、越真心。例如,同样是对于“一夜情”的道德评判,外国人之间发生的与中国人的不一样,同龄人之间发生的与涉及未成年人的也不一样,结局美满的与闹翻天的又不一样。如果仅仅询问“您对一夜情的看法”,那么我们所得到的回答很可能只是对这个概念(名词)的道德判断,而不是对这个事实(行为)的看法。
笔者建议最好给被访者讲一段故事,不是长篇大论、有头有尾的故事,而是故事化的一段话,这样人家才能够知道你到底在问什么。例如,我们可以这样来提问:“一个已婚的男人与一个未婚的女性自愿发生了‘一夜情’,没有经济来往,没有后果,也没有别人知道。您认为在道德上应该如何评价这件事情?”
“讲故事法”的优点是可以更加准确地了解人们对一个情境化的事实的道德判断。当然它也有局限性,就是故事的情境越细化,对于这个故事的回答就越不能推论其他的哪怕是稍有不同的情况。
可是,这个局限性是可以充分地消解的。我们可以根据自己所要考察的主要目标,尽量多地设置一些不同的情境与故事,来分别考察人们对于同一个问题的道德判断。例如,上述“一夜情”的故事,只要改变其中的任何一个要素,就可以成为不同的故事。这样,虽然提问的数目增加了,但是我们对问题的理解也更加广阔与深入了。我们宁可只得到一些虽然狭窄但是深入的回答,也不愿意让那些大而不当的提问把被访者与我们自己都引入云遮雾罩的境地。
(三)调查方法,最好是照本宣科(www.xing528.com)
前面说过,问卷调查是一种人际互动,调查员对被访者的回答是有影响的。这在观念调查里尤其突出。试想,如果一个人用一种不够正经的口气来谈论一个其实很正经的问题,再问您的看法,您还会如实回答吗?
因此,调查者在设计观念调查的问卷时,必须规定调查员使用什么样的方法来操作这个观念调查。因为这关系到整个调查的质量高低,甚至关系到调查该不该开始做。
从最理想的状态出发,笔者建议观念调查最好是使用“照本宣科”的方式,就是要求调查员不要更改问卷中的任何一个字,甚至要求他们严格按照规定的声调、语调宣读问卷,例如,只能用平调,不许用升调、降调,或者只能用降调等。因为同样的一句话,调查员用不同的声调念出来,对方就很可能做出不同的回答。
越是敏感的问题,就越要坚持这个要求。它要求我们更多地培训调查员,但是为了保障学术研究的质量,这样做还是很值得的。
这里附带说一下,笔者在“性调查”中使用笔记本电脑进行调查的好处就在于此。由于提问被转化为出现在电脑屏幕上的文字,而不是调查员的直接口头表述,因此调查员的干扰被降到了最低,而且提问本身的敏感性也被降到了最低。这是因为有一些性行为方面的词语,许多人连听都不愿意听,可是阅读一下却是可以容忍的。
“照本宣科”的方法还有另外一个好处,就是可以化解观念调查中经常遇到的一个难题:调查员应该记录的究竟是被访者的第一反应,还是被访者修改后的选择?[6]
就事论事地看,两种方法谁也说服不了谁。第一反应可能是“本能的”反应,可能更准确,但是对第一反应的修改可能是更加深思熟虑的、更加真实的。其实,这两个办法之间的区别不在于调查员应该记录什么,而在于问卷设计者允不允许调查员与被访者互相讨论。如果允许他们讨论,那就是向定性访谈靠近,那就应该是双方充分讨论之后,共同决定一个选择。可惜,这等于把调查质量的决定权完全放给那些不一定合格的调查员。在那种规模较大的调查中,与其如此费时费力地调查,还不如另外组织一次更加纯粹的定性调查。
如果我们使用“照本宣科”的方法,事情就简单了。由于我们不允许讨论,而且连声调和语调都规定死了,因此我们要求调查员仅仅记录被访者的第一反应。即使被访者提出要修改,我们也只是把它作为额外记录,在统计分析的时候加以参考而已。
“照本宣科”的方法还有一个好处,那就是可以在一定限度上有意营造统一的调查情境。不过,这个好处不是太显著。
在理想状态下,观念调查在操作时的情境应该是统一的,这样才能尽可能地减少“到什么山唱什么歌”这种生活习惯的干扰。否则,在不同的情境中获得的数据会缺乏统一性,放在一起来统计就多少有些勉强。笔者在“性调查”里统一规定:调查必须是在被访者的住处之外、在封闭的房间里、在没有第三者在场的情境下一对一地进行。这样的规定,是为了保密,更是为了尽可能地把对数千人的调查的情境统一起来。
由于现实的原因,这样的标准很难被大多数的调查沿用。那么“照本宣科”的方法就是至少在调查员给出的信息这个方面尽可能地走向统一。
(四)提问中要尽量弱化“对方指向”
被访者在回答敏感的观念题时,实际上存在一个类似于“文责自负”的顾虑,意思就是说我的任何回答都是我自己的真实想法,必要时,我必须对这个回答负责。尤其是在被问到一些负面的观念时,有些被访者的这种潜在的“负责焦虑”会相当严重。例如,如果一个人被认为是循规蹈矩的已婚者,但是他(她)却想对调查员表达赞成“一夜情”的态度,那么他(她)的自我心理压力可能会不小。因此,如果鲁莽地直接询问:“您赞成一夜情吗?”获得真实回答的可能性就会被严重地降低。
这种提问方式就是“对方指向”。在某些敏感的被访者听来,其言外之意就是,我(问卷设计者)可不赞成“一夜情”,如果你(被访者)非要赞成,那你就去负责任吧。
为了避免出现这样的局面,笔者强烈建议把所有敏感的观念题都写成“有人说……您认为这种说法对吗?”这样的句式。这样一来,潜在的“文责”就被潜在地转移到一个其实并不存在的“有人说”上面去了。被访者回答这样的提问就会轻松得多。在笔者的“性调查”里,凡是涉及观念的提问,全部都采用了这样的句式。这种做法得到了国际同行的好评。[7]
(五)“假设式提问”必须注意观念的层次
“如果你遇到这种情况,你会怎么办?”这是观念调查中经常使用的一种提问方式,以便测定被访者对某种比较具体的情况的态度。
可是,这种提问方式的前提条件是:我们所假设的情况,是被访者非常可能遇到的,最好是肯定会遇到的情况;否则最好不要这样提问。这是因为,被访者发生这种情况的可能性越小,他们对这种情况就越缺乏真实感,做出的回答就越具有猜测性。
按照笔者前述的观念的四个层次来看,这种提问方式恐怕只有在最低的“生活策略考虑”这个层次上才是合适的。例如,同样是调查“金钱观”这个问题,在最低层次上,我们可以假设地询问对方如果买彩票中了大奖将会怎么使用它。虽然买彩票者在总人口中的比例并不高,但是买彩票这件事情还是广为人知的,因此这个提问的实现可能性还是比较高的。
可是,如上升到“生活态度”的层次上,我们就不得不假设地询问对方有了很多钱之后会怎么办。然而,相当多的人可能这辈子也不会有很多钱;结果,有些被访者只好像网上流传的笑话那样回答我们:“买两碗面条,吃一碗,扔一碗。”
如果再上升到“道德观念”这个更高的层次,我们的假设式提问就可能变成“您是否同意金钱是万能的这种说法”。那么被访者的回答早在20世纪90年代就被电视剧的台词给框定了:“金钱不是万能的,可是没钱是万万不能的。”
倘若非要去考察信仰层次上的观念“是否相信金钱最重要”,那么无论对方回答什么,我们都无法知道这个回答与他的实际生活有多大的联系。
进一步来说,即使在最低的“生活策略考虑”这个层次上,假设式提问的人口涵盖面也是很成问题的。在上面的例子中,我们其实并不知道有多少中国人穷得根本就不考虑买彩票或者富得不需要考虑买彩票。如果我们非要这样提问,那么对他们就是一种强迫,其回答的意义也就要打折扣。极端地说,即使我们假设地询问被访者“收入增加之后会做什么”,也不得不考虑有许多人的收入根本就没有增加的任何可能这种情况。
笔者希望,在类似的观念调查中,最好能够在问卷中设计一种“观念的参照指标”,就是用某些事实(行为)的变量来加权所获得的观念变量的数值。如上例,关于“中大奖后做什么”,我们应该增设“是否买过彩票”的变量。被访者买过或者没买过彩票,他们对于观念的回答都需要进行加权处理。
(六)观念调查,最好不用排序的方法
有些调查者总是想知道,人们的第一位的观念是什么,第二位的观念是什么,因此就在问卷里设计出排序题来,有人甚至排序排到第10位、第20位。
这样的设计者忽视了一个基本的问题:社会学的调查,最关键的并不是您自己需要了解什么,而是被访者有可能告诉您什么。除了不愿意回答之外,被访者有没有足够的能力来回答您的问题,才是最重要的。
这里笔者谈的不是被访者的文化水平或者个人素质的问题,而是说问卷设计者需要理解下面这一点,那就是,在这个世界上,恐怕只有与我们类似的“一小撮人”才会关注我们所提问的现象或者问题,才会经常思考它,才会有答案,才能在有人询问的时候脱口而出。我们之外的人,有着自己的生活,想着自己的事情。对于我们所问的问题,他们很可能从来都没有认真想过,也没有什么现成的答案。可是我们又非要去询问他们,那么,信口开河或者随声附和已经是人家很礼貌的反应了。
在这种情况下,如果我们还非要让人家排出序来,那真是强人所难了。说句不好听的话,如果有的被访者真的能够如实排序,那我们就是巧遇专家了。在笔者的“性调查”里,至少有八个直接针对观念的提问。笔者课题组的同仁们曾经自我试验,但是没有一个人能够把它们排出顺序来。
更为根本的问题是:就观念而言,我们怎么知道在现实生活中它们是不是真的可以进行排序?如果有排序的根据,那么请在调查报告里多少提及一下,也让别人学习学习。
(七)观念调查,其实无法“总汇”
“总汇”是观念调查中一种时有所见的方法,就是先把小的或者低层次的观念一个一个列出来,最后询问一个总的或者高层次的观念,而且假设其中具有逻辑关系。例如,先问现在社会形势好不好,再问经济形势、治安形势、就业形势等,最后再问:那么您认为总的形势好不好呢?在这种“总汇”方法中,如果所有的“分题”都回答的是“好”,而“总题”却说“不好”,就会被认为是不合逻辑的,反之亦然。它甚至被认为可以起到测谎的作用。
可是,这种“部分与总体相矛盾”的情况虽然不符合数学上的逻辑,但是却很有可能符合生活的逻辑。这是因为:
第一,我们的提问没有也不可能涵盖被访者的全部生活。例如,我们只问了九个方面,而被访者可能恰恰生活在第十个方面的生活中。如果这个人是出口商,我们什么都问了,唯独没有问外贸形势,那么他(她)给出的评价当然就不会符合我们所设定的逻辑。
第二,我们无法预先把被访者的生活赋予权重,可是他(她)自己心里却很清楚。在日常生活中,人们总是倾向于在对自己最重要的那些事情上做出“一俊遮百丑”式的或者“一粒耗子屎坏了一锅汤”式的价值判断。例如,上述的出口商就很可能这样回答:九个方面的形势都很好,但是总的形势却很不好。因为他自己最关注的外贸形势很不好,因此他就会“以偏概全”。
因此,“总汇”的方法不适用于生活逻辑,社会学研究不应该使用。
综上,可以用一句通俗的话来表达:“没有金刚钻,别揽瓷器活。”观念调查其实是社会调查中最难的一种,缺乏经验的人最好不要涉足。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。