简单来讲,实证研究最核心的工作是以下这三步(具体步骤的论述请见本书2.2“什么是实证研究的底层逻辑——从西蒙的一篇经典文章说起”):
第一步:你要确定一个研究问题。
这个研究问题最好是你感兴趣的、非常具体的、可以检验的(本书2.3会详细讨论选题)。比如,以下都是可以作为实证研究的题目:
·每年年初制定计划的人会比不做计划的人工作效率更高吗?
·在医院工作的人,是比不在医院工作的人更容易生病还是更不容易生病?
·数学好的人语言能力会更差吗?
·随着年龄增加,人的同情心会逐渐增加吗?
·一个非营利组织的筹款数额与员工对工作满意度有相关性吗?
·明星片酬越高的电影票房越高吗?
·养狗的人比养猫的人更愿意跟其他人社交吗?
以上是我随便举的几个例子,我尽量列举了一些离我们生活不远的例子。你会发现,实证研究的主题经常是非常有趣、非常接地气、跟我们生活息息相关的,所以我相信很多学者都跟我一样,因为自己做了实证研究而对学术研究产生了巨大的兴趣。
此外,当你自己做过实证研究,你会发现你看待周围人和事物的方式或多或少发生一些变化,你相当于给自己的思维做了一个全面加固的升级,它会帮助你更有力地思考很多现实问题。你还会发现,其实我们生活中很多习以为常、墨守成规的观点,未必是经得起推敲的事实,因为它们从未经过系统验证。
我们中国悠久的历史和沿承的文化决定了我们很多知识是通过经验、习俗或口耳相传积累而来的,而不是以更系统化、科学化的方式验证而来的。那么这就意味着可能有些流行的认知、习惯性的做法、默认的观念还有待验证,还需要有更加系统扎实的数据去支持,还值得去展开质疑和进一步探讨。这也意味着,作为一个社会科学研究者,在国内做实证研究,其实有大量“低垂的果实”可以开采,大量的学术贡献等待着学者做出,实证研究方法正是被需要的好时候。
第二步:你要自己设计出验证研究问题的过程。
这其实就是写计划书(proposal)的过程。你要在这一步里思考怎样才能够验证你的研究问题,而具体来说,也就是收集到什么样的数据能够帮你验证你的研究假设。
从这一步开始,你要做的工作就越来越有意思了,你开始通过自己的能力去创造一个从未有过的验证过程。这个过程需要你具备扎实的专业知识和严谨的思维能力,但它最诱人的地方在于,你设计的研究,不会跟任何其他人设计的研究完全一样,它是带着你烙印的作品,它将展现你的思维方式、教育背景、训练背景和对世界的看法。这个研究可是真真正正、从里到外印着你名字的作品。
比如说“在医院工作的人,是比不在医院工作的人更容易生病还是更不容易生病?”这个题目,是我有一次去医院的时候忽然想到的,虽然不是我自己的研究范围,但是我觉得是一个很有意思的话题。这里我好奇的并不主要是医院工作人员更容易被传染,或者免疫能力更强的问题,我当时在医院里的感受是,所有的工作人员每一天都会接触很多的病人、谈论很多的疾病名称、看到很多的病痛症状。他们谈论、思考、接触这些疾病和症状的频率,大概是我们普通人的好几十倍。我们平时也就是偶尔会谈论起某个人生病了,或是偶尔看到别人生病的症状。所以我特别好奇这种“谈论”和“接触”对人有没有心理暗示,人会不会因为每天讨论病情,就更容易得某种病呢?
要想真的用实证方法来验证这个问题,不同的学者的设计思路一定会不一样。比如,到底什么样的数据类型才能回答这个问题?定量还是定性的方法更有效?访谈还是问卷的方法更适合?如何测量“更容易生病”这个变量?选取多少个医院的工作人员才够?选哪里的医院?要不要选多家不同类型的医院?要不要把不同的工作人员(比如医生、护士、其他工作人员)区分开来研究?……这些方面都需要考虑,具体做起来时每个学者也都会有不一样的设计。
更系统一点说,这一步要想把研究设计得精彩,意味着我们需要有以下几个方面的知识(分别在本部分后续内容中进行梳理):
·确定研究假设(research hypothesis)。
·确定抽样过程(sampling process):什么是样本?有什么不同的抽样方法?抽样背后的逻辑是什么?什么时候应该用什么样的抽样方法才合理?定量研究和定性研究的抽样方法有何不同?(www.xing528.com)
·数据收集(data collection):了解数据收集的不同方法,以及各种方法的具体步骤。比如访谈(interview)分为结构化访谈(structured interview)、非结构化访谈(unstructured interview)以及半结构化访谈(semi-structured interview);问卷(questionnaire)可以使用网络问卷、电子邮件问卷、纸质版问卷等;除此之外还有实验(experiment)、实地观察(observation)、焦点小组(focus group)等方法——这些不同的数据收集方法都分别应该在什么情况下使用?什么才是高质量的访谈?什么才是好的问卷?问卷里应该先问什么后问什么?应该如何提高问卷反馈率?……
·测量(measurement):如何问好你想知道的问题呢?你问了问题就一定能得到你想知道的东西吗?如何能准确测量你的变量呢?怎样保证较高的效度(validity)和信度(reliability)呢?是否应该选择和使用前人建好的测量方法呢?
实证研究的迷人之处在于,实证研究的设计,永远没有最好,只有更好。
真正在做实证研究的时候,你会发现各种选项都各有其优劣,就像特点不同的兵器,你拿起哪一把都必须接受它的弱点,所以看起来好像不难的事情其实里面需要考虑和权衡的细节非常多。因为无论你选择哪种抽样方法、数据收集办法、测量的方式,你都真切地知道它们不会是完美的方式。然而,如何在不可能出现完美的现实里,做出尽量无限接近完美的设计,如何在已知困难的事情面前想出最巧妙的方法,这就是做实证研究的巨大魅力。
我总觉得这世界上可以自己决定的事情不多,而亲手做实证研究时,你就像是坐在驾驶舱的位置,通过自己做出的每一步设计去观察和了解这个世界。每一个步骤都可以一丝不苟,做得精良一点再精良一点。大概没有什么事是比看到自己亲手设计和创造的东西做出了好的效果而更有成就感的了。
第三步:数据收集上来之后,你要用统计学或其他合适的分析方法来验证结果。
这一步简单来说,就是“见证奇迹的时刻”!
我自己在做实证研究的所有步骤中,这一环最让我上瘾,也就是数据分析的阶段。分析数据的时候坐在那里“嗖嗖嗖的”几个小时就没有了,异常兴奋,特别想知道分析出来的结果到底是什么样的。
我曾经跟我一个朋友描述过这种兴奋,就好比你本来凭空冒出了一个别人都没有过的想法,一个完全属于你自己的想法,你花了很大力气才找来了可以验证的证据,拟采用客观的方法分析一看,你的想法居然真的被印证了!你说你是不是会觉得自己站上了世界之巅呢?
而有的时候分析结果居然跟你假设的恰恰相反——这难道不是太好玩了吗?假如你认为养狗的人会比养猫的人更喜欢跟人社交,然而结果恰恰是养猫的人更爱社交,这到底是为什么?是你分析时用的工具不对,你的抽样有问题,还是你有什么你没有考虑到的其他解释因素呢?
分析数据的时候需要拥有“知人善任”的能力——各种数据分析的方法都是我们工具箱里的宝贝,它们都有自己最擅长的领域,而面对你的数据,你的研究问题,你需要找到最适合自己现在面临问题的那一种工具,你还要知道你的数据能不能满足使用这个工具的条件[也就是它们各自的假定(assumption)]。分析数据这个能力,是要不断通过看教材、看实证文章、自己做实证研究进行积累的。
我觉得在这一步骤,重要的并不是你要记住所有分析工具的具体使用步骤(这些都能在网上和教科书里轻松查到),而是要知道到底在什么时候去拿起哪种工具。比如,如果你要做定量分析,你可能要了解和考虑使用以下哪种工具才能解决你的研究问题:
·线性相关和线性回归(Linear correlation and linear regression)
·因子分析(Factor analysis)
·结构方程模型(Structural equation modeling)
·方差分析(ANOVA,MANOVA,MANCOVA)
·偏最小二乘回归(Partial least squares regression)
·逻辑回归(Logistic regression)
·非线性回归(Nonlinear regression)
·多层线性模型(Hierarchical linear models)
·……
很多对工具的学习都是通过使用该工具来实现的,很少有学者会对世界上每一种分析工具都了如指掌,但是实证研究做得越多,你接触到的工具自然也就会越多。所以很多时候并不是准备得万无一失了才上战场,而是在战场上边向目标努力边利用实战的机会进一步积累。不断学习新的分析工具本身就是做实证研究的一大乐事。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。