几乎在所有研究领域中,数据收集过程中都有人的参与。然而,因为人不可能像机器一样完美,操作者(即收集数据的研究者、科学家和实验室工作者)都可能引入误差。
假设有一个化学家名叫苏珊。她的情况和弗雷德的很相似,但是更有趣点。苏珊在称量一种粉末状样本的重量,有时她的测量值是正确的,在公差范围内,有时测量值会有一个具体的量的偏差(这是间歇偏移误差)。见表5.4。
表5.4 苏珊报告的测量值
测量过程中可能发生了什么?如果我们观察一下苏珊的实验原始数据,我们可能有所发现(见表5.5)。
表5.5 苏珊的实验记录
意料之外的测量值出现在深夜(或凌晨)。进一步查看苏的记录,我们还发现装她测量粉末样本的烧杯重量正好是2克。
操作者疲劳(operator fatigue)可能是误差来源之一。在这个例子中,苏忘了按下皮重按钮(也称零按钮,把新的样本放在秤上称时,它会去掉烧杯的重量)。如果她实际上按了皮重按钮,但是它没起作用,或者不是一直起作用,这就是设备误差(equipment error)。疲劳可能还会使操作者不能发现他们的设备不能正常工作。
操作者误差有许多形式,包括误读或誊写错数字、把数据输错位置(在纸上或计算机上)、计算不准确或者没有遵循确立的实验室步骤(这也是方法论误差)。有些操作者误差可以通过额外培训解决,有些可以通过操作自动化解决。然而,操作者疲劳和由工作环境(如工作区工效)引起的其他问题,可能影响科学结果的准确性。
为了避免操作者误差,有些技术需要被作为实验室方法论的一部分进行培训。例如,在许多化学实验室,称量物质重量的化学家,要把装有物质的大容器放在秤上,把秤上的重量调到零(即按下“皮重”按钮,使天平读数显示为零),然后从大容器中舀出几勺物质放入天平边上的小容器中。当天平上读数为他们想称量的量的相反数时,化学家知道在较小容器中的量是准确的。然后化学家可以再次把秤上的重量归零,并再一次把物质舀到较小的容器中。这有助于避免上述例子中苏的问题,因为如果化学家忘记在测量间隙按皮重按钮,秤上的读数立即会比预期的大,错误会容易被发现。
3.5.1 社会科学和医学中的操作者误差
有些研究领域中可能存在更复杂的操作者误差。例如,在社会科学实验中,经常会让实验对象(人、实验鼠、猴子等)接受不同的刺激,以观察实验对象是否会根据不同刺激做出不同反应。有时也观察那些反应是否跟没有受到刺激的对照组的有所不同(这与上面讨论的医药测试相似)。
例如,在非常简单但是典型的认知心理学实验设计中,一组实验对象会被安排听一段时间某种音乐,第二组会被安排听同样一段时间的另一种音乐。研究的目标是发现不同类型的音乐是否会产生不同的结果,即实验对象是否会有不同的反应或者不同的行为。在一个更复杂的实验设计中,使相同的实验对象在不同的时间听不同类型的音乐,并检查他们的反应:第一种研究设计被称作“被试间(between subjects)设计”,因为不同的实验对象受到观察,因此科学家在不同实验对象间作比较;第二种研究设计被称为“被试内(within subjects)设计”,因为同样的实验对象在不同时间受到观察,因此科学家把实验对象与他们自己比较。
但是,研究者是如何知道实验对象的反应,以及他们如何把那些结果变成数据的呢?社会科学家经常使用人体编码器(human coders)创造有关结果的数据。编码者可能阅读文本,如书面的调查问卷;他们可能听音频,如录制的访谈;或者可能看视频。在此过程中,他们关注言行并写下(或输入计算机,或以某种其他方式记下)研究者感兴趣的答复。
棉冠獠狨案(www.xing528.com)
1995年,哈佛大学受人尊敬的科学家马克·豪瑟(Marc Hauser)教授发表了惊人的发现:一种名为棉冠獠狨的猴子,能认出镜子中的自己。在那之前,科学家认为只有高等灵长类动物和其他一些发达的物种(包括海豚和大象)才具备这个本领,这是自我意识和感知能力的主要标志。豪瑟教授在接下来的十年发表了有关棉冠獠狨认知的突破性研究,并成为这个领域受人尊敬的研究者。
认知心理学家有许多方法测试认知能力。豪瑟教授的实验室后来进行了一项实验,调查棉冠獠狨能否注意到声音刺激中的变化(即声音的区别)。为了测试这一点,研究者通过电子扬声器播放了两组音乐,每组有三首乐曲。有时第二组的乐曲与第一组的不同,有时又与第一组的相同。如果棉冠獠狨在第二组乐曲与第一组不同时看向扬声器,但是在第二组与第一组乐曲相同时不看向扬声器,这就说明它们注意到了差别。
豪瑟教授实验室里的科学家给棉冠獠狨录制了视频。为了通过视频获得数据,没有参与实验的编码者会静音观看视频回放(这样他们听不到呈现的是哪种实验条件),并观察棉冠獠狨是否看扬声器。然后编码者记录他们的观察,收集的数据(研究对象看/不看)将与两组音乐是否一致构成反相关。
2006年,在豪瑟教授实验室工作的研究生,对于这个实验中收集数据的方式产生疑虑。特别是,豪瑟教授自己也是视频的编码者,并且他的数据和其他编码者的不一致。研究生们提醒了哈佛官方,他们开始了为期多年的调查。2010年,哈佛大学发现豪瑟教授研究行为不端。2012年,美国研究诚信办公室证实了那些发现。
2011年马克·豪瑟辞去了在哈佛的职位,称他的错误是疲劳和过度工作造成的。他有些研究论文也被撤稿。哈佛大学的全体心理学教职员以压倒性的票数投票,禁止他从事进一步的研究。
正如上面指出的,社会科学家和医学科学家经常通过编码收集数据。然而,编码者的工作并不像在尺子或天平称上读数那么简单。编码者常常需要对事件(如看着扬声器)是否发生做出判断。为了避免编码者带来操作者误差,研究者会使用几种不同的技术。
3.5.2 盲法
研究中的盲法(blinding)是指收集数据的人不知道实验对象被置于哪种条件下。例如,编码者可能被要求看段视频,并判断收看广告的人在微笑还是在皱眉。然而,广告本身不出现在视频中:编码者只能看到和广告同步的时钟,这样他们就能注意到微笑或皱眉发生在什么时候。
在医学研究中,测试新药的科学家常常使用对照条件,给一组实验对象(例如人或鼠)服用或注射假药(安慰剂),给另一组服用或注射测试的药物。在实验中使用对照组时,研究者在给药时非常小心,确保他们自己也不知道药物的真假。这样,在跟被置于两种不同条件下(即测试的药物和安慰剂)的实验对象互动时,他们不会偶然或无意识地表现出不同。如果研究者无意识地表现出不同,实验对象可能会有不同的反应。
在以人类为实验对象的研究中,常常使用双盲实验(double-blinding)。双盲的意思是实验者和/或编码者都不知道实验对象被置于哪种条件下,且病人自身也不知道。实验对象常常认为(有意识或无意识地)自己知道实验者想要他们做怎样的反应,然后(有意识或无意识地)让他们如愿以偿,或者(有意识或无意识地)不让他们如愿以偿。双盲将防止实验者区别对待不同条件下的实验对象,还将防止实验对象想象或虚构反应(这些想象的对疗效的偏向性回答叫做需求特性demand characteristics)。
3.5.3 多重编码者
社会科学中的研究者避免操作者误差的另一个方法是使用多重编码者(multiple coders)。也就是说,不是由一个人观看视频、听取录音或阅读调查问卷,而是多个人各自进行。会将那些编码者收集的数据进行比较,评价编码者获得的结果间的相关性是高还是低。低相关性通常表明系统中存在偏差,它常常(不总是)存在于一个具体的编码者的感知和评价中。
如果许多不同的编码者从同一个来源收集到的数据非常相似,实验被视作有良好的编码者信度(intercoder reliability.)。
3.5.4 独立编码者
虽然编码者常常是与实验所在的实验室有联系的研究生,最好的做法应该是使用不参与实验其他具体环节的编码者。研究者不应该给自己的实验编码。因为研究者总是对实验结果有偏好,他们的编码易受确认性偏差(confirmation bias)的影响。确认性偏差就是说大家常常看到(听到或读到)他们已经相信或者他们想看到的东西。确认偏差会导致严重的系统误差。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。