研究目标和设计的多样性使得确认一组可接受的实验程序的工作变得更加复杂。然而,某些一般性的实验设计和程序思路适用于大部分实验研究,在这里对其进行讨论是具有启发性的。为了能够说清楚,下文将主要从市场实验的角度展开讨论。
一般来讲,实验设计应该能使研究者利用上面所讨论的实验的主要优势:可复制性和控制性。尽管实验设计思路的分类方法在某种程度上与个人偏好相关,但是我们发现下面的分类是有用的:程序规律性、激励、无偏性、校准以及设计的类似性。程序的规律性是涉及遵循一条能被复制的路径。激励、无偏性和校准是我们在下文中将进行解释的控制实验的重要特征。设计的类似性指的是实验情境设置和自然发生的经济过程之间的联系。这些设计标准我们以一般化的方式进行介绍。
6.2.4.1 程序规律性
实验者赋予所收集数据的专业可信度对于实验的有用性至关重要。其他人能够并且确实可以复制实验的结果,并且在进行实验和报告结果时,研究者感觉到潜在的复制性的压力。为便于复制,程序和环境应当标准化,从而使得需要处理的变量得到调整。除此之外,仔细撰写这些程序(尤其是导语)也是很重要的。一般而言,标准化和报告程序的指导性原则是允许研究者和外在观察者能够接受这一复制的有效性。研究者应当采用并且报告以下相关内容:
(l)引言。
(2)解释性的例子和被试者理解程度的检验(它应当包括在引言中)。
(3)回答问题的标准(例如没有超越引言的信息)。
(4)货币或者其他报酬的性质。
(5)没有报酬的“实验”或者练习时期。
(6)被试群体和招募被试者的方法。
(7)被试者的数目和经验水平。
(8)匹配被试者角色的程序。
(9)实验回合的位置、日期和持续时间。
(l0)物理环境、使用的实验助手、特别的方法以及计算机化。
(l l)任何被试者企图实施的欺骗。
(l2)需要解释的具体回合中程序的无规律性。
即使期刊空间不允许有导语、工作表格和数据的发表,研究者也应当使期刊的审稿人和想要浏览和评价这一研究的其他人可以获得这方面信息。
计算机的使用已经在强化经济学复制性标准方面做了许多工作。通过可视化计算机终端实现的导语以及实验环境的展示增强了实验的标准化和可控制性,并且简化了使用不同被试群体复制实验时的工作。而且,一些涉及大量互动或者私密的程序性人物,很容易通过计算机执行,并且计算机化往往能够通过节省用于保留记录和传递信息的时间,使得研究者在一个回合中获得更多的观察值。
然而,重要的是,计算机化并不是进行许多实验的必要条件。即使是在可以广泛使用计算机的情况下,一些非计算机的程序依然有用。例如,如果被试者怀疑被欺骗或者报酬通常很大,那么扔骰子的物理行为就比用电脑程序产生随机数更具可信性。同理,即使导语是通过计算机呈现的,我们通常更偏好在被试者看着电脑屏幕时实验者能大声地宣读导语。这增加了共同知识,即每个人都清楚其他人知道程序和报酬的一些内容。宣读也排除了一些被试者比其他被试者更早完成阅读并且变得无聊的情况。
最后一个程序上的重要话题涉及一个被试库的建立和维持。尽管很少谈及,被试招募、引导以及支付的方式都会严重地影响到结果。实验室之外学生彼此之间的联系,可能会使得实验室中的行为因此而受到扭曲。例如,在涉及欺骗或合作的实验中,朋友可能与匿名的参与者表现有所不同。通过在一个给定的回合中从多个班级(年级)招募参与者可避免潜在的问题。基于同样的理由,实验者可能想要避免在实验回合中出现上他(她)课的学生。这些学生会考虑他们的教授希望看到怎样的结果,从而可能会改变他们的选择。
研究者也应当仔细避免欺骗参与者。许多经济学家非常在意在学生群体中形成并且维持一个诚实的声誉,以确保被试的行动受到引导的货币报酬而非怀疑操纵的心理反应的激励。如果出现这一情况,被试者可能会怀疑受到欺骗。而且,即使被试者不能够在一个回合中察觉到被欺骗,但如果被试者发现他们受欺骗并且报告这一信息给他们的朋友,这可能使未来的实验受到损害。维持被试群体的另一个重要的方面是系统性记录被试者参与的历史。一个共同记录姓名和参与时期的系统允许每个研究者能够确定一个新的被试者是在所使用的环境中是无经历的。同理,在需要经验的回合中,一个好的记录维护系统使得在多重“经验”回合中控制相同被试者的重复性使用变得可能。
6.2.4.2 激励(www.xing528.com)
在设计一个实验中,参与者收到显著的报酬应该与相关理论或者应用中所假定的激励相对应,这是至关重要的。显著性意味着决策的变化对于报酬有一个显著的效应。显著性要求:①被试者明确所作出的决策和报酬结果之间的关系;②所引导的报酬足够高,从某种意义上来讲,占优于被试者所作出的决策和交易的成本。例如,考虑一个竞争性数量预测,它要求对一个买者价值l.40美元而对于一个卖者成本为l.30美元的一个单位进行交易。如果协商合约的联合成本超过0.l0美元,那么将不会完成这一交易,并且竞争性数量预测将“失败”。
在考虑具体的实验情境前,没有人能够先验地保证报酬是足够的。一方面,即使是通过最大化纯粹假设的报酬数额,参与者也会试图在许多情形中“表现得出色”。另一方面,不一致或者变化的行为并不必然是货币激励不足的一个信号。没有货币数额能激励被试者进行超越他们智力范围之外的计算,而任何更多慷慨的奖励将会使我们成为专业的运动员。然而,这样一种观点已经形成,即给被试者提供报酬倾向于减少表现的波动性。基于这一理由,经济学实验几乎一直涉及非假设的报酬。
同时,作为一般的情形,报酬是货币的。货币报酬最小化了有关个体对于报酬媒介的异质性态度效应的忧虑。用诸如咖啡杯或者巧克力棒等实物表示报酬,可能会导致一些无法控制的成本,因为参与者可能各自对于实物的评价是不同的。货币报酬也是高度可见的并且具有非餍足性的优势;与没有吃够巧克力棒的假定相比,假定参与者没有获得足够的货币会使得问题更少。
在许多情境当中,即使所有参与者都作出了仔细的决策,对于边际行动的充分激励还需要参与者的收益存在很大的差异。例如,在一个市场中的高成本卖者,不管他们的决策如何,将往往比低成本卖者赚得更少。如果有可能的话,那么平均报酬应当设定得相当高以用来充分抵消所有参与者时间的机会成本。这一机会成本将取决于被试群体,专业人士的时间机会成本会比学生被试者要高。如果同时涉及几个替代性理论或者假说,那么对于激励意图而言,收益水平在所考虑的每一个替代方案的结果中都应当足够高。例如,如果在竞争性均衡中被试者的收益是零,那么将不能观察到竞争性定价行为,因为零收益可能导致反常的行为。
在一些实验中,被试者的收益是用实验货币来表示的,然后再转换为现金。一个非常低的转换率(例如,l00实验货币兑换l元,相当于一个货币过滤器的功能)能形成好的价格序列,它更接近于连续模型中的理论结果。使用实验货币“过滤器”的第二个优势体现在实验主持者想要通过大额的实验货币表现最小化的人与人之间的报酬比较。当实验者关心收益水平时,实验货币也可以用于控制报酬锚定的位置。比如,通过在相同的设计中以不同的实验货币与真实货币的转换率进行实验,能够控制在绝对报酬水平上的收益效应。当实验回合是在使用不同货币的不同国家中进行时,用实验室货币表示报酬也可以控制回合中的不同聚点。
一些实验经济学家进一步坚持认为货币过滤器能够增加激励,比如,被试者可能努力地赚取即使他们被嘲笑只值l元的l00实验货币。我们发现这一货币幻觉的观点不那么有说服力。许多国外的旅行者在第一次回国时,会津津乐道地说着自己花费了成千上万比索或者其他货币的故事,却并不担心产品的真实成本。同样地,实验室货币的使用可能掩盖甚至是稀释了金钱动机。而且,即使实验室报酬确实造成了货币幻觉,它们也可能同时制造一种人为的投机性竞争的“棋盘游戏”的感觉。基于这些理由,除非研究者对于使用实验货币有一个具体的设计动机,用现金表示实验室收益应该是深思熟虑的结果。
关于激励的三个额外的评论值得简要地提及一下。首先,除了支付参与者在实验中的收益之外,再支付给参与者一个出场费用,这是相当标准的惯例。支付一个之前告知的费用有利于招募被试者,建立可信度,并且提供了被试者在导语中可能阅读到的重要的激励内容。其次,为了控制激励,实验者具体化实验的所有方面是非常重要的。例如,无法提供回合的持续时间和时期个数,可能影响被试者对以某种未知的和不受控制的方式进行合谋的动机的认知。第三点是第二点的限制性条件。如果给予被试者其他人所得货币报酬的完全信息,那么存在着对于激励失去控制的风险。在完全信息条件下,如果理论模型激励行为人最大化他们自己的报酬,那么嫉妒和善意更有可能成为另一个问题出现。史密斯(l982)将隐私(只知道自己的报酬函数)加入到了一个有效微观经济学实验的充分条件之中。隐私对于某些意图是合适的,诸如检验那些将隐私具体化的理论,或者对那些并不具体化隐私的理论进行压力检验。另一方面,隐私可能并不适合那些受到将博弈结构的完全信息具体化的博弈理论模型所驱使的实验。
6.2.4.3 无偏性
实验的进行不能使得参与者认为某种行为模式是正确的或者被期望的,除非外在暗示是一个处理变量。复制的可能性应当提供充分的激励以阻止那种扭曲参与者行为的极其恶劣的尝试。然而,我们提及无偏性的话题,并不是为了警告研究者远离明显的暗示性行为,而是指出即使是最为好意的研究者也应该怎样小心避免微小的行为暗示。与其他观察性的实验数据所不同的是,人类参与者渴望做出研究者希望得到的东西并且能对极其微小的暗示作出反应以显示他们做得“很好”。如果一个实验是人工进行的,那么让实验执行者不知道具体设计的理论预测有时很有用。这是可以实现的,比如,在一个实验市场回合中,通过对所有价值和成本增加一个伪装的参数,这在没有改动市场的主要结构条件下将供给和需求移动了同样的距离。在每一回合中改变移动的参数,这可能使一个实验的执行者不知道均衡价格。这些变化也减少了学生之间的事后讨论影响后续回合中的行为的可能性。
一些研究者认为回合应当由一个不知道实验意图的助手进行,也就是在一个“双盲”的环境中进行。我们自己的感觉是,研究者有最强的动机和能力发现程序问题,因而我们偏好于让自己出现在一个回合之中。但是在某些类型的实验特别是在那些涉及公平话题的实验当中的被试者,可能会受到他们正被第三方所观察到的事实的影响。在这样的情形中,对于研究者来说,最好是不引人注目或者不被看见。
另一种偏误的可能来源是用于解释激励的术语。抽象物品的交易,而非“污染许可证”或者“垂危企业”,可能会避免不可观测的个体偏好或者对特殊产品的厌恶而对结果产生影响。具体的经济学或市场术语也可能暗示具体的行为类型,比如“卡特尔”或者“合谋”。基于这一理由,避免提及任一具体产品的实践方式被广泛认同。然而,在此应当有一个权衡。尽管对博弈理论概念的简单检验能够并且应当在不给出决策变量的经济名称下进行,但是在另外的更为复杂的交易制度中,市场术语的使用在有效地交流报酬的结构方面是有价值的。例如,尽管在没有使用诸如“买者”“卖者”或者“价格”等词的情况下有可能进行史密斯的双向拍卖市场实验,但是将很难向被试者解释这一实验结构。
人们应当运用常识来评价在提供足够的经济背景以解释激励结构和不提供暗示性术语之间的权衡。在导语上值得花费大量的时间;最为保险的方法,是从标准的、常用的导语开始,并且修正它们以备将来使用。实验性实验和个体“汇报”回合有利于诊断措辞的问题。例如,曾有被试者告知一名实验主持者,说明表中的“寡头垄断”一词泄露了实验的意图,因为被试者记得他的介绍性的经济学课堂中假定寡头垄断者应当合谋。这一被试者与众不同地成功实现了合谋。结果,所有前面的数据被抛弃,并且说明表也因此作出改变。
6.2.4.4 校准
实验设计也需要着眼于所产生的数据。校准涉及建立一个清楚的比较基础。例如,假设正在研究的理论是竞争性行为会受到一个处理变量——比如,一些卖者持有的联合市场势力的影响而改变。在这一条件下,就必须从竞争性结果是在没有市场势力的条件下产生的基准条件开始的。校准的一个相关方面是设计一个实验使得替代性理论的预测能被清晰地分离。这一方面是重要的,因为一个行为理论的评价过程是经历证伪而非证实,而如果有一个不被证明是虚假的合理替代方案,那么证伪更加令人信服。
行为上的“噪声”是不可避免的。市场回合中价格集聚在竞争性的预测结果附近,但是它们并没有单一地受限于竞争性价格区间的边界。事实上,即使是用同样的交易者开展了相对较多的交易回合,仍然有理由怀疑依然存在着一些残差的价格变化。从这一行为上的噪声来看,可以得到两点:第一点是设计的问题。仔细的实验设计不能仅仅局限于识别替代性的预测结果,竞争性预测结果在行为上的后果应当充分显著,以使其能够很容易同内在表现变化性区别开来。第二个问题与在理论定义域之外的预期行为变化有关。尽管某些行为变异性属于不能被有效减少的噪声,但是存在着非常普遍地影响表现的其他理论上的不相关因素,诸如在实验环境下形成的经验、群体效应以及实验局呈现的顺序。为了得到合理的统计论断,对这些可预期的变化来源进行控制是很重要的。
块状化,或者是有条理地配对观察值,可以被用于中和这一噪声变量效应。例如,考虑旨在评价卖者之间的交流对于定价的效应的市场实验。这一实验包含两个实验局:A(没有交流)和B(有交流)。若结果是交流倾向于产生更高的、合谋性的价格,那么观察到一个序贯的或者实验局顺序效应并不是什么令人惊讶的事情。在一个给定的回合中,当A紧跟在实验局B之后而非在B之前时,我们可能预期看到无交流的实验局A中的更高价格。有时这一问题的经济学理论表明了一个特定的序列。例如,一个维持现状的实验局在一个实施一种可能的替代性政策的实验局之前进行,这往往是合理的。当这一情形的经济学并不需要一个特定的序列时,在每个其他回合中反转实验局的顺序以控制顺序效应将是可取的。
6.2.4.5 设计类似性
作为最后一个设计话题,我们考虑实验的构建究竟应当在多大程度上类似于自然发生的经济情境。设计类似性的术语在这里用于表示与自然情境的接近程度,而非与经济学家已设计的理论的接近程度。给定实验环境相对简单的性质,非实验学家往往对此表示怀疑,而实验学家应当对自然市场中有关行为的论断表示谨慎。回想一下理论的证伪是实验分析的重要目标。这样的检验要求具体实验环境满足理论的条件,而非自然市场的条件。通过增加实验的复杂性从而增加实验设计的类似性,这很简单却具有诱惑性,但是这往往会导致很难进行理论分析以及被试者很难理解的后果发生。
在一个理想化环境中的理论证伪过程并不是没有政策相关性的。尽管简单的实验不能在更丰富的环境中预测具体理论或政策修正的效应,但是这样的实验能够提供政策建议是否会产生合意效应的大量证据。例如,Isaac和Smith(l985年)使用一个建议的反掠夺规则进行了一系列回合的试验,在反掠夺规则当中,禁止一个占优势的企业对进入作出临时降低价格的反应;与那些在没有这一规则下进行的可比较的“未受保护”市场中所观察到的结果相比,这些回合表现出更高的价格和更低的效率,这些结果使得管制“疗法”备受质疑,因为它损害了即使是在最好环境中的表现。普遍来讲,如果一个理论的行为上的假设在简单的条件下失灵,那么解释的重任将转移到相关政策的倡导者身上来。
然而,最大简洁化并不一直是必需的。当试图作出相关理论的正面论断以作为压力检验过程的一部分时,增加复杂性是合理的。当理论在逐渐复杂化的实验环境中的表现超过其竞争理论时,这种理论在自然界中起作用的可能性就会随之上升。事实上,在实验室研究之后紧接着进行一个现场实验,即在一个限定的自然情境中的检验看起来是合乎逻辑的。现场实验通常很昂贵,因此现场实验很少进行。
实验设计类似性中的一个重要话题是给予被试者数量合适的信息。例如,寡头垄断或者博弈理论行为假设的最小化检验,应该复制理论假定的信息环境,即使这需要比在产业市场中企业通常所持有的信息更多、更精确。另一方面,那些交易者不知道其他人的成本和价值的实验,诸如史密斯初始的市场实验,能被近似地视为敏感性检验以及试图在“真实”环境中发现特征事实的努力。因而,设计类似性的程度取决于实验的意图。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。