假设你家乡镇上有两家医院,较大的那家医院每天约有45名婴儿出生,较小的医院每天约有15名婴儿出生。你知道,大约50%的婴儿是男孩,但确切的百分比每天各不相同,有时可能高些,有时可能低些。在过去的一年里,两家医院分别记录了超过60%的婴儿是男孩的日子。你认为哪家医院记录的这样的日子较多——较大的那家、较小的那家,还是两家大致相同(即相差在5%以内)?①
①本例取自D. Kahneman和A. Tversky的“Subjective Probability:A Judgment of Representativeness”,Cognitive Psychology 3,no. 3(1972):430。
当被问及这个问题时,大多数人认为两家医院会有大致相同的这样的日子。然而,我们应该预计小医院有较多60%是男孩的天数。为什么呢?因为小样本中的结果有更大的变数,因此有更多的机会发生这样看似不具代表性的事件。但是我们做判断时没有意识到样本规模的重要性,而是误以为小样本具有与大样本一样的代表性。
如果抛6次均匀的硬币,你认为更可能发生下面哪种序列?
(A) H T H T T H
(B) H H H T T T(www.xing528.com)
是A、是B,还是它们具有相同的概率?大多数人都说A,其实A和B的可能性是相同的。为什么呢?由于每个硬币哪面朝上都与下一次无关,每次正面朝上或反面朝上的概率都是1/2。为了得到每个特定序列的概率,要将1/2自乘6次(抛硬币的次数)。结果是1/64,即每种序列的概率是1.5%。然而,我们往往以为即使一个随机过程的短序列也会是那个过程的代表,因此这个序列的每个部分看上去一定是随机的,因为随机过程在正面和反面之间切换,所以选项A似乎更像。②
②这被称为小数字定律中的信念,在这里我们认为大数字定律同样适用于小样本。参见A. Tversky和D. Kahneman的“Belief in the Law of Small Numbers”,Psychological Bulletin 76(1971):105。
正如你所看到的,我们有一个错误的观念,以为小样本能较近地代表母体,而实际上并不能。因此我们在做判断时认为小样本与大样本一样可靠。这样可能导致各种各样的错误决定。例如,一项研究表明,学生经常根据几个同学的建议来选课,而不是根据数十名学生写的书面评价。为什么呢?学生将注意力集中在少数个人陈述上,忽略了那么小的样本规模的不可靠性。③但是小样本能代表母体的可能性较小——班上的几名学生相比于整个班级,其观点的差异性可能更大。意识到小样本并没有大样本那样具有代表性,将大大有助于我们形成更好的信念,做出正确的决定。
③Sutherland,Irrationality第213页。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。