学生作文贴堂,我们挑最好的;推销员评选,我们推销量领冠同侪的;养猪比赛,我们找体型最大的……对于鼓励士气或认识“最佳的可能”来说,评选冠军无疑是有效而且可行的手段。可是若求认识全班学生、全体推销员、全区所养的猪,冠军的代表性实在有限。同级绝大多数学生是达不到这水平的,要提高全班的写作能力,贴堂作品对同学有示范作用,对老师衡量全班的写作水平则不足。根据冠军推销员的业绩来制订明年的计划,根据冠军肥猪的重量来估计猪肉供应量,偏误是明显的。对于这些应用目标来说,一般性的表现其实更重要。
“一般性”“代表性”和“平均值”这些字眼,看起来简单,有时却得不到重视或得不到准确的估计,这两种情况也互相影响。有时因为严格意义的代表难求,人们索性以模范代替,偏差可能很严重。严格的代表之所以难以选择得到,主因之一是不知代表的范围究竟有多大,代表了什么也说不出,这又怎能说得上代表呢?
这与找冠军不一样,冠军的辨认通常不要求认识范围内所有个体,有时甚至不须界定范围。何况在日常生活中,人们习惯了在理解不足的情况下便做出选择,因而也就多了一丝苟且。即使在找寻最重要的东西时,人们也未必或未能在穷尽范围后才做决定。不相信吗?只消想想我们如何寻觅理想的伴侣便知道了。不过找伴侣虽不容易,我们大多数人毕竟都找到了。(www.xing528.com)
把代表性和冠军来对比,目的不在否定挑选模范的作用,而在于强调分清两者的必要。从研究的需要出发,由于时间、资源和降低错误等考虑,很多时候选择研究的对象只有两个策略:选最具代表性的或选“典型”。“典型”在这里不带代表性意义,也不带评价,“冠军”只是典型的一种,最劣的情况也可以是一种典型。选择具有代表性的样本时,要求知道代表的范围,严格地说,要求知道范围内每一单位被抽出来当样本的概率,这种抽样叫“概率/或然率抽样”(probabilistic sampling)。在无法知道样本被抽出的概率时的选择,或者选择“典型”时,称为“非概率/非或然率抽样”(non-probablistic sampling)。
抽样受许多条件限制,即使看起来最完美的抽法,也不会完全消除偏差,研究者必须尽力而为,在客观限制下选用最适合的方法,如果无法保障代表性,便须坦承这不是概率性样本,不能作推论性研究(inferential study)。非概率性样本(non-probablistic sample)只可用作直接被研究那批对象的描述性研究(descriptive study)。进行任何推论时,应该指出样本的特殊性和可能导致系统性偏差的根源。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。