首页 理论教育 证据等级划分的不同策略

证据等级划分的不同策略

时间:2023-07-20 理论教育 版权反馈
【摘要】:循证实践起源于医学界,其中美国医学协会的界定被广泛采用:“循证实践是指将最好的研究证据同临床专家及服务对象价值观相结合。”[20]其中,“最佳证据”“临床专家意见”和“服务对象价值观”三者的重要程度是不一样的。例如,“服务对象价值观”主要体现在个别化的干预情境之中,难以进行客观衡量。由此,循证的证据等级划分就成为一个重要议题。

证据等级划分的不同策略

循证实践起源于医学界,其中美国医学协会的界定被广泛采用:“循证实践是指将最好的研究证据同临床专家及服务对象价值观相结合。”[20]其中,“最佳证据”“临床专家意见”和“服务对象价值观”三者的重要程度是不一样的。例如,“服务对象价值观”主要体现在个别化的干预情境之中,难以进行客观衡量。更加量化的测量方式和更客观的研究设计具有更高的信度和效度,获得更高的证据等级。由此,循证的证据等级划分就成为一个重要议题。总的原则是,客观优先、主观为辅,专家意见及实践经验只有在更高级别客观证据不足的情况下才使用。[21]据此形成了一个各领域循证实践普遍接受的证据等级基本框架,参见下表4-2:

表4-2 证据等级基本框架

续表

资料来源:Glasner-Edwards S.and Rawson R.,“Evidence-based Practices in Addiction Treatment:Review and Recommendations for Public Policy,Health Policy,97(2010),pp.93-104.

然而,以上循证实践的证据等级体系却难以轻易复制、运用到社区矫正领域。究其原因,首先,社区矫正对象大多是被动接受的客体,难以像医学等领域的服务对象那样积极主动参与实践或实验;其次,罪犯矫正的干预措施同效果之间的联系不像医疗服务那样能够准确测量或感知;再次,循证社区矫正的效果往往需要很长的时间跨度才能得以检验;最后,社区矫正领域大量存在的是问卷调查数据,很多是一次性的横截面数据。面临这种现实,加拿大的循证矫正学者们采取了更加灵活的定量化研究策略,进而将矫正证据划分为如下四个等级,参见下表4-3:

表4-3 加拿大循证矫正证据等级

资料来源:James Bonta and Andrews D.A.,The Psychology of Criminal Conduct,Sixth Edition,London and New York:Routledge,2017,pp.14-15.

加拿大矫正学派的这种划分更加具有包容性。横截面数据通过相关或回归得出的影响犯罪/再犯罪的因素,主要说明过去状态,可以成为潜在的风险/需求因素(时常能被其他三类研究印证),但在科学性方面不及其他三类。其他三种类型都是不同形式的动态数据,对将来犯罪行为具有不同程度的预测性。随机分组试验研究设计得出的因果分析结果,则具有最高级别的科学性。

此外,加拿大矫正学派还特别重视荟萃分析的作用,这是为了回应学界的批评,如法学界质疑不同的循证研究得出不同结论,哪怕采用同一种干预方法,也会导致无边无际的犯罪学研究和循证结论,[22]使得立法和政策无所适从。那么,整合相同或相似主题下的分散研究结果,实现更广层面跨情境的提炼和概括,以此求得一个综合结果就非常有必要。荟萃分析的主要操作方法是把不同研究中的统计效果值(如r、t、OR、x2、AUC等)进行加权转换,得出一个通用的值(通常为皮尔森相关系数r或OR)。[23]这种综合结果,也便于读者理解。安德鲁斯和邦德将荟萃分析贯穿于著作的始终,得到国际矫正学界的广泛认同。

但荟萃分析不能代替随机试验,尤其是大型随机控制实验。相对于加拿大学派对于社区矫正证据的灵活性策略,美国更加执着于最高等级的循证证据——试验法,他们划分的循证矫正证据等级也主要依据试验法的严密程度。马里兰大学研究者完成的报告《预防犯罪:哪些有效、哪些无效、哪些有希望?》[24]中,建立了马里兰大学循证矫正证据等级,以此评估500多项犯罪预防项目的研究方法质量。这个等级分为五个层次,从低到高如下表4-4所示:

表4-4 马里兰大学循证矫正证据等级

续表(www.xing528.com)

资料来源:Farrington D.P.,Gottfredson D.C.,Sherman L.W.and Welsh B.C.,“The Maryland Scientific Methods Scale”,in L.W.Sherman,Farrington D.P.,Welsh B.C.and MacKenzie D.L.eds.,Evidence-based Crime Prevention,London and New York:Routledge,2002.

其中,第1级到第2级一般被视为不合适或无效解释(加拿大学派认为是有希望的),第3级是可以做出有效性结论的最低等级,第4级和第5级被认为具有最高程度的信度和效度。还有学者进一步把以上5个证据层次简化为3个级别,并形象地称为黄金标准、青铜标准和不科学/无意义的方法,如下表4-5所示:

表4-5 美国的黄金青铜证据等级

资料来源:James M.Byrne,Arthur J.Lurigio,“Separating Science from Nonsense:Evidence-Based Research,Policy,and Practice in Criminal and Juvenile Justice Settings”,Victims and Offenders,4(2009),pp.303-310.

该研究坦率地指出,在美国犯罪和青少年司法的领域里,很多研究和项目落入“不科学/无意义”的类别中。不科学的研究往往被决策者和项目开发者所利用,却对缜密、科学研究得出的结论视而不见。而且,实际管理层较少支持外部独立第三方开展项目评估工作。[25]不难发现,美国循证社区矫正项目的发展,受到了实际管理部门不少的抵制。

美国国家司法学会(NIJ)为了摆脱这种困境,引导各地更加忠实地贯彻循证矫正思路,专门制定了一套更加详细的评价矫正项目证据质量的标准体系。该评估标准主要关注研究设计质量和研究结果两个方面,综合评分高的为质量更好的循证矫正研究证据[26],参见下表4-6:

表4-6 循证矫正研究评价量表

续表

资料来源:“How We Review and Rate a Program from Start to Finish”,available at https://www.crimesolutions.gov/about_starttofinish.aspx,last visited on 2016-07-06.

在美国国家司法学会这套精细、严谨的研究证据分级评估标准之下,即使是随机分组对照试验也只有在符合系列标准后,才能被确认为高质量的循证矫正证据。

美国和加拿大不同的循证矫正发展策略的结果也迥然不同,加拿大目前已经在矫正领域立法中体现了循证矫正的理念和原则,而美国基本上每一个州都有自己的循证矫正项目或研究,但全美还没有在立法中得以确认,因为很多方面还面临较大争议需要深入探讨。[27]水至清则无鱼,严格高标准的循证社区矫正要求必定限制其发挥作用的空间,甚至受到实务部门的抗拒。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈