(一)主题综合法
主题综合法(Thematic Synthesis)是以形成主题而对研究结果进行资料综合的一种方法。主题综合法符合系统评价的目的,并且能够准确反映各个研究结果内容的主题观点。由于其兼具实用性和科学性,目前被广泛而普遍地应用于资料综合过程。在运用主题综合法的过程中,“三级诠释”是确立最终主题的有效方法,同时它也是主题综合法的关键与核心步骤(图8-2)。合理且准确地运用主题综合法,对进行定性研究系统评价的意义重大。其关键步骤为:
图8-2 主题综合法示意图
1.根据研究目的整理资料
首先,研究人员需要对纳入文献进行反复的阅读、理解、分析,并进行信息提取,提炼出内容完好、解释明确的研究结果。资料提取完成后,研究者需要对研究结果进行归纳整理,为初步产生主题观点奠定基础。然后将每个独立的研究结果进行初步的归纳,整理形成不同的主题类别。归纳整理时,每位研究者先独立进行分析整合,之后由2位甚至多位研究者再对归纳整理的结果进行讨论以形成一致的主题。
2.产生统一的主题框架
形成主题,是主题综合法的目标,这一过程主要经历2个阶段:首先,对原始研究结果进行“逐行编译”(Line-by-Line Coding),主要把握原始结果中作者描述的关键词,以及访谈语录中具有提示意义的相关词,根据这些重要的或反复出现的关键词汇,将结果初步归类,进行“编译”、转化和分析,为进一步的总结描述奠定基础。其次,“三级诠释”为主题的形成提供了一种思路,也成为主题综合法的核心思想。三级诠释即经过对研究结果进行阐释和提炼,形成描述性主题(Descriptive Themes),继而发展成为分析性主题(Analytic Themes)。每一级主题都代表了形成主题过程中的阶段性目标。
3.分类汇总相关主题
将反映同一评价问题的主题观点汇总到一个主题类别下。汇总的目的,即为产生的新观点或新的解释提供支持依据,指导着研究者得出可靠的评价结果,同时帮助其他研究人员更好地理解研究结果的综合。研究者需深刻认识各个主题的含义以及产生过程,并且严格把握系统评价的目的、意义,对已形成的主题框架进行解析,整理具有相关性的主题,并思考其对最终所提出新观点的意义,再合理地将相关主题归纳到一起,最终提出第三级主题(The Third Order Themes)。第三级主题是基于分析性主题而进一步提炼总结得出的,相较之前的描述性以及分析性的主题而言,总结归纳的层次又有所上升,具有概括性和针对性,并且能够更加贴切地反映系统评价的目的、意义。第三级主题的产生,即到了主题综合法的尾声,标志着资料综合的基本完成,也决定了下一步将提出一个怎样的结论,并为其提供可靠性依据。
4.形成一致认可的最终主题
研究者各自对主题进行归纳整合形成最终的主题后,须与其他研究者进行意见交换,对主题再次进行检查核对,确定其规范性、严谨性和表达的准确性。对存在严重分歧的主题词,要相互进行解释说明,从而达成一致,若无法保持意见统一,则要求另外一位研究者做出判断。该过程是尽可能将人为的主观偏差减到更小,使得产生的主题更具有说服性和可靠性,并且使评价结果更加准确。
(二)Meta-民族志
Meta-民族志(Meta-ethnography)是综合定性研究证据的另一种常用方法,1988年由Noblit和Hare两位学者提出。其特点是将归纳和诠释相结合,通过提取定性研究中的概念、主题,以特殊综合方法建立更高层次的综合,形成一级/二级结构,并经“线性综合方法”最终形成三级结构,得出结论并据此提出新的概念和理论见解(图8-3)。其结果是形成一种新的“高层次”的诠释或理论,以便较为完善地解释现有的证据。故Meta-民族志是在已确定研究领域时,对定性研究的综合和延伸,有利于定性研究更广泛的应用。
需要注意的是,Meta-民族志是一种诠释而非简单集合。它不是像叙述性文献综述一样,简单地收集和评价一些解释,其目的在于开发新的理论以解释一系列研究结果。通过再分析和比较已发表的研究,对结果提出新的诠释,产生新理论。
图8-3 Meta-民族志示意图
1.Meta-民族志主要综合方法
(1)相似分析转化
当提取的关键概念、主题在不同纳入文献中的诠释具有相似性时,可在具体分析后进行转化合并;例如,在研究儿童虐待相关课题时,一篇文献出现的“殴打”概念和另一篇文献的概念“躯体暴力”,可以进行转化合并,归到“行为虐待”一类。需要注意的是,使用相似分析转化方法时,需综合考虑研究目的和关键概念的属性,选择合适的角度进行综合。
(2)对立综合
当纳入文献中所提取主题、概念相互驳斥时,可找出特征性矛盾点,进行对立分析,选择排除或进一步从新的角度进行深入分析研究问题。
(3)线性论证综合
当关键概念范围分布较为广泛,无明显的相似或对立关系时,或已经过相似分析转化/对立综合后得到二级结构,在形成研究结果的三级结构过程中,可以多篇纳入研究的结果为基础,深入挖掘关键主题、概念间的相关关系,并将其建立成线性框架,从而形成结果的大体解释,其特征是本质性推断。(图8-4)
图8-4 Meta-民族志的综合过程展示
2.Meta-民族志应用特点
(1)适用范围
研究涉及范围广,常用于传统的综合方法应用有困难时,或者由于提取的关键概念缺乏明确的指向性且分布广泛,需经转换合并后方可综合时,或者纳入文献中有互相支持或互相对立的研究时。
(2)最终结果(www.xing528.com)
形成有关研究主题的三级结构,在集合关键概念的同时,提出针对研究的新解释,从而得到理论的发展。
研究方法较为局限,以致方法的灵活程度不高。同时Meta-民族志作为一种综合定性研究的方式,综合时由于并无样本指导,要求较高,过程繁杂,需随着相关软件的进一步发展与更多相关研究的进行方可获得改善。
(三)CIS(Critical Interpretive Synthesis)
CIS(Critical Interpretive Synthesis)是基于Meta-民族志总结出的一种资料综合方法,主要用于以解释性结果为主的系统评价。CIS是由Mary Dixon-Woods等学者共同定义和发展的。CIS以解释性的分析为主要特点,且更多地应用于对某种现象、重大的事件以及各种经验等方面的阐释。CIS与汇集性整合等方法相比,后者依赖于预先设定的问题进行结果综合,而CIS是通过反复的质询来探索各种结果之间的相关性,并且可以对其关联的层次以及关联程度进行进一步的发掘。此外,当进行系统评价的目的是对过程繁杂的研究进行分析时,传统的评价方法就不再适合,而CIS恰好就是解决这一问题的重要理论方法。针对研究过程中所存在的问题、研究结果中的推断性结论,以及其最终对决策选择所产生的影响,进行不断的质询、理解和评估。因此,应用CIS是一个持续的动态循环过程,且该过程的进行具有很大的灵活性。同时,CIS也是对纳入评价的文献再次进行排除的过程,并可通过评价人员的反复质询,对文献的质量进行再次评估,这对资料的综合结果有很大的意义。
定性研究证据合成方法比较见第二章相关内容(表2-4)。
(四)叙事性合成数据分析方法
在叙事性合成时,将研究结果整理成表格是最重要的步骤之一。表格应对研究的人群、研究的方法和结果做充分描述。清晰的表格使研究更加透明,它向我们展示了某项数据是从哪一单个研究中提取的,并阐明了这个研究对整体综述的贡献。表格还能够揭示出评价中更加宽广的背景内容,即它既能用来呈现单个研究中的方法和结果,也能够将单个研究的背景信息,如人群对象、条件设置等清晰陈述。总而言之,条理清晰且结构合理的表格能告诉读者研究数据是如何影响研究的最终结论,同时读者可以基于相同的数据得出类似的结论。
叙事性合成通过以下几个方面来实行。在干预措施效果评价中最常用的方法就是以一个叙事的总结开始,这种总结是关于定量结局评估的结果。将这个过程分成三步或许有帮助:①把研究分成不同类别;②在每个类别中分析结果;③将包含的所有研究结果合成起来。
1.研究的组织
纳入研究数据的逻辑结构将有助于分析数据,随着对发表后研究的评论数量的增加,这变得尤为重要。一个简单的研究清单,如果在系统评价中只有4个研究,那么它们的方法和结论可能相对容易解释。研究的整理主要通过研究设计实现,或者通过研究质量可以说明哪个研究可信(涉及内部真实性)。通过研究结果将研究分组,可以促进解答有关这些成果是怎么被完成的问题;通过干预类型分组可以帮助解答干预的相对有效性问题。这些归类方法都不同,但是它们一定都是与问题相关。
2.分析研究本身
这涉及每个研究结果的叙事性描述,通常附带有研究质量描述。它们同样也提供了大量的表格描述定量结果。当评价是以日志的形式被呈现时,每个研究的总结可能会更简短。在包含许多主要研究的评价中,由于空间的原因,对每一个研究(除了那些在表格中出现的)的描述是有限的。这种评价的许多主体研究描述非常长,同时也依赖于已经描述的研究。
3.横向研究合成
横向研究合成的目的是做出一个关于研究结果的综合总结,这种综合总结会考虑到研究质量的变化以及其他可能会影响结果的普遍性等因素(比如在人群、干预措施和设置上的变化)。这个过程通过有条理、详细的表格实现起来会更容易,但研究结果的图形显示也可以使过程更容易。研究合成也应该分析纳入研究间的不同点,这通常被描述成调查研究异质性。这包含研究结果变化的检查和变化原因的探究,也涉及调节变量效应的分析。
(五)最优证据合成
最优证据合成(Best Evidence Synthesis,BES)的方法被评价者广泛应用,而且这个方法源于一个叫Robert Slavin的教育学研究者。在最优证据合成中,满足适当性和关联性的最低标准的研究包含在评价里。BES以一个评价研究质量和研究关联性的系统方法将提取的信息进行Meta混合分析。BES旨在鉴别和合成不同的证据来源,但根据以上描述可能会发现BES是一个非常好的系统评价练习例子。Suri指出,作为一个标准的Meta分析,其中一个不同点就是在从原始研究中提取数据时BES更倾向于计算平均值而不是加权平均值。
(六)计票
总结研究结果最简单的方法就是“计票”;比如,计算哪些研究显示某项政策有效,哪些显示政策无效,比较这两个数字。尽管用起来方便,但通常这种方法不适用。Light和Smith在30多年前概述了这种方法的问题。其中包括它忽视了样本大小的事实(小型研究的计数和大型研究差不多),它很少考虑研究方法和研究质量(差的方法且有偏倚的研究和质量好的研究计数一样),忽视了研究亚组之间定性的差异,也没有进行研究变量之间的相互作用分析。
许多传统的评估采用隐式计票法。在作者列出的研究中,总结出哪些结果“支持”假设的研究,和“反对”假设的研究。得出“大多数研究表明……”这样的结论之前,先在作者的心中衡量证据的质量然后再得出结论。这种方法类似于计票(但缺乏科学严谨性)。就像计票,它忽略了研究之间的差异,还依赖于评估者内心的判断。
(七)交叉设计合成
交叉设计合成是由美国总审计局提出的一种将数据库分析中的辅助数据和随机对照试验的结果结合在一起的方法。在医药和其他领域,这种方法已经得到了认可,随机对照试验在内部有效性比较高时,某些情况下可能不包括人群的代表样本,因此某些试验结果的普遍性遭到质疑。随机对照试验是评估干预影响的理想选择(随机对照试验中干预的内容、实施、接受都是可控的)。相比之下,从常规数据库获得的观察数据可能更适合那些在研究背景之外接受干预的人群。
理论上交叉设计合成实现了实验研究和非实验研究的优势互补——例如通过规范随机对照试验结果使得其适应数据库分布。这种办法可能很少适用于社会干预的系统评价,因为社会干预缺少获得这些信息的数据库。
(八)三角测量系统评价
社会科学领域的系统评价往往是汇集不同设计和质量研究的一系列证据。这和“三角测量”的过程及准确的证据不存在的工作原理类似,其他隐性证据可能可以从观察性研究(比如对照研究)、病因学研究(例如病例-对照研究)以及前瞻性研究中获得。跨不同来源信息的三角测量可能会填补一些证据基础空缺。对许多社会干预来说几乎不能从对照研究中获取证据评价——但这并不意味着证据不存在。能够显示哪些干预有效,并需要进一步研究的潜在性证据可能可以在别处找到。当证据拼图被怀疑有很多块丢失时,尽可能多地收集存在的碎片就很有意义。
另一方面,证据越多就越可能找到偏倚最低的研究证据。例如,评估创伤性事件(如交通事故、殴打、火灾、暴力犯罪、创伤性分娩),心理报告有效性评价,只包括随机对照试验。没有结果表明单个干预方法有助于减少痛苦或减少创伤后应激障碍(PTSD)。
(九)评价复杂证据
多个社会因素(如社会政策)的干预系统评价经常需要考虑和详细说明干预的实施环境。这些评估经常关注群体和干预项目,以“以工代赈”方案为例,其目的是完成和加强从失业福利费到有偿就业的过渡。虽然“以工代赈”这个词可能在许多西方国家都得到了承认,但方案的组成部分各不相同,该方案的具体实施内容和政治制度也不一样。如果不包括该方案传达的福利、文化和政治背景等详细信息,那么关于“以工代赈”国际文献的评估就没有多大意义,但是如果这些方案在每个地方均相同,那么在某种程度上它就好像是社会中的“阿司匹林”。评估潜在用户显然需要更多地了解如此复杂的干预实施环境和更多地了解干预本身而不仅仅是简单的描述。在大多数文化中“阿司匹林”意味着相同的事物,“福利”和“工作”却不是。合成不同质量的信息对于评估者来说是一项挑战。虽然定量证据可通过Meta分析合成,但其他类型的证据可能不是那么容易处理。
(十)定性合成和混合方法研究
定性研究不只是一个简单的研究方法,它是包含一系列的研究设计,就像深度访谈、焦点组访谈、病例研究以及参与式和非参与式观察法。而且,定性研究也不仅仅是对数据组织的非定量研究方法,它也在归纳分析的不同范例中实施。在过去,定性工作在许多系统评价中被归到一个相当小(甚至没有)的领域,但是现在变了。所有的文化都有一些故事来作为有效的交流手段,所以在这样一个叙事性传统上建立起来的合成,使得它自身的重要性很有可能增加。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。