对于定量系统评价,GRADE仅用于对证据质量分级,不给出推荐意见。在应用GRADE系统时,需注意以下几点:
1.GRADE的证据质量分级不是对单个临床研究或系统评价的分级,而是针对报告了某个结局指标的证据体的质量分级。这种分级是建立在系统评价基础上的。即使系统评价最终仅纳入了1个研究,但其中报告了不同的结局指标,证据质量分级仍然应针对不同结局指标分别进行。此时,降级的5个因素里面,不一致性不适用,因为只有1个研究,而其他4个降级因素均适用。
2.对于随机对照试验和观察性研究,均可以进行降级,因为其研究设计均可能存在缺陷。对随机对照试验应重点考虑降级,且在一般情况下,不考虑升级,因为如果设计无缺陷,本身就是最高级别,无须升级,如果设计有缺陷,则应降级。对于观察性研究,在无降级因素存在的情况下,如果有符合条件的升级因素,则可考虑升级。
3.对于不精确性和不一致性这2个条目,在指南和系统评价中的含义和用法有所不同。在指南当中是否需要在这2个方面降级,取决于其是否能够明确支持或反对指南制订者给出一个一致的推荐意见。
4.如果结局指标较多,首先应按它们对患者的重要性进行排序,最多纳入7个指标,并分为3个等级:关键结局,如死亡、严重的不良反应等;重要结局,如疼痛缓解、糖化血红蛋白降低等;一般结局,如轻度发热或胃肠道反应等。(www.xing528.com)
5.当一项干预措施可以同时影响多个结局时,关于该干预措施的总体证据质量则取决于关键结局的证据质量或者它们中证据质量较低的那个。譬如,抗病毒药物治疗流感的有效性,病死率和ICU患者收治率均被列为至关重要的结局指标,但如果病死率的证据质量为高,ICU患者收治率的证据质量为中,则总的证据质量为中而非高。主要原因是在考虑结局指标相对重要性的基础上,下结论应保守。如果一旦将该证据质量定为高,则意味着将ICU患者收治率这一关键结局从中升级为高,夸大了干预的有效性,可能会给出不恰当的推荐意见。
6.升降级级数无须严格量化,无论是升级还是降级,都不必拘泥于量化指标。如,尽管GRADE规定有非常严重的偏倚风险可降低2级(-2),有非常严重不精确性可降低2级(-2),存在以上2方面缺陷的证据,理论上会被降到“极低”以下,但实际来说,最后的级别反倒可能是“低”而非“极低”。因为要对5个降级因素整体考虑,综合给出最后的证据级别。对于观察性研究升级也是一样,3个升级因素,每个都可升高2级,如果3个因素都存在,最高可升6级,但GRADE中规定观察性研究一开始的级别为“低”,最多经过2级就可以升到“高”,所以无须拘泥于每个升降级因素的级数,而是应总体考虑后,充分描述升降级的原因。
GRADE既可用来对作者自己撰写的系统评价进行分级,也可以为他人撰写的系统评价进行分级。可能存在2个潜在因素,会造成分级结果的巨大差异:一是系统评价本身质量的低下,包括检索的不全面、纳入与排除标准不合理、无意义的合并以及系统评价制作者的利益冲突。以有缺陷的检索为例,未检索灰色文献或限定了语种的系统评价,其遗漏的研究很可能会直接作用于升降级的各个因素,甚至会逆转分级的结果以及总的证据质量。故在应用GRADE之前,分级人员应该对系统评价制作的报告质量和方法学质量予以评估,如果其有明显缺陷,则应放弃分级,否则分级结果将会产生严重误导。第二个可能影响GRADE分级结果的因素是分级人员之间的不一致性,对于同一个结局指标,不同分级人员的结果可能存在差异,可能的解决办法为在分级前对人员进行统一培训,并就升降级因素的理解达成共识,在证据概要表和结果总结表备注中详细说明,以便使分级结果尽可能一致,并体现GRADE分级系统化、结构化、透明化和清晰明确的特点。但由于分级人员本身水平的差异以及证据体的复杂程度,对同一个证据体有可能得出不一样的分级结果。研究显示,经过培训的分级人员较未经过培训的,其分级结果更为趋同,2人以上的分级结果相对于1个人更为客观。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。