作者简介:李伦(1987-),男,河南内乡人,博士研究生,从事循证外科学研究。
由于网状Meta分析可以同时比较多个干预措施,对结果排序并计算其概率,因此网状Meta分析迅速被各国卫生技术评估组织认可和接受。针对网状Meta分析的产生背景、分类、统计学基础、假设和证据质量评估进行综述,以期更好地理解和应用网状Meta分析。
Network meta analysis could compare multiple interventions simultaneously, rank according to their efficacy with probabilities, so network meta analysis has been accepted by lots of health technology assessment agencies in the world very quickly. The objective of this article is to review the background, category, statistics, assumption and evidence level assessment of network meta analysis in order to better conduct the network meta analysis.
不断增多的药物及治疗方案使医生和患者的选择增多, 进而增加临床决策的困难。研究显示晚期胰腺癌有19种化疗方案[1], 慢性阻塞性肺病有18种治疗方案[2]。这就要求筛选出最有效最安全的治疗措施, 提高卫生保健的质量[3]。设计和实施良好的随机对照试验是评估临床效果和安全性的金标准[4], 可以为临床治疗提供最佳证据。但随机对照试验可以比较的干预措施数目有限, 常为2~4个干预措施。传统Meta分析可以合并相关数据, 提高统计效能和精确性; 但它仅比较2个干预措施间的疗效和安全性, 为临床决策服务的能力是有限的。因此, 1997年, Bucher等[5]提出了调整间接比较, 即在没有直接比较时通过一个共同对照比较两个治疗措施间差异的统计学方法[6]。2002年, Lumley等提出了网状Meta分析, 并提供直接比较和间接比较的合并办法[7]; 当存在直接比较时, 可以将直接和间接比较结果进行合并, 进而提高结果的精确性和统计学效能(混合治疗效应)[8]。调整间接比较和混合治疗效应是网状Meta分析的两种类型[9]。
2011年, White[10]更新Stata软件mvmeta程序包, 为频率统计方法开展网状Meta分析提供程序支持; 2012年, 英国国家卫生医疗质量标准署(National Institute for Health and Clinical Excellence)发表网状Meta分析的系列论文, 以Winbugs软件为基础, 提供线性回归模型进行网状Meta分析的统计学原理和具体方法[11, 12]; 2014年, 网状Meta分析中应用GRADE的评估原则相继发表[13, 14], 标志着网状Meta分析已经建立成熟的理论体系。
间接比较有两种, 其一为原始间接比较, 即直接叠加关注干预措施的数据, 然后进行比较。这种方法忽视研究间基线资料(患者基本特征, 尤其是影响结果的基本特征)的不一致, 形同于将随机对照试验的数据当作队列研究来处理, 破坏随机对照试验的随机性。因此观察到的差异不仅仅来自于治疗措施本身, 还可能来自于不同人群、试验场所或者随访时间[15]。其二为调整间接比较, 即基于Meta分析结果进行比较, 利用共同对照进行结果调整。这种方法基于随机对照试验的结果, 保持了研究间的随机性, 从而减少了偏倚。
以lnORac(SelnORac)、lnORbc(SelnORbc)分别表示干预措施A、B与C在某结果指标效应量比值比(odds ratio, OR)的对数及其标准误差, lnORab′ (SelnORab′ )表示干预措施A与B的调整间接比较的结果及其标准误差, 那么
lnORab′ = lnORac-lnORbc(公式1)
在直接和间接比较结果同时存在的情况下, 采取倒方差方法合并, 即分别给予直接和间接比较结果一定的权重(方差的倒数)进行合并[7]。
lnORab(SelnORab)表示干预措施A与B的直接比较结果及其标准误差, 那么其合并结果
其标准误差为
混合治疗效应在考虑直接和间接比较结果的基础上, 同时按照精确程度(方差)给予一定的权重, 不但保持随机对照试验的随机性, 而且增加结果的精确性和统计效能(公式5)[16, 17]。公式1和公式3同样适用于相对危险度(relative risk, RR)和危险比(hazard ratio, HR)。对于连续变量, 并不需要对效应量取对数, 直接按照结果(均数差)进行计算。
网状Meta分析的统计学基础之一是传统直接比较Meta分析, 因此网状Meta分析的假设之一是同质性假设, 即不存在异质性。根据来源异质性可以分为临床异质性、方法学异质性和统计学异质性[18]。临床异质性是指纳入研究在患者或者人群、干预措施、对照措施等影响结果的临床因素上存在差异。方法学异质性是指纳入研究在研究设计和研究质量上存在差异[19]。统计学异质性是指纳入研究的结果效应量存在差异。异质性会影响直接比较Meta分析的结果与可靠性, 进而影响网状Meta分析的结果与可靠性。
网状Meta分析应该对所有直接比较的异质性进行评估或检验, 常用的方法为比较研究间的患者和试验的特征、比较结果效应量大小和精确性、假设检验(如卡方检验)、统计学测量(I2)、分别采取固定和随机效应模型、采用亚组分析或者Meta回归[19]。
相似性是网状Meta分析最重要的假设之一, 主要针对调整间接比较, 即所有研究间以及不同对照组间影响效应量的因素相似[15]。从统计学角度讲, 相似性为传递性, 即调整间接比较基于共同对照得到两个干预措施的效果差异[16]; 从结果角度讲, 相似性为可交换性, 即在不同的环境下, 所有研究的效果相似[20]。当满足相似性假设, 网状Meta分析会产生准确的结果, 反之, 网状Meta分析结果会产生偏倚[21]。
评估网状Meta分析相似性假设只能通过间接方法, 即评估可能影响研究结果的混杂因素在研究间的可比性, 主要包括内部真实性因素(如患者特征、随访时间和结果指标等)和外部真实性因素(如试验开展的地点和当地的卫生政策等)。但是定性评估存在局限性, 不能保证发现所有混杂因素。比较研究间临床和方法学特征的相似性(如患者、试验设计等基线资料)是目前检验相似性最为常用的方法。
网状Meta分析结果有效的另一个重要前提是直接证据与间接证据一致和(或)不同路径的间接证据一致[22]。这种假设适用于混合治疗效应Meta分析(直接证据和间接证据同时存在)或者调整间接比较(同一对照组间存在多个调整间接比较结果)。以lnORac、lnORbc分别表示干预措施A、B与C效应量OR的对数, lnORab、lnORab′ 表示干预措施A与B直接、间接比较结果, 那么lnORab= lnORac- lnORbc= lnORab′ 。当存在第二个共同对照措施D时, 以lnORad、lnORbd分别表示干预措施A、B与D效应量OR的对数, 在满足相似性假设时, 两次调整间接比较的结果应该是一致的。
不一致性最简单的评估方法是假设检验, 即比较直接和间接结果间的一致性[21], 常用的方法为Z检验。但这种方法只适用于两臂随机对照试验(只关注两个干预措施)的网状Meta分析。
分别以lnORab(SelnORab)、lnORab′ (SelnORab′ )表示干预措施A与B直接、间接比较结果及其标准误差, 那么Δ =lnORab-lnORab′ (公式6)
Se(Δ )=
Z=
对于连续变量, 可以用均数差之差(直接比较结果和间接比较结果的差值)及其95%可信区间(confidence interval, CI)(均数差之差± 1.96Se)来判断不一致性。之后根据Z值计算对应的P值, 进而判断直接结果和间接结果是否一致。一般P< 0.05认为存在统计学差异。不一致性也可以通过比值比之比(ROR)及其95%CI来说明ROR=exp(Δ ), 其95%CI即为exp(Δ ± 1.96 Se(Δ )), 进而通过可信区间判断直接和间接证据是否一致。对于连续变量, 并不需要对效应量取对数, 直接按照结果(均数差)进行计算。
当存在三臂(关注三个干预措施)或者四臂(关注四个干预措施)随机对照试验时, 这种方法就不合适, 因为三臂或者四臂随机对照试验内部真实性一致, 此时采取假设检验就会降低不一致性的检测几率。Dias等[23]提出的点分法可克服这种局限, 即将某两个干预措施的结果分为两部分:直接比较结果和间接比较结果。直接比较的结果即直接比较研究Meta分析的结果, 间接比较的结果即其余研究间接比较的合并结果。点分法可以计算直接证据和间接证据之间的差异, 进而判断是否存在不一致性。点分法目前可以在贝叶斯方法和频率统计方法中实现[24]。
网状Meta分析证据质量评估方法有两种。第一种方法由Salanti等[13]提出, 基于GRADE主要原则和网状Meta分析的特点。研究局限性的评估主要结合风险评估和证据贡献图; 间接性不仅考虑人群、治疗措施和结果指标的间接性, 还考虑间接比较假设是否成立; 不一致性主要考虑直接比较的异质性以及直接和间接证据之间的不一致性; 不精确性主要是考虑结果网状Meta分析的可信区间; 发表偏倚主要依据各组直接比较和组别调整的漏斗图。第二种方法由GRADE工作组提出[14], 主要有四步:呈现干预措施间直接和间接比较结果、分别对其进行证据质量评估、呈现网状Meta分析的结果、评估网状Meta分析结果的证据质量。按照GRADE在传统Meta分析中的应用原则评估直接比较证据质量[25], 间接证据的评估主要依据产生间接结果的直接比较。如干预措施A与B的调整间接比较结果是基于干预措施A、B与C得出的, 那么调整间接比较的证据质量也是依据两组对比措施的证据质量。若干预措施A与C所产生的证据质量级别为高级别, 干预措施B与C所产生的证据质量级别为中等级别, 那么调整间接比较的证据级别根据低级别证据, 即为中等级别证据。当直接和间接证据同时存在时, 要按照高级别证据。如直接证据为高级别证据, 间接证据为中等级别证据, 则网状Meta分析的结果为高级别证据。两种方法各有优劣, 第一种方法严格按照GRADE的主要原则对网状Meta分析证据质量进行评估, 忽略了间接比较本身的间接性, 以及间接比较和网状Meta分析最佳样本量; 第二种方法基于GRADE对直接证据质量的评估, 进而对间接证据和合并证据进行评估, 忽略了直接证据和间接证据在合并证据中的比例。
间接比较的优势在于不存在直接比较的时候, 可为临床决策提供有价值的证据。在直接比较存在的情况下, 可以合并间接比较结果和直接比较结果, 有助于提高结果的精确性和统计学效能。网状Meta分析同时利用间接结果或者间接结果与直接结果的合并结果比较多个干预措施间的效果差异, 对结果排序并计算其概率, 进而筛选最佳的治疗措施。即使所有干预措施之间的疗效差异没有统计学意义, 也可以基于网状Meta分析的方法筛选出当前最佳的一个或者两个治疗措施, 以便临床决策[26]。由于网状Meta分析的特殊优势:间接证据、同时比较多组干预措施、对结果排序并计算其概率, 网状Meta分析在未来循证医学研究和临床实践中将发挥重要的作用。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|