瞿振和胡翠苹并列第一作者。瞿振(1989-),男,湖北洪湖人,硕士研究生,以分子免疫、肿瘤诊断等基础研究为主要研究方向;胡翠苹(1990-),女, 湖北鄂州人,硕士研究生,以药物新剂型与新技术为主要研究方向。
Objective To provide method of data extraction and a meta-analysis for microRNA-122 in the diagnosis of chronic viral hepatitis from healthy. Methods Combination of computer and manual was used to search for literatures in CBM、CNKI、VIP、EMBASE、PubMed database, and the key words HCV, HBV and microRNA-122 were related to inclusion serum levels of microRNA-122 for HBV/HCV. And the software of GetData Graph Digitizer 2.24 was exploited to extract data. Values of sensitivity, specificity and symmetrical receiver operating characteristic curvefor microRNA-122 in the diagnosis of chronic viral hepatitis B/C from healthy were analyzed by stata12 software. Result Six articles were included, and three for diagnosis healthy from HCV, and three for healthy people from HBV. Which involved 321 chronic viral hepatitis patients (112 HCV patients and 209 HBV patients) and 191 healthy controls in our study; The abstracted data of sensitivity and specificity were pooled 0.91 (95%CI 0.83~0.96), 0.87(95%CI 0.80~0.952) respectively, the area under roc curve of symmetrical receiver operating characteristic curve was 0.93(95%CI 0.90~0.95). Conclusion We created a repeatability and facticity method of using GetData Graph Digitizer software to extract the date of receiver operating characteristic curve,the extracted data were pooled in our meta-analysis. Meta-analysis showed that serum microRNA-122 can be perfect bio-marker in the diagnosis of chronic viral hepatitis from healthy,especially in the diagnosis of HBV from healthy.
受试者工作特征(receiver operating characteristic, ROC)曲线在临床上常用于诊断性Marker的鉴别评价[1, 2, 3, 4], 当确定了某种Marker对疾病具有鉴别特性后, 就需要获得其诊断最佳的cut-off值, 这种确定方法有几种常用的原则:最大的约登指数(Youden index J max), 到坐标点(0, 1)最短的距离dmin, 以及其他的专业性或现实的需要[5, 6]。根据以上原则, 即便文章中缺少具体的数据, 也能根据ROC曲线判断出最佳的cut-off值, GetData Graph Digitizer就是其中一种数据提取软件, 其能很方便且有效地获得图中有用的信息。
微小核苷酸(microRNA, miRNA)-122是一种大量存在于肝脏中的miRNA, 其约占肝脏总miRNA的70%[7]。不仅参与肝脏的分化调节, 维持着肝脏正常功能, 而且与丙型肝炎病毒(hepatitis C virus, HCV)的感染和肝细胞癌(hepatocellular carcinoma, HCC)的发生密切相关[8, 9, 10], miRNA-122可结合到HCV基因组5’ UTR两位点上, 并促使HCV RNA的复制[11]。血清miRNA-122与乙型肝炎病毒(hepatitis B virus, HBV)的关系也十分密切, 在感染了HBV的患者体内miRNA-122的表达明显上升[12]。
本研究拟通过构建一种ROC曲线数据提取的方法获得文章中未直接报道的敏感性和特异性数据, 并进一步使用所提取的数据对miRNA-122鉴别慢性病毒性肝炎患者和健康人进行Meta分析。
(1)数据提取相关的软件:GetData Graph Digitizer 2.24, Origin 9; Meta分析相关软件:stata12软件, 以及Meta-disc 1.4 (下载地址http://www.hrc.es/investigacion/metadisc_en.htm)使用方法简单[13]。
(2)截取文章中ROC曲线图, 导入GetData Graph Digitizer 2.24中, 点击Set the scale < E:\X循证医学\循证2016-3\Q瞿-a.tif> 设定坐标轴原点(0, 0), X-max (1, 0)和Y-max (0, 1), 如图1。
(3)为了方便, 选择Show grid< E:\X循证医学\循证2016-3\Q瞿-b.tif> , 选择Area is related to axes, 设置Grid, 其中dx的值表示为被等分X轴的间距, dy的值为被等分Y轴的间距。本文以Kumar等[10]文献为例, miRNA-122鉴别慢性病毒性肝炎患者和健康人的ROC曲线图提取说明作为演示, 文章中鉴别的样本分别为丙型肝炎患者和健康人各25例, 因此此处设置的dx=0.04和dy=0.04, 如图2。
(4)定义后的网格图如图3, 此时两坐标均被等分为25等分, 以Y轴为例, 选择Point capture mode< c:\program files\founder\founderfx6\plugins\v12pluginwordtranslator\wordimage\xxx-354A\image5.png> , 我们在ROC曲线与每个网格交叉点提取数据点。
(5)数据被完整的记录于右侧的数据栏, 通过File-Export data步骤导出。
(6)将导出后的数据, 粘贴至Origin 9.0软件中, 通过Analysis-mathematics-integrate步骤, 打开对话框后, 即可得到ROC曲线的曲线下面积(area under roc curve, AUC), 如图4。得出的结果AUC=0.929, 与文章报道的结果AUC=0.92相一致。
(7)将第6步数据复制到Excel中, 利用约登指数J=specificity+sensitivity-1和曲线上的点(x, y)到坐标点(0, 1)距离d=sqrt((x-0)2+(y-1)2), 找出具有最大约登指数Jmax和最小距离dmin对应点的灵敏度和特异度值。如本文通过以上规则取得敏感度为92.02%、特异度83.92%(被选中部分), 如图5所示, 通过对比发现提取的敏感性与特异性与原文献的92.00%和84.00%一致。
(8)以同样的方法对未提供数据文献的ROC曲线图进行数据的提取, 提取的敏感性和特异性分别为95.26%、92.80%[14]、79.16%、93.15%[16]和97.70%、92.50%[18]。
2.1.1 文献检索 以PubMed为例对文献检索的策略如下:
#1 “ microRNA-122” or “ miRNA-122” or “ miR-122” or “ hsa-miR-122”
#2 “ ROC” or “ ROC curve” or “ receiver operating characteristic curve”
#3 “ HCV” or “ Chronic hepatitis C” or “ CHC”
#4 “ HBV” or “ Chronic hepatitis B” or “ CHB”
#5“ #1 AND #2 AND (#3 OR #4)”
2.1.2 选入纳入标准 通过两人检索, 当发生意见分歧时由第三人协同两人解决, 纳入标准如下: ①HCV/HBV或HCC与miRNA-122相关的数据, 或可被转化的相关数据; ②均有实验组和对照组; ③miRNA-122为血清水平; ④以Taqman探针或SYBR Green PCR绝对定量表示的方法; ⑤HBV/HCV患者的诊断为检测到其病毒的拷贝数或病毒抗原为金标准。
2.1.3 排除标准 ①重复数据; ②少于20例的数据; ③无对照组的数据; ④非血清miRNA-122数据。
2.1.4 数据的提取和质量评估 此过程由两位作者独立完成, 内容包括如下:①研究特点(作者、年份、国家、分析方法、样本); ②对象特点(平均年龄、样本大小、性别、病因); ③均值、标准差。
2.1.5 统计软件分析 采用Stata12和Meta disc1.4软件进行分析和统计。P≤ 0.05表示有统计学意义, 研究间的异质性通过I2检验, I2≥ 50%并且P≤ 0.05代表有异质性。当存在异质性时, 随机效应模型被用于汇总的统计指标中, Meta回归分析用于进一步探讨异质性的来源。
2.2.1 纳入文献的基本情况
通过制定的文献检索和排除标准, 最终纳入6篇文献[10, 14, 15, 16, 17, 18], 涉及慢性肝炎患者321人(包括112名HCV患者、209名HBV患者)和健康对照者191名被纳入研究, 全部为英文文献, 研究国家包括印度、荷兰、中国, 纳入文献的基本特征见表1。
2.2.2 敏感性与特异性汇总图
血清miRNA-122鉴别HBV/HCV患者与健康人的研究中, 汇总的敏感性为0.92[95%可信区间(confidence interval, CI)0.86~ 0.96], 有较大的异质性I2=69.27%, 汇总的特异性为0.90(95%CI 0.85~0.93), I2=43.04%, 如图6所示; miRNA-122鉴别HCV患者与健康人的亚组研究中, 敏感性和特异性数据分别为0.87(95%CI 0.79~0.92)、0.87(95%CI 0.81~ 0.92), 而在miRNA-122鉴别HBV患者与健康人的亚组研究中, 具有更高的敏感性和特异性, 其值分别为0.94(95%CI 0.89~ 0.98)、0.88(95%CI 0.68~0.97)。
2.2.3 汇总ROC曲线图
通过汇总6个诊断性研究, 如图7所示, 汇总的ROC曲线下面积为0.94(95%CI 0.92~0.96), 汇总的阳性似然比(positive likelihood ratio, PLR)为8.17(95%CI 5.23~12.77), 阴性似然比(negative likelihood ratio, NLR)为0.11 (95%CI 0.06~0.19), 诊断比值比(diagnostic odds ratio, DOR)为62.19(95%CI 31.27~123.65), I2=41.4%。miRNA-122鉴别HCV患者与健康人的亚组研究中, 汇总的AUC=0.934(95%CI 0.912~0.952), PLR =6.24 (95%CI 4.05~9.62), NLR=0.16 (95%CI 0.08~0.30), DOR=43.64(95%CI 20.50~92.89), I2=0%; miRNA-122鉴别HBV患者与健康人的研究的亚组研究中, 汇总的AUC=0.984 (95%CI 0.976~0.992), PLR =3.74 (95%CI 6.14~30.73), NLR=0.06 (95%CI 0.03~0.16), DOR=314.33(95%CI 99.25~999.55), I2=0%。
2.2.4 Deek’ s诊断图
采用Deek’ s检验来探讨纳入研究之间潜在的发表偏倚, 在纳入的6个反映血清miRNA-122对慢性病毒性肝炎的Deek’ s诊断中发现, 我们的研究分布对称, 并无明显的发表偏倚存在, P=0.92(如图8)。
在进行Meta分析的实践中, 我们经常会遇到这样的情况, 当想纳入某篇文献时, 因缺少小部分数据而不得不放弃, 这样一方面可能使我们的研究产生偏倚, 另一方面也会因纳入文献的数量有限, 降低了Meta分析的可信度。联系作者当然是很好的一种解决方法, 但不可否认的情形是大多数作者因时间原因导致数据的丢失或甚至得不到作者的回复, 因此从作者发表文章的图中得到数据不失为一种方便省力的途径, 在这点上, 有一些数据提取软件如Engauge被广泛使用, 它可以很好地提取生存曲线上的数据[19, 20]。另一款优秀的软件GetData Graph Digitizer能简便、真实和高效地提取图片中的数据, 因而也被用于一些研究中[21]。借此, 本文通过GetData Graph Digitizer软件提取ROC曲线中的数据, 我们发现所提取的数据与原文的结果一致, 说明此软件提取的数据是可信赖的。接着我们用此方法提取到没有给出具体数据的3篇文献中的敏感性和特异性值, 根据上述原则, 我们综合并选择了95.26%、92.80%, 79.16%、93.15%和97.70%、92.50%分别作为其敏感性和特异性值。
用所提取的数据进行Meta分析结果表明, 汇总的ROC曲线下面积为0.94 (95%CI 0.92~0.96); 敏感性为0.90(95%CI 0.83~0.95), 存在较高的异质性I2=69.27%; 特异性为0.89(95%CI 0.83~0.93), I2=43.04%。我们采用Spearman相关分析检验其是否为阈值效应引起的异质性, 通过分析发现其相关系数R=-0.086, P=0.872, 说明其异质性的产生并非由阈值效应引起[22, 23, 24], 通过Meta回归分析表明, 年份、国家、检测方法、年龄以及性别比等均不是异质性的主要来源, 异质性可能来源于其他方面。在不同肝炎病毒感染的分析中发现, 相比从健康人中鉴别HCV, miRNA-122用于鉴别HBV感染的灵敏性更高, 两者AUC分别为93.35%和98.05%。
通过数据库的检索, 共6篇文献被纳入到我们的Meta分析中, 我们汇总的结果支持血清中miRNA-122可用于慢性病毒性肝炎的鉴别诊断, 但是, 这些研究也存在一些不足。其一, 根据最大约登指数原则, 我们用软件提取了ROC上的敏感性和特异性数据, 虽然很实用, 但这种方法自身也存在着一定的限制, 例如当研究某种癌症的诊断指标时, 临床实践中需要控制并减少对癌症漏诊情况的发生, 此时需要根据实际的临床要求对敏感性和特异性进行倾斜, 选择参考标准可接受的 cut-off 值。其二, 虽然通过Deek’ s检测结果表明, 我们所纳入的文献并无明显的发表偏倚存在(P=0.92), 但鉴于纳入研究的文献数量较少, 可能导致结果的不稳定性, 我们也没有足够的数据对异质性等作进一步的分析, 并且以上研究结果也需谨慎地看待。但就目前数据表明, miRNA-122能对慢性病毒性肝炎的诊断具有较高的诊断价值, 当然更多、更高质量的文献需要被纳入作为慢性病毒性肝炎的诊断。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|