一种ROC曲线数据提取方法并用于miRNA-122诊断慢性病毒性肝炎的Meta分析
瞿振1,2a, 胡翠苹2b

瞿振和胡翠苹并列第一作者。瞿振(1989-),男,湖北洪湖人,硕士研究生,以分子免疫、肿瘤诊断等基础研究为主要研究方向;胡翠苹(1990-),女, 湖北鄂州人,硕士研究生,以药物新剂型与新技术为主要研究方向。

摘要
目的提供一种数据提取方法并用于microRNA-122对慢性病毒性肝炎的诊断性Meta分析。方法计算机检索CBM、CNKI、VIP、EMBASE、PubMed数据库,对检索文献进行筛查,纳入符合标准的文献,并汇总文献中有关microRNA-122对丙型肝炎病毒/乙型肝炎病毒的受试者工作特征曲线诊断的结果;对于未正式报道敏感性数值和特异性数值的文献,采用数据提取软件GetData Graph Digitizer 2.24获取文献中相关敏感性和特异性数值,用于microRNA-122鉴别健康人和慢性肝炎病毒(乙型/丙型)感染患者,通过Stata12软件等进行分析,结果以敏感性、特异性以及对受试者工作特征曲线进行汇总。结果最终纳入6篇文献,其中3篇是关于丙型肝炎病毒感染患者的诊断,另外3篇为乙型肝炎病毒感染患者的诊断;共有321名慢性病毒性肝炎感染者(包括112名丙型肝炎患者、209名乙型肝炎患者)以及191名健康对照者被纳入研究;应用我们提取数据的方法表明,通过软件提取的敏感性和特异性数据与原文数据保持一致。数据提取汇总后的敏感性、特异性分别为0.91(95%可信区间 0.83~0.96)、0.87(95%可信区间0.80~0.92),受试者工作特征曲线下面积为0.94(95%可信区间0.92~0.96)。结论以GetData Graph Digitizer软件创建的提取受试者工作特征曲线中数据的方法具有很好的真实性和可重复性,以提取的数据汇总分析表明,血清microRNA-122可很好地用于鉴别健康人与慢性肝炎感染患者,并且对慢性乙型肝炎病毒感染的诊断具有更高的灵敏性。
关键词: microRNA-122; 慢性病毒性肝炎; 受试者工作特征曲线; 敏感性; 特异性; 数据提取
中图分类号:R735.7;R195.1 文献标志码:A
A Method of Data Extraction and Meta-Analysis for miRNA-122 in The Diagnosis of Chronic Viral Hepatitis from Healthy
QU Zhen1,2a, HU Cui-ping2b
1. Guangdong Food and Drug Vocational College ,Guangzhou 510520 ,China ;a. School of Basic Medical Sciences ;b. School of Pharmaceutical Sciences
2. Wuhan University ,Wuhan 430071 ,China
Keyword: microRNA-122; chronic virus hepatitis; receiver operating characteristic curve; sensitivity; specificity; data extract
Abstract

Objective To provide method of data extraction and a meta-analysis for microRNA-122 in the diagnosis of chronic viral hepatitis from healthy. Methods Combination of computer and manual was used to search for literatures in CBM、CNKI、VIP、EMBASE、PubMed database, and the key words HCV, HBV and microRNA-122 were related to inclusion serum levels of microRNA-122 for HBV/HCV. And the software of GetData Graph Digitizer 2.24 was exploited to extract data. Values of sensitivity, specificity and symmetrical receiver operating characteristic curvefor microRNA-122 in the diagnosis of chronic viral hepatitis B/C from healthy were analyzed by stata12 software. Result Six articles were included, and three for diagnosis healthy from HCV, and three for healthy people from HBV. Which involved 321 chronic viral hepatitis patients (112 HCV patients and 209 HBV patients) and 191 healthy controls in our study; The abstracted data of sensitivity and specificity were pooled 0.91 (95%CI 0.83~0.96), 0.87(95%CI 0.80~0.952) respectively, the area under roc curve of symmetrical receiver operating characteristic curve was 0.93(95%CI 0.90~0.95). Conclusion We created a repeatability and facticity method of using GetData Graph Digitizer software to extract the date of receiver operating characteristic curve,the extracted data were pooled in our meta-analysis. Meta-analysis showed that serum microRNA-122 can be perfect bio-marker in the diagnosis of chronic viral hepatitis from healthy,especially in the diagnosis of HBV from healthy.

Key word: microRNA-122; chronic virus hepatitis; receiver operating characteristic curve; sensitivity; specificity; data extract

受试者工作特征(receiver operating characteristic, ROC)曲线在临床上常用于诊断性Marker的鉴别评价[1, 2, 3, 4], 当确定了某种Marker对疾病具有鉴别特性后, 就需要获得其诊断最佳的cut-off值, 这种确定方法有几种常用的原则:最大的约登指数(Youden index J max), 到坐标点(0, 1)最短的距离dmin, 以及其他的专业性或现实的需要[5, 6]。根据以上原则, 即便文章中缺少具体的数据, 也能根据ROC曲线判断出最佳的cut-off值, GetData Graph Digitizer就是其中一种数据提取软件, 其能很方便且有效地获得图中有用的信息。

微小核苷酸(microRNA, miRNA)-122是一种大量存在于肝脏中的miRNA, 其约占肝脏总miRNA的70%[7]。不仅参与肝脏的分化调节, 维持着肝脏正常功能, 而且与丙型肝炎病毒(hepatitis C virus, HCV)的感染和肝细胞癌(hepatocellular carcinoma, HCC)的发生密切相关[8, 9, 10], miRNA-122可结合到HCV基因组5’ UTR两位点上, 并促使HCV RNA的复制[11]。血清miRNA-122与乙型肝炎病毒(hepatitis B virus, HBV)的关系也十分密切, 在感染了HBV的患者体内miRNA-122的表达明显上升[12]

本研究拟通过构建一种ROC曲线数据提取的方法获得文章中未直接报道的敏感性和特异性数据, 并进一步使用所提取的数据对miRNA-122鉴别慢性病毒性肝炎患者和健康人进行Meta分析。

1 ROC曲线图提取数据方法的建立

(1)数据提取相关的软件:GetData Graph Digitizer 2.24, Origin 9; Meta分析相关软件:stata12软件, 以及Meta-disc 1.4 (下载地址http://www.hrc.es/investigacion/metadisc_en.htm)使用方法简单[13]

(2)截取文章中ROC曲线图, 导入GetData Graph Digitizer 2.24中, 点击Set the scale < E:\X循证医学\循证2016-3\Q瞿-a.tif> 设定坐标轴原点(0, 0), X-max (1, 0)和Y-max (0, 1), 如图1

图1 导入图片设置X、Y 轴

(3)为了方便, 选择Show grid< E:\X循证医学\循证2016-3\Q瞿-b.tif> , 选择Area is related to axes, 设置Grid, 其中dx的值表示为被等分X轴的间距, dy的值为被等分Y轴的间距。本文以Kumar等[10]文献为例, miRNA-122鉴别慢性病毒性肝炎患者和健康人的ROC曲线图提取说明作为演示, 文章中鉴别的样本分别为丙型肝炎患者和健康人各25例, 因此此处设置的dx=0.04和dy=0.04, 如图2

图2 网格的设置对话框

(4)定义后的网格图如图3, 此时两坐标均被等分为25等分, 以Y轴为例, 选择Point capture mode< c:\program files\founder\founderfx6\plugins\v12pluginwordtranslator\wordimage\xxx-354A\image5.png> , 我们在ROC曲线与每个网格交叉点提取数据点。

图3 网格线以及数据点的提取

(5)数据被完整的记录于右侧的数据栏, 通过File-Export data步骤导出。

(6)将导出后的数据, 粘贴至Origin 9.0软件中, 通过Analysis-mathematics-integrate步骤, 打开对话框后, 即可得到ROC曲线的曲线下面积(area under roc curve, AUC), 如图4。得出的结果AUC=0.929, 与文章报道的结果AUC=0.92相一致。

图4 Origin 9.0 计算的AUC 曲线面积结果框

(7)将第6步数据复制到Excel中, 利用约登指数J=specificity+sensitivity-1和曲线上的点(x, y)到坐标点(0, 1)距离d=sqrt((x-0)2+(y-1)2), 找出具有最大约登指数Jmax和最小距离dmin对应点的灵敏度和特异度值。如本文通过以上规则取得敏感度为92.02%、特异度83.92%(被选中部分), 如图5所示, 通过对比发现提取的敏感性与特异性与原文献的92.00%和84.00%一致。

图5 敏感性和特异性数据的提取

(8)以同样的方法对未提供数据文献的ROC曲线图进行数据的提取, 提取的敏感性和特异性分别为95.26%、92.80%[14]、79.16%、93.15%[16]和97.70%、92.50%[18]

2 miRNA-122对慢性病毒性肝炎诊断的Meta分析
2.1 文献检索及方法

2.1.1 文献检索 以PubMed为例对文献检索的策略如下:

#1 “ microRNA-122” or “ miRNA-122” or “ miR-122” or “ hsa-miR-122”

#2 “ ROC” or “ ROC curve” or “ receiver operating characteristic curve”

#3 “ HCV” or “ Chronic hepatitis C” or “ CHC”

#4 “ HBV” or “ Chronic hepatitis B” or “ CHB”

#5“ #1 AND #2 AND (#3 OR #4)”

2.1.2 选入纳入标准 通过两人检索, 当发生意见分歧时由第三人协同两人解决, 纳入标准如下: ①HCV/HBV或HCC与miRNA-122相关的数据, 或可被转化的相关数据; ②均有实验组和对照组; ③miRNA-122为血清水平; ④以Taqman探针或SYBR Green PCR绝对定量表示的方法; ⑤HBV/HCV患者的诊断为检测到其病毒的拷贝数或病毒抗原为金标准。

2.1.3 排除标准 ①重复数据; ②少于20例的数据; ③无对照组的数据; ④非血清miRNA-122数据。

2.1.4 数据的提取和质量评估 此过程由两位作者独立完成, 内容包括如下:①研究特点(作者、年份、国家、分析方法、样本); ②对象特点(平均年龄、样本大小、性别、病因); ③均值、标准差。

2.1.5 统计软件分析 采用Stata12和Meta disc1.4软件进行分析和统计。P≤ 0.05表示有统计学意义, 研究间的异质性通过I2检验, I2≥ 50%并且P≤ 0.05代表有异质性。当存在异质性时, 随机效应模型被用于汇总的统计指标中, Meta回归分析用于进一步探讨异质性的来源。

2.2 结果

2.2.1 纳入文献的基本情况

通过制定的文献检索和排除标准, 最终纳入6篇文献[10, 14, 15, 16, 17, 18], 涉及慢性肝炎患者321人(包括112名HCV患者、209名HBV患者)和健康对照者191名被纳入研究, 全部为英文文献, 研究国家包括印度、荷兰、中国, 纳入文献的基本特征见表1

表1 纳入文献的基本情况

2.2.2 敏感性与特异性汇总图

血清miRNA-122鉴别HBV/HCV患者与健康人的研究中, 汇总的敏感性为0.92[95%可信区间(confidence interval, CI)0.86~ 0.96], 有较大的异质性I2=69.27%, 汇总的特异性为0.90(95%CI 0.85~0.93), I2=43.04%, 如图6所示; miRNA-122鉴别HCV患者与健康人的亚组研究中, 敏感性和特异性数据分别为0.87(95%CI 0.79~0.92)、0.87(95%CI 0.81~ 0.92), 而在miRNA-122鉴别HBV患者与健康人的亚组研究中, 具有更高的敏感性和特异性, 其值分别为0.94(95%CI 0.89~ 0.98)、0.88(95%CI 0.68~0.97)。

图6 敏感性与特异性汇总图

2.2.3 汇总ROC曲线图

通过汇总6个诊断性研究, 如图7所示, 汇总的ROC曲线下面积为0.94(95%CI 0.92~0.96), 汇总的阳性似然比(positive likelihood ratio, PLR)为8.17(95%CI 5.23~12.77), 阴性似然比(negative likelihood ratio, NLR)为0.11 (95%CI 0.06~0.19), 诊断比值比(diagnostic odds ratio, DOR)为62.19(95%CI 31.27~123.65), I2=41.4%。miRNA-122鉴别HCV患者与健康人的亚组研究中, 汇总的AUC=0.934(95%CI 0.912~0.952), PLR =6.24 (95%CI 4.05~9.62), NLR=0.16 (95%CI 0.08~0.30), DOR=43.64(95%CI 20.50~92.89), I2=0%; miRNA-122鉴别HBV患者与健康人的研究的亚组研究中, 汇总的AUC=0.984 (95%CI 0.976~0.992), PLR =3.74 (95%CI 6.14~30.73), NLR=0.06 (95%CI 0.03~0.16), DOR=314.33(95%CI 99.25~999.55), I2=0%。

图7 汇总ROC 曲线图

2.2.4 Deek’ s诊断图

采用Deek’ s检验来探讨纳入研究之间潜在的发表偏倚, 在纳入的6个反映血清miRNA-122对慢性病毒性肝炎的Deek’ s诊断中发现, 我们的研究分布对称, 并无明显的发表偏倚存在, P=0.92(如图8)。

图8 Deek’ s 诊断图

3 讨论

在进行Meta分析的实践中, 我们经常会遇到这样的情况, 当想纳入某篇文献时, 因缺少小部分数据而不得不放弃, 这样一方面可能使我们的研究产生偏倚, 另一方面也会因纳入文献的数量有限, 降低了Meta分析的可信度。联系作者当然是很好的一种解决方法, 但不可否认的情形是大多数作者因时间原因导致数据的丢失或甚至得不到作者的回复, 因此从作者发表文章的图中得到数据不失为一种方便省力的途径, 在这点上, 有一些数据提取软件如Engauge被广泛使用, 它可以很好地提取生存曲线上的数据[19, 20]。另一款优秀的软件GetData Graph Digitizer能简便、真实和高效地提取图片中的数据, 因而也被用于一些研究中[21]。借此, 本文通过GetData Graph Digitizer软件提取ROC曲线中的数据, 我们发现所提取的数据与原文的结果一致, 说明此软件提取的数据是可信赖的。接着我们用此方法提取到没有给出具体数据的3篇文献中的敏感性和特异性值, 根据上述原则, 我们综合并选择了95.26%、92.80%, 79.16%、93.15%和97.70%、92.50%分别作为其敏感性和特异性值。

用所提取的数据进行Meta分析结果表明, 汇总的ROC曲线下面积为0.94 (95%CI 0.92~0.96); 敏感性为0.90(95%CI 0.83~0.95), 存在较高的异质性I2=69.27%; 特异性为0.89(95%CI 0.83~0.93), I2=43.04%。我们采用Spearman相关分析检验其是否为阈值效应引起的异质性, 通过分析发现其相关系数R=-0.086, P=0.872, 说明其异质性的产生并非由阈值效应引起[22, 23, 24], 通过Meta回归分析表明, 年份、国家、检测方法、年龄以及性别比等均不是异质性的主要来源, 异质性可能来源于其他方面。在不同肝炎病毒感染的分析中发现, 相比从健康人中鉴别HCV, miRNA-122用于鉴别HBV感染的灵敏性更高, 两者AUC分别为93.35%和98.05%。

通过数据库的检索, 共6篇文献被纳入到我们的Meta分析中, 我们汇总的结果支持血清中miRNA-122可用于慢性病毒性肝炎的鉴别诊断, 但是, 这些研究也存在一些不足。其一, 根据最大约登指数原则, 我们用软件提取了ROC上的敏感性和特异性数据, 虽然很实用, 但这种方法自身也存在着一定的限制, 例如当研究某种癌症的诊断指标时, 临床实践中需要控制并减少对癌症漏诊情况的发生, 此时需要根据实际的临床要求对敏感性和特异性进行倾斜, 选择参考标准可接受的 cut-off 值。其二, 虽然通过Deek’ s检测结果表明, 我们所纳入的文献并无明显的发表偏倚存在(P=0.92), 但鉴于纳入研究的文献数量较少, 可能导致结果的不稳定性, 我们也没有足够的数据对异质性等作进一步的分析, 并且以上研究结果也需谨慎地看待。但就目前数据表明, miRNA-122能对慢性病毒性肝炎的诊断具有较高的诊断价值, 当然更多、更高质量的文献需要被纳入作为慢性病毒性肝炎的诊断。

The authors have declared that no competing interests exist.

参考文献
[1] El-Garem H. , Ammer A. , Shehab H. , et al. Circulating microRNA, miR-122 and miR-221 signature in Egyptian patients with chronic hepatitis C related hepatocellular carcinoma[J]. World J Hepatol, 2014, 6(11): 818-824. [本文引用:1]
[2] Luo J. , Chen M. , Huang H. , et al. Circulating microRNA-122a as a diagnostic marker for hepatocellular carcinoma[J]. Onco Targets Ther, 2013, 6: 577-583. [本文引用:1]
[3] Wang JY. , Mao RC. , Zhang YM. , et al. Serum microRNA-124 is a novel biomarker for liver necroinflammation in patients with chronic hepatitis B virus infection[J]. J Viral Hepat, 2015, 22(2): 128-136. [本文引用:1]
[4] 左铎, 罗艺, 郭华, . 联合检测血清miR-125b和AFP对原发性肝细胞癌的诊断价值[J]. 中国肿瘤临床, 2014(10): 662-666. [本文引用:1]
[5] Zweig MH. , Campbell G. Receiver-operating characteristic (ROC) plots: A fundamental evaluation tool in clinical medicine[J]. Clin Chem, 1993, 39(4): 561-577. [本文引用:1]
[6] Xia J. , Broadhurst DI. , Wilson M. , et al. Translational biomarker discovery in clinical metabolomics: An introductory tutorial[J]. Metabolomics, 2013, 9(2): 280-299. [本文引用:1]
[7] Yang X. , Salminen WF. , Shi Q. , et al. Potential of extracellular microRNAs as biomarkers of acetaminophen toxicity in children[J]. Toxicol Appl Pharmacol, 2015, 284(2): 180-187. [本文引用:1]
[8] Cheng HR. , Kao JH. , Wu HL. , et al. Clinical significance of circulating miR-122 in patients with dual chronic hepatitis B and C virus infection[J]. Hepatol Int, 2015, 9(1): 35-42. [本文引用:1]
[9] Kamo Y. , Ichikawa T. , Miyaaki H. , et al. Significance of miRNA-122 in chronic hepatitis C patients with serotype 1 on interferon therapy[J]. Hepatol Res, 2015, 45(1): 88-96. [本文引用:1]
[10] Kumar S. , Chawla YK. , Ghosh S. , et al. Severity of hepatitis C virus (genotype-3) infection positively correlates with circulating microRNA-122 in patients sera[J]. Dis Markers, 2014: 435476. [本文引用:3]
[11] Wilson JA. , Huys A. miR-122 promotion of the hepatitis C virus life cycle: Sound in the silence[J]. Wiley Interdiscip Rev RNA, 2013, 4(6): 665-676. [本文引用:1]
[12] Thakral S. , Ghoshal K. miR-122 is a unique molecule with great potential in diagnosis, prognosis of liver disease, and therapy both as miRNA mimic and antimir[J]. Curr Gene Ther, 2015, 15(2): 142-150. [本文引用:1]
[13] 张天嵩, 钟文昭. Meta-DiSc软件在诊断试验Meta分析中的应用[J]. 循证医学, 2008, 8(2): 97-100. [本文引用:1]
[14] van der Meer AJ. , Farid WR. , Sonneveld MJ. , et al. Sensitive detection of hepatocellular injury in chronic hepatitis C patients with circulating hepatocyte-derived microRNA-122[J]. J Viral Hepat, 2013, 20(3): 158-166. [本文引用:2]
[15] Xu J. , Wu C. , Che X. , et al. Circulating microRNAs, miR-21, miR-122, and miR-223, in patients with hepatocellular carcinoma or chronic hepatitis[J]. Mol Carcinog, 2011, 50(2): 136-142. [本文引用:1]
[16] Zhang S. , Ouyang X. , Jiang X. , et al. Dysregulated serum microRNA expression profile and potential biomarkers in hepatitis C virus-infected patients[J]. Int J Med Sci, 2015, 12(7): 590-598. [本文引用:2]
[17] Zhang H. , Li QY. , Guo ZZ. , et al. Serum levels of microRNAs can specifically predict liver injury of chronic hepatitis B[J]. World J Gastroenterol, 2012, 18(37): 5188-5196. [本文引用:1]
[18] Zhang Y. , Jia Y. , Zheng R. , et al. Plasma microRNA-122 as a biomarker for viral-, alcohol-, and chemical-related hepatic diseases[J]. Clin Chem, 2010, 56(12): 1830-1838. [本文引用:2]
[19] Ma J. , Liu Y. , Yang X. , et al. Induction chemotherapy in patients with resectable head and neck squamous cell carcinoma: A meta-analysis[J]. World J Surg Oncol, 2013, 11: 67. [本文引用:1]
[20] 周支瑞, 张天嵩, 李博, . 生存曲线中Meta分析适宜数据的提取与转换[J]. 中国循证心血管医学杂志, 2014, 6(3): 243-247. [本文引用:1]
[21] 黎晓玲, 任昀, 陈扬. Graph Digitizer在计量检定工作中的应用探讨[J]. 计量与测试技术, 2014, 41(2): 1-2. [本文引用:1]
[22] 吴耀忠, 黎丽群, 黄超, . 血清铁蛋白诊断乳腺癌准确性的Meta分析[J]. 中国循证医学杂志, 2014, 14(12): 1450-1458. [本文引用:1]
[23] Zamora J. , Abraira V. , Muriel A. , et al. Meta-DiSc: A software for meta-analysis of test accuracy data[J]. BMC Med Res Methodol, 2006, 6: 31. [本文引用:1]
[24] Liao Q. , Han P. , Huang Y. , et al. Potential role of circulating microRNA-21 for hepatocellular carcinoma diagnosis: A meta-analysis[J]. PLoS One, 2015, 10(6): e130677. [本文引用:1]