在R软件中实现单个率的Meta分析
罗美玲, 谭红专, 周权, 王莎亚, 蔡畅, 郭亚伟, 沈琳
中南大学公共卫生学院流行病与卫生统计学系, 长沙 410078
通讯作者: 谭红专, Tel:0731-88885835; E-mail:tanhz99@qq.com

作者简介: 罗美玲(1987-),女,土家族,湖南湘西自治州人,在读硕士研究生,研究方向为分子流行病学。

摘要

目的介绍在R软件中实现单个率的Meta分析方法。方法在R软件中加载Meta分析程序包,录入Meta分析数据,用实例数据进行Meta分析。结果单个率资料的Meta分析要求率的分布服从正态分布,R软件提供了四种率的转换方法。对实例数据进行正态性转换后进行Meta分析,其合并率及95%可信区间与原文一致。结论R软件可以实现对单个率研究结果的Meta分析,功能强大,实用性强。

关键词: ; Meta分析; R软件
中图分类号:R195.1 文献标识码:A
Realizing the Meta-Analysis of Single Rate in R Software
LUO Mei-ling, TAN Hong-zhuan, ZHOU Quan, WANG Sha-ya, CAI Chang, GUO Ya-wei, SHEN Lin
Department of Epidemiology and Health Statistics, School of Public Health, Central South University, Changsha 410078, China
Abstract

Objective To introduce the method of meta-analysis for single rate in R software. Method We loaded meta-analysis package and inputted data, and then analyzed the example data in R software.Results Meta-analysis for single rate requested the distribution of rate was normal, and R software provided four transformation methods. The example results were consistent with the original literatures.Conclusion Meta-analysis for single rate could be realized in R software.

Key words: rate; meta-analysis; R software

Meta分析主要用于汇总众多研究结果并进行定量分析[ 1]。目前Meta分析的效应量有单个率(rate)、比值比(odds ratio,OR)、相对危险度(relative risk,RR)、均数(mean)等,单个率的 Meta 分析是一种只提供了一组人群的总人数和事件发生人数,基于原始研究为横断面的研究[ 2]。各独立研究的效应量为率的Meta分析在国内外均有报道,多个软件可以实现[ 3, 4, 5]。国内Meta分析的软件主要是Review Manager,但该软件无法实现单个率的Meta分析[ 6]。Stata软件可进行单个率的Meta分析,但其计算繁琐,操作较复杂且是收费的统计软件[ 7]。Meta-analysis 软件是一款免费的软件且可以进行单个率的Meta分析,但是其为菜单操作,无法实现对原始率的转换[ 8]。R软件是一种共享的免费统计软件,有专门的Meta分析程序包,可以进行单个率的Meta分析,而且提供了五种方法估算率,研究者可以根据原始率的分布选择合适的方法[ 9]。国内少有用R软件进行Meta分析的文献,且没有介绍其具体操作步骤及适用条件[ 10, 11]。本文结合编程和Meta分析程序包,以实例说明R软件在单个率Meta分析中的应用,以期为今后的Meta分析提供方法学指导。

1 R软件介绍及Meta程序包导入

R软件是一个自由、免费、源代码开放的软件,可用于统计计算和统计制图的优秀工具[ 12]

R软件的最新版本可以从CRAN(the Comprehensive R Archive Network)下载,网址为:http://cran. r-project.org/,截止到2012年10月30日的最新版本是R-2.15.2。

软件安装好后,先在电脑中的任意盘(如D盘)建一个名为Rworkplace文件夹,同时在桌面上的R软件图标上单击右键选择属性,将“起始位置”修改为:D:\Rworkplace,目的是使以后读文件方便。运行R软件,点击 “程序包”下拉菜单后,再选“安装程序包”,会出现下载数据源的镜像列表,然后选择离自己距离最近的镜像,如China(Beijing1),确定之后在出现的对话框中找到“meta”模块。最后加载meta程序包,点击“程序包”图标后,选 “加载程序包”,在列表中加载“meta”模块。

2 数据录入

以Ford等[ 13]的研究在消化不良人群中肠易激综合征发生率的Meta分析数据为例(见 表1)。建立Excel表,按照 图1中的格式录入原始数据,录入原始研究的事件发生数(event)及样本量(n),然后另存为CSV(逗号分隔)文件,放在之前建立的D:\Rworkplace文件夹中。

图1 数据录入格式

表1 消化不良人群中肠易激综合征发生率的研究数据
3 R软件中的Meta分析函数
3.1 数据读入

可利用read函数读入之前建立好的Excel数据集,相应的命令是:rate<-read.csv("rate.csv")

3.2 单个率的合并

可使用metaprop函数进行率的合并,R软件中关于样本率的估计方法有五种,根据样本率的分布决定使用哪种合并方法,五种估计方法如下:

sm="PRAW", Raw, i.e. untransformed, proportions(没有转换的原始率)。

sm="PLN", Log transformation(对数转换)。

sm="PLOGIT", Logit transformation(logit转换)。

sm="PAS",Arcsine transformation(反正弦转换)。

sm="PFT", Freeman-Tukey Double arcsine

transformation(Freeman-Tukey双重反正弦转换)[ 14]

在进行metaprop分析之前,对原始率及按四种估计方法进行转换后的率进行正态性检验,根据检验结果选择接近正态分布的方法。transform为对数据进行计算,p、log、logit、arcsin、dsrcsin表示分别按上述五种方法估计率的函数、write为保存转换后的数据,shapiro.test为正态性检验。命令如下:

transform(rate, p=event/n, log=log(event/n),logit=log((event/n)/(1-event/n)), arcsin=asin(sqrt(event/(n+1))), darcsin=0.5∗(asin(sqrt(event/(n+1)))+asin (sqrt((event+1)/(n+1)))))->rate

write.csv (rate,file="rate.csv")

shapiro.test(rate p); shapiro.test(rate log);shapiro.test (rate logit); shapiro.test (rate arcsin);shapiro.test (rate darcsin)

metaprop函数用于计算各个独立研究的率及95%可信区间,并按照率的分布选择合适的估计方法,得到合并的率及95%可信区间。命令如下:

metarate<- metaprop(event, n, study, data=rate, sm="PLOGIT", incr=0.5, allincr=TRUE, addincr=FALSE, title="")

sm表示估计样本率的方法,根据正态性检验结果选择合适的估计方法。本例原始率的分布为偏态,选取的是PLOGIT法估计原始率。

incr=0.5表示当事件发生数为0时用0.5来替代。

allincr=TRUE表示至少有一个研究的事件发生数为0时,所有事件发生数都加上incr数值。为FALSE时,只对事件发生数为0的研究加上incr数值。

addincr=TRUE表示无论是否有事件发生数为0的研究,所有研究都加上incr数值。

title=""表示这次meta分析的标题。

3.3 森林图的绘制

forest是对计算的结果按森林图表示。命令为:forest (metarate, digits=2)。digits表示保留的小数位数。合并的率及95%可信区间与原文一致,结果见 图 2

图2 Meta分析森林图

3.4 漏斗图的绘制

funnel画漏斗图,是用于识别发表偏倚或其他偏倚的方法,根据图形的不对称程度判断Meta分析中偏倚的有无。

命令为:funnel(metarate)。结果见 图3。漏斗图是一种用主观定性的方法来判断有无偏倚,因此需要对漏斗图的不对称程度进行统计学检验。

图3 Meta分析漏斗图

3.5 漏斗图的不对称性检验

metabias是对漏斗图的不对称性进行统计学检验。

Egger检验的命令为metabias(metarate, method="linreg"),根据结果输出窗口 P值大小,判断发表偏倚或其他偏倚是否具有统计学意义。输出Egger漏斗图的命令为metabias (metarate, method ="linreg", plotit=TRUE, k.min=10)。结果见 图4。Method为Egger检验的方法;plotit为画图函数;k.min为进行检验时所需最小的单个研究的数量,默认为10,如果研究在3~10个之间可通过此函数进行调整。

图4 Meta分析Egger漏斗图

3.6 敏感性分析

metainf可以进行敏感性分析,计算分别剔除每个入选研究后合并的OR值及95%可信区间。命令为:metainf(metarate)。

4 讨 论

在科学研究中,设立对照是一项基本原则,如病例对照研究的病例组和对照组、队列研究中的暴露组和非暴露组,临床随机对照试验的试验组和对照组。对这些研究进行Meta分析时合并的指标是两组的相对效应如OR值、RR值或是绝对效应如危险度差值(risk difference, RD),然而在并未设立对照组如流行病学中的现况研究,如要了解某种病毒在全国的一个总体感染率而又没有足够的时间或经费做全国性的调查时,我们可以通过对现有文献报道的感染率进行Meta分析,了解该病毒在全国的感染情况。

单个率可包括流行病学现况研究中的患病率、感染率,临床试验的有效率,药物试验中的不良反应发生率等,只要收集到各个原始研究的样本量和事件发生数,在R软件就可以用metaprop函数对单个率进行定量的Meta分析,来计算合并的率及95%可信区间,结合funnel函数,可绘制漏斗图,通过观察图形是否对称初步判断有无发表偏倚,结合metabias可以绘制出Begg和Egger图,对发表偏倚进行统计学检验。

考虑到不同类型的单个率的资料的分布可能会有不同的情况,R软件给出了五种估计率的方法。如原始率不服从正态分布,可经过转换使其服从或接近正态分布,从而提高合并结果的可靠性。

本文选取的实例纳入文献数为19, I2值为96.7%,各研究间存在异质性。由于单个率的Meta分析各原始文献为单个组别的率,稳定性不同于具有两个组的研究,因此在合并时统计学异质性一般会比较大,这在国内外发表的关于单个率的Meta分析文章也可以看出[ 11, 15, 16]。当异质性较大时,首先要从专业性的角度对不同情况下的率进行亚组分析,或通过敏感性分析来确定Meta分析的结果是否可靠。

本文结合实例,介绍了在R软件中如何实现单个率的Meta分析。R软件可以对Meta分析中多种计算方法进行快速简便且准确的统计分析[ 17],而且不断更新,可以从网站上免费下载,实用性强。R软件在国内已逐渐得到应用,其在Meta分析中的优势也将显现出来。

The authors have declared that no competing interests exist.

参考文献
[1] Glass GV. Primary, secondary and meta-analysis of research[J]. Educat Res, 1976, 6(5): 3. [本文引用:1]
[2] 曾宪涛, 冷卫东, 郭毅, . Meta分析系列之一: Meta分析的类型[J]. 中国循证心血管医学杂志, 2012, 4(1): 3-5. [本文引用:1]
[3] 王佩鑫, 李宏田, 刘建蒙. 无对照二分类资料的Meta分析方法及Stata实现[J]. 循证医学, 2012, 12(1): 52-55. [本文引用:1]
[4] Koskinen J, Löhönen J, Koponen H, et al. Prevalence of alcohol use disorders in schizophrenia—a systematic review and meta-analysis[J]. Acta Psychiatr Scand , 2009, 120(2): 85-96. [本文引用:1]
[5] Batham A, Narula D, Toteja T, et al. Systematic review and meta-analysis of prevalence of hepatitis B in India[J]. Indian Pediatr, 2007, 44(9): 663-674. [本文引用:1] [JCR: 1.036]
[6] 钟文昭, 吴一龙, 谷力加. Review manager(RevMan)——临床医生通向 Meta分析的桥梁[J]. 循证医学, 2003, 3(4): 234-246. [本文引用:1]
[7] 柏建岭, 钟文昭, 郑明华. Stata在 Meta 分析中的应用[J]. 循证医学, 2007, 7(6): 363-368. [本文引用:1]
[8] Wallace BC, Schmid CH, Lau J, et al. Meta-analyst: Software for meta-analysis of binary, continuous and diagnostic data[J]. BMC Med Res Methodol, 2009, 9(1): 80-91. [本文引用:1] [JCR: 2.211]
[9] 张天嵩, 钟文昭. 实用循证医学方法学2012[M]. 长沙: 中南大学出版社, 2012: 363. [本文引用:1]
[10] 杨国静, 孙乐平, 吴锋, . 50%氯硝柳胺乙醇胺盐可湿性粉剂现场灭螺效果的Meta分析[J]. 中国血吸虫病防治杂志, 2010, 22(6): 579-582. [本文引用:1]
[11] 何倩, 王静, 朱玉, . 中国内地居民2000-2009年被动吸烟率Meta分析[J]. 中华流行病学杂志, 2011, 32(2): 159-163. [本文引用:1]
[12] Chongsuvivatwong V. Analysis of epidemiological data using R and Epicalc[M]. Songkhla, Thailand : Chanmuang Press, 2008. [本文引用:1]
[13] Ford AC, Marwaha A, Lim A, et al. Systematic review and meta-analysis of the prevalence of irritable bowel syndrome in individuals with dyspepsia[J]. Clin Gastroenterol Hepatol, 2010, 8(5): 401-409. [本文引用:1]
[14] Freeman MF, Tukey JW. Transformations related to the angular and the square root[J]. Ann Math Statist, 1950, 21(4): 607-611. [本文引用:1] [JCR: 0.736]
[15] Ahmed B, Al-Khaffaf H. Prevalence of significant asymptomatic carotid artery disease in patients with peripheral vascular disease: A meta-analysis[J]. Eur J Vasc Endovasc Surg, 2009, 37(3): 262-271. [本文引用:1]
[16] Vallely A, Page A, Dias S, et al. The prevalence of sexually transmitted infections in papua new guinea: A systematic review and meta-analysis[J]. PLoS ONE, 2010, 5(12): e15586. [本文引用:1] [JCR: 3.73]
[17] 蒋文瀚, 陈炳为, 郑建光, . R语言meta包在Meta分析中的应用[J]. 循证医学, 2011, 11(5): 305-309. [本文引用:1]