设计类型与变量类型对医学研究统计方法恰当选择的影响
吴俊林1, 唐雪莉1, 陈霞1, 戴浩然1, 李家兵1, 黄艳君1, 黄国平1,2
1.四川省精神卫生中心、绵阳市第三人民医院, 四川绵阳 621000
2.川北医学院精神卫生学院, 四川南充 637000
通讯作者: 黄国平, Tel:0816-2285679, E-mail:achuanggp@163.com
作者简介:

吴俊林(1979- ),男,四川绵阳人,副编审,医学硕士,主要研究方向为临床科研统计与精神医学。

摘要

恰当的统计方法选择对医学研究结果可信度的影响显而易见,关于在医学科研中如何恰当选择统计方法的文章和著作虽然不在少数,但目前中文医学期刊中统计分析方法误用情况仍屡见不鲜。原因可能是复杂的,其中过度追求具体方法的使用而对其基本概念理解的不充分可能是误用统计方法的重要原因之一。本文将以研究设计阶段所涉及的设计类型和变量类型两个重要概念为核心探讨选择恰当统计方法需要把握的要点。旨在提高医学论文的科学性和统计学内容的编校质量。

关键词: 医学论文; 统计分析; 设计类型; 变量类型; 选择
中图分类号:R195.1 文献标识码:A 收稿日期: 2020-10-27
The Influence of Design Type and Variable Type on the Appropriate Choice of Statistical Methods for Clinical Medical Research
WU Jun-lin1, TANG Xue-li1, CHEN Xia1, DAI Hao-ran1, LI Jia-bin1, HUANG Yan-jun1, HUANG Guo-ping1,2
1. Sichuan Mental Health Center, The Third Hospital of Mianyang, Sichuan Mianyang 621000, China
2. Mental Health School of North Sichuan Medical College, Sichuan Nanchong 637000, China
Abstract

The impact of proper statistical method selection on the credibility of medical research results is obvious. Naturally, there are many articles and works on how to properly select statistical methods in medical research. However, the misuse of statistical analysis methods in Chinese medical journals is still common. The reasons may be complex, but excessive pursuit of the use of specific methods and insufficient understanding of their basic concepts may be one of the important reasons for the misuse of statistical methods. This article will focus on the two important concepts of design types and variable types involved in the design phase, and discuss the key points to choose appropriate statistical methods. The aim is to improve the scientific and statistical quality of medical papers.

Key words: medical paper; statistical analysis; design type; variable type; choice

医学领域存在大量的随机现象, 比如拟研究某种药物的临床疗效, 研究实施前可预知疗效共有两种可能结果, 有效和无效, 但此时并不能预知研究实施后到底出现哪种结果。这种在事前并不能预知相同条件下每次试验的具体结果的现象称为随机现象。概率论和统计学就是研究和揭示随机现象统计规律性的科学, 统计学是以概率论为理论基础, 研究怎样以有效的方式收集、整理、分析带随机性的数据, 在此基础上对所研究的问题做出回答, 为决策提供依据[1]。可见, 在医学研究中引入统计学是必要且合理的。目前关于在医学科研中恰当选用统计方法的文章和著作并不缺乏, 并且很多文献详细介绍了统计方法使用常见错误以及正确方法[2, 3, 4], 但医学论文中统计方法误用现象仍较普遍[5, 6, 7]。其中过度追求具体方法的使用而对其基本概念和原理理解的不充分可能是错误使用统计方法的重要原因之一。由于医学统计体系庞大, 需要理解的概念较多, 本文将以试验研究设计阶段所涉及的设计类型和变量类型两个重要概念为核心探讨统计方法的恰当选择, 为医学科研人员和医学学术期刊编辑提供参考。

1 设计类型

在实际工作, 常常会见到一些研究人员拿着收集好的数据找统计专家帮助分析, 而在研究设计阶段完全没有统计人员参与, 也没有做充分的统计设计思考, 假如此时数据存在严重的统计设计缺陷, 再优秀的统计学家, 再完美的统计方法也无济于事, 这无异于“ 尸体解剖仅可以得出死因而已” 。合理的科研流程应在研究设计阶段进行专业设计的同时还要引入统计设计, 它是研究方案中不可或缺的重要内容之一, 在研究与交流的其他环节也可能会涉及到统计内容, 如图1。

图1 临床研究与学术交流流程图Fig.1 Flow chart of clinical research and academic exchange

试验研究统计设计内容包括设计类型、研究设计三要素与四原则等, 临床试验研究包括伦理审查、依从性、盲法设计等[8, 9]。其中, 设计类型与三要素中的效应指标类型(变量类型)与统计方法的选择高度相关[10, 11, 12]

设计类型指因素及其不同水平决定的结构, 因素是研究者所考察的可能影响试验结果的各种试验条件的总称[13, 14]。比如, 某临床医生拟探讨A、B、C三种降压药对原发性高血压患者的降压效果, 此研究中药物即为一个因素, 设置三种药物, 即A药、B药和C药, 称为“ 水平” 。再如性别这一因素可以取两个值, 男和女。特别注意的是仅当取值为两个或以上时才称为因素。因素可分为试验因素(处理因素)和非试验因素(混杂因素、区组因素)[15, 16, 17, 18]。根据涉及因素的多寡将研究设计类型分为单因素试验设计和多因素试验设计, 它们分别包含多个不同的具体类型, 如配对设计、成组设计、重复测量设计、析因设计、嵌套设计、拉丁方设计等, 正确识别不同的设计类型是合理选择统计分析方法的前提之一[19, 20, 21, 22]。如某研究拟探讨帕利哌酮缓释剂与奥氮平治疗精神分裂症的效果。将120例精神分裂症患者随机分成两个药物组各60例进行治疗, 观察3个月, 于治疗前、治疗后1月末、2月末、3月末采用阳性和阴性症状量表(Positive and Negative Syndrome Scale, PANSS)测评。如果研究者多次采用成组设计一元定量资料的t检验来分析此资料, 妥否?显然不妥, 因为它既割裂了资料的整体性, 又没有考虑消除不同时间点上数据之间的内在联系对结果的影响, 如果研究者能够正确识别出此研究属于重复测量设计类型, 则应当采用具有一个重复测量的两因素设计定量资料的一元协方差分析来分析数据, 两个因素分别指药物种类和时间, 其中时间为一个重复测量因素, 治疗前PANSS的测量结果可作为协变量, 亦可作为时间的一个水平。可见, 统计方法的恰当选择与采用的试验设计类型以及正确识别出试验设计类型高度相关。

还有一类因没能正确识别设计类型而误用统计方法的典型案例, 就是把多因素的不同水平组合用“ 组别” 这个词作为变量名致使误以为是单因素多水平, 进而采用单因素多水平设计定量资料方差分析方法[23, 24]。如某研究者拟探讨人参茎叶皂苷(ginsenosides, GSS)对热损伤大鼠肝细胞糖皮质激素受体(glucocorticoid receptor, GR)的影响, 选用SD大鼠32只, 随机分为4组, 即正常对照组、GSS治疗组、热损伤模型组、热损伤模型GSS治疗组, 经过试验程序后, 测量肝细胞液GR最大结合容量。若以“ 组别” 为变量名称, 其取值分别为正常对照组、GSS治疗组、热损伤模型组、热损伤模型GSS治疗组, 则此设计类型被误判为单因素四水平设计, 采用单因素四水平设计定量资料方差分析, 这显然与设计类型不符, 采用的统计方法欠妥。仔细分析发现, 此研究至少涉及两个需要考察的因素:(1)是否为热损伤模型, 它有两个取值, 即热损伤模型和非热损伤模型; (2)是否给予GSS治疗, 它也有两个取值, 即给予GSS治疗和未给予GSS治疗。这两个因素及其水平的全面组合, 即非热损伤模型且未给予GSS治疗则为正常对照组, 非热损伤模型且给予GSS治疗为GSS治疗组, 热损伤模型且未给予GSS治疗为热损伤模型组, 热损伤模型且给予GSS治疗为热损伤模型GSS治疗组。若两因素对效应指标的影响无主次之分, 且数据满足方差分析的前提条件, 则可采用两因素析因设计定量资料的方差分析进行处理, 或影响有主次之分, 则可考虑嵌套设计定量资料的方差分析等[25, 26]

设计类型种类较多, 它不仅与统计方法的选择有关, 还与研究目的密切相关, 熟练掌握各种设计类型的本质特征及其应用场景, 不仅是恰当选择统计方法的需要, 也是实现研究目的的需要, 当然, 恰当的统计方法的选择也是为了实现研究目的, 最终为发现科学规律, 服务人类健康。

2 变量类型

医学论文中的统计分析部分常见“ × × 计量资料采用× × 检验, ##计数资料采用##检验” 的描述, 虽然这样的表达显得有些粗糙, 但反映出选择恰当的统计方法需要对变量类型的正确识别。不同的学科将变量分为不同的类型, 如数理统计将变量分为离散变量和连续变量, 医学统计中有的分为两类有的分为三类, 如计量资料、计数资料、定量资料、定性资料, 归纳如图2。

图2 变量分类Fig.2 Variable categories

采用两大类四小类的分类方法来区分和识别变量类型对选择恰当的统计方法可能更有帮助, 两大类指将变量分为定量变量和定性变量, 前者进一步细分为连续变量和离散变量, 后者分为名义变量和有序变量。连续变量与离散变量的区别在于前者是连续数据, 有小数位, 后者是离散数据, 无小数位。如身高、体质量等变量虽然实际工作中都以整数形式呈现出来, 但并不代表它们不属于连续变量, 因为这是由于测量精度的原因, 如果精度足够的高, 那么任意两个数之间一定会有第三个数的存在, 可见身高、体质量属于连续变量。脉搏这类变量只能取整数数据, 属于离散变量。定性变量可分为名义变量和有序变量, 主要用于区分不同性质的事物, 且不能用具体的数值反映其结果, 但可以用数字表示定量变量的取值, 如用“ 1” 表示性别变量中男性这一取值, “ 2” 表示女性, 形式上虽是数字, 但它们并无大小之分, 不能参加四则运算。名义变量的取值可以是两个或以上, 且取值无顺序排列, 如性别变量, 它有两个取值, 血型变量, 它有A、B、O、AB四个取值。有序变量的取值存在一定的顺序, 且相邻水平之间的相差程度并不一定相等, 如疗效变量, 其取值可为痊愈、显著进步(基本痊愈)、好转、无变化、恶化五个等级。

对变量或统计数据的正确分类与统计方法的恰当选择密切相关[27, 28]。例如某研究拟探讨雌激素受体(estrogen receptor, ER)和孕激素受体(progesterone receptor, PR)在不同血管瘤发生中的意义, 采用免疫组化的方法对毛细血管瘤、海绵状血管瘤、混合型血管瘤及正常皮肤组织的ER和PR进行检测, 高倍镜下每例肿瘤区内计数500个细胞, 计算ER和PR阳性细胞百分比。如果从数据形式为“ 率” 或“ 百分比” 这一表面现象进行判断, 容易误认为它是定性资料, 随之选择χ 2检验处理数据。本例中问题的关键在于并非根据细胞测定结果的“ 阳性” 和“ 阴性” 对研究对象进行分类计数, 而是比较不同类型血管瘤及正常皮肤组织的ER和PR阳性细胞百分比的均值是否相等, 这些百分数都是每个标本测定的具体数值, 有大小之分, 应属于定量资料, 一般情况下对百分比资料宜作平方根反正弦变换, 当资料满足一定前提条件, 根据设计类型可选择单因素四水平设计定量资料的方差分析方法[29, 30]

在对定性资料的分析中, 常出现对有序定性资料的顺序视而不见的现象, 导致对资料分析的不完全[31, 32]。如某研究拟分析三种药物的疗效, 数据如表1

表1 三种药物疗效比较数据 Tab.1 Comparison of treatment efficacy

表1中的数据类型比较容易识别, 它属于定性资料, 常采用一般χ 2检验, 若对其应用条件有所了解, 则会进一步检视理论频数等是否满足要求, 之后有Fisher精确检验等统计方法供选择。但如果再仔细考察数据特征, 会发现它不仅是定性资料, 而且由于疗效结果明显有等级之分, 它应属于定性资料中的多值有序变量。根据不同的研究目的, 此类资料可选择秩和检验、Ridit分析以及结果变量为多值有序变量的Logistic回归分析方法进行处理[33, 34, 35]

虽然变量类型仅有四种, 但要对研究所获得的各种资料进行正确的分类也并非是易事, 努力弄清变量分类的种类, 把握判断资料分类的关键要点是选择恰当统计分析方法不可回避的工作。

3 小结

对于一项医学科学研究, 往往会收集多项指标数据, 获得大量资料, 对这些资料的分析也会选择多种统计方法综合分析, 然而选择每一种恰当的统计方法需要全面考虑多种因素, 对这些因素的考虑不仅要充分, 而且要准确并合理。只有在明确研究目的的前提下, 正确识别或判断该研究的设计类型, 对采集的数据正确的分类等, 才有可能为数据处理选择恰当的统计方法[36, 37, 38]。当然除了以上两个关键概念之外, 还有许多其他重要的因素值得进一步澄清, 如“ 样本” 概念, 也许它既熟悉又陌生, 对它的准确把握, 会发现很多研究还有改进的空间, 这将在后继文章中进一步讨论。

参考文献
[1] CHEN J J. Some applied research of mathematical statistics in medicine and other fields[D]. Beijing University of Civil Engineering and Architecture, 2016: 1-13.
[陈建杰. 数理统计在医学等领域的若干应用研究[D]. 北京建筑大学, 2016: 1-13. ] [本文引用:1]
[2] VÄHÄNIKKILÄ H, VIRTANEN J I, NIEMINEN P. How do statistics in dental articles differ from those articles published in highly visible medical journals?[J]. Scientometrics, 2016, 108: 1417-1424. [本文引用:1]
[3] HAN Z H, LIU Z X, GUAN X, et al. Case analysis on misapplication and misuse of statistical analysis methods in medical papers[J]. Acta Editologica, 2019, 31(1): 37-40.
[韩宏志, 刘仲祥, 官鑫, . 医学期刊中常见的几种统计学分析方法错用误用案例辨析[J]. 编辑学报, 2019, 31(1): 37-40. ] [本文引用:1]
[4] SMITH R J. The continuing misuse of null hypothesis significance testing in biological a nthropology[J]. Am J Phys Anthropol, 2018, 166(1): 236-245. [本文引用:1]
[5] ZHANG J F, DONG H Y. Common statistical errors in the review of medical papers: Misuse analysis of repeated measurement methods[J]. Chinese Remedies & Clinics, 2017, 17(12): 1875-1876.
[张军锋, 董海原. 医学论文审稿中常见的统计学错误: 重复测量方法的误用分析[J]. 中国药物与临床, 2017, 17(12): 1875-1876. ] [本文引用:1]
[6] SUZUKI E, TSUDA T, MITSUHASHI T, et al. Errors in causal inference: An organizational schema for systematic Error and rand om error[J]. Ann Epidemiol, 2016, 26(11): 788-793. [本文引用:1]
[7] ZHANG J F, DONG H Y. Common statistical errors in the review of medical papers: Misuse analysis of correlation and regression analysis methods[J]. Chinese Remedies & Clinics, 2018, 18(3): 503-504
[张军锋, 董海原. 医学论文审稿中常见的统计学错误: 相关回归分析方法的误用分析[J]. 中国药物与临床, 2018, 18(3): 503-504. ] [本文引用:1]
[8] STALLARD N, TODD S, RYAN E G, et al. Comparison of Bayesian and frequentist group-sequential clinical trial designs[J]. BMC Med Res Methodol, 2020, 20(1): 4. [本文引用:1]
[9] HU L P. Application of three types of statistics theory in experimental design[M]. Beijing: People's Military Medical Press, 2006: 12-16.
[胡良平. 统计学三型理论在实验设计中的应用[M]. 北京: 人民军医出版社, 2006: 12-16. ] [本文引用:1]
[10] SHEN N, HU L P. Introduction to methods of medical research design[J]. Sichuan Mental Health, 2017, 30(4): 301-305.
[沈宁, 胡良平. 医学科研设计方法概论[J]. 四川精神卫生, 2017, 30(4): 301-305. ] [本文引用:1]
[11] MADIGAN D, RYAN P B, SCHUEMIE M. Does design matter?Systematic evaluation of the impact of analytical choices on effect estimates in observational studies[J]. Ther Adv Drug Saf, 2013, 4(2): 53-62. [本文引用:1]
[12] SHEN N, HU L P. Overview for the design of clinical trials[J]. Sichuan Mental Health, 2017, 30(4): 306-309.
[沈宁, 胡良平. 临床试验设计之概述[J]. 四川精神卫生, 2017, 30(4): 306-309. ] [本文引用:1]
[13] HILGERS R D, MANOLOV M, HEUSSEN N, et al. Design and analysis of stratified clinical trials in the presence of bias[J]. Stat Methods Med Res, 2020, 29(6): 1715-1727. [本文引用:1]
[14] BARRAZA F, ARANCIBIA M, MADRID E, et al. General concepts in biostatistics and clinical epidemiology: Rand om error and systematic error[J]. Medwave, 2019, 19(7): e7687. [本文引用:1]
[15] STREETER A J, LIN N X, CRATHORNE L, et al. Adjusting for unmeasured confounding in nonrand omized longitudinal studies: A methodological review[J]. J Clin Epidemiol, 2017, 87: 23-34. [本文引用:1]
[16] HUANG L H, WEI Y Y, CHEN F. Confounder adjustment in observational comparative effectiveness researches: (1)statistical adjustment approaches for measured confounder[J]. Chinese Journal of Epidemiology, 2019, 40(10): 1304-1309.
[黄丽红, 魏永越, 陈峰. 如何控制观察性疗效比较研究中的混杂因素: (一)已测量混杂因素的统计学分析方法[J]. 中华流行病学杂志, 2019, 40(10): 1304-1309. ] [本文引用:1]
[17] HUANG L H, WEI Y Y, CHEN F. Confounder adjustment in observational comparative effectiveness researches: (2)statistical adjustment approaches for unmeasured confounders[J]. Chinese Journal of Epidemiology, 2019, 40(11): 1450-1455.
[黄丽红, 魏永越, 陈峰. 如何控制观察性疗效比较研究中的混杂因素: (二)未知或未测量混杂因素的统计学分析方法[J]. 中华流行病学杂志, 2019, 40(11): 1450-1455. ] [本文引用:1]
[18] URACH S, GAASTERLAND C, POSCH M, et al. Statistical analysis of goal attainment scaling endpoints in rand omised trials[J]. Stat Methods Med Res, 2019, 28(6): 1893-1910. [本文引用:1]
[19] SHEN N, HU L P. Overview of the experimental design type[J]. Sichuan Mental Health, 2017, 30(1): 1-5.
[沈宁, 胡良平. 试验设计类型之概述[J]. 四川精神卫生, 2017, 30(1): 1-5. ] [本文引用:1]
[20] GUO C X, HU L P. Types of experimental design: A single factor design[J]. Sichuan Mental Health, 2017, 30(1): 6-10.
[郭春雪, 胡良平. 试验设计类型之单因素设计[J]. 四川精神卫生, 2017, 30(1): 6-10. ] [本文引用:1]
[21] SHAKHGELDIAN K I, GELTZER B I, GMAR D V, et al. The problems of analysis of medical statistics data[J]. Probl Sotsialnoi Gig Zdravookhranenniiai Istor Med, 2018, 26(3): 132-136. [本文引用:1]
[22] LUO Y M, SUN Y M, GOU L, et al. Statistical methods commonly applied in Chinese medical journals[J]. Acta Editologica, 2017, 29(4): 351-353.
[罗云梅, 孙艳梅, 苟莉, . 中文医学期刊中常用的统计分析方法[J]. 编辑学报, 2017, 29(4): 351-353. ] [本文引用:1]
[23] BURAK B, PAMBUCCIAN S E, BARKAN G A, et al. The use and misuse of statistical methods in cytopathology studies: Review of 6 journals[J]. Lab Med, 2019, 50(1): 8-15. [本文引用:1]
[24] XIANG D F, GAO Y, ZHOU Z Y. P-value errors in two-sample t-test of medical papers and reason analysis[J]. Chinese Journal of Scientific and Technical Periodicals, 2018, 29(12): 1224-1228.
[相丹风, 高永, 周英智. 医学论文中成组t检验P值错误及其原因分析[J]. 中国科技期刊研究, 2018, 29(12): 1224-1228. ] [本文引用:1]
[25] HU L P, GAO H. How to use one-way analysis of variance correctly[J]. Journal of Chinese Integrative Medicine, 2008, 6(3): 316-319.
[胡良平, 高辉. 如何正确运用单因素多水平设计定量资料方差分析[J]. 中西医结合学报, 2008, 6(3): 316-319. ] [本文引用:1]
[26] LYTSY P. P in the right place: Revisiting the evidential value of P-values[J]. J Evid Based Med, 2018, 11(4): 288-291. [本文引用:1]
[27] WANG L, SHANG L. Correct selection of common data types and descriptive statistics in medical research[J]. Chinese Journal of Child Health Care, 2019, 27(9): 1041-1044.
[王陵, 尚磊. 医学研究常见资料类型及描述性统计量的正确选择[J]. 中国儿童保健杂志, 2019, 27(9): 1041-1044. ] [本文引用:1]
[28] WANG X, XU T, ZHONG S, et al. An efficient sample size adaptation strategy with adjustment of rand omization ratio[J]. Biom J, 2019, 61(3): 769-778. [本文引用:1]
[29] LI Z J, HU L P, LIU H G. Error analysis and disambiguation of statistical analysis in medical papers(6)--Proper selection of quantitative data analysis method[J]. National Medical Journal of China, 2004, 84(6): 519-521.
[李子健, 胡良平, 刘惠刚. 医学论文中统计分析错误辨析与释疑(6)-定量资料分析方法的合理选择[J]. 中华医学杂志, 2004, 84(6): 519-521. ] [本文引用:1]
[30] JANSZKY I, BJØRNGAARD J H, ROMUNDSTAD P, et al. Rand om error units, extensionof a novel method to express rand om error in epidemiological studies[J]. Clin Epidemiol, 2019, 11: 127-132. [本文引用:1]
[31] LI C P, HU L P. Overview of the data structure and analysis methods of qualitative data[J]. Sichuan Mental Health, 2019, 32(4): 289-296.
[李长平, 胡良平. 定性资料的数据结构与分析方法概述[J]. 四川精神卫生, 2019, 32(4): 289-296. ] [本文引用:1]
[32] SCHÜTT H H, ROTHKEGEL L O M, TRUKENBROD H A, et al. Likelihood-based parameter estimation and comparison of dynamical cognitive models[J]. Psychol Rev, 2017, 124(4): 505-524. [本文引用:1]
[33] PU S Q, LUO Y M, LI Y L. Misuse of statistical method for ordinal data in medical papers and case discrimination[J]. Acta Editologica, 2019, 31(5): 513-515.
[蒲素清, 罗云梅, 李缨来. 医学论文中等级资料统计方法误用的案例辨析[J]. 编辑学报, 2019, 31(5): 513-515. ] [本文引用:1]
[34] FENG S Y, LI C P, HU L P. Multi-level multiple Logistic regression analysis of the multi-value ordinal data collected from the unpaired design[J]. Sichuan Mental Health, 2019, 32(6): 481-485.
[凤思苑, 李长平, 胡良平. 非配对设计多值有序资料多水平多重Logistic回归分析[J]. 四川精神卫生, 2019, 32(6): 481-485. ] [本文引用:1]
[35] YAN Y, ZHOU H, CAI J. Improving efficiency of parameter estimation in case-cohort studies with multivariate failure time data[J]. Biometrics, 2017, 73(3): 1042-1052. [本文引用:1]
[36] WORTHY G. Statistical analysis and reporting: common errors found during peer review and how to avoid them[J]. Swiss Med Wkly, 2015, 145: w14076. [本文引用:1]
[37] ZHAI C C, GAO J, JIA Z J, et al. Investigation and analysis of statistical service demand of Chinese medical journal authors and readers under digital publishing mode[J]. Journal editors essays, 2019: 304-309.
[翟铖铖, 高静, 贾泽军, . 数字出版模式下中文医学期刊作者及读者对统计学服务需求的调查分析[J]. 学报编辑论丛, 2019: 304-309. ] [本文引用:1]
[38] LUO Y M, SUN Y M, GOU L, et al. Statistical methods commonly applied in Chinese medical journals[J]. Acta Editologica, 2017, 29(4): 351-353.
[罗云梅, 孙艳梅, 苟莉, . 中文医学期刊中常用的统计分析方法[J]. 编辑学报, 2017, 29(4): 351-353. ] [本文引用:1]