绪论:写作既是个人情感的抒发,也是对学术真理的探索,欢迎阅读由发表云整理的11篇军事医学论文范文,希望它们能为您的写作提供参考和启发。
[中图分类号] G230 [文献标识码] A [文章编号] 1009-5853 (2013) 05-0067-03
医学统计学是一门以统计学原理和方法为基础,探索医学科研工作中遇到的有关数据的收集、整理和分析方法的应用科学,又可被看成一个收集信息、处理信息、分析信息,进而从中提炼和总结分析出新的信息的过程[1]。随着医学科研水平和医疗技术水平的不断提高,医学科研和临床实际工作中,人们对待科学的态度逐渐从原来的“经验主义”转变为“论据先行原则”,无论是在一些医学相关学科的基础实验中,还是在一些临床疾病的诊治等工作中,人们遇到问题时不再“想当然”,而是首先考虑为什么,有何依据,而这些依据大多需要通过统计学中的信息收集、整理、分析来提供。因此,医学统计学在医学工作中的地位越来越重要,统计学应用的正确与否直接影响着医学科研结论的科学性、严谨性和可靠性,具体到医学期刊方面,就会出现因统计学应用不恰当而导致医学期刊不严谨、不科学、不可靠和不具有影响力[2]。鉴于医学统计学在医学期刊中的重要地位,作者结合《肿瘤基础与临床》杂志2011年的240篇文章中出现的统计学问题,对目前我国医学期刊中常见的统计学问题进行分析,同时提出一定的解决方案,为医学编辑工作能力的提高以及医学期刊整体水平的上升提供一定帮助。
1 医学期刊中常见统计学问题
统计学的误用、错用和不用问题广泛存在于许多医学期刊中,统计学错误率处于较高水平,有文献报道期刊论文统计学错误率为38%—80%,而且统计学问题的种类几乎涉及统计学的每个方面,包括实验设计不合理、未进行统计学处理、统计分析软件未介绍或介绍不清、统计学数据的描述方法不当、统计学方法的描述不清或错用、统计值或P值不全或描述不清、统计学结果分析或描述错误等[3-4]。王倩等[5]对5种“中华”系列杂志刊登的文章的统计学应用进行回顾性分析,发现1985年统计学方法应用的错误率占24%,1995年占36%。沈进等[6]选取8种医学期刊,分析发表于1998年至2005年的544篇论著文章的统计学方法应用情况,结果显示,136篇的统计学出现明显错误,错误率达到25%,其中以资料处理方法不当所占比例最高,达到61.76%,其次为图表错误、未作统计学处理等。我刊2011年刊登的240篇论文中,排除个案报道、教学论文、棕色行论文36篇,剩余的204篇论文中有126篇论文采用了统计学处理,占61.76%(126/204),现结合本刊统计学应用现状针对医学期刊中常见的统计学问题进行分类分析如下。
1.1 统计研究设计不合理问题
大多数非统计学专业的学者在进行统计研究设计(包括实验设计、调查设计、临床试验设计)时仅仅从本专业的角度考虑,根据主观想要得到的结果进行分组设计,而完全没有考虑该实验设计的可行性、组间数据是否具有可比性等问题,主要表现在实验设计时不遵循随机化原则、未设置对照或对照不合理、均衡性原则贯彻不彻底等[7]。常见的统计研究设计不合理问题包括缺少对照或对照不合理、单因素设计取代多因素设计、样本量选择不具有代表性或样本量不足等[8]。例如,本刊《SMO蛋白及mRNA在食管癌鳞状细胞癌组织中的表达及意义》一文,在实验分组设计时未对各组间数据是否具有可比性进行统计学分析。
1.2 未进行统计学处理问题
许多医学期刊论文虽然也进行了分组设计、设立对照等,但是文中未说明采用何种统计方法,也未对这些数据进行统计学处理,仅仅通过对实验所得的实际数据的直观判断就得出结论[9]。例如,本刊《肺尖癌26例疗效分析》一文中,作者在分析不同治疗方法对肺尖癌的疗效时并未采用任何统计方法,而是直接得出了“综合治疗较单纯治疗更能延长肺尖癌患者生存期”的结论,这不符合现代医学科研的结论需有据而立的原则。
1.3 统计方法的描述不具体或错用问题
1.3.1 统计方法的描述不具体
一些医学期刊论文中列出的统计方法过于简单,甚至未列出,主要有以下几种情况[10-12]:在“材料与方法”部分中的“统计学处理”中未列出所用的统计学软件或仅列出所用软件而未说明所用软件的版本;对于何种数据采用何种统计方法仅笼统描述,未具体列出文中的那些数据应该用何统计方法;对于定量数据仅列出采取t检验或方差分析,而未列出是否进行正态性检验和方差齐性检验;对于两组定量数据无论是应该采用成组设计t检验还是配对设计t检验,均仅描述为“两组定量数据比较采用t检验”;对于两组或多组定性数据的比较,无论是仅需用 2检验,还是需要采用矫正 2检验或 2分割检验,均描述为“两组或多组定性数据的比较采用 2检验”;统计学符号书写不规范,例如,根据GB/T3358-82,F检验、P值、 2检验、t检验等中的字母应为斜体,不符合上述规定的书写均为错误情况,这在论文中非常普遍;未列出检验水准 ,检验水准 是事先设定的判断小概率实践的标准,实际意义是允许犯假阳性错误概率的最大值,需要根据不同的研究目的进行设定。例如,本刊《 -连环蛋白和层粘连蛋白的表达与垂体腺瘤侵袭性的关系》一文在“统计学处理”仅说明数据的比较采用t检验,而未说明t检验的类型。
1.3.2 统计方法的错用
一些医学期刊论文中的统计方法的应用存在明显的错误。对于所有定量数据,常见的错误有[13-14]:无论是否符合正态分布、是否方差齐,一律盲目应用t检验或单因素方差分析等参数检验方法进行比较分析;无论数据分为几组,一律采用t检验进行比较分析,把其当做定量数据比较的万能工具;无论各组数据是何关系,一律采用成组设计t检验或单因素方差分析。例如,本刊《癌症相关性乏力与TGF- 1的关系分析》一文中,定量数据进行比较分析之前未说明是否进行了方差齐性检验和正态性检验。对于所有定性数据,常见的错误有:把 2检验当做所有定性数据的万能统计工具,忽略了其应用的前提条件是, 2检验适用于正态分布的定性数据,且样本量最好>40,列联表数据进行 2检验时不能有1/5以上的格子其理论频数
1.4 统计结果的描述及分析错误问题
许多医学期刊论文中均可见到统计结果的描述或分析错误,常见的有以下几种[15-17]:1)对于定量数据应当根据是否符合正态分布而采用不同的描述方法,符合者一般采用“均数±标准差”或“均数±标准误”表示,而不符合者则采用中位数和四分位间距来进行表示,不按上述规定进行描述者均属于错误描述;2)对于定性数据,常见的错误是构成比和百分率不分,计算率或构成比等相对数的样本量过小;3)解释有统计学意义时仅根据P值的大小得出相应结论,例如对于A、B组2组的疗效(假定A组疗效优于B组),其“P
1.5 统计值和(或)P值描述不清以及统计值缺失问题
许多医学期刊对统计结果进行描述时,通常不能完整清晰地描述出统计值和P值,常见的有以下几种情况[18-19]:统计结果仅用“P0.05”得出结论,缺少相应的统计值;统计结果包括统计值,但是P值仅写出“0.05”,未列出具体的P值;仅列出具体的P值,而统计值缺失,上述几种情况均不利于文献阅读者进行数据验证和meta分析。例如,本刊《同步放化疗治疗局部晚期食管癌临床观察》一文中,所有统计结果均仅列出了“P0.05”,未列出具体的统计值和P值。
2 针对医学期刊中常见统计学错误的解决对策
目前,医学期刊论文的统计学问题已经成为衡量论文质量高低的重要标准,统计学的错误可能会导致论文学术水平和学术质量的降低,甚至有可能导致严重的后果。近年来,随着广大医学科研工作者和医学期刊编辑及审稿专家对医学统计学应用的重视,医学期刊论文中的统计学问题已经明显减少,但仍然处于较高的水平,这可能与以下几点有关[20-22]:论文作者、编辑及审稿专家思想上不够重视论文统计学应用;期刊编辑的统计学应用知识匮乏;选择审稿专家只注重其专业领域内的影响力,而未关注其统计学应用水平。因此,要想提高医学期刊的统计学应用水平,从而更进一步提高期刊总体质量,需要做到以下几点:作为医学期刊编辑,必须不断进行统计学相关知识的学习,例如参加相关培训班、旁听医学院校的统计学课程及请教统计方面的专家等,以提高自身的统计学应用水平,并从思想上重视统计学应用的审查,在给新投稿件的作者的初步意见中就强调统计学应用的重要性,规定一旦统计学有问题,论文可随时退稿;聘请医学统计学专家进入期刊编委会,负责所有论文的统计学审稿;应通过各种途径,向广大科研工作者宣讲统计学在医学科研工作中的重要性,使其养成良好的正确应用统计学的习惯;在科研课题设计过程中要求有统计学相关专家的参与;科技期刊中增加统计学应用栏目,刊登与本刊论文关系密切的统计学方法,或者刊登一些常见的统计学错误,与作者或读者交流,提高其统计学应用能力。
注 释
[1]孙振球.医学统计学(第3版)[M].北京:人民卫生出版社,2010:1-8
[2]胡良平,郭秀花,刘惠刚.医学统计学是评价医学科技论文质量优劣的重要依据[J].中华口腔医学杂志,2011,36(3):229-232
[3][8]胡良平,李子建.医学统计学基础与典型错误辨析[M].北京:军事医学科学出版社,2003:4
[4] Garc韆-Berthou E,Alcaraz C.Incongruence between test statistics and P values in medical papers[J].BMC Med Res Methodol,2004,4:13
[5]王倩,张博恒.五种中华医学会系列杂志论著中统计方法的应用现状[J].中华医学杂志,1998,78(3):230-233
[6]沈进,苟莉,汤洁,等.生物医学期刊中统计学方法应用情况分析[J].中国修复重建外科杂志,2007,21(5):541-543
[7] [15]王晓瑜,王雅琢.《山东医药》论文中统计学错误分析[J].中国科技信息,2010(16):193-194
[8][9][10][20]邱春晖,郭明兴,邱源.医学论文中统计学方法的误用及其防范措施[J].山东教育学院学报,2009(5):116-118
[11] 冉明会,罗萍,邓丹.医学期刊编辑应注意的几个统计学处理问题[J].编辑学报,2009,21(6):503-505
[12][16][18]李霞,张印朋,闫苏平.医学期刊作者来稿统计学应用与表述常见问题分析[J].中国科技期刊研究,2011,22(1):88-89
[13] 王晓瑜,王雅琢,封艳辉,等.医学期刊投稿常见统计学问题分析[J].科技与出版,2011(11):42-44
[14] 金永勤,王维.医学期刊编辑应重视统计学中的几个问题[J].编辑学报,2009,21(1):33-34
[17]张功员,田庆丰.医学科研论文中统计结果表达和解释错误分析[J].郑州大学学报(医学版),2002,37(3):338-340
[19]叶亮,李伟东,范欣生.医学论文中常见的统计学应用问题辨析[J].南京中医药大学学报(社会科学版),2011,12(4):247-248
1.1期刊选择
影响因子与总被引频次是国际公认的评价期刊影响力的指标,他引率I>0.80比较合适”J。因此,以2008年版《中国科技期刊引证报告》核心版(cJcR)"1中医药卫牛科技期刊的引证指标数据为依据,选出总被引频次与影响因子均排位在前10%(55/549)且他引率≥0.80的期刊,共22种,见表1。其中预防医学与卫生学2种(2/40),基础医学与医学综合1种(1/92),药学1种(1/35),临床医学1种(1/48),妇产科学与儿科学2种(2/22),护理学1种(1/12),内科学4种(4/44),外科学5种(5/47),眼科学与耳鼻咽喉科学1种(1/16),肿瘤学2种(2/22),中医学与中药学1种(1./43),军事医学与特种医学1种(1/24);医科大学学报、保健医学、神经病学与精神病学、口腔医学4个领域共104种期刊没有。基础医学与医学综合比例最低(1/92),外科学比例最高(5/47);中华系列杂志有18种,占81.8%(18/22)。
1.2数据收集、分析
以2004—2008年版《中国科技期刊引证报告》核心版(CjCR)”。9’为源数据,分析上述22种医药期刊的总被引频次、影响因子、他引率、引用刊数、扩散因子、学科影响指标、学科扩散指标、来源文献量、基金论文比与国际论文比共10个指标数据的变化趋势;并与2007年CJCR收录的549种医药卫生期刊和1765种科技期刊做比较,用SAS9.2软件做Knmkal—WallisH检验。同时采用学术影响力动态评估模型分析期刊的影响力变化情况。其中2004年版无学科影响指标与学科扩散指标。
2结果
2.12003—2007年的总被引频次与影响因子
22种期刊的总被引频次几乎都平稳上升,只有中国中西医结合杂志在2006年到2007年由3352轻微降低至3181。5种期刊的总被引频次翻番,其中中华护理杂志、中华肝脏病杂志、癌症的增长率较高,分别为142.2%,142.8%,144.3%;增长率较低的为中华骨科杂志和中国中西医结合杂志,分别为30.2%和37.4%。5年的平均总被引频次在2000一3000的有10种期刊;<2000的有6种,其中中华创伤杂志和癌症较低(<1700),分别为1618和1520;≥3000的有6种,其中中华护理杂志和中华医学杂志居领先地位,分别为“3l和3878(表2)。大多数期刊(16种)的影响因子处于波动状态,其中波动较大的有中华结核和呼吸杂志与中华消化杂志,其波幅(最大值一最小值)分别为0.963与0.552;3种平稳上升,3种一直上升。有4种期刊增长率较高(>30.0%),即中华护理杂志、药学学报、癌症和中国中西医结合杂志,分别为30.9%,74.1%,89.8%,36.2%;9种期刊呈现负增长,包括2种波动大的,其中中华肝脏病杂志、中国实用外科杂志和中华内科杂志降幅较大,分别为26.7%,20.9%和22.4%,中华医学杂志降幅最低(0.8%)。表明大多数期刊影响因子进入低增长期或处于调整状态。5年的平均影响因子>1.O的有14种,其中中华结核和呼吸杂志与中华护理杂志较高(>1.5),分别为1.513和1.521;在0.8一1.0的有5种;余下3种较低,即药学学报、癌症和中国中西医结合杂志,分别为0.737,0.672和0.740(表2),该3种期刊的影响因子一直处于上升状态,增长率也居前3位。2种期刊每年的平均总被引频次均呈上升趋势(表3)。2007年的平均总被引频次为3278,高于549种医药卫生期刊的868,也高于CACR收录的1765种科技期刊的749(表4)。每年的平均影响因子呈轻微波动状态或比较平稳(表3)。2007的平均影响因子为1.071,远高于549种期刊的0.435与1765种期刊的0.469(表4)。
2.22003—2007年的他引率
22种期刊每年的他引率都比较稳定或稳中有升,均≥O。82。5年的平均他引率≥0.90的有16种期刊,其中≥0.95的有中华骨科杂志、中华儿科杂志、中华消化杂志、中华妇产科杂志、中华内科杂志,分别为0.96,0.95,0.95,0.95,0.97;在0.86—0.90的有6种(表2)。22种期刊每年的平均他引率稳步上升,由0.91升到0.93(表3)。2007年的平均他引率为0.93,远高于549种期刊的0.82与1765种期刊的0.81(表4)。
2.32003—2007年的引用刊数与扩散因子
引用刊数指引用被评价期刊的期刊数,可反映被评价期刊被使用的广泛程度;扩散因子指被评价期刊在当年每被引100次所涉及的期刊数,是一个用于评估期刊影响力的学术指标,显示总被引频次扩散的范围。22种期刊每年的引用刊数都平稳上升,增长率>50.O%的有8种,其中中华护理杂志、中华肝脏病杂志、癌症的增幅较大,分别为91.7%,73.3%和73.9%;中华骨科杂志和中国中西医结合杂志的增长率较低(<30.o%),分别为27.3%和24.4%。随着引用—一846—一hap://zgkjqkyj.periodicals.net.en/刊数的增加大多数期刊的扩散因子一直呈下降趋势(16种),下降幅度较大的有5种期刊(>25.0%):中华流行病学杂志(26.2%)、中华肝脏病杂志(28,6%)、中华检验医学杂志(34.0%)、癌症(28.7%)、中华医学杂志(28.3%);4种较平稳;中华消化杂志和中国实用外科杂志2种处于轻微波动状态。5年的平均引用刊数<200的为中华护理杂志和中华眼科杂志,分别为181和191;在200—300的有9种;I>300的有11种,其中药学学报、中华外科杂志、中华内科杂志和中华医学杂志较高(>350),分别为381,359,385和505(表2)。平均扩散因子>10.0的有18种期刊,其中中华检验医学杂志和癌症较高,分别为19.25和22.07;其余4种<10.0,其中中华护理杂志最低,为4.20(表2)。22种期刊每年的平均引用刊数平稳上升而平均扩散因子逐渐下降(表3)。2007年的平均引用刊数与扩散因子分别为357和11.63,549种医药卫生期刊分别为184和31.25,1765种科技期刊为162和32.38(表4)。表明引用刊数在增加,而扩散因子在降低,这种影响力的反向变化说明“扩散因子”这一指标存在某些缺陷¨引,应用该指标评价期刊影响力时需慎重。
2.42003—2007年的学科影响指标与学科扩散指标
学科影响指标是期刊所在学科内引用该刊的期刊数占学科内全部期刊数的比例,可反映期刊在其学科领域内的地位,其值越高,表明其在该学科领域内的影响力越大。在4年中,中华护理杂志、中华肿瘤杂志和癌症3种的学科影响指标维持l,中华流行病学杂志与中国中西医结合杂志上升并维持1,而其他17种期刊均呈轻微波动状态,增长率为一16.5%一12.O%。平均学科影响指标≥0.80的有12种期刊;在0.6~0.8的有6种;中华骨科杂志、中华消化杂志、中华肝脏病杂志和中华泌尿外科杂志4种较低,分别为0.52,0.54,0.56和0.46,不过中华骨科杂志和中华肝脏病杂志的增长率居前(分别为9.8%和12.o%),另2种呈负增长(分别为一5.3%和一5.9%),见表2。学科扩散指标是在统计源期刊内引用该刊的期刊数量与其所在学科全部期刊数量之比。4年的学科扩散指标一直上升的有3种:药学学报、中国实用外科杂志和中华眼科杂志,其增长率也较高,分别为42.7%,12.6%和31.2%;一直下降的为中华肿瘤杂志,下降率也最大(26.1%);呈轻微波动的有3种:中华结核和呼吸杂志、中华医学杂志和中国中西医结合杂志;其余15种均是上升后趋于稳定或轻微下降。4年的平均学科扩散指标>10.0的有11种期刊,其中中华护理杂志、中华肿瘤杂志与癌症较高,分别为19.14,20.13和20.56;其余11种期刊<10.0,其中中华骨科杂志、中国实用外科杂志、中华泌尿外科杂志、中华创伤杂志与中华医学杂志较低(<7.0),分别为6.00,6.13,5.99,6.10,6.10(表2)。22种期刊每年的平均学科影响指标比较稳定,平均学科扩散指标先升后略降(表3)。2007年两指标的均值分别为0.8l和10.73,均高于549种医药卫生期刊的0.55和5.09,也远高于1765种科技期刊的0.52和4.69(表4)。
2.5加03一枷7年的来源文献量
来源文献量上升后趋于稳定的9种,一直上升的4种,较平稳的5种,呈波动状态的4种。增幅超过1倍的有中华检验医学杂志、中华外科杂志和中华内科杂志3种,增长率分别为134.O%,165.4%和117.5%;呈波动状态的中华结核和呼吸杂志、中华流行病学杂志、中华消化杂志和中国中西医结合杂志的波幅(最大值一最小值)分别为120,124,168,163。5年的平均来源文献量<200的只有中华骨科杂志(192);200—400的有18种期刊;3400的有3种期刊:中华护理杂志冲华外科杂志和中华医学杂志,分别是440,445,793(表2)。22种期刊每年的平均来源文献量呈上升趋势(表3)。2007年为369,略高于549种医药卫生期刊的356,远高于1765种科技期刊的257(表4)。
2.620帕~2007年的基金论文比与国际论文比
几乎每种期刊的基金论文比都呈波动状态或波动性降低。平均基金论文比<0.20的有5种期刊,其中中华护理杂志与中国实用外科杂志较低,分别为0.12和o.05;在0.2—0.4的有12种期刊(中华医学杂志为0.394);≥O.40的有5种期刊:中华流行病学杂志、中华肝脏病杂志、药学学报、癌症和中国中西医结合杂志,分别为0.44,0.40.0.58。0.48和0.43(表2)。22种期刊的国际论文比几乎都呈先升后降或平稳下降或波动性下降趋势,到2007年有14种为0,6种为0.Ol,1种0.02,1种0.06。每种期刊的平均国际论文比都很低,>10.02的有16种,其中中华流行病学杂志和中华骨科杂志较高(>0.04),分别为0.044和0.050;<0.02的有6种期刊,其中中华妇产科杂志和中国实用外科杂志较低,分别为0.010与0.008(表2)。22种期刊每年的平均基金论文比呈波动性变化或震荡(表3)。2007年的平均基金论文比为0.28,略高于549种医药卫生期刊的0.25,而低于1765种科技期刊的0.46。每年的平均国际论文比在前4年比较平稳,到20cr7年陡降至0.006(表3);甚至略低于2007年549种医药卫生期刊的0.009与1765种科技期刊的0.010,只是差异无统计学意义(表4),表明国际论文比对期刊影响力的作用已大大减弱。
3学术影响力动态模型评价表5列出了22种医药期刊2003—2007年学术影响力动态评估计算结果,其中I为科技期刊的学术影响力评估值,I,是对l进行修正后得出的相对评估值,为相对学术影响力,更便于比较和排序,具体的计算公式见文献[11]。l一直呈上升趋势的有6种期刊,其中1种的I,>1.O(1.26),2种的增长率>O.5(均为0.51);上升后趋于稳定(或先升后略降)的有10种,其中4种的I,>1.0(分别为2.0,1.02,1.15,4.25);呈“V”形变化或波动上升的有5种期刊,其中2种的I。>1.O(分别为1.44和1.20),且增长率均较高(0.71和0.75),表明这些期刊在调整后增长势头良好,其中中华结核和呼吸杂志与中华消化杂志呈“V”形变化;在高位震荡的只有中华内科杂志,其I,接近l(0.96),但增长率较低(0.07),表明该刊一直处于调整状态。I,≥1.0的有7种,中华护理杂志与中华医学杂志处于领先地位,分别为2.0和4.25;在0.5—0.99的有10种(其中中华肝脏病杂志为0.99);I。<0.50的有5种期刊,其中中华泌尿外科杂志、中华创伤杂志和中华眼科杂志较低(<0.40),分别为0.34,0.38和0.39。学术影响力增长率>0.50的有4种,其中中华结核和呼吸杂志与中华流行病学杂志较高(>0.70),分别为0.7l和0.75;在0—0.50的有16种,其中中华肿瘤杂志和中华内科杂志较低(<0.10),分别为0.09和0.07;<0的有2种,即中华护理杂志和中华儿科杂志,分别为一0.05和一0.08,推测该两种杂志很快或已进入调整期。
4讨论
4.1影响力发展趋势呈现多样化
从每年的平均引用刊数逐年上升看,所选期刊的影响力在逐年升高,2007年各主要评价指标均值也远远高于549种医药卫生期刊与CJCa的1765种科技期刊。该22种期刊的影响力变化趋势存在以下特点。(1)主要评价指标(除国际论文比与扩散因子外)的数值较高,但增长幅度或增长率较低,相对学术影响力增长率也无>1.0的。(2)指标变化趋势以比较平稳或轻微波动或先升后趋于稳定为主,因此这些高影响力期刊的影响力增速已减缓,大部分期刊快或已进入调整期:部分在调整后增势较好;少部分期刊一直处于上升期,如药学学报与癌症的多项指标数值较低,但增长率居前。学术影响力动态模型评估结果也显示,该22种期刊影响力的发展主要呈现4种趋势:一直呈上升趋势(6种);上升后趋于稳定(10种);呈“V”形变化或波动上升(5种);在高位震荡(1种)。影响力一直上升的可以中华外科杂志为代表,其I,较高(1.26),列第四位,影响力增长率居中(0.33)。其总被引频次与引用刊数分别为3425与359,分别列第三、第四位;来源文献量居第二位(445),其增长率最高(165.4%);他引率与学科影响指标也较高,分别为0.94和0.98。第二种趋势是上升后趋于稳定或略有降低。这类期刊目前的影响力均较高,可以中华护理杂志和中华医学杂志为代表,其I,居领先地位,分别为2.0和4.25;但增长率较低,中华护理杂志呈负增长(一0.05)。其主要评价指标(总被引频次与来源文献量)居领先地位;中华护理杂志的影响因子居第一,中华医学杂志的引用刊数居第一。2007年的总体影响力降低可能与国际论文比大幅降低有关,也可能与其来源文献量增加的影响已远远超过总被引频次增加的作用导致影响因子降低有关。第三种趋势是呈“V”形变化或波动上升。可以中华结核和呼吸杂志为代表,其I,较高(1.44),居第三位,增长率居第二位(O.71)。部分主要评价指标居前,平均影响因子(1.513)居第二位,总被引频次(3195)列第四位,引用刊数(334)列第五位;但其影响因子波幅最大(0.963),来源文献量的波幅也达120,学科影响指标与学科扩散指标也呈波动状态。最后就是中华内科杂志呈高位震荡,其I,接近1(0.96),但增长率只有0.07。其影响因子呈波动状态(波幅为0.451),但平均影响因子>1.0;平均他引率最高(0.97);引用刊数(385)居第二位;学科影响指标与学科扩散指标呈波动状态,但平均学科影响指标与平均学科扩散指标较高,分别为0.98和13.07;其国际论文比与基金论文比均呈波动性降低,尽管其总被引频次与来源文献量一直呈上升趋势。指标变化趋势与动态评估模型评价期刊影响力各有特点,后者计算结果的数据比较直观,便于总结规律;前者比较感性与分散,可用于解释与印证所总结的规律。
4.2影响力受多种因素的影响
科研设计包括专业设计和统计研究设计。专业设计主要包括基本常识和专业知识的正确、全面、巧妙地运用;而统计研究设计包括实验设计、临床试验设计和调查设计。值得注意的是:在很多科研人员所做的科研课题中,不仅严重忽视统计研究设计,就连专业设计也有严重错误,主要表现在犯了基本常识错误和违背专业知识错误。这类错误所发生的频率还相当高,是一种不能容忍的不正常现象!
在统计研究设计所包含的3种研究设计中,实验设计是最重要的,因为很多关键性的内容都包含在其中,其核心内容是“三要素”、“四原则”和“设计类型”。所谓“三要素”就是受试对象(或调查对象)、影响因素(包括试验因素和重要的非试验因素)和实验效应(通过具体的观测指标来体现);所谓“四原则”就是随机、对照、重复和均衡原则,它们在选取和分配受试对象、控制重要非试验因素对观测结果的干扰和影响、提高组间均衡性、提高结论的可靠性和说服力等方面将起到“保驾护航”的作用;所谓“设计类型”就是实验中因素及其水平如何合理搭配而形成的一种结构,它决定了能否多快好省且又经济可靠地实现研究目标。科研人员若对重要非试验因素考虑不周到、对照组选择不合理、设计类型选择不当或辨别不清,导致科研课题的科研设计千疮百孔、数据分析滥竽充数、结果解释稀里糊涂、结论陈述啼笑皆非。下面笔者就“实验设计”环节存在的问题辨析如下。
1 在分析定量资料前未明确交代所对应的实验设计类型
人们在处理定量资料前未明确交代定量资料所对应的实验设计,对数千篇稿件进行审阅后发现,大多数人都是盲目套用统计分析方法,其结论的正确性如何是可想而知的。这是一条出现非常频繁的错误,应当引起广大科研工作者的高度重视。
2 临床试验设计中一个极易被忽视的问题——按重要非试验因素进行分层随机化
例1:原文题目为《气管舒合剂治疗支气管哮喘的临床观察》。原作者写到:“全部病例均来源于本院呼吸专科门诊和普通门诊,随机分为治疗组40例和对照组30例。其中治疗组男21例,女19例;年龄21~55岁,平均(36.28±9.36)岁;病程2~23年,平均(10.31±17.48)年;病情轻度者16例,中度24例。对照组30例,男16例,女14例;年龄20~53岁,平均(35.78±9.53)岁;病程3~24年,平均(11.05±6.47)年;病情轻度者13例,中度者17例。两组间情况差异无显著性,具有可比性。”请问这样随机化,其组间具有可比性吗?
对差错的辨析与释疑:显然,研究者在试验设计时未对重要非试验因素采用分层随机保证各组之间的可比性。这条错误的严重程度为不可逆,出现不可逆错误意味着原作者的试验设计具有无法改正的错误,必须重做实验!究其原因,主要是原作者未理解统计学上随机的概念。统计学上随机化的目的是尽可能去掉人为因素对观测结果的干扰和影响,让重要的非试验因素在组间达到平衡。稍微留意一下原作者随机化分组,明显带有人为的痕迹,治疗组40人比对照组30人多出10人;治疗组病程的标准差17.48是对照组病程的标准差6.47的近3倍。笔者很疑惑怎样的随机化才能达到如此的不平衡?事实上随机化有4种:子总体内随机、完全随机、分层随机和按不平衡指数最小原则所进行的随机,原文条件下应当选用分层随机,即以两个重要的非试验因素(性别和病情)水平组合形成4个小组(男轻,女轻,男中,女中),然后把每个小组内的患者再随机均分到治疗组和对照组中去,这样分层随机的最终结果一定是治疗组和对照组各35人,且使2组间非试验因素的影响达到尽可能的平衡,从而可大大提高组间的可比性。在本例中,若“病程”对观测结果有重要影响,在进行分层随机化时,在按“性别”和“病情”分组的基础上,还应再按“病程”(设分为短、中、长)分组,即共形成12个小组,将每个小组中的患者随机均分入治疗组与对照组中去,这是使“性别、病情、病程”3个重要非试验因素对观测结果的影响在治疗组与对照组之间达到平衡的重要举措,也是所有临床试验研究成败与否的最关键环节!
3 实验设计类型判断错误
例2:某作者欲观察甘草酸、泼尼松对慢性马兜铃酸肾病(AAN)肾损害的干预作用,于是,进行了实验,数据见表1。原作者经过用甘草酸和泼尼松分别与同期正常对照组和模型组比较,一个P<0.05,另一个P<0.01,于是得到甘草酸、泼尼松对慢性AAN肾损害具有一定程度的保护作用,且泼尼松的效果更佳。请问原作者的结论可信吗?表1 各组大鼠血BUN及SCr变化比较(略)注:与正常对照组同期比较,*P<0.05,**P<0.01;与模型组同期比较,P<0.05,P<0.01
对差错的辨析与释疑:本例错误极为典型,通常科研工作者欲观察某种药物是否有效,习惯上会建立正常对照组、模型组(即该药物拟治疗的病态组)和在模型组基础上的用药组(如本例中甘草酸组和泼尼松组)。这样的设计本身并没有错,但这仅仅是专业上的“实验安排(可称为多因素非平衡组合实验[1])”,而并非是统计学中所说的某种标准实验设计类型。写在“组别”之下的4个组,并非是一个因素的4个水平,而是2个因素水平的部分组合。这2个因素分别是“是否建模(即正常与模型2个水平)”和“用药种类[即不用药(相当于安慰剂)、用甘草酸和用泼尼松3个水平]”。2个因素共有6种水平组合,即“组别”之下缺少了“正常基础上用甘草酸”和“正常基础上用泼尼松”。这样设计的实验才可能反映出“是否建模”与“用药种类”2个因素之间是否存在交互作用。
在本课题研究中,由于未在实验前作出正确的实验设计,处理数据时错误就悄然产生了。具体到本例,从原作者在表1的注解中可以看出,通过单因素方差分析分别比较同期(即相同观测时间点)的甘草酸组和泼尼松组与正常对照组和模型组之间的差别是否有统计学意义。这样的做法有3个严重错误:第一,严格地说,在模型组基础上的用药组是不适合直接与正常对照组相比较的,因为这样的比较解释不清到底是药物的作用还是由于模型未建成功而造成的假象;第二,将各个时间点割裂开分别比较破坏了原先的整体设计,数据利用率降低,误差估计不准确,导致结论的可信度降低。将一个重复测量实验的各个时间点割裂开来考察,就等于在各个片段上估计实验误差、作出统计推断,好像盲人摸象一样,摸出来的结果差别何其之大;第三,要想说明两种药物哪个效果更佳,在得出差别具有统计学意义的基础上,衡量的标准是应看组间平均值的差量的大小而不应看P值是否足够地小,不能说P<0.01时就比P<0.05时更有效,这种忽视实验误差、忽视绝对数量和脱离专业知识的想法和做法都是不妥当的。
如何正确处理表1中的实验资料呢?关键要正确判定该定量资料所对应的是什么实验设计类型。由前面的分析可知,表1定量资料对应的是“多因素非平衡组合实验”,而不是某种标准的多因素实验设计类型。明智的做法是对“组别”进行合理拆分,即根据专业知识和统计学知识,对“组别”之下的所有组重新进行组合,应使每种组合对应着一个标准的实验设计类型。正确地拆分结果分别见表2和表3。表2 正常对照组与模型组大鼠血BUN及SCr变化的测定结果(略)表3 模型组和2个用药组大鼠血BUN及SCr变化的测定结果(略)
事实上,由科研习惯形成的这一套实验方案笔者形象地称之为多因素非平衡的组合实验,或者说,它是实验设计的表现型。通常可以进行统计分析的都必须是标准型(即统计学上所说的某种实验设计类型),因此需要能看出代表表现型本质的原型(本例中组别之下应该有6个组,这6个组构成一个2×3析因设计结构,但原作者少设计了2个组)。通常需要将表现型或/和原型拆分成标准型后再选择合适的统计分析方法进行数据分析。本例根据原作者的意图,可以将表1拆分成2个标准型,形成2个具有一个重复测量的两因素设计定量资料,见表2和表3。相应的统计分析方法就是具有一个重复测量的两因素设计定量资料的方差分析。此处请读者注意:第一,具有一个重复测量的两因素设计定量资料的方差分析和一般的方差分析虽然都叫方差分析,但它们的计算公式却有本质区别,绝不可混用;第二,重复测量因素(本例中为时间)不要与实验分组因素(表2中叫“是否建模”;表3中叫“药物种类”)同时列入左边,它们是本质不同的两种因素,一般应该把“重复测量因素”放到表头横线下方。
通过本例可以看出,在实验前明确实验设计是多么重要的一件事情。试想,若让本例原作者写明他的实验设计类型,他必然就会对基本的实验设计类型作一番调查和学习,自然就能发现他所“设计”的实验并不是统计学上相应的实验设计。那么通过咨询相关人士必能做出比较正确的实验设计,不仅可以提高科研设计水平,而且可以大大提高科研课题和论文质量。
例3:原文题目为《土荆芥-水团花对胃溃疡大鼠黏膜保护作用的研究》。原作者使用单因素多水平设计定量资料方差分析处理表4中的数据。请问原作者这样做对吗?表4 各组黏膜肌层宽度、再生黏膜厚度变化(略)注:与正常组比较,aP<0.05;与NS组比较,bP<0.05;与CP 10 mg·kg-1 组比较,cP<0.05
对差错的辨析与释疑:本例涉及到统计学三型理论[1]中的一些概念,简单地说就是可以直接进行统计分析的来自标准设计的数据表叫标准型,反映问题本质但并非是标准型的数据表叫原型,而掩盖了原型信息的数据表叫表现型。“组别”之下的6个组,似乎是某个因素的6个水平,其实不然!这6个组涉及到多个试验因素,应对“组别”拆分重新组合后,再分别判定各种组合所对应的实验设计类型,并选用相应的统计分析方法。组合1:空白对照组(正常)、阴性对照组(NS),这是单因素两水平设计(简称为成组设计)。由于正常组无实验数据,故该组合无法进行统计分析;组合2:NS组、RA组、CP(20/mg·kg-1)组,这是单因素3水平设计,因素的名称叫“药物种类”;组合3:NS组、CP(10/mg·kg-1)组、CP(15/mg·kg-1)组、CP(20/mg·kg-1)组,这是单因素4水平设计,因素名称叫CP的剂量(其中,NS组可视为CP的剂量为0)。
对于组合2和组合3,若定量资料满足参数检验的前提条件,可选用相应设计定量资料的方差分析,否则,需要改用相应设计定量资料的秩和检验。
4 人为改变设计类型且数据利用不全
例4:某作者使用表5中的数据进行分析,欲比较治疗组和对照组在治疗后的各个时间点的疗效情况,使用的分析方法为一般卡方检验,请问原作者这样做对吗?
对差错的辨析与释疑:从给出的统计表可以看出,该作者有意或者无意之间收集了一类相当复杂的实验设计类型下的定性资料,结果变量为多值有序变量的具有一个重复测量的两因素设计定性资料,处理这个设计下收集的定性资料要使用相应设计定性资料的统计模型分析法。由于上述方法过于复杂,因此,通常在实际运用中,实际工作者将重复测量因素武断地视为实验分组因素,从而使该资料变为结果变量为多值有序变量的三维列联表资料。在已经出错的前提下,原本应当使用CMH校正的秩和检验或者有序变量的多重logistic回归分析处理资料。然而,该作者显然在此基础上进一步合并了数据,将结果变量变成二值变量(有效、无效),也就是说,原作者实际使用的仅仅是最后一列数据(即总有效率),并且最为严重的错误是将三维列联表资料强行降维成二维列联表资料,使用一般χ2检验进行分析。经过一系列的简化与错误合并,最后结论的可信度还剩下多少呢?表5 原作者对2组疗效比较的试验设计及数据表达(略)注:与对照组同期比较,*P<0.05
由于篇幅所限,这类错误笔者只给出1例,实际上此类例子在很多杂志中普遍存在。这说明在进行实验设计时,很多研究人员并未做到心中有数;分析数据时,按自己熟悉的简单统计分析方法所能解决的数据结构强硬地改造数据,严格地说,在用表格表达实验资料的那一刹那就已人为改变了资料所对应的实验设计类型,这种做法的科学性和得出结论的正确性都将受到质疑[2]。
5 正交设计及数据处理方面的错误
人们在进行正交设计和对正交设计定量资料进行统计分析时,常存在下列3个误区:很多人过分强调用正交设计可以大大减少实验次数,因此,无论各实验条件(正交表中的每一行)下的实验结果波动有多大,都不做重复实验,这是第1个误区;将正交表各列上都排满试验因素,用对实验结果影响最小的试验因素所对应的标准误作为分析其他因素是否具有统计学意义的误差项,导致误差项的自由度较小,结论的可信度较低,这是第2个误区;在对正交设计定量资料进行方差分析后,即使存在多个无统计学意义的因素,仍对少数几个有统计学意义的因素进行解释,未将无统计学意义的因素合并到误差项中去重新估计实验误差,以获得具有较大自由度的误差项,这是第3个误区。