资源描述:
《两个非正态分布资料比较方法的选择》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、中国卫生统计2003年6月第20卷第3期#185##学术讨论#两个非正态分布资料比较方法的选择哈尔滨医科大学公共卫生学院(150001)赵景波李洪源李康112为对自由度校正的t.检验),问题是应该选择那一问题提出种统计方法(得出的结论)是适宜的呢?分析临床科研数据,需要选择适宜的统计检验方法,首先明确是参数检验还是非参数检验。不同的检验方法有不同的前提假设,如果违反了假设,统计分析就会得出错误的结论(P值)。假如被分析的数据与使用的方法前提假设不一致,真正的显著性水准很可能与预先规定的名义水准(nominallevel,通常为0105)相差很大。因此,
2、为了保持预期的检验水准和检验效能,选择一个恰当的检验方法是很重要的。在临床研究中,经常比较两独立病人群体的均值。如果观察指标是连续变量,则统计分析常用两样本的图1霍奇金氏病嗜中性白血球的恢复时间t检验或Wilcoxon-Mann-Whitney(WMW)检验,传统看法认为如果观察对象服从正态分布或每个样本病人数量很大,则选择t检验;当样本很小且分布是偏态的,则选择WMW检验。但是,实际临床研究数据的分析并非像传统选择方法那样简单。两样本的检验,无论是否参数检验,都需做一个重要的假设:即比较的两个分布形状相同及方差相等(homoscedasticity)
3、。如果两个分布的方差不齐或形状不同,就违背了前提假设。对于方差不齐两个正态分布数据的检验早在60112图2非霍奇金氏病嗜中性白血球的恢复时间多年前就发展完善,且表明WMW检验和t检验所得到的显著性水准与方差齐时真实水准有明显的不表1三种方法的统计检验P值12~72同,该研究已在统计杂志上发表。但对于分布不方法P值同或方差不齐(heteroscedasticity),在医学研究领域并ttest01080没有得到广泛重视,在现在的统计教科书中也很少提WelchUtest01224及。这里主要介绍EvaSkovlund和GreteU1FenstadWilco
4、xon-Mann-Whitney(WMW)01418182两位学者所作的研究,他们针对临床研究常见数据,通过模拟试验对通常选择的统计方法的特性进行以上两组病人嗜中性白血球的恢复时间的分布明比较和论证并给出了适宜统计方法选择指南,深受启显不同,且方差(1913和312)也不相等,很明显,违背发。故整理成文,与同道共勉。了t检验和WMW检验的前提假设,因此,计算出的P值是不可靠的。临床实例常见的分布类型对35例患有恶性淋巴瘤的病人化疗后,通过192MIME/G-CSF进行外周血原始细胞的移植治疗,10图3A是两个正态分布,有相同的方差,但均数不名病人患霍奇
5、金氏病(Hodgkin.sdisease),其余25人同,对于这种分布,两样本的t检验是最好的检验方为非霍奇金氏病,嗜中性白血球的恢复时间(天)作为法。图3B是右长尾(heavyrighttail)分布(gamma分观察指标。两组病人的恢复时间分布见图1、2。布,形状参数a=3),若样本含量很少,数据间的检验研究者采用SPSS810统计软件对本例使用三种采用WMW检验。图3C是具有相同均数但方差不等统计方法得出了不同的P值(表1,其中WelchUtest的两个正态分布,其中一个方差是另一个方差的9倍。#186#ChineseJournalofHealt
6、hStatistics,June2003,Vol.20,No.3图3D显示了两个具有相同的均数和形状参数的gam-性。ma分布,一个分布的方差是另一个的9倍。研究者在在医学研究中,图3列出的情况是很常见的,当样两样本的各种分布类型中模拟研究了三种方法的适用本含量很小时,很难判断出数据分布假设是否满足。图3常见分布类型模拟实验研究者通过模拟实验对三种方法的适用性进行了研究。在该实验中,相互独立的样本来自具有相同形状和均数的两种分布,但方差可能不等,其比值在1/9和9间变动。模拟试验是在不同的分布范围上进行的,包括正态、正偏态分布,涉及两个小样本的不同组合
7、,如m=n=10,m=5,n=15。为了估计每个试验的显著性水准,共进行了10000次的模拟试验,基本上可以保证估计水准的精确性。为了避免检验结果之间图5观察数据在gamma分布情况下的模拟结果的模拟变异,是在同一模拟试验中对上述三种检验方11样本含量相等(m=n=10)法进行比较。分别设定数据为正态分布和gamma分布,名义水准为0105,标准差之比H=1,2,3。结果相应的估计水准见图4和图5。图4显示了观察对象从正态分布中抽样三种检验21样本含量不等(m=5,n=15)估计的显著性水准。当方差相等时,三种检验都接近模拟方法同前。图6显示了观察值服
8、从正态分布名义水准:当方差不相等时(标准差之比HX1),Welch时显著性水平的估计值,Wel