资源描述:
《医学论文中统计设计的聚类分析_1》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果医学论文中统计设计的聚类分析 摘要:本文应用系统聚类方法,对医学中常用的统计设计方案按其使用情况进行分类,通过对类间的分析与比较,找出存在的问题,综合评价三年医学统计设计方案的不足与可取之处,通过对医学常用的统计设计方案进行聚类,以便引起有关人员应该对哪些统计设计方案更加重视,从而为提高期刊中医学论文的质量提供一点建议,对如何改进并提高医学论文统计设计方案提供一点参考价值。 关键词:医学论文;统计设计
2、方案;聚类分析 1前言课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果 在医学科研中,设计主要包括专业设计和统计学设计两个方面。近年来,统计设计方案存在着很大的问题[1],如统计设计方案过于简单,没有充分体现处理因素间的效应;统计设计方案使用不当,与目的和处理因素的水平数不符。在定量资料的假设检验中,误用统计方法最常见的原因是忽视资料
3、所对应的设计类型[2]。医学统计设计是进行临床医学实验的重要前提,只有一个好的统计设计,才能使实验用比较经济的人力、物力和时间得到一个准确、可靠、重现性好的结果。而要得到一个好的统计设计,必须严格遵循统计设计的4个原则:对照、均衡、随机化、重复的原则,然后制定一个合理的统计设计方案[3],它直接影响到医学期刊质量高低,目前国内外对医学统计设计方案的研究只是针对某个设计类型应用方法进行分析,而对医学中统计设计方案的使用质量并未系统地进行分析。为此,本文采用样品聚类方法,对医学中常用的9种统计设计方案进行分析,通过类内与类间的比较,找出其中
4、存在的问题,对改进研究设计提供一点参考价值。 2材料与方法 从河北省图书馆和河北医科大学图书馆藏书中,用单纯随机抽样的方法抽取XX年、XX年和XX年期刊刊登的需要进行统计设计的临床医学研究、基础医学研究文章657篇,其样本量用率的抽样方法进行计算,公式如下[4]: n--所需样本量大小。 本次调查α=,则μ=;δ为容许误差(即所希望检出的差值)。本次调查根据以往的经验δ取;预调查了100篇文章,其中48篇文章的统计设计方案存在不足之处,故本次调查p取值为;为了剔除与本研究无关的文章,本文抽取了1000篇基础研究与临床研究中的医学
5、论文,最后剔除了非本文研究的设计类型343篇,剩余657篇,所以有效样本量为657篇,满足了本文需要的601篇文章。 3统计方法 指标的确定及其赋值课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果 本次调查的样品为医学中常用的统计设计类型(成组设计、配对设计、随机区组设计、交叉设计、拉丁方设计、析因设计、正交设计、重复测量设计和序贯设计
6、),统计设计方案的指标依次为无、不正确、不明确和正确[5-7],其数据结果用百分比表示[8],本次调查的统计设计方案主要从以下几方面进行判断:与实验目的是否相符;处理因素的水平数;区组因素的个数;处理因素间有无交互作用;非处理因素的均衡情况。无:指文章中没有统计设计过程,没有遵循统计设计的四个原则;不正确:指论文中写明了统计设计方案但与上述任一方面不符者;不明确:指论文中没有写明具体的统计设计方案名称,仅是对受试对象进行了随机分配并分组,无法判断的;正确:指论文中写明了统计设计方案的具体名称,且全部条件都符合的。无、不正确、不明确和正确
7、分别赋值为1、2、3和4。 型系统聚类课题份量和难易程度要恰当,博士生能在二年内作出结果,硕士生能在一年内作出结果,特别是对实验条件等要有恰当的估计。从本学科出发,应着重选对国民经济具有一定实用价值和理论意义的课题。课题具有先进性,便于研究生提出新见解,特别是博士生必须有创新性的成果 本次调查采用系统聚类法,聚类统计量用欧氏距离,类与类的距离定义为类平均法,数据处理用,在样本聚类分析中,两个样本之间的距离越小,说明两个样本的性质越相似。类间距离是用来度量一个类(一组样本)与另一个类(另一组样本)之间距离的统计量。令类A中有a个样本,
8、类B中有b个样本,D(i,j)为A中的第i个样本与类B中的第j个样本之间的距离,则称D(i,j)为类A和类B中一对样本之间的距离,i=1,2,…,a;j=1,2,…,b。假设D(A,B)为类A和类B之间的距