毕业设计——属性数据建模分析

毕业设计——属性数据建模分析

ID:33653595

大小:786.00 KB

页数:31页

时间:2019-02-28

毕业设计——属性数据建模分析_第1页
毕业设计——属性数据建模分析_第2页
毕业设计——属性数据建模分析_第3页
毕业设计——属性数据建模分析_第4页
毕业设计——属性数据建模分析_第5页
资源描述:

《毕业设计——属性数据建模分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、目录中文摘要2英文摘要31引言31.1研究背景和意义31.2数据来源和预处理41.3属性数据的相关概念61.3.1属性数据的定义61.3.2名义变量和有序变量的区别61.4SPSS和SAS介绍72基本理论72.1相关系数的定义72.2相关系数的显著性检验82.3Kendall的τ相关系数的定义82.4聚类分析的定义102.5聚类分析的统计量102.5.1距离系数112.5.2聚类分析的方法132.6用VARCLUS过程进行变量聚类142.6.1VARCLUS过程的原理142.6.2VARCLUS过程的步骤143结果和分析153.1相关

2、性分析在SPSS中的实现153.1.1相关性分析的结果分析163.2聚类结果解释分析173.2.1聚类分析的结论274总结275谢辞296参考文献301属性数据建模分析—某项调查数据的统计分析中文摘要摘要:本文的目的是通过对问卷调查中的数据进行相关性分析和聚类分析,以便探索出影响女性健康的因素。首先,本文把问卷中的20个问题作为变量,并用SPSS软件计算它们的Kendall的τ相关系数。其次,运用SAS软件实现对这20个问题的聚类分析。最终得出一些结论,如精神比较衰弱的女性心慌气短和胸闷的可能性较大,泌尿系统受感染的患者一般会有尿黄、

3、尿频的症状等等。因此相关性分析和聚类分析对医生诊断以及开药都具有很大的指导性,故本文建议医生在诊断时要善于参考相关性分析和聚类分析的结果。关键词:属性数据;女性健康;相关性分析;聚类分析111Attributedatamodelingandanalysis-statisticalanalysisofasurveydata英文摘要Abstract:Thetaskofthispaperistoexplorethefactorsthataffectwomen’shealth,soitneedstothecorrelationanalysis

4、andclusteranalysisofquestionnairedata.Firstofall,20questionsinthequestionnaireas20variables,anditusesSPSSsoftwarecalculatetheKendallτcorrelationcoefficient.Secondly,itusesSASsoftwaretoachieveaclusteranalysisofthese20questions.Finally,itdrawssomeconclusions,suchas,mental

5、lyweakwomenaremorelikelytofeelchesttightnessandshortnessofbreath,Urinarysystemofinfectedfemalepatientsusuallyhavedarkurineandfrequenturination,andsoon.Therefore,thecorrelationanalysisandclusteranalysishavealotguidancefordoctorstodiagnoseandprescribemedication,sothisarti

6、clesuggeststhatdoctorsshouldrefertotheresultsofcorrelationanalysisandclusteranalysis.Kewords:attributedata;women'shealth;correlationanalysis;clusteranalysis11引言1.1研究背景和意义专门针对属性数据的分析方法起源于20世纪初的英国,20世纪早期,属性数据领域的研究主要集中于变量间的关联性。其后,Yule提出了属性变量关联性的优势比度量。同为统计学家和遗传学家的Fisher于192

7、2年引入了刻画卡方分布族特征的自由度,并于1934年引入了Fisher精确检验。针对属性数据的模型最早出现在20世纪30年代,probit模型在处理毒理学中二分响应的应用中流行起来。1938年R.A.Fisher和FrankYates提出了log[π(1-π)]变换。同是医师及统计学家的JosephBerkson于1944年为该变换引入了术语“logit”。1951年,JeromeCornfield通过该模型,在案例对照研究中使用优势比去近似相对风险,logistic模型逐步流行起来。20世纪50年代和60年代早期,出现了大量有关多向

8、列联表关联性和交互结构的工作,这激起了1965至1975年间人们对对数线性模型的研究。近来,属性数据领域的研究焦点在于对聚簇关联响应数据拟合logistic回归模型。这些研究一方面对聚簇关联数据的边缘进行建模,另一方面利

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。