基于改进邻域粗糙集和随机森林算法的糖尿病预测研究

基于改进邻域粗糙集和随机森林算法的糖尿病预测研究

ID:17384021

大小:1.86 MB

页数:67页

时间:2018-08-30

基于改进邻域粗糙集和随机森林算法的糖尿病预测研究_第1页
基于改进邻域粗糙集和随机森林算法的糖尿病预测研究_第2页
基于改进邻域粗糙集和随机森林算法的糖尿病预测研究_第3页
基于改进邻域粗糙集和随机森林算法的糖尿病预测研究_第4页
基于改进邻域粗糙集和随机森林算法的糖尿病预测研究_第5页
资源描述:

《基于改进邻域粗糙集和随机森林算法的糖尿病预测研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于改进邻域粗糙集和随机森林算法的糖尿病预测研究培养单位:信息学院专业名称:管理科学与工程作者姓名:胡玮指导教师:高静副教授ResearchonPredictionofDiabetesBasedonImprovedNeighbourhoodRoughSetandRandomForestAlgorithmCandidate:HuWeiSupervisor:Prof.GaoJingCapitalUniversityofEconomicsandBusiness,Beijing,China独创性声明本人郑重声明:所呈交的论文是本人

2、在指导教师指导下独立进行研究工作所取得的成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致谢外,本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得首都经济贸易大学或其它教育机构的学位或学历证书而使用过的材料。与我一同工作的同志对研究所做的任何贡献均已在论文中作出了明确的说明。若有不实之处,本人愿意承担相关法律责任。学位论文作者签名:日期:年月日关于论文使用授权的说明本人完全同意首都经济贸易大学有权使用本学位论文(包括但不限于其印刷版和电子版),使用方式包括但不限于:保留学位论文,按规

3、定向国家有关部门(机构)送交学位论文,以学术交流为目的赠送和交换学位论文,允许学位论文被查阅、借阅和复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、缩印或其他复制手段保存学位论文。保密学位论文在解密后的使用授权同上。学位论文作者签名:日期:年月日指导教师签名:日期:年月日摘要糖尿病已成为全球危害性较大的慢性疾病之一,而中国更是全球糖尿病第一大国,近年来患病率还呈现出逐年增高的趋势,严重影响人类健康。并且随着医疗服务水平的不断提高,人们对医疗诊断效率以及准确率有了更高的要求。目前该疾病的诊断主要是在化验的基

4、础上由医生人工诊断完成,但是糖尿病的潜伏期较长,而且各地区医疗资源不协调。针对以上这些问题,论文采集了国家人口与健康科学数据共享服务平台某医院糖尿病数据,并针对邻域粗糙集的只依赖单属性计算重要度的不足,提出了改进的邻域粗糙集(INRS)属性约简算法,后将其与随机森林(RF)组成分类预测模型应用在糖尿病数据上,形成了高精度的糖尿病预测模型,旨为医生临床诊断和疾病研究等提供辅助支持,提高临床诊断治疗水平。本文分别使用MATLAB和WEKA实现糖尿病数据的改进的邻域粗糙集(INRS)属性约简和随机森林(RF)分类预测。后面为探讨

5、该组合模型的成效,分别从属性约简和分类器选择两个方面进行了对比分析。首先从属性约简效果分析,分别以不约简、粗糙集约简、邻域粗糙集约简和改进的邻域粗糙集算法建立特征模型,并将约简后的数据使用随机森林分类器评估效果,发现约简后的数据明显比不约简好,分类更准确,而改进后的邻域粗糙集虽然属性个数比未改进的多,但分类准确率最优,说明改进算法有改善。然后从分类器选择效果分析,对INRS约简后的数据使用随机森林算法、BP算法、C4.5算法及NaiveByes算法分类器从建模耗时、误差、分类准确率、ROC面积四个方面进行对比分析,发现综合

6、效果最优的是随机森林分类器。综上,本论文中的基于改进的邻域粗糙集和随机森林的组合模型得到的糖尿病预测模型的分类准确率达到92.05%,其综合效果甚佳。通过本次研究希望后续可以将糖尿病预测功能添加到医院的诊疗系统中,进而辅助医生对糖尿病诊断做出科学的诊断决策。关键词:改进的邻域粗糙集;随机森林;糖尿病IAbstractDiabeteshasbecomeoneofthemostharmfulchronicdiseasesintheworld,andChinaistheworld'slargestdiabetescountry.

7、Inrecentyears,theprevalenceratehasalsoincreasedyearbyyear,whichseriouslyaffectshumanhealth.Andwiththecontinuousimprovementofthelevelofmedicalservices,peoplehavehigherrequirementsformedicaldiagnosisefficiencyandaccuracy.Atpresent,thediagnosisofthediseaseismainlybas

8、edonlaboratorytestsperformedbyadoctor.However,theincubationperiodofdiabetesislonger,andthemedicalresourcesindifferentregionsareinconsistent.Inresponseto

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。