均衡采样和深度学习在不平衡医疗数据中的应用研究

均衡采样和深度学习在不平衡医疗数据中的应用研究

ID:42495059

大小:2.16 MB

页数:67页

时间:2019-09-15

均衡采样和深度学习在不平衡医疗数据中的应用研究_第1页
均衡采样和深度学习在不平衡医疗数据中的应用研究_第2页
均衡采样和深度学习在不平衡医疗数据中的应用研究_第3页
均衡采样和深度学习在不平衡医疗数据中的应用研究_第4页
均衡采样和深度学习在不平衡医疗数据中的应用研究_第5页
资源描述:

《均衡采样和深度学习在不平衡医疗数据中的应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、均衡采样和深度学习在不平衡医疗数据中的应用研究ResearchonApplicationofImbalancedMedicalDataBasedonBalancedSamplingandDeepLearning工程领域:软件工程作者姓名:赵永伟指导教师:喻梅教授企业导师:李国翚正高级工程师天津大学软件学院二零一七年十二月万方数据万方数据万方数据万方数据摘要随着科学技术的发展,我国正处在医疗数据信息化的高速发展阶段。医疗数据的指数式增长及医疗平台的发展,使得医疗数据的获取日益便捷,但隐藏在海量医疗数据中的有效信息并没有得到充分的挖掘和有

2、效利用,如何从医疗数据中挖掘出隐含的有用信息,从而对医生的诊断提供辅助具有现实意义。针对医疗数据不平衡问题和疾病建模预测问题,论文运用数据挖掘的知识,对医疗数据建立预测模型,为医生诊断病情提供参考。论文在数据层面,针对医疗数据中存在的数据不平衡问题,提出一种数据不平衡处理算法KE-SMOTE。KE-SMOTE算法对于数据集中的多数类样本,首先进行多次聚类,直至聚类最小误差不再变小或者达到指定的迭代次数,然后采用聚类融合的方法进行欠采样;对于数据集中的少数类样本,采用smote算法进行过采样,将得到的新的多数类样本和新的少数类样本结合,

3、得到新的训练数据集。论文采用UCI数据集进行实验,实验证明KE-SMOTE算法相较于传统的类别不平衡处理算法,具有更好的效果。在算法层面,论文提出一种基于自编码器的深度置信网络算法AE-DBN,用于对医疗数据进行建模预测。AE-DBN算法采用自编码器对数据集进行特征抽取,将抽取得到的特征与原特征集结合,运用深度置信网络建立模型,通过调节隐藏层层数和结点数量,构造最优深度置信网络模型。论文采用某医院提供的高尿酸血症医疗数据集进行实验,通过与传统的机器学习算法进行对比实验,证明了AE-DBN算法具有更高的分类准确率。同时通过对数据集中指标

4、的数据分析和组合不同特征进行建模实验,得出了影响高尿酸血症的患病因素,可以为医生诊断高尿酸血症提供参考。关键词:医疗数据,数据不平衡,聚类融合,自编码器,深度置信网络I万方数据II万方数据ABSTRACTWiththedevelopmentofscienceandtechnology,ourcountryisinthehigh-speeddevelopmentstageofmedicaldatainformatization.Withtheexponentialgrowthofmedicaldataandthedevelopmento

5、fmedicalmanagementsystem,theac-cesstomedicaldataisbecomingmoreandmoreconvenient.buttheeffectiveinfor-mationhiddeninmassivemedicaldatahasnotbeenfullytappedandeffectivelyuti-lized.Medicaldataincludephysicalexaminationdata,electronicmedicalrecords,di-agnosticimaging,andmed

6、icaldata.Atpresent,medicaldiagnosismainlyreliesondoctors'professionalknowledgeandrichclinicalexperiences.Itisofapracticalsig-nificancetohowtodigouthiddenusefulinformationfrommedicaldata,soastopro-videassistancefordoctor'streatmentdecision.Aimingattheproblemofimbalancedc

7、lassificationinmedicaldataandtheproblemofdiseasemodeling,thispaperusestheknowledgeofdataminingtoestablishpredictionmodelformedicaldata,andpro-videsreferencefordoctorstodiagnosethedisease.Atthedatalevel,anewimbalanceddataprocessingalgorithmcalledKE-SMOTEisproposedtosolve

8、theproblemofclassimbalanceinmedicaldata.Formajorityclassdataset,KE-SMOTEusesK-Meansrepeatedlyuntiltheminimumer

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。