数据挖掘技术在疾病预防与医保费用控制的应用研究

数据挖掘技术在疾病预防与医保费用控制的应用研究

ID:37613358

大小:537.78 KB

页数:32页

时间:2019-05-26

数据挖掘技术在疾病预防与医保费用控制的应用研究_第1页
数据挖掘技术在疾病预防与医保费用控制的应用研究_第2页
数据挖掘技术在疾病预防与医保费用控制的应用研究_第3页
数据挖掘技术在疾病预防与医保费用控制的应用研究_第4页
数据挖掘技术在疾病预防与医保费用控制的应用研究_第5页
资源描述:

《数据挖掘技术在疾病预防与医保费用控制的应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、数据挖掘技术在疾病预防与医保费用控制的应用研究---------基于糖尿病卫生观测数据赵茜倩张盼指导教师:李庆提纲问题引入相关研究实验设计实证研究总结一、问题引入医疗改革在我国是讨论的重点问题之一医疗费用及疾病预防是医改重要内容以糖尿病卫生观测数据为基础,利用数据挖掘的方法来帮助发现该类疾病形成的原因及费用控制二二、二、、相关研究、相关研究数据挖掘技术在医疗保健方面的应用–PeterLucas:贝叶斯分析、模式识别–SEBrossette等:关联规则–郑西川等:决策树分析三三、三、、实验

2、设计、1、问题分析2、数据分析3、实验方法三三、三、、实验设计、1、问题分析–(1).得糖尿病的人与年龄或性别是否有关系–(2).糖尿病患病几率与哪些变量有关系,如肥胖、高血压等–(3).患有糖尿病如何影响病人的医疗总费用三三、三、、实验设计、2、数据分析样本数据由美国USHETH(TheUnitedStatesHealthExpenseThinkTank)组织提供,共有50788条记录,主要包含个人信息及相关疾病记录。(1)主要变量主要变量36个变量。目标变量:DIABETES_DIAG_BINAR

3、Y(2)变量分类IntervalVariable(区间变量)ClassVariable(类别变量)变量解释1CENSUS_REGION地区-1INAPPLICABLE1NORTHEAST2MIDWEST3SOUTH4WEST2AGE年龄-1INAPPLICABLERealvalue3TOTAL_INCOME收入总额REALVALUE4TOTALEXP医疗保健总额REALVALUE5AMOUNT_PAID_MEDICARE医疗保险支付总额REALVALUE6ADULT_BMI成人体质指数-1INAPPLIC

4、ABLEREALVALUE7DIABETES_DIAG_BINARY糖尿病诊断1YES0NOBMI(BodyMassIndex)BMI分类WHO标准亚洲标准中国参考标准体质指数,是评估体重偏瘦<18.5<18.5<18.5与身高比例的参考指数正常18.5~24.918.5~22.918.5~23.9超重≥25≥23≥24计算公式:偏胖25.0~29.923~24.924~26.9BMI=体重/身高的平方(国际单位kg/㎡)肥胖30.0~34.925~29.927~29.9重度肥胖35.0~39.9≥3

5、0≥30极重度肥胖≥40.0三三、三、、实验设计、2、数据分析样本数据由美国USHETH(TheUnitedStatesHealthExpenseThinkTank)组织提供,共有50788条记录,主要包含个人信息及相关疾病记录。(1)主要变量36个变量。目标变量:DIABETES_DIAG_BINARY(2)变量分类变量分类IntervalVariable(区间变量):AGE、YEARS_EDUS、TOTAL_INCOME、PRESON_WEIGHT、TOTALEXP、AMOUNT_PAID_MEDI

6、CARE、AMOUNT_PAID_MEDICAID、NUMB_VISITS、CHILD_BMI、ADULT_BMIClassVariable(类别变量)三三、三、、实验设计、3、实验方法使用SAS软件的EnterpriseMiner模块进行数据挖掘。设定目标变量变量交互分析模型训练选择算法结果分析四四、四、、实证研究、1、控制变量与目标变量交互对比分析2、模型训练3、不同年龄群体患病影响因素分析1、控制变量与目标变量交互对比分析控制变量“年龄”与目标变量对比图2、模型训练对糖尿病卫生观测数据的数

7、据挖掘的模型模型评估提升图2、、模型训练、模型训练(1)决策树分析重要变量树状结构(2)逻辑斯蒂回归分析重要变量2、、模型训练、模型训练(1)决策树分析决策树分析重要变量树状结构(2)逻辑斯蒂回归分析重要变量NameImportanceNameImportanceAGE1.0000AMOUNT_PAID_MEDI0.1327CAIDHIGH_BLOOD_PRESSURE_0.7256LAST_FLUSHOT0.1281DIAGTOTALEXP0.6728SERVED_ARMED_FOR0.0738CESA

8、DULT_BMI0.6057HIGHEST_DEGREE0.0446YEARS_EDUC0.3540TOTAL_INCOME0.0411CHOLEST_LST_MEDICAID0.1789NUMB_VISITS0.0151决策树变量重要性2、、模型训练、模型训练(1)决策树分析重要变量树状结构(2)逻辑斯蒂回归分析重要变量决策树树状图A2、、模型训练、模型训练(1)决策树分析重要变量树状结构(2)逻辑斯蒂回归分析逻辑斯蒂回归分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。