基于pca与分类回归树医疗诊断应用研究

基于pca与分类回归树医疗诊断应用研究

ID:21859177

大小:268.00 KB

页数:6页

时间:2018-10-25

基于pca与分类回归树医疗诊断应用研究_第1页
基于pca与分类回归树医疗诊断应用研究_第2页
基于pca与分类回归树医疗诊断应用研究_第3页
基于pca与分类回归树医疗诊断应用研究_第4页
基于pca与分类回归树医疗诊断应用研究_第5页
资源描述:

《基于pca与分类回归树医疗诊断应用研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于PCA与分类回归树的医疗诊断应用研究摘要:本文介绍了基于基尼系数的分类回归树方法(CART)的原理。以医疗辅助诊断为应用对象,建立了基于主成分分析与分类回归树的分类器。首先应用主成分分析的方法对数据属性进行约简,然后在此基础上建立相应的分类回归树分类器。针对皮肤病学中鳞片状红斑疾病区分诊断的难题,使用该分类器进行实际验证,结果表明该分类器具有较好的识别效果,且准确率可以达到93%以上,说明本文建立的分类器在医疗诊断中具有很大的应用潜力。关键字:主成分分析;分类回归树;皮肤病学诊断;分类ResearchofDermatologyDiagnos

2、eBasedonPCAandClassificationandRegressionTress(CART)AnalysisAbstract:Thispaperpresentstheprincipiumofclassificationandregressiontrees(CART),whichbasedonGeordiecoefficient.Asthemedicaldiagnoseassistantanapplicationobject,itconstitutedtheclassificationbasedonthePCAandCART.Firs

3、tly,itusedPCAtoreducethedatasetattributes.Thenitconstructedaclassificationaboutclassificationandregressiontrees.Todealwiththedifficultproblemofrecognizedifferentialdiseasesindermatologydiagnosis,thisarticlethroughactualvalidatingtothedermatologydiagnosisdata,computationalres

4、ultsindicatethatthisclassificationpossessgoodperformanceofrecognize,andtheaccuracyrateisachievedbetterthan93%,thisclassificationhaspotentialapplicationindermatologydiagnostics.Keywords:PCA;ClassificationandRegressionTrees(CART);dermatologydiagnose;classification1引言决策树作为数据挖掘中

5、一种常用的方法,具有以下优点:(1)产生的分类规则易于理解。决策树的每个分枝都对应于一个分类规则,因此决策树分类算法,最终可以输出一个理解的规则集;(2)速度相对较快;(3)准确率相对较高。尤其擅长处理非数值型数据(离散值字段),这与神经网络只能处理数值型数据相比,免去了很多数据预处理工作。(4)决策树相对神经网络其包容性较强。作为决策树方法中的一种,CART(ClassificationAndRegressionTree)分类回归树应用在很多领域,包括有电信行业异动客户识别[1]、中文文语转换系统[2]、生产过程控制[3]等取得了不错的效果。

6、鳞片状红斑疾病的区分诊断作为皮肤病学诊断中的一个难题,原因有很多,其中一方面主要是由于在通常情况下,虽然需要做活组织检查,但是这些疾病往往有许多相似的组织病理学特征;另外一个重要方面就是某一种疾病可能在开始阶段表现出其他类疾病特征以及在随后的阶段中才可能表现本身病症的特征,所以使得在对红斑疾病的区分诊断上往往产生误分和错判。因此本文提出利用CART分类回归树对几种鳞状红斑疾病进行分类判别研究,进而帮助对该类疾病的诊断识别进行辅助决策。2CART分类回归树算法二叉决策树作为分类使用是一种非参数化的模式识别方法。决策树依据通过由树结构分叉上的节点顺

7、序所做决策得到的结果,将模式分配到类上来对特征空间进行层次化表示。二叉决策树是由对特征空间重复进行分割到伴随着类相关的终节点的两个子空间所构成。一个令人满意的决策树需要满足的条件有:分枝数量相对较少;从分枝上获得相对少量的合理的节点;具有较高的预测能力,即实体在终节点能被正确分类。CART分类回归树可以处理高度倾斜或多态的数值型数据,也可处理顺序或无序的类属型数据。CART不仅可以将实体分类到各个离散群体中,同样可以作为回归分析中针对相应(非独立变量)值和特定的解释性(独立的)变量值估计的选择性方法。CART不仅具有分类和回归的能力,同样也是一

8、种决定属性变量相对重要性的方法。每一个变量在CART树结构中都有一个重要性得分,这个得分表示变量贯穿树频率和适合为首要的或者代替分裂机的重要性。2.1

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。