基于超球体多类支持向量数据描述医学图像分类新方法

基于超球体多类支持向量数据描述医学图像分类新方法

ID:6075195

大小:27.50 KB

页数:5页

时间:2018-01-02

基于超球体多类支持向量数据描述医学图像分类新方法_第1页
基于超球体多类支持向量数据描述医学图像分类新方法_第2页
基于超球体多类支持向量数据描述医学图像分类新方法_第3页
基于超球体多类支持向量数据描述医学图像分类新方法_第4页
基于超球体多类支持向量数据描述医学图像分类新方法_第5页
资源描述:

《基于超球体多类支持向量数据描述医学图像分类新方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、基于超球体多类支持向量数据描述医学图像分类新方法  摘要:针对乳腺X光医学图像多分类问题中训练速度比较慢的问题,提出超球体多分类支持向量数据描述(HSMCSVDD)分类算法,即把超球体单分类支持向量数据描述直接扩展到超球体多分类支持向量数据描述。通过对乳腺X光图像提取灰度共生矩阵特征;然后用核主成分分析(KPCA)对数据进行降维;最后用超球体多分类支持向量数据描述分类器进行分类。由于每一类样本只参与构造一个超球体的训练,因此训练速度明显提高。实验结果表明,这种超球体多分类支持向量数据描述分类器的平均训练时

2、间为21.369s,训练时间比Wei等(WEILY,YANGYY,NISHIKAWARM,etal.Astudyonseveralmachinelearningmethodsforclassificationofmalignantandbenignclusteredmicrocalcifications.IEEETransactionsonMedicalImaging,2005,24(3):371-380)提出的组合分类器(平均训练时间40.2s)减少了10~20s,分类精度最高达76.6929%,适合解

3、决类别数较多的分类问题。关键词:5乳腺X光图像;多类支持向量数据描述;灰度共生矩阵;核主成分分析0引言乳腺癌是女性常见的肿瘤疾病之一,由于乳腺癌的病发机理还未完全弄清楚,因此早期诊断对防治乳腺癌十分重要[1]。乳腺癌的临床诊断方法包括触摸式诊断、组织学诊断、细胞学诊断和影像学诊断四大类,其中影像诊断是最适合适龄女性乳腺癌诊断方法,乳腺X光摄影技术是最常见乳腺癌早期诊断方法[2]。随着计算机技术的不断发展,医学图像上的计算机辅助诊断技术也得到了迅猛的发展,其中常用的方法有关联规则、决策树、遗传算法、人工神经

4、网络神经网络、贝叶斯、粗糙集、模糊聚类和支持向量机(SupportVectorMachine,SVM)等。支持向量机在近些年发展比较迅速,它是建立在统计学习理论中的VC理论和结构化风险最小原理基础上实现的一种机器学习方法[3],能较好地解决小样本、非线性、高维数和局部极小点等实际问题。Tax等[4]在1999年提出支持向量数据描述(SupportVectorDataDescription,5SVDD),它是一种源于统计学习理论和SVM的全新的数据描述方法,与SVM寻求最优超平面不同,SVDD包容所有目标样

5、本数据的最小超球体。并且相比SVM,SVDD有着复杂性低、易移植和训练速度快等优点,在信用卡欺诈检测、入侵检测、人脸识别领域等有着广泛的应用,同时SVDD在解决不平衡数据分类和多示例分类中已成为一种新方法。SVDD在单分类问题中分类效果比较好,其中超球体单分类支持向量机[5]表现的效果更好,但是超球体单分类SVM缺乏有效的训练算法,所以其在应用中受到限制。在实际问题的解决中,很多分类问题都是包含多个类别的多分类问题,而目前大多数多分类器基本上都是由二分类器组合而成的,当分类类别数达到一定的数量时,这种经二

6、分类器组合而成的多分类器将会遇到诸如样本训练阶段速度较慢的问题。例如在医学图像识别问题中,从图像中提取出来的信息特征量往往比较大,如果直接用二分类器组合而成的多分类器,训练速度相对来说较慢,而文献[6-7]中分别提到的关于多球体支持向量数据描述和多分类支持向量机的基本思想和实现对进一步研究多分类问题提供了帮助。Wei等[8]提到用级联AdaBoost对标准医学图像数据集进行分类,分类精度达到80.3%,但是训练时间比较长,平均训练时间为40.2s。文献[9]中提到对标准医学图像数据集进行分类的方法,如果只

7、使用ID3进行分类,分类精度为43.3%,只使用K最近邻(KNearestNeighborhood,KNN)分类法进行分类,分类精度为40.3%,而使用ID3和KNN的组合分类器进行分类,分类精度为47.6%。文献[10]中提到对标准医学图像数据集进行分类的方法,用主成分分析(PrincipalComponentAnalysis,PCA)和基于规则的粗糙集进行分类,分类精度为69.27%;用BP(Back5Propagation)神经网络进行分类,分类精度为51.51%;用学习向量量化(LearningV

8、ectorQuantization,LVQ)神经网络分类器进行分类,分类精度为63.63%。从文献[8]中可以看出分类精度虽然达到80.3%,但是训练速度比较慢;而文献[9-10]中的分类精度比较低。针对上述问题,本文提出基于超球体多分类支持向量数据描述方法。一些冗余的特征信息不仅会增大分类算法在构建分类模型时的数据量,而且还会影响分类器的分类效果;所以本文提出的超球体多分类支持向量数据描述算法优点在于分类模型建立前期先运用核

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。