数学建模_肿瘤诊断问题模型

数学建模_肿瘤诊断问题模型

ID:20359373

大小:292.50 KB

页数:7页

时间:2018-10-09

数学建模_肿瘤诊断问题模型_第1页
数学建模_肿瘤诊断问题模型_第2页
数学建模_肿瘤诊断问题模型_第3页
数学建模_肿瘤诊断问题模型_第4页
数学建模_肿瘤诊断问题模型_第5页
资源描述:

《数学建模_肿瘤诊断问题模型》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、肿瘤的诊断模型摘要本文对肿瘤的诊断问题,应用神经网络与模糊数学的理论,给出了几种乳房癌的量化诊断方案.首先,建立了LVQ神经网络模型,使用500组数据的前400组作为训练样本,用后100组数据对网络性能进行检测,诊断正确率达98%.然后对这500个特征向量进行了回归分析,从30个特征中筛选出了6个特征,它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、周长的均值.并将以上6个特征用于LVQ网络,诊断正确率达95%.进一步考虑到神经网络与模糊数学各自的特点,将二者有机结合构造了神经模糊系统,并用以上的6个特征对系统进行训练,诊断

2、正确率达96%.本文构造的模型具有良好的稳定性,对于模式识别问题具有很强的实用价值,最后本文提出了神经网络和模糊数学深层次结合的方向.一.问题的重述肿瘤通过穿刺采样进行分析可以确定其为良性或恶性.医学研究发现乳房肿瘤病灶组织的细胞显微图像的10个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的性质有密切关系.现有500个已确诊病例,每个病例的一组数据包括采样组织中各细胞核的这十个特征量的平均值,标准差和“最坏值”(各特征的3个最大特征的平均值)共30个数据.根据这500组数据建立诊断模型,并将其用于

3、另外69名已做穿刺采样的患者.为节省费用发展一种只用此30个特征数据中的部分特征来区分乳房肿瘤是良性还是恶性的方法.二.问题的假设1.所给的500组病例具有广泛的代表性.2.500组病例所反映的良性与恶性的概率分布符合病例的自然分布.三.问题的分析本问题是一个典型的模式识别问题,要求根据它的特征量来进行分类.对于模式识别问题,现今有两类解决办法.一类是传统的线性模型.另一类是近年来发展起来的非线性模型.本题是一个典型的非线性问题,用传统的线性模型解决有一定的困难,而且识别率不高.所以非线性模型是解决此类问题的首选.现今常用的非线性模型有神经网络模型

4、和模糊系统模型.神经网络由许多并行运算的简单单元组成,单个神经元的结构及其简单,但大量神经元相互连接组成人工神经元网络显示出人脑的某些特征:1)分布存储和容错性;2)大规模并行处理;3)自学习、自组织和自适应性;4)它并不是各单元行为的简单相加,而表现出一般复杂非线性动态系统的特性.神经元可以处理一些环境信息十分复杂、知识背景不清楚和推理规则不明确的问题,如乳房癌诊断问题.7模糊集打破了传统的分明集只有0和1的界限,任意元素可同时部分地属于多个模糊子集,隶属关系用隶属的程度来表示.这更接近人的表述方式.模糊规则是定义在模糊集上规则,常采用“If-t

5、hen”(若…则…)的形式,可用来表示专家的经验、知识等.由一组模糊规则构成的模糊系统可代表一个输入、输出的映射关系.从理论上说,模糊系统可以近似任意的连续函数.模糊系统除了模糊规则外,还包括模糊逻辑推理和去模糊化的部分.由于模糊集能处理非定量的信息,因此在模式识别(尤其是具有模糊特点的识别问题)中模糊系统具有很大的优势,本题肿瘤的良性、恶性正是模糊概念,所以用模糊系统进行模式识别会得到很好的效果.为了避免量纲的影响,在应用数据之前对数据经行了标准化.标准化方法:用每个数据与整体均值的差除以整体标准差.一.模型的建立与求解(一)神经网络模型学习向量

6、量化(LVQ)是在监督状态下对竞争层进行训练的一种学习算法.LVQ网络由一个竞争层和一个线性层组成.竞争层的神经元将输入向量分成组,由现行层组合到期望的类中.在任何给定的时刻,线性层的输出神经元只有一个非零输出1,该神经元就是竞争中得胜者.假定获胜的元为,它之所以获胜的原因是它受到了最大的输入刺激,那么,的总加权输入为其中,表示的状态,表示第个元到第个元的权值,表示第个输入分量.其矩阵形式为若元获胜,就意味着若连接到每个输出层神经元的权向量都是规范化的,上式等价于网络输入模式为时,具有权向量与最近的元将获得竞争的胜利.若元竞争获胜,将权值作如下调整

7、(1)使获胜者的权向量向输入向量移近一小段距离,这使网络在遇到或与接近的模式时,元可以有更大的获胜可能性.若在竞争中失败,将权值作如下调整(2)7使权向离开样品的方向移动,这样就减小了错误分类的机会.在(1)、(2)式中,表示学习率.在本模型中取为0.01,取隐竞争层的神经元数为60,取输出层神经元数为2,并规定输出(0,1)为良性,输出(1,0)为恶性.用前400组数据作训练样本,经过15000次迭代,两类样本的聚类情况如下图:用后100组数据对训练进行检测,诊断正确率达98%.对69组待定病例的诊断结果如下表:病例号类别病例号类别病例号类别病例

8、号类别914862B917062B91979701B924632B91504M917080B919812B924934B9

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。