欢迎来到天天文库
浏览记录
ID:10527559
大小:54.50 KB
页数:4页
时间:2018-07-07
《基于人工神经网络的肺癌诊断研究 》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、基于人工神经网络的肺癌诊断研究 肺癌的诊断问题各国医学界已作了一些研究,并取得了某些实际的成果。但是,由于肺癌的多种类型以及多种相关因素,使得现有的诊断在准确性和实用性方面都存在着相当的局限性,如建模复杂困难。由于对影响罹病与否的各种因子的作用机制了解得不是很清楚,如何建立诊断模型,以及如何确定新建立的模型在何种程度上与实际情况相吻合还是一个问题;容错能力不强,适用范围不广;依赖于某个病例库新建立起来的医学模型往往具有很强的局限性,用于新的病例库时误差有时较大。另外,由于医学方面的原因,我们收集到的数据有时不完整,而现有的研究方
2、法所建立起的医学模型由于容错性差,对这些不完整的数据通常都难以处理。以非线性大规模并行分布处理为特点的人工神经网络理论突破了传统的线性处理模式,以其高度的并行性,良好的容错性和自适应能力成为人们研究其赖以生存的非线性世界,探索和研究某些复杂大系统的有力工具。原理与方法 神经网络是一个具有高度非线性的超大规模连续时间动力系统。是由大量的处理单元(神经元)广泛互连而形成的网络。它是在现代神经科学研究成果的基础上提出的,反映了脑功能的基本特征。但它并不是人脑的真实描写,而只是它的某种抽象、简化与模拟。网络的信息处理由神经元之间的相互作
3、用来实现;知识与信息的存储表现为网络元件互连间分布式的物理联系;网络的学习和计算决定于各神经元连接权系的动态演化过程。因此神经元构成了网络的基本运算单元。每个神经元具有自己的阈值。每个神经元的输入信号是所有与其相连的神经元的输出信号和加权后的和。而输出信号是其净输入信号的非线性函数。如果输入信号的加权集合高于其阈值,该神经元便被激活而输出相应的值。在人工神经网络中所存储的是单元之间连接的加权值阵列。 神经网络的工作过程主要由两个阶段组成,一个阶段是工作期,此时各连接权值固定,计算单元的状态变化,以求达到稳定状态。另一阶段是学习期
4、(自适应期,或设计期),此时各计算单元状态不变,各连接权值可修改(通过学习样本或其他方法),前一阶段较快,各单元的状态亦称短期记忆(STM),后一阶段慢的多,权及连接方式亦称长期记忆(LTM)〔1〕。 根据网络的拓扑结构和学习规则可将人工神经网络分为多种类型,如不含反馈的前向神经网络、层内有相互结合的前向网络、反馈网络、相互结合型网络等〔2〕。本文的人工神经网络模型是采用BP算法的多层前馈网络。 该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,连接权用oid函数,设神
5、经网络输入层的p个节点,输出层有q个节点,k-1层的任意节点用l表示,k层的任意节点用j表示,k+1层的任意节点用l表示。,ym),其中yi=f(xi)。这里描述的是一般的数学抽象,像识别与分类这些计算都可以抽象为这样的一种近似数学映射。 所谓诊断,实质上是一个分类问题。即根据候诊者的症状,医学检查结果(如体温、心跳等)等一些情况,它们可以用一向量(e1,e2,…,em)来表示,将其归类为病人或非病人。这也可以转化为寻找一差别函数f使得: (1)f(e1,e2,…,em)>ε, (e1,e2,…,em)∈T (2)f(e1,
6、e2,…,em)>ε, (e1,e2,…,em)T 其中集合T表示患病。 因此,病情诊断最终也可作为一类函数的逼近问题。 而许多研究已表明,前向神经网络可作为非线性逼近的标准型。对于实数空间的任一函数,只要它满足一定的条件,一定存在唯一的具有单一隐层的前向网络作为它的最优最佳逼近。而含有两个隐含层的前向网络可在任意的平方误差内逼近某一实函数〔3〕。诊断步骤 肺癌病例数据选自1981~1994年在某医院住院的病人,共计551例。其中486例(88%)经病理学、细胞学诊断证实为肺癌。每一病例都包括多项数据,其中用于诊断的数据项
7、有:病人的一般情况(如年龄、性别等),家族史、既往史、吸烟史、术后病理、X射线检查、CT检查、纤维支气管镜检查、PAT痰检等多达58项。因此,原则上58项数据应作为神经网络的输入项,而神经网络的输出值就是病人是否患肺癌的结果。 1.网络训练集的确定:在最原始的551例病人数据中存在着各种各样的差别,如性别差异(419例男性,132例女性),诊断结果的差异(486例经证实为肺癌),所患肺癌种类的差异(鳞癌、小细胞癌、大细胞癌等),患病程度上的差异(早、中晚期的不同)等等。显然,训练数据集应最大限度地保证兼顾各种病例情况。经过仔细筛
8、选,选择了含有460个病例的集合作为肺癌诊断用的网络的训练集。 2.神经网络输入和输出数据的预处理 按照人工神经网络的理论,神经网络的输入输出数据都应该属于(0,1)区间的实数,为此我们需对原始数据进行如下的规一化处理:其中xi为原始数据项,而
此文档下载收益归作者所有