基于数字图像分析的急性白血病细胞形态学研究及分类识别

基于数字图像分析的急性白血病细胞形态学研究及分类识别

ID:76138979

大小:9.44 MB

页数:72页

时间:2024-02-04

上传者:笑似︶ㄣ無奈
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第1页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第2页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第3页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第4页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第5页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第6页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第7页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第8页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第9页
基于数字图像分析的急性白血病细胞形态学研究及分类识别_第10页
资源描述:

《基于数字图像分析的急性白血病细胞形态学研究及分类识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

学校编号图书分类号学号福建师范大学硕士学位论文基于数字图像分析的急性白血病细胞形态学研究及分类识别蒋英学科专业研究方向指导教师申请学位级别论文提交日期论文评阅人论文答辩日期答辩委员会主席学位授予单位学位授予日期年月年月 福建师范大学工学硕士学位论文摘要本文对白血病细胞的检测和诊断方面进行了探索,具体步骤是首先将获取的原始细胞图像进行预处理,得到需要的细胞样本图像,提取细胞图像形态学特征参数,最后采用神经网络对细胞作诊断分类识别。在图像分割部分,本文提出了基于小波变换的分水岭分割方法,克服了骨髓涂片中因为白血病细胞粘连,而导致利用传统分割方法分割结果误差大的问题,分别对细胞、细胞核进行分割分割后,采用八链码算法及线段表法对细胞周长、细胞面积、核周长、核面积、细胞形状因子、核形状因子、核浆比等细胞形态学特征参数进行测量并进行特征值标准化。最后在取得了数据样本后,进行人工神经网络的训练。文中采用人工神经网络的模型主要是反向传播误差。通过所取得的数据样本对人工神经网络的权值进行训练。当误差小于规定值后,再对人工神经网络进行测试。通过大量的实验对比结果可以知道,应用反向传播误差算法可以对几类急性白血病进行较准确的分类。关键词白血病图像分割特征提取人工神经网络细胞识别 福建师范大学工学硕士学位论文,,,一,,,,,,,,、、、工 福建师范大学工学硕士学位论文中文文摘目前,数字图像处理、模式识别和人工智能技术已经被广泛地应用于生物医学领域,并且取得了一定的研究成果。但由于对于务工作者来说,癌细胞的检测和诊断仍是较为困难的工作之一,癌症早期的病理性诊断的医学图像处理系统的报道还不多。本论文通过计算机图像处理和分析技术,实现对急性白血病细胞的形态学的研究及分类识别。针对研究的算法,利用软件开发平台及软件编制程序实现图像分割、特征提取进行数值分析计算及神经网络的建立,及实验研究。本论文的论文结构及主要研究内容主要包括以下几个方面第一章,绪论主要介绍课题研究的背景及目前国内外在本课题方面的研究状况,提出了图像处理与分析技术在白血病诊断的优势所在。本文利用计算机辅助的图像分析系统对骨髓涂片细胞进行形态定量研究,旨在探寻一种客观性强、重复性好的形态诊断方法,为实现白血病计算机自动化诊断、分类提供依据。第二章,主要介绍各类急性白血病的分类方法在临床诊断时的病理特征。急性白血病主要分为急性淋巴性白血病和急性粒性白血病两大类。各类急性白血病又根据某类细胞的多少及分化程度分成数种类型,正常人的骨髓细胞中所含细胞类的数目都是在一定正常范围内的,如果超出了正常值就很可能是患上白血病的一种征兆,因而其中的每一类细胞的计数及异常情况都可能是诊断早期白血病的一个重要条件。第三章,详细介绍了一些常用的图像分割算法,重点研究分水岭分割算法,分析和总结了各类算法在实际应用中的优缺点,并在此基础上引入小波变换的基本理论,为之后进行基于小波变换的分水岭分割提供快速算法的理论基础,这种改进后的算法克服了传统分水岭变换难以解决的细胞互相粘连的问题。其具体步骤是首先利用小波变换在原图的梯度图上产生多分辨率图像,然后对低分辨率图像进行应用标记的分水岭分割。采用内部标记标记对象的内部和外部标记标记背景的标记方法得到初始分割区域,最后利用小波反变换,得到高分辨率的分水岭结果。第四章,介绍了细胞特征值的提取。特征提取部分采用对二值分割图像进 福建师范大学工学硕士学位论文行边缘跟踪,利用基于区域边界的链码和基于区域的线段表示来提取形态学特征参数从而获得细胞的形态特征,如细胞周长、细胞面积、核浆比等七个细胞形状特征参数。特征值标准化是指通过变换处理将数据限制在,或介,区间内。经过测量得到的细胞特征参数大多数要经过标准化处理后才能进入人工神经网络进行训练。第五章,介绍神经网络的基本原理及其相关概念,建立神经网络在细胞识别中的应用模型,并对采集到的几类急性白血病病例进行分类识别。根据所测量的细胞的形态学参数即细胞周长、细胞面积、核周长、核面积、细胞形状因子、核形状因子及浆核比作为神经网络的输入变量,并确定隐含层神经元个数,最终完成整个网络的变量设计。之后,又对传统的算法进行引入动量项的算法改进。在基础上,进行了实验结果及其讨论。通过大量的实验对比结果可以知道,应用改进后的反向传播误差算法具有较好的分类能力。第六章,总结了本论文所做的主要工作,并指出不足之处及今后的研究方向。 摘要……,,…,,,……,,……,二,……,…………,……中文文摘……,…,……,,……目录……第章绪论……,……,……选题依据及背景……,……,……传统检测方式及缺点,,……,……计算机图像处理技术……研究对象……,……,,二国内外发展现状及临床应用……,……,二论文内容和组织结构……,……,……第章急性白血病的分类及临床病理特征……前言……、……急性白血病的分类及临床病理特征……,……,…,,,二,,,…,,…,……样本采集……,……、……本章小结……第章图像分割方法及改进……前言……图像采集…,…,…,…,…,……,……,……,……图像彩色空间的转换……,……,……颜色模型……,……,……,……,,,…,……颜色模型…,……、二模式到模式的转换……`……图像分割方法的基本概念及方法……阂值分割法……、……、……,区域生长法,……,……分水岭分割法……,……传统分水岭分割的改进……,……,…,二,……,,……,……小波变换发展背景…,……,……,……连续小波变换及反变换的定义……,……离散小波变换…… 福建师范大学工学硕士学位论文实验结果及分析……,……,……本章小结……第章白血病细胞形态特征提取……,……,…,,…,……前言……特征提取方法……,……、……链码……,……八连通链码……,……链码表的结构……,线段表的定义……,……,……,……链码表与线段表的转换……、……边界点的分类……,……类型转化……,……线段表的生成……,……细胞形态学特征参数……,……本章小结……,……,…第章神经网络及在白血病细胞识别中的应用……`…,…,,……,…,二,……前言……,……人工神经网络的发展历史……神经网络原理……,……网络的学习算法……,……、……网络变量设计……,……输入输出变量设计……隐层节点的选取……,……网络学习算法的改进……网络的缺点……,……,……引入动量项……、……实验结果及讨论……,二,……实验方法……实验依据……、……三类急性白血病细胞形态学参数……,……网络算法改进前后实验结果对比二,…,二…,,……,……本章小结……,……,……第章结束语……,……参考文献……肖 目录福建师范大学学位论文使用授权声明……攻读学位期间承担的科研任务与主要成果……致谢……,……,……个人简历……、…… 第章绪论第章绪论选题依据及背景白血病是一种骨髓及造血组织异常增生性疾病,特点为骨髓及其他造血组织中白血病细胞呈过度异常增生或分化障碍,浸润全身各器官组织,抑制正常的造血功能并出现各种症状。依据白血病细胞的分化程度和自然病程的长短,可分为急性和慢性两大类。白血病是我国十大高发肿瘤疾病之一,类型分布急性多于慢性,与欧美等国的类型分布有较明显差别。后期的白血病治愈率目前仍然较低。因此,白血病的早发现、早治疗己成为医学界的共识。传统检测方式及缺点白血病主要体现为血液中白细胞的异常情况,而骨髓是造血的主要器官,对骨髓样本中各类原始、幼稚等不同生长阶段的细胞进行分类计数以及异常细胞信急的分析,可尽早发现白血病的病变趋向,是早期诊断的一种行之有效的手段。目前常用的白血病诊断方式主要有骨髓涂片检测和流式细胞术这两种方式“。骨髓涂片检测是从形态学的角度依靠人工检验样本涂片的显微图像完成。这种检测方法设备简单、易于操作、成本较低,是目前白血病诊断的主要手段。骨髓涂片检查的具体方法是经骨髓穿刺抽取骨髓液,用载玻片制成定量涂片,经化学染色,在光学显微镜下观察骨髓中细胞微米级的数量和形态质量的变化,而这些在涂片中可观察到的即从形态学上可以辨认的细胞是造血细胞在生长发育过程中的第三阶段即幼稚及成熟细胞阶段的细胞。就目前的检查手段来说,显微镜下观察骨髓涂片中血细胞形态的变化和血细胞计数等手段仍然是医院检验科的常规检查,是人体造血系统疾病最基本的诊断方法,也能协助诊断部分血液系统疾病和其他相关的一些疾病,但此人工方法耗时,检验人员劳动强度大,因此人工检验结果的可靠性及有效性难以保证。目前,另一种基于流式细胞术的白血病诊断方法,通过分析细胞与化学试剂作用呈现的不同反应来进行识别计数,能实现对单细胞进行快速定量分析和 福建师范大学工学硕士学位论文分选。然而同一生长系列的细胞对化学试剂反应相近,难以再细分出其中不同生长阶段的细胞,故仅限于实现粗略区分出不同的生长系列的细胞,同时对异常情况也无法处理,因而不足以满足白血病早期诊断的需要。计算机图像处理技术由于人工形态分析效率低下,而利用化学方法的流式细胞仪又难以识别所有骨髓细胞,因而结合数字图像处理、模式识别和计算机视觉等学科的相关知识,从形态学的角度对骨髓细胞样本涂片进行基于专家知识的骨髓细胞的自动分类识别,以实现白血病早期辅助诊断系统,无疑具有十分重要的现实意义。随着计算机技术以及图像处理、模式识别技术的发展,细胞显微图像识别系统的优势更加明显,表现在下面几点可以抽取细胞图像的形态、色彩、纹理等方面的多种特征信息,实现病情诊断由定性分析向定量分析的转变。可将病理资料以血液涂片图像的形式存于微机,并整理建库。为医生提供宝贵的第一手资料,便于诊断的回顾和疑难病症的会诊。总结专家诊断经验,建立辅助诊断系统。为远程医疗创造条件【'。研究对象骨髓是一种如海绵样的胶状组织,是人体的主要造血器官。正常情况下,骨髓是唯一能产生红细胞、粒细胞和血小板的场所,同时,骨髓也产生淋巴细胞和单核细胞。造血器官内的各种造血细胞按一定的规律发育成各种成熟血细胞,然后释放入血循环中。造血细胞的生长发育过程可分为造血干细胞、造血祖细胞、幼稚及成熟细胞三个阶段。造血细胞生长发育模式如图一所示`'】。 第章绪论螂一匆咖申扛令自胃月七一徽扭翻臼稗刀母娜妇妞阵倪月口曰趁笠愧弃缀一一二`瓜嘴策愧姚。节砚氏州,,”,怡翻口胜韶知理声斌“映花,日`必扮平自瞬黔一漂令爱一透翔级惫,翻脚勇竺州泊争,附翔晚雄已城,,口月`登一势奋一搜乡一吵月刀切协碑刀处渔刀色袭育下水系图一血细胞发育体系一国内外发展现状及临床应用医学显微图像处理是近几十年来发展起来的新兴技术,其中血液白细胞图像自动识别是其中的代表性课题之一,从六十年代至今,国内外出现建立了专门研发或附带研发医学图文分析报告系统的医疗仪器公司或实验室,同时也推出了一些商业的产品。六十年代,与研发了分析血涂片的全自动研究系统,它通过自动扫描平台对血液涂片扫描以获取白细胞图像,经数字化后提取细胞的各种特征参数并进行分类识别。七十年代末,出售的商业化细胞分类机,它们的识别误差更是减小到了人工误差范围内。八十年代,出现了基于彩色图像技术的血细胞分析仪,其中的细胞图像分析仪,它能对骨髓细胞中的粒系和红系细胞提取多达个参数并自动分析,但该分析仪对 福建师范大学工学硕士学位论文骨髓细胞的识别精度并不理想。九十年代至今,随着计算机技术的进步,以及图像处理、模式识别技术的发展,血细胞分析仪的技术与性能正在日趋完善。目前,白细胞三分类的血球计数仪己普遍使用于各医院实验室,将白细胞分成三大类型,有淋巴细胞群、粒细胞群和中间细胞群。这些仪器不仅能提供更多的血细胞学实验参数,而且还能提供相应的血细胞分布直方图。一全自动血细胞分析仪是日本公司生产的一种对白细胞进行五分类计数的全自动血细胞分析仪仪器。采用电阻法和激光技术相结合的原理,运用半导体激光流式细胞分析系统结合核酸荧光染色技术,当怀疑有异常细胞时自动报警提示。美国雅培公司制造的一型全自动血细胞分析仪,对白细胞分布直方图进行了观察和分析。但是白细胞三分类分析仪还是存在一定的缺陷,它虽然可以避免人为的计数误差,使计数结果正确,提高了工作效率,给日常工作带来了很多的便利,但同时也对白血病患者准确进行白细胞分类计数存在着明显的缺陷,例如它无法正确识别幼稚细胞,对于血病患者不能为临床提供一个正确的分类结果,因此医务工作者必须正确识别白细胞直方图,进行全面综合分析,及时采用涂片镜检,才能防止血液幼稚细胞的漏检,为临床提供可靠的检验。国内从八十年代初开始从事细胞诊断方面的工作,成立了癌细胞自动识别研究协作组,取得了一些成果。关于血细胞自动识别分类方面的研究,九十年代初,华东师范大学等也曾初步研究过白细胞显微图像的自动识别问题后来,东南大学影像分析研究所利用微机和单色采集白细胞图像,较系统地研究了白细胞的自动识别问题,但由于采用单色灰度图像,使得细胞分割、特征描述方法等存在一定难度,导致识别准确率不太理想西安交通大学以彩色获取的一真彩色显微细胞图像为对象,从信息融合的不同层次上深入地研究了外周血细胞的真彩色图像识别系统的图像处理和模式识别方法「川。国内公司推出的数码医学图像分析系统,如体视学形态定量分析、骨髓图像自动分析、细胞图像自动分析,具有数码图像兼容模拟图像采集、显示、处理图像分割、图像和图形编辑等、组织细胞结构参数和光密度计量分析的功能,对多个细胞测量,给出统计学处理参数为病理诊断提供可靠的形态参数。该系统可应用于形态计量分析、病理辅助诊断、远程病理会诊和单、多终端或大屏幕投影的形态学教学。 第章绪论但由于骨髓涂片和血液涂片的生物细胞信息含量太大,细胞图像种类太多,形态太繁杂,因此骨髓和血液细胞计算机自动化形态学分析是世界性难题。又由于骨髓涂片和血液涂片报告的规范化程度不高,现有的骨髓细胞图像分析报告系统离智能化和规范化还相差很远,特别是缺少细胞形态的定量研究。目前,所有的骨髓细胞图像分析报告系统只能对血细胞结构如细胞浆、细胞核等进行一种大体的形态学描述,缺少量化和数值依据。因此本文在新的骨髓细胞图像分析报告系统中,将逐步建立对这一方面的细胞形态学量化参数,当然这些参数的实用价值还有待于临床检验人员在实际临床工作中进行检验。论文内容和组织结构本论文以骨髓涂片中的急性白血病细胞为研究对象,通过采用图像处理和分析技术来实现白血病细胞的分析,重点放在利用的图像分割算法进行显微图像的预处理和白血病细胞的种类特征值的提取与分析。论文采用的主要技术路线及研究方法如图一所示图像采集输入一口州图像灰度化图像分割特征值提取特征值标准化呈丈了飞否学习神经网络学习神经网络分类权值输出结果输出图一技术路线流程图一 福建师范大学工学硕士学位论文论文的创新表现在以下两个方面在图像分割过程中,提出基于小波变换的分水岭分割方法,采用小波变换与分水岭算法相结合的方法来克服细胞的粘连问题。实现白血病细胞特征的量化,并将量化后的特征参数进入神经网络进行训练和分类,并分析这些特征在分类中的有效性。 第章急性白血病的分类及临床病理特征第章急性白血病的分类及临床病理特征前言白血病是一种发病原因未明的血液病,其特点是白血病细胞在骨髓及其他造血组织中呈恶性,产生各种症状,其中外周血中细胞有量和质的变化。依据白血病细胞的分化程度和自然病程的长短,可分为急性和慢性两大类。急性和慢性白血病可再根据癌细胞的类型,分为若干型。如急性白血病又分为急性淋巴细胞白血病,和急性非淋巴细胞白血病一卿,。由于样本关系及涉及到的相关知识,本文主要对某些类急性白血病的分类做些研究。急性白血病的分类及临床病理特征根据国际上通用的法、美、英协作组的、、分类,急性白血病主要分为急性淋巴细胞白血病和急性非淋巴细胞白血病两大类。急性淋巴细胞性白血病多见于儿童和青年人。根据形态学和免疫学特点可分为不同的亚型。根据瘤细胞形态将急性淋巴细胞性白血病分为,,和型`。型细胞较小,大小一致。核较大,圆形,染色质均匀、细致,核仁不明显。胞浆少,嗜碱性。原始和幼稚淋巴细胞以小细胞直径引林为主。这种类型多见于儿童。型细胞较大,约为正常成熟小淋巴细胞的倍。细胞大小不一,胞浆丰富,嗜碱性。细胞核形状不规则,有些有裂隙或切迹或呈折叠状,常有个明显的核仁。原始和幼稚淋巴细胞以大细胞直径林为主。这种类型多见于成人或大年龄儿童。型细胞大,大小一致。胞浆丰富,嗜碱性,深蓝色,胞浆内常有小空泡。细胞核圆或椭圆形,外形规则。染色质致密、均匀,呈点彩状,常有一个或多个明显的核仁。急性非淋巴细胞白血病多见于成人,儿童较少。多能髓细胞样干 福建师范大学工学硕士学位论文细胞在分化过程的不同阶段都可发生恶变,因此的细胞来源不同,可分为多种类型。分类根据白血病细胞分化的程度和主要的细胞类型分为至等七个类型`。型急性原粒细胞白血病未分化型,大多数瘤细胞为原粒细胞,少数为早幼粒细胞。型急性原粒细胞白血病分化型,瘤细胞包括多数原始粒细胞和多数早幼粒细胞及多少不一的中幼粒以下的细胞。型急性早幼粒细胞白血病,以早幼粒细胞为主。型急性粒一单核细胞白血病,瘤细胞包括粒细胞及单核细胞两种方向分化。粒细胞同,但同时有多数幼单核细胞和单核细胞。型急性单核细胞白血病,以原单核细胞为主或以幼单核细胞为主。型急性红白血病,瘤细胞以畸形、多核或分叶状核的原红细胞为主,同时有原单核细胞和早幼单核细胞。型急性巨核细胞白血病,主要为多形性、未分化的原巨核细胞。样本采集我们从福建医科大学附属协和医院血液细胞室选择染色较满意的急性白血病初诊骨髓片,经病理专家复查选出前后两次诊断一致的病例共例,每个病例选一幅骨髓涂片图像。由于急性白血病的分类复杂,再加上实际取得的研究样本不齐全,要研究全部的类型显得不可能,所以只选出其中类,即,和型并对其骨髓涂片来做具体研究。根据分型标准,急性淋巴细胞性白血病中,、型例,急性非淋性白血病中,型例,型例。以下是类急性白血病的骨髓像 第章急性白血病的分类及临床病理特征替黯熟图一,骨髓像一、左图有核细胞增生活跃,细胞成堆分布右图胞浆量少,核仁小且不清楚。兴淤翻图一骨髓像一。左图骨髓增生活跃右图颗粒增多的异常早幼粒细胞极度增多。图一。骨髓像一左图原单细胞显著增多,细胞大小悬殊,核浆较大右图原单细胞增多,细 福建师范大学工学硕士学位论文胞成堆分布。本章小结本章介绍了急性白血病诊断及一般传统分型标准。传统的诊断白血病的传统方法分型,它以细胞形态学和细胞组织化学为手段,通过瑞氏染色和显微系统来确定白血病的类型。此外对急性白血病的分类及临床病理特征,特别是对实际取得的类急性白血病的细胞形态和骨髓像的病理特征做了一个较为粗略的介绍,为之后的图像处理及分类识别工作做好准备。 第章图像分割方法及改进第章图像分割方法及改进前言图像分割就是对图像中有物理意义的连通区域的一种集合。图像分割的目的就是为了进一步对图像进行分析、跟踪、识别等工作,因此分割的准确性直接影响后面一系列工作的有效性,具有非常重要的意义。对于一幅我们所研究的白血病细胞图像,它主要包括四个区域白细胞的细胞核、细胞质、部分红细胞和背景。背景是图像的高亮部分,对应的图像区域灰度值最大,红细胞和白细胞的细胞质区域具有中等灰度值,白细胞核的灰度值最小。不同类型、不同成熟阶段的白细胞图像,细胞质、细胞核的颜色纹理也不一样,而且细胞的大小,形状,颜色等因素会因某种疾病而改变。对于这样的图像,分割是比较困难的。特别是白血病诊断中常用的骨髓涂片,其中细胞图像形态变化更复杂且常粘连,因此分割变得更加困难。图像采集骨髓涂片制作经骨髓穿刺后抽取骨髓液,采用瑞氏染色法,用载玻片制成涂片。使用一型生物显微镜、彩色摄像机如图一所示将骨髓涂片经倍油镜放大后获取骨髓细胞微米级的显微图像,并利用彩色图像采集卡将获取的图像进行数字化转换。采集到的数字图像的尺寸为像素,颜色深度为位、、每个通道各位。本文使用的骨髓样本由福建医科大学附属协和医院提供,主要以四种急性白血病类型为主,分别为急性淋巴细胞白血病型、颗粒增多的急性早幼粒细胞白血病细颗粒型型和急性单核细胞白血病。型。 福建师范大学工学硕士学位论文图一一型生物显微镜一产一图像彩色空间的转换彩色空间模型是一种根据不同的应用目的而提出的表达颜色的模型,一般是用一个三维颜色坐标系统来表示的。通常,各种颜色模型都是以、、三基色为基础的,这些模型仅仅规定范围内的各种颜色。模型常用于彩色监视器和其它彩色光栅显示器。有时,为了更好地反映人眼对颜色的直观感受,可以经过一非线性变换将空间转换到其它三维空间。颜色模型模型是用用三个分量值来表示颜色,几乎所有的颜色都能由三种基本颜色混配出来。在彩色空间的原点上,任一基色均没有亮度,即原点为黑色。三基色都达到最高亮度时则表现为白色,亮度较低的等量的三种基色产生灰色的影调,所有这些点均落在彩色立方体的对角线上,该对角线被称为灰色线。彩色立方体中有三个角对应于三基色一一红、绿、蓝。如图一、图一、图一所示,它们分别是我们通过实验,对图一进行分离后得到的红色、 第章图像分割方法及改进绿色、蓝色分量。图一红色分量图像图一骨髓涂片样品原图一一一图一绿色分量图像图一蓝色分量图像一一彩色图像常用模型来表示,但三分量之间常有很高的相关性,由于在血液涂片的制备过程中染色条件的变化,以及在摄取彩色细胞图片时光照等条件的不同,拍摄到的彩色图像中,细胞的彩色分量的分布将产生较大的变化,因此直接利用、、这些分量常常不能得到所需的效果。为了降低彩色特征空间中各个特征分量之间的相关性,以及为了使所选的特征空间更方便于彩色图像分割方法的具体应用,实际中常需要将图像变换到其它的彩色特征空间中去,使得细胞的特征在该空间上对染色及光照条件变化不敏感,以保证细胞的稳定提取。 福建师范大学工学硕士学位论文颜色模型与模式相比,由色调、饱和度和亮度组成的颜色空间更加符合人的视觉规律。色调是彩色彼此相互区分的特性。可见光谱不同波长的辐射在视觉上表现为各种色调,如红、橙、黄、绿、蓝、紫等。通常,色调用“度”来表示,在一的标准色上是按位置度量如红或、黄、绿一、蓝等。饱和度是指彩色的纯洁性,也就是颜色的深浅程度,可见光中各种单色光是最饱和的彩色。光谱色中掺入白光成分越多,就变得越不饱和。通常,饱和度用百分比来表示,百分比越大,饱和度越大。范围在灰色到完全饱和中变化。亮度是颜色的相对明暗程度,通常用从黑到白的百分比来度量。彩色光的亮度越高,人眼就觉得明亮。色彩空间可以用一个圆锥空间模型来描述。用这种描述色彩空间的圆锥模型相当复杂,但确能把色调、饱和度和亮度的变化情形表现得很清楚,如图一所示。其中,纵轴表示亮度,亮度值是沿着圆锥的轴线度量的,沿着圆锥轴线上的点表示完全不饱和的颜色,按照不同的灰度等级,最亮点为纯白色、最暗点为纯黑色圆锥纵切面描述了同一色调的不同亮度和饱和度关系圆锥横切面色调为绕着圆锥截面度量的色环,圆周上的颜色为完全饱和的纯色,饱和度为穿过中心的半径横轴。通常把色调和饱和度统称为色度,用来表示颜色的类别与深浅程度。由于人的视觉对亮度的敏感程度远强于对颜色浓淡的敏感程度,为了便于色彩处理和识别,人的视觉系统经常采用色彩空间,它比色彩空间更符合人的视觉特性。在图像处理和计算机视觉中大量算法都可在色彩空间中方便地使用,它们可以分开处理而且是相互独立的。因此,在色彩空间可以大大简化图像分析和处理的工作量。如图一、图一、图一所示,它们分别是我们通过实验,对图一进行分离后得到的色调、饱和度和亮度分量。 第章图像分割方法及改进竺狱一曰〔军乡扩、图一颜色模型图一色调分量图像一一图一饱和度分量图像图一亮度分量图像一一模式到模式的转换在图像分割中,模式难以直接进行分割,只有将它们转换成模式后进行。与颜色模型的转换关系如式一、一、一所示。在实际处理时为了提高计算机的运算速度,将三分量量化为【。,的整型数值。,、。一,二一一二二一二二大,,方任,又入行万一 福建师范大学工学硕士学位论文厂、三一。【,厂」一生一、一一产…“'卜一。、,一,。一一,与'、刀。,一图像分割方法的基本概念及方法闽值分割法图像闭值分割是一种广泛使用的图像分割技术。它利用图像中要提取的目标物与背景在灰度特性上的差异,把图像分为具有不同灰度级别的目标区域和背景区域的组合。选取一个合适的闭值,以确定图像中每个像素点应该属于目标还是属于背景,从而得到相应的二值图像。这种方法是先确定一个处于图像灰度取值范围之中的灰度闭值,然后将图像中各个像素的灰度值都与这个闭值相比较,并根据比较结果将对应的像素划分为两类像素的灰度值大于闭值的为一类,像素的灰度值小于阂值的为另一类。反映在图像直方图上,不同的目标和背景对应不同的峰,选取的闭值应该在两峰之间的谷上,从而将各峰分开。轴嫩图一阖值分割示意图一 第章图像分割方法及改进阂值法对物体和背景对比比较强的景物分割有较强的优势,且计算比较简单,可以用封闭和连通的边界定义区域。通过设置灰度级门限,可将直方图划分为两段。一段对应于背景,一段对应于物体,从而实现图像的二值化分割,这个过程可以表示为,、了且︸如尉,力之关`、夕一一如卿,其中,为阂值或门限。区域生长法图像分割是依据图像的灰度、颜色或几何特征将图像中具有特殊含义的不同区域分开,这些区域是互相不相交的,每一个区域都满足特定的区域的一致性。区域生长的基本思想是将具有相似性质的像素集合起来构成区域如一。具体步骤是先对每个需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与种子像素有相同或相似性质的像素根据某种事先确定的生长或相似准则来判定合并到种子像素所在的区域中。将这些新像素当作新的种子点重复上述的过程,直到没有满足条件的像素被包括进来,这样一个区域就生长完了。种子点图一区域生长示意图一分水岭分割法分水岭变换的基本思想是根据水面浸没地形的过程提出来的。如图一所示,在每个区域的最低处,水以均匀速度上升,从低到高淹没整个地形。当处在不同汇水盆地中的水将要聚合在一起时,修建的大坝将阻止聚合。水只能达 福建师范大学工学硕士学位论文到大坝的顶部,大坝的边缘即为分水岭的分割线。传统的分水岭算法采用数学形态学运算来实现,即先用最终腐蚀标记所有粒子,所谓最终腐蚀是指腐蚀处理时不能使粒子消失,处理结果使每个粒子收缩成一个点。然后用条件膨胀标一记生长出粒子,所谓膨胀是指将膨胀限制在原始集合内,同时当两个粒子靠得很近时不能有连接部分。为了区分不同的汇水盆地,这些汇水盆地必须分别标上不同的记号。相同的一记号代表相同的汇水盆地,也就是相同的区域。所有的区域属性虽然不同但可以被归类,有着相同属性的区域将代表某种特殊意义。算法从图像的最小灰度值开始处理,逐步递增其灰度值,即逐步抬高水位,当水淹到某一个高度,可能会使两个不同的汇水盆地的水合并在一起时,便在此两个不同的蓄水池的接触线筑起一道水坝,将这两个不同的汇水盆地隔开。图像会有许多的高低起伏,因此要建很多水坝,也就是会有很多的分水岭。当图像从灰度最低点淹满整张图片,便可以分隔出许多区域,这些区域就是分水岭算法的分割结果。灰度值图一分水岭算法示意图一逐渐升高水位实现图像的分水岭分割的过程可通过以下步骤实现检查每个像素的邻域像素,若中心点周围的像素都没有赋予记号,表示相邻区域都高于水位,这时赋予中心点一个新的记号,如图若相邻区域的其中任何一个像素已被标上记号,而这个记号并不是分水岭时,那么这个中心点与相邻区域应属于同一个汇水盆地,所以中心点的记号与相邻区域的记号是一致的,如图若相邻区域有二种以上的记号,表示中心点处于许多汇水盆地之间, 第章图像分割方法及改进为了分别不同的区域,将中心点视为分水岭,标上代表分水岭的记号,如可以设定为一,如图所示,重复将此方法可完成分水岭分割。四睦目相邻区域没有卷标为中心点贴上新的卷标相邻区域己有卷标且只有一种,中心的卷标应与新区域的卷标相同相邻区域有个以上卷标,因此中心点应为一图一标记示意图一传统分水岭分割的改进骨髓涂片中白血病细胞常互相粘连,而外周血涂片中白细胞的分布却很分散。在外周血中,正常情况下成熟红细胞与有核细胞之比为,如图一而在骨髓中,白血病样本的有核细胞明显增生如图一,成熟红细胞与有核细胞之比达到,甚至卜。通常,分水岭分割算法会由于噪声和其他诸如梯度局部不规则性的影响而造成过度分割,使结果变得毫无意义。一个较实际且简单的解决方案是加入一个预处理阶段。首先确定图像中目标的标记,然后再进行生长,并且在生长的过程中,仅对具有不同标记的流域,才建筑防止溢流会合的堤坝,以产生分水线,这就是应用标记的分水岭变换。图像的背景和目标的内部区域对应图像灰度图中灰度较低的位置,而目标边缘则对应梯度图中的灰度较高的位置。我们分别采用一个内部标记集合处在每一个感兴趣对象的内部和一个外部标记集合包含在背景中,标记的选取用基于灰度级值和连通性的简单的过程分类。这里我们采用线性滤波和非线性滤波处理实现计算梯度图像的内部和外部标一记符。 福建师范大学工学硕士学位论文图一外周血涂片样品图一白血病的骨髓涂一一本文采用小波变换与分水岭算法相结合的方法来克服细胞互相粘连的问题。图一表示的是我们整个改进算法的流程图,具体步骤是首先利用小波变换在原图的梯度图上产生多分辨率图像,然后对低分辨率图像进行应用标一记的分水岭分割。最后利用小波反变换,得到高分辨率的分水岭结果。原始灰度梯度图像小波变换低分辨率图像内部标记外部标记小波反变换高分辨率图像结果图一算法流程一 第章图像分割方法及改进小波变换发展背景小波变换是在傅立叶分析的基础上发展起来的,是一门新兴学科。由于小波分析在时域和频域同时具有良好的局部化特性,极大解决了传统傅立叶分析中出现的问题,近十多年来,其理论和方法在许多邻域,如信号处理、语音分析、模式识别等中都取得了重要的应用。小波变换既可以分析信号的概貌,又可以分析信号的细节,是分析非平稳信号的强有力工具。由于人眼对图像中平滑区域的变化较敏感,而对纹理和边缘处的微小变化不太敏感,小波变换后,纹理和边缘特征大都集中在细节分量子带中。因此小波变换近年来在计算机视觉和图像处理领域得到了很好的应用。连续小波变换及反变换的定义设函数“满足工冲一。条件,和”分另是申`缩`口平移因子,刁·波函数就是通过将函数平移和伸缩而产生的一个函数簇,尹,一,。。二。一`、业“卜,。·,·,。通常称为基本小波。令刀为可测的,平方可积函数的矢量空间为实数集,对于任意的。尸的连续小波变化定义如下,。。众,。一一伽硕宁卜一写成内积形式为一峨,。·了,。。它对应于。厂在函数簇。上的分解,且这一分解必须满足以下可容性条件一一一厂卿田军骂。。或“冲其中。是的傅立叶变换。 福建师范大学工学硕士学位论文由式一可知,函数可以描述为一带通滤波器的脉冲响应,因此小波变换式一、一可以描述为函数尸通过一带通滤波函数的输出,且具有频率放大的作用放大系数为。因此小波变换的逆变换可以写成一了`,·亩`你,,,“离散小波变换当对数字图像进行处理时,一般采用离散小波变换。离散小波变换可通过对伸缩因子和平移因子的取样而实现。丁,。罗其中。。一力。。天,、,则由式一,可得用,。,'一。一因此离散小波变换可定义为一。呱、。一,,。,任'离散小波反变换为作下下二一呱,。二。么一刀昨。,。一蕊实验结果及分析图一显示的是我们通过实验,直接利用直方图选取闭值进行图像分割的结果。闺值分割法的优点是算法简单,且总能用封闭而连通的边界来定义不交叠的区域,缺点是对目标与背景反差较小的景物很难得到精确的目标边界。经过大量实验得知,白细胞图像在用三分量表示的图中,在分量图中,细胞的核区和背景有较好的独立性,从分量图像直方图,如图一 第章图像分割方法及改进可见存在较明显的两类分布,从左到右分别代表核区和背景。由于、、三分量间有密切的相关性,并且在血液涂片的制备过程中染色条件的变化,以及在摄取彩色细胞图片时光照等条件的不同,所摄取的彩色图像中,细胞的彩色分量的分布将发生较大的变化,为此进行向彩色空间的变换,利用空间中色度信息独立性的特点,在图像中通过双闭值确定细胞核的色度变化范围,将细胞核分割出来,如图一。`原图分量的直方图璐、卜心,甘幼呼白利用分量的闺值分割利用分量的阂值分割图一阂值分割结果一图一是我们利用区域生长的分割方法进行图像分割的实验结果,从结果可得区域生长法虽然可以得到封闭轮廓,但是它的缺点是需要人工交互获得种子点,这样必须在每个需要抽取的区域中选择一个种子点。选取的种子点不同,得到的分割效果也不同,如图一、一。图一中,两个粘连的细胞 福建师范大学工学硕士学位论文被分割开来。种子点变换前种子点变换后图一区域生长分割图一图一显示的是利用传统分水岭算法及经过改进后的分水岭算法的分割结果。在使用分水岭变换之前,通常要使用梯度幅度来预处理图像如图一。梯度幅度图像会在沿对象的边缘处有较高的像素值,在其他地方有较低的像素值,因此分水岭变换会在沿对象边缘处产生分水岭脊线如图一。从图一中可见,传统的分水岭变换直接用于梯度图时,由于噪声和梯度的影响,会造成许多假性小区域的存在,导致过度分割的问题。图一至一则显示的是经改进后的分水岭算法。图一和一分别对梯度图做一级小波变换和二级小波变换。图一为对原始图像的一级小波变换进行应用标一记分水岭分割的结果,分割的区域个数为。图一同样是对原始图像二级小波变换后运用同样的方法进行分割得到的结果,最后得到分割的区域个数为。结果说明将小波变换和应用标记的分水岭分割算法相结合,可以有效的防止过度分割。利用该方法能得到单像素宽的、连通的、封闭的轮廓,特别适合粘连区域的分割。但是它的缺点是处理过程复杂、计算量大,此外如果待分割的两个粘连区域面积大小悬殊时分割失真比较严重。 第章图像分害方法及改进梯度图分水岭脊线传统分水岭分割结果一级小波变换为外标记分割结果 福建师范大学工学硕士学位论文二级小波变换内外标记分割结果图一传统分水岭算法及改进后的分割结果一本章小结本章介绍了处理彩色图像的基本原理,彩色图像常用模型来表示,但三分量之间常有很高的相关性,因此为了降低彩色特征空间中各个特征分量之间的相关性,以及为了使所选的特征空间更方便于彩色图像分割方法的具体应用,根据实际需要将图像变换到颜色模型,提取饱和度图像,使得细胞的特征在该空间上对染色及光照条件变化不敏感,以保证细胞的稳定提取。之后,本章又系统介绍了几种对白血病骨髓图像进行分割的算法,比较各类算法的优缺点,分析各自的适用范围,并在此基础上根据所处理图像的实际情 第章图像分割方法及改进况对传统算法做出一些改进。采用小波变换与分水岭算法相结合的方法来克服细胞的粘连问题。首先利用小波变换在原图的梯度图上产生多分辨率图像,然后对低分辨率图像进行应用标记的分水岭分割。最后利用小波反变换,得到高分辨率的分水岭结果,实现对图片更准确地分割。 福建师范大学工学硕士学位论文 第章白血病细胞形态特征提取第章白血病细胞形态特征提取前言长期以来,研究生物体细胞学和病理学的主要手段一般是通过细胞和组织形态的特征分析,目前许多血液疾病的临床常规检查还是依靠观察和计算血细胞的体积、表面积、细胞及细胞核的形态等等。在诊断白血病时,由于骨髓细胞种类较多,同一类别不同成熟阶段的差别又比较细微,病变细胞的特征难以描述等原因,所以对特征的选取和测定也提出了较高要求。细胞形态特征属于外部特征,可从分割图像上直接测量。特征选择同样也是重要的一步,过多的特征使得特征空间维数极大地增加,导致样本训练量增大,而且会带入噪声,损害所生成分类规则的精度。目前从白血病样本中提取不同类别、不同成熟阶段细胞特征这方面的研究还是较少的。。从个白血病患者骨髓与外周血中得到种血细胞,并分别提取了个形态学特征。不过这个系统的细胞分割过程仍然需要人工辅助完成,而且提取特征基础上只对细胞分类,没有对白血病分类【'。。等分析毛细胞白血病时的异常大细胞的形态特征,并实现与正常淋巴细胞的区分针对慢性淋巴白血病细胞帅,得到形态学、颜色和纹理特征。等从急性非淋巴白血病。”,患者的髓细胞中提取了原粒细胞等四种未成熟细胞的众多特征,并讨论了细胞的预处理问题。。等针对中的种不同骨髓细胞提取了多方面的特征,并讨论了白血病细胞的特征选择问题。以为研究对象,提取外周血中淋巴细胞、原淋巴细胞的种特征】。总之,目前在特征提取方面,大部分研究是以白血病种类分别进行特征提取,这样得到的特征量是宏观的反映,在此基础上进行分类虽然简单快速,但是不能反映出各类细胞的变化,与分型思想也是不一致。另一方面,特征提取的对象往往是正常的细胞,没有将形态发生病变的细胞特征量化。若能在医师的指导下,把专家的描述变成量化的特征,这将有助于白血病的分类诊断。细胞特征参数的选取和计算是细胞自动识别的关键,在对细胞图像进行特征提取时,首先要了解各类细胞的特征,特别是良性细胞与恶性细胞之间的区 福建师范大学工学硕士学位论文别。病理专家在对癌细胞进行识别时,往往从细胞的核浆比例、细胞核颜色深浅、细胞变异程度等具有代表性的特征入手。这些特征我们可以用从原始图像中抽取的数字特征进行一定程度上的近似描述,根据抽取出的细胞特征,就可以对其进行正确的分类识别,得到诊断结果。因此,特征选择是构造分类器中一个重要环节。对于从细胞图像中提取的众多特征来说,除了靠医生的临床经验确定哪些特征较典型以外还需要根据各特征在算法中体现出的实际分辨能力进行筛选。这里采用细胞周长、细胞面积、核周长、核面积、细胞形状因子、核形状因子、核浆比等这些细胞形态学特征参数,这些形态参数直观反映了细胞核、细胞浆以及细胞的形状和大小的变化。特征提取方法对物体形状表示和描述的方法有很多种,本论文采用的是对二值分割图像进行区域边缘的跟踪,利用基于区域边界的链码和基于区域的线段表示来提取形态学特征参数从而获得其形态特征。图像中包括许多对象区域,如何将他们找出来,并进行分析研究是图像处理的一个重要任务。因此,描述区域的数据结构非常重要。本论文中采用两种方法来表示区域,即轮廓表示法和水平线段端点表示法。轮廓表示法基于区域边界上相邻像素的连通性,沿区域边界走一圈后回到起点,最后得到一段封闭的曲线,适用于轮廓完整,但内部像素性质不一定相一致的区域分割。线段表示法基于相邻线段的连通性,适用于区域内部像素具有相同性质的区域分割。图一,和图一,】给出了这两种表示法的例子,字母顺序表示了编码的次序。 第章白血病细胞形态特征提取申二硫味叩尹冲`冲巾冲申一轮廓表示法一线段表示法一一链码链码是图像处理中描述物体的种常用方法,它是用顺次连接并具有指定长度、方向的直线段组成的边界线,在获取链码之后,就能够比较方便的计算出物体的一些特征信息了。通常四连通或八连通用来定义链码,本文中使用的是八连通链码。八连通链码八连通链码是用中心像素指向它的八个相邻的方向来定义的,每个方向使用数字编号方法进行编码。为此,我们定义、、、、、、、这个方向符,它们分别表示、、、、、、、,如图一所示的这个方向。此外,还定义偶数码和奇数码对应线段的单位长度分别为和拒。由于这个方向符可以给出相邻点所相对应的“坐标”。 福建师范大学工学硕士学位论文图一链码的八个方向一根据链码的定义,我们可以用表示单位长度和确定方向的直线段的数字表示一条折线,使用八连通链码,一条曲线最终可以由公式表示二””“,,一,,,…,一式中一曲线的链码如图一所示,假定网格空间为,方向,,,长度为,方向,,,的长度为扼。图中的黑点表示细胞的边缘像素点,如果以点为链码的起始点,沿顺时针方向获取链码,可以得到该细胞的链码序列为。使用八连通链码来提取细胞的形态特征,物体轮廓的跟踪可依照链码的方向进行,下一个跟踪点的取得依赖于上一轮廓点,从而避免了对所有像素点的扫描,增加了轮廓跟踪的效率,这样不但可以提高处理速度,准确进行计算,而且节省存储空间。刘飞、香专公一户一石习白晤月二`、二功卜,一一月目``洲'图一链码表示的线段一 第章白血病细胞形态特征提取链码表的结构在图像处理中,我们将链码表存放在一维数组中。数组的第、第单元存放边界起点的、坐标,第单元存放链码的个数和边界的点数,第单元开始存放链码序列,如表一所示田。表一链码表结构一下标存放点一在一个的邻域中,中心点与其上、下、左、右点的距离为,与斜角的点的距离为拒,因此可以利用边界的链码表计算区域的周长,即对偶数号链码和奇数号链码分别计数,然后将偶数号链码数和奇数号链码数与万的乘积相加即得区域得周长。计算区域周长程序代码为区域的链码表返回值为区域周长,,,二刀取边界点数」,奇数链码计数刀偶数链码计数计算周长线段表的定义线段表示法基于相邻线段的连通性,适用于线段内部像素具有相同性质的区域分割。我们将区域看成是由一条条水平的线段所组成的。每一个线段可由两个端点表示。将区域中所有水平线段按照顺序排列起来得到的端点表称为线段 福建师范大学工学硕士学位论文表。实现线段表最简单的方法是定义一个结构的表。〕,表中相邻两个端点的表示一根水平线段,如表一所示。表一线段表一端点坐标,,,,,,,,线段利用线段表可以很方便的获取区域内部的像素数据,并依此计算,例如计算区域的面积。以下分别是计算面积和形状因子的程序代码,为线段表,为线段表中的端点数返回值为区域面积`一产少矛洲︸右端点构成一条线段」一【」,、为区域的周长与面积返回值为区域的形状参数链码表与线段表的转换图像处理中,在计算某些细胞的某些参数时必须要取得区域内的像素数据由于链码表无法直接区别区域的内外,因此难以实现所需要的处理要求。所以在得到链码表之后,还需进一步地将它转化成线段表,由线条来表示区域,获 第章白血病细胞形态特征提取取像素数据为后续处理做好准备。边界点的分类根据实际应用中的需要,中我们将边界点分为三中类型左、右边界点该点的右左边为区域中的点,而其左右边不是区域中的点,则称为左右端点。如图一中、、点为左端点,、、点为右端点。中间点该点的左右两边都是区域中的点。如图一川中、点为中间点。奇异点封闭区域边界上的极值点,其左、右两邻点均非区域中的点,则此点成为奇异点。如图一中的点。中二申申巾二巾巾二巾二申二巾…中巾巾巾角巾二自晰二…巾中…申小巾巾…中巾巾申…巾申巾水…二哈…二巾图一边界点类型一类型转化边界点类型的定义为了便于实际处理,我们给各类点进行了编码,定义中间点的类型为,左端点为,右端点为,奇异点为。转化表结构我们采用表格形式来进行链码表到线段表的转换转换。转换表有两个变量,即进入该点的链码和离开该点的链码。链码有种类型,所以用二维数组构成一个的转化表,如表一所示。 福建师范大学工学硕士学位论文表一类型转换表一边界点类型〔右下离开的链码角表格数值进入的链码线段表的生成先扫描链码表,根据类型转换表确定各边界点的类型,线段表的生成步骤如下按链码表顺序提取区域水平线的左、右端点将左、右端点的坐标存入一个临时数组中,为保证每个线段有两个端点,奇异点的坐标应存两次,中间点坐标不存入数组。将线段表中的端点按坐标的大小排序同一行内各端点按坐标大小排序最后得到所需的线段表,表中从表头开始每两个点组成一条线段。细胞形态学特征参数使用八连通链码和线段表得到的形态学特征参数及各自代表的意义细胞周长链码所围细胞区域的周长,即链码的长度五。。拒一式中一一链码中偶数码的数目一一链码中奇数码的数目。 第章白血病细胞形态特征提取〔细胞核面积︺,艺,,',其中,力一,,任,一,,必表示细胞的核区域细胞面积`产`·艺`,,其中`,了一,,任一,,茫表示细胞区域细胞核与细胞面积之比核质比二一核质比用来描述细胞的成熟情况。在细胞成熟过程中,胞核逐渐缩小巨核细胞例外胞质量逐渐增多,由核大质少,变化为核小质多,即由高核质变为低核质比。形状因子斌尸一形状因子用于描述细胞区域与圆形的偏离程度。在相同面积的条件下,细胞区域边界光滑且为圆形,则周长最短,其圆度为。细胞区域的形状越偏离圆形,则越小。特征值标准化特征值标准化是指通过变换处理将数据限制在,或,区间内。经过测量得到的细胞特征参数大多数要经过标准化处理后才能进入人工神经网络进行训练。对于形态学特征参数,由于似圆度和细胞核浆比取值范围都在,之间,因此只对周长、细胞面积进行标准化处理,换算公式如下石二习。一万二。一。测量获得某类周长最大值测量获得某类面积最大值。 福建师范大学丁学硕学位论文本章小结本章重点介绍了图像特征提取的方法,分别利用八连通链码取得细胞边界的像素数据。由于链码表无法直接区别细胞的区域内外,在实际应用中,我们还需要进一步取得区域内的像素数据来进行各种参数的计算。因此在得到链码表之后,再将它转化成线段表,从而提取细胞的周长、面积、核周长、核面积、形状因子及浆核比等数个形态学特征参数,并定量分析了参数的定义和算法及其在临床诊断中的参考价值,最后将这些细胞特征参数进行标准化处理。 第章神经网络及在白血病细胞识别中的应用第章神经网络及在白血病细胞识别中的应用前言人工神经网络简称神经网络,是对人脑或自然神经网络若干基本特性的抽象和模拟,是由大量神经元组成的非线性动力系统。人工神经网络是在对人脑神经网络的基本认识的基础上,从信息处理的角度对人脑神经网络进行抽象,用数理方法建立起来的某种简化模型。通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可以呈现出人脑的许多特征,并具有人脑的一些基本功能。人工神经网络具有高速信息处理能力和知识存储容量很大的特点,它可以看成是从输入空间到输出空间的一个非线性映射,它通过调整权重和阂值来学习和发现变量之间的关系,实现对事务的分类,。人工神经网络的发展历史人工神经网络的研究开始与世纪年代,它的发展经历了兴起、萧条和兴盛三个阶段。神经网络的理论、应用、实现以及开发工具均以令人振奋的速度快速发展,神经网络理论己经成为涉及神经生理科学、认识科学、数理科学、心理学、信息科学、计算机科学、微电子学、光学、生物电子学等多学科交叉、综合的前沿科学。目前,人工神经网络己经在科研、生产和生活中产生了普遍而巨大的影响“。神经网络原理年,和。提出一种利用误差反向传播衫练算法的神经网络,简称网络,是一种有隐含层的多层前馈网络,系统地解决了多层网络中隐含单元连接权的学习问题。如果网络的输入节点数为,输出节点数为,则次神经网络可看成是从维欧氏空间到维欧氏空间的映射,这种映射是高度非线性的。网络的结构如图一所示'】。网络分为输入层、中间层隐层和输出层。上下层之间实现全连接,而每个神经元之间无连接。当一对学习样本提 福建师范大学工学硕士学位论文供给网络后,神经元的激活值从输入层经各中间层向输出层传播,接着按照减小实际输出值与希望输出值的误差均方差的方向,从输出层经中间层逐层修正连接权值,最后回到输入层,这种算法就是“误差逆向传播方法”。叽对砚风以叹叹图一网络结构一网络的学习算法网络的学习过程主要由四部分组成、输入模式顺序传播,这一过程主要利用输入模式求出它所对应的实际输出。具体步骤又分为以下部分确定输入向量,,…,,,…,是学习模式对数。是输入层单元个数一确定期望输出向量一,,…,是输出层单元数一计算中间层各神经元的激活值一,艺叽一。,,,…,其中,」是输入层至中间层的连接权值氏是中间层单元的阂值是中间层单元数。激活层函数采用型函数,即二达一一一 第章神经网络及在白血病细胞识别中的应用计算中间层单元的输出值,一,卜一一一上一—一`一艺叽,已阂值已在学习过程中与权值一起被不断修改。计算输出层第个单元的激活值一`一艺叱,,,一只计算输出层第个单元的实际输出值,,,,…,一式中,、是中间层至输出层的权值弓是输出层单元阂值是型激活函数。、输出误差逆向传播在前一步的输入模式顺序传播中,得到了网络的实际输出值,当这些实际输出值与期望的输出值大于限定的误差时,就必须对网络进行校正,校正是从网络的输出层往前,依此经过中间层、输入层。具体步骤又分为以下部分输出层的校正误差为刃对一讨'广一式中,,,…,是输出层单元数,,…,是学习模式总数才是期望输出讨是实际输出厂讨是对输出层函数的导数。中间层各单元的校正误差为一一艺溅,广'其中,二,,…,是中间层单元数,,一是学习模式总数对于输出层至中间层连接权和输出层阂值的校正量为■代,二,衅,对一■,二。刃一 福建师范大学学硕十学位论文其中,对是中间层单元的输出衅是输出层的校正误差。二,,,…,,,是学习系数中间层至输出层的校正量为■叽氏刀弓,对一刀,弓一式中,弓是中间层单元的校正误差。,,··一是输入层单元数刀学习系数、循环记忆训练在训练过程中,模式顺传播与误差逆传播的计算过程反复循环进行,最后使得网络的输出误差趋向于极小值。对于网络输出的每一组训练模式,一般要经过数百次、千次的循环记忆训练,才能使网络记住这个模式。、学习结果判别每当循环记忆训练结束后,都要进行学习结果的判断。判断的主要依据就是检查误差是否己经在允许的范围之内。如果达到要求,就结束整个学习过程,否则还要进行循环学习训练。图一表示的是神经网络学习和分类的整个流程图 第章神经网络及在白血病细胞识别中的应用开始连接权及阑值的初始化选择网络学习的模式计算中间层各单元的输入、输出计算输出层各单元的输入、输出计算输出层各单元的校正误差计算中间层各单兀的校正误差调整中间层至输出层之间的连接权值及输出层各单元的输出闽值调整输入层至中间层之间的连接权值及中间层各单元的输出阂值更新学习输入模式全部模式训练完更新学习次数误差学习结束图一神经网络流程图一 福建师范大学工学硕士学位论文网络变量设计输入输出变量设计将所测量的细胞的形态学作为神经网络的输入变量,一共为个,分别为细胞周长、细胞面积、核周长、核面积、细胞形状因子、核形状因子及浆核比。输出变量代表系统要实现的功能目标,例如系统的性能指标,分类问题的类别归属,或是非线性函数的函数值等等。在本文中,输出变量就是要解决的急性白血病分类问题的类别归属。根据所收集的白血病骨髓图片的样本,确定了神经网络的三个输出变量,采用如下的形式来表示输出型急性早幼粒细胞白血病型急性单核细胞白血病型急性淋巴细胞性白血病隐层节点的选取网络隐层神经元的选择是个比较复杂的问题。隐含层节点的作用是从样本中提取并存储其内在规律。如果隐含层节点数量太少,网络从样本中获取的信息能力就差,不足以概括和体现训练集中的样本规律。反之,若隐含层节点数量过多,又可能把样本中非规律性的内容如噪声等也学会了,太多的隐含层节点数会减低网络的训练效果。根据定理,由于输入向量有个元素,即网络的输入层的神经元有个,所以隐含层节点数计算如下一式中一隐含层节点数一输入层节点数本文中,因此。根据计算,隐含层的神经元近似为个,隐含层的神经元个数并不是固定的,需要经过实际训练的检验来不断调整。在反向传播学习算法中,在初始权值时采用的随机给值的方法。这样做是为了取得均匀分布的小数。本文中所采取测试的方法如下学习结束条件反向传播误差 第章神经网络及在白血病细胞识别中的应用输入层节点数为,输出层节点数为,训练样例巧例学习速率为隐含层节点数固定的情况下,运行程序次网络学习算法的改进网络的缺点网络能够实现输入输出之间的非线性映射,并且网络的各连接权中分布储存了输入与输出的关联信息,但它也存在一定的缺点收敛速度慢局部极值较难确定隐含层与隐节点的个数。为了克服以上缺陷,我们对网络做了一些改进,引入动量项,改善网络的收敛性。引入动量项基于算法的神经网络,在学习过程中,需要不断地改变权值,而权值是和权值误差导数成正比的。通常学习速率冲是一个常数,并且专越大,权值的改变越大。所以在这里修改学习速率,使它包含有一个动向量,在每次加权调节量上加上一项正比例与前次加权变化量的值,它减小了学习过程的振荡趋势。带有动量项的加权调节公式为■砰`、·。婴口。,一引入动向量的效果就是使得学习过程中等效的改变刁值而不再是恒定的值。引入这个动向量之后,使得调节向着底部的平均方向变化,不至产生大的摆动,即动向量起到缓冲平滑的作用。若系统进入误差曲面平坦区,那么误差将变化很小,■近似等于■。 福建师范大学工学硕士学位论文实验结果及讨论实验方法对制作好的骨髓涂片在光学显微镜下使用数码相机对其进行拍摄,并将图像传入到计算机中。计算机分析输入图像,根据有关信息,分割感兴趣的组织区域等处理后使用链码法及线段法测量细胞的特征参数。在一幅图中随机提取无重叠的有核细胞的形状特征参数,再取其平均值,进行细胞混合特性分析。由于骨髓细胞涂片直接来自患者,数量有限,所以我们采用对训练样本利用比较充分的交叉验证的方法获得分类结果,即对样本集随机划分为相等的份,每次抽取其中一份作为测试样本集,其余为训练样本集,对神经网络做次训练和测试,取其平均正确率作为神经网络性能的反映。实验依据由于诊断病理专家在对白血病骨髓涂片进行识别时,往往从细胞的核浆比例、细胞核颜色深浅、细胞变异程度等具有代表性的特征入手。这些特征可以用从细胞图像中抽取出的个数字特征进行一定程度的近似描述。当患某类白血病时,骨髓细胞所含细胞类的数目会增加或减少。如果超出了正常值就很可能是患上白血病的一种征兆,如。型以早幼粒细胞为主,以原单核细胞为主或以幼单核细胞为主,因而其中的每一类细胞的计数及异常情况都可能是诊断早期白血病的一个重要条件。三类急性白血病细胞形态学参数下列三张表是我们通过实验,使用链码法测量细胞,得到的相关细胞形态学的参数,如细胞周长、面积、细胞形状因子、浆核比等。从这些数据中不难发现,这三类白血病细胞的形态学参数还是变化比较明显的。比如在实验的这三种类型的白血病中,类型的细胞的浆核比最大,。类型的细胞核面积最大,类型的细胞核面积最小。 第章神经网络及在白血病细胞识别中的应用表一型白血病细胞形态学参数一编号细胞周长细胞面积核周长核面积细胞形状因子核形状因子浆核比】,山】】 福建师范大学工学硕士学位论文表一型白血病细胞形态学参数一印冲编号细胞周长细胞面积核周长核面积细胞形状因子核形状因子浆核比,,】 第章神经网络及在白血病细胞识别中的应用表一型血病细胞形态学参数一编号细胞周长细胞面积核周长核面积细胞形状因子核形状因子浆核比了︻注匕洲月六︺叭曰只汀从八︸只曰匕︺舒月州只八户气︺,…“'`匕护匕﹄民,氏口尸只““`“'…。`表一表示的是我们在进行神经网络的创建时,三类白血病的训练网络的样本数量和测试网络的样本数量。表一测试样本一细胞类型训练样本数测试样本数样本总数】 福建师范大学工学硕士学位论文网络算法改进前后实验结果对比表一和表一显示的是神经网络改进前实验结果。从结果中发现,在引入动量项的变化后,网络的测试分类能力提高了,特别是当网络只有个隐节点时,网络能够完全正确地将样本进行分类。表一神经网络改进前实验结果一输入变量输出变量隐节点数测试分类准确率表一神经网络改进后实验结果一输入变量输出变量隐节点数测试分类准确率 第章神经网络及在白血病细胞识别中的应用图一显示的是改进前后,不同隐节点的情况下,网络的预测误差曲线。图中红色线条是条误差判断线,它表示网络对某样本点的分类识别是否超出误差。当分类结果误差率超出时,我们认为在识别该样本点时,网络的分类结果出错。即网络臼月个节点即网梅必价朴点吞不二样笨刀刀刀'书连刹断出佑刀、刀、'到断出烤」尽羹一命工滋︸匕易枷线“拼一竺书触象改进前个隐节点改进后个隐节点日叫闷峪〔个除节点磷典渔顿如神攀片夏召曝赢蹂行喻瓤巍瓢蘸改进前巧个隐节点改进前巧个隐节点劝雳布写止,址斗玉迪选蜘样本判断出始样本月、二烈间断出怡走勤畏﹄乙日﹄一儿丫广职认舀改进前个隐节点幻改进前个隐节点 福建师范大学工学硕士学位论文网路个息节点即网络丈祖个油节谧样本判断出借﹄目`卫、去申」断出怡脚曰﹄﹃一汾石忍礴嚣万污扛掩幻石参蒸闪厂八︹几“,,。称墓滋一刀石刃样知改进前个隐节点改进前个隐节点日网峪白个挽节意〕一一`,一日样本`,卿」断出烤样本、二、一、、刀泪荆归断络出姗妇鳞通巡动斗厂里博橇黔一扣娜勃一刃一声丫刃样知改进前个隐节点改进前个隐节点两峪个巨节点〕即网格时陇节点样本`、日、、、之申」断出份匡要而月衬瑞巍一彗刀沮。`卜。、”麟瑞狱群改进前个隐节点改进前隐节点 第章神经网络及在白血病细胞识别中的应用日网络加个魔节点日两络刀个扭带点之兰本、、、刀、、之】、汤荆断出屯纽了下份兀三判断出柑样本司一一厂、改进前节隐节点……改进前个隐节点图一改进前后不同隐节点的网络的预测误差曲线一本章小结本章介绍了神经网络的原理及其主要学习算法,探讨了神经网络在急性白血病细胞图像识别中的应用。根据所测量的细胞的形态学参数即细胞周长、细胞面积、核周长、核面积、细胞形状因子、核形状因子及浆核比作为神经网络的输入变量,并确定隐含层神经元个数,最终完成整个网络的变量设计。之后,又对传统的算法进行引入动量项的算法改进。实验结果表明隐节点数目增多虽然可以提高训练样本集的分类准确率,但测试集的准确率却降低了。而目增加隐节点数会加大网络复杂度,使网络的执行效率减低。再对网络进行引入动量项的改进后,尽管学习和训练样本较小,但网络总体识别率有所改进。总之,网络具有设计简单、训练速度快等优点,虽然样本数量对分类准确率有影响,但可以通过一些方法进行改进,较好地对三类急性白血病进行分类识别,得到比较满意的结果。因此神经网络可以在计算机辅助诊断方而具有较好的应用前景。 福建师范大学工学硕士学位论文 第章结束语第章结束语白血病是我国十大高发肿瘤疾病之一,因此白血病的早期诊断对于此类疾病的治疗至关重要。本文从图像处理识别领域出发,针对白血病诊断由定性分析向定量分析这一转变过程所涉及的问题,探讨利用图像处理技术和分析技术对细胞显微特征进行分析的方法,并重点研究了白血病骨髓涂片的图像分割技术及特征参数,现总结如下、介绍了急性白血病诊断及一般传统分型标准。传统的分型,这是诊断白血病的传统方法,它以细胞形态学和细胞组织化学为手段,通过瑞氏染色和显微系统来确定白血病的类型。此外对急性白血病的分类及临床病理特征,特别是对实际取得的类急性白血病的细胞形态和骨髓像的病理特征做了一个较为粗略的介绍,为之后的图像处理及分类识别工作做好准备。、介绍了对彩色图像进行处理的基本原理,彩色图像常用模型来表示,但三分量之间常有很高的相关性,因此为了降低彩色特征空间中各个特征分量之间的相关性,以及为了使所选的特征空间更方便于彩色图像分割方法的具体应用,根据实际需要将图像变换到颜色模型,提取饱和度图像,使得细胞的特征在该空间上对染色及光照条件变化不敏感,以保证细胞的稳定提取。、介绍了几种对白血病骨髓图像进行分割的算法,比较各类算法的优缺点,分析各自的适用范围,并在此基础上根据所处理图像的实际情况对传统算法做出一些改进。采用小波变换与分水岭算法相结合的方法来克服细胞的粘连问题。首先利用小波变换在原图的梯度图上产生多分辨率图像,然后对低分辨率图像进行应用标记的分水岭分割。最后利用小波反变换,得到高分辨率的分水岭结果,实现对图片更准确地分割。、介绍了图像特征提取的方法,分别利用八连通链码取得细胞边界的像素数据。由于链码表无法直接区别细胞的区域内外,在实际应用中,我们还需要进一步取得区域内的像素数据来进行各种参数的计算。因此在得到链码表之后,再将它转化成线段表,从而提取细胞的周长、面积、核周长、核面积、形状因子及浆核比等数个形态学特征参数,并定量分析了参数的定义和算法及其在临床诊断中的参考价值,最后将细胞特征参数进行标准化处理。 福建师范大学工学硕士学位论文、介绍了神经网络的原理及其主要学习算法,探讨了神经网络在急性白血病细胞图像识别中的应用。根据所测量的细胞的形态学参数即细胞周长、细胞面积、核周长、核面积、细胞形状因子、核形状因子及浆核比作为神经网络的输入变量,并确定隐含层神经元个数,最终完成整个网络的变量设计。人工神经网在经过一系列的学习后,学得了比较好的分类权值。最后能够对新测得的细胞特征值进行分类。本文中设计的神经网络分类器,输入层个节点、隐含层巧个节点、输出层个节点。细胞样本共例,由于骨髓细胞涂片直接来自患者数量有限,所以我们采用对训练样本利用比较充分的交叉验证的方法获得分类结果,即对样本集随机划分为相等的份,每次抽取其中一份作为测试样本集,其余为训练样本集,对神经网络做次训练。当误差小于规定值后,再用剩余的数据样本对人工神经网络进行测试,最后取其平均正确率作为神经网络性能的反映。作者认为,依据现有的工作基础和实际使用的要求,还可以在以下方面作进一步研究、图像分割是图像处理中的关键问题,能否找到更加有效,更加具有智能化的算法依然是重点及难点之一。目前使用的分割方法否则仍旧需要人工干预,不能真正实现全自动检测和分析。本文采用的方法,目前还无法提取核仁,也缺少对细胞质分割的探讨。、本文主要研究对象是急性白血病细胞,以后还要继续探讨慢性白血病与一些特殊类型的白血病中,因为其中的细胞变化情况和分类将更复杂。、在对传统的神经网络算法进行引入动量项的改进后,网络总体识别率有所改进,但是由于学习和训练样本较小,因此网络还不是非常稳定,不能保证当有更多的数据需要测试时,能否达到正确的识别目标。、软件设计要注意结合实际工作的需要,还要考虑建立病理数据库和病理档案的需要,以及病理诊断报告的制备、输出、保存等问题。、收集到足够的癌细胞样本来进行训练及测试,以完成对癌细胞进行识别。、与现有的病理分析方法相比较,进而提高相关性和识别率。 参考文献参考文献高隽人工神经网络原理及仿真实例北京机械工业出版社,,一〔黄晓伟,李晖,邱怡申图像处理技术在白血病诊断中的应用激光与光电子学进展,,一刘斌,曾立波,刘生浩血液细胞图像自动识别系统的研究计算机工程,,一陈兵旗,孙明实用图像处理北京清华大学出版社,一一何苗基于神经网络的宫颈涂片诊断系统的研究与设计东北大学硕士学位论文【刘茜萍,窦万春,蔡士杰骨髓细胞显微图像的分类认知方法研究计算机应用与软件,,一王鑫,罗斌,宁晨一种基于小波和分水岭算法的图像分割方法计算机技术与发展,,一李海燕,石玉,于盛林巨核细胞图像分割方法的研究计算机仿真,,一【」,,,一【」,,川张勇彩色白细胞显微图像分析与识别西安交通大学博士学位论文〔章毓晋图像下程北京清华大学出版社,一一〔〕杨梅如血液病骨髓组织病理学彩色图谱上海科学技术文献出版社,殷蔚明,王典洪法的多阐值推广及其快速实现中国体视学与图像分析,,一【,,,一」,,,一【林轶群,林奇峰基于小波多孔算法的暂态电能质量检测方法中国电力,,一 福建师范大学工学硕士学位论文」艾超,聂邦歌人工神经网络在医学中的应用与展望现代医学仪器与应用,,一【」何苗,全宇,李建华等神经网络在子宫颈细胞图像识别中的应用中国卫生统计,,一【」·,,一【姜远,周志华,谢琪等神经网络集成在肺癌细胞识别中的应用南京大学学报,,一〕陆新泉,李宁,陈世福形态,颜色特征及神经网络在肺癌细胞识别中的应用研究计算机辅助设计与图形学学报,,一【〕求是科技编著十十数字图像处理典型算法及实现人民邮电出版社」陈俊梅,周为血液分析仪技术的原理与应用医疗设备信息,,一【朱雪明,陈资志,张佩瑜等,“匕急性白血病骨髓有核细胞的形态定量分析苏州医学学报,一【」陈海强,刘福太神经网络及其应用和其推广能力的分析德州学院学报,,一【刘喜英,吴淑泉,徐向民基于改进分水岭算法的医学图像分割的研究微电子技术,,一【·,,,一〕,,,,一【〕,一一【〕,,,一【〕,一',,〕, 参考文献,,一【〕,·〕,,,【,陆宗哄十图像处理编程清华大学出版社【」,,,〕王传勇,孙杰基于神经网络的血液细胞图像彩色分割光电子激光,,一李国勇智能控制及其实现电子工业出版社一阵高丽,杨树元一种基于标记的分水岭图像分割新算法中国图象图形学报,,一田娅,饶妮妮国内医学图像处理技术的最新动态电子科技大学学士及,,·阵阂惜琳,刘国华用工具箱开发网络应用计算机应用,,一〕陈小前,罗世彬,王振国神经网络应用中的前后处理过程系统工程理论与实践,,一【」桂现才神经网络在上的实现与应用湛江师范学院学,,一【高英杰,王海芳,董国江神经网络工具箱在系统辨识中的应用液压气动与密封,,一郑富盛细胞形态立体计量学北京医科大学出版社周浩,李天牧基于数学形态学的血液细胞图像边缘提取北京生物医学工程,,一 福建师范大学工学硕士学位论文【〕杨波,高芳,李建兰等骨髓切片和涂片观察在恶性血液诊断中的意义白血病,淋巴瘤,一【王虹基于人工神经网络的平面图像识别研究武汉理工大学硕士论文李军,周月琴小波变换用于影像分割的研究中国图象图形学报,,一 福建师范大学学位论文使用授权声明福建师范大学学位论文使用授权声明本人姓名蒋英学号专业二光学工程所呈交的论文论文题目基于数字图像分析的急性白血病细胞形态学研究及分类识别是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人己经发表或撰写过的研究成果。本人了解福建师范大学有关保留、使用学位论文的规定,即学校有权保留送交的学位论文并允许论文被查阅和借阅学校可以公布论文的全部或部分内容学校可以采用影印、缩印或其他复制手段保存论文。保密的论文在解密后应遵守此规定学位论文作者签名垂迄一一指导教师签名签名日期 攻读学位期间承担的科研任务与主要成果攻读学位期间承担的科研任务与主要成果令主要参与的科研项目一生物医学光学领域一,教育部新世纪优秀人才资助计划。令发表论文情况蒋英,李晖,黄晓伟白血病图像分割方法的适应性分析及改进算法激光生物学报蒋英,李晖神经网络在白血病图像识别中的应用福建电脑蒋英,李晖数字图像处理技术在白血病细胞形状特征参数的提取中的应用,投稿中 致谢致谢值此硕士研究生生活结束之际,谨向指导我工作、学习、生活三年之久的导师李晖教授表示衷心感谢。导师勤奋忘我的工作精神深深影响了我,使我受益非浅。感谢福建医科大学附属协和医院王少元教授、黄慧芳博士提供白血病骨髓涂片样品及相关的医学背景知识,以及福建师范大学生命科学学院杨月梅、蔡梅芳同学在图像采集方面给予的指导与帮助。感谢三年来在实验室里一起学习生活的师兄师姐们。他们是朱莉莉,俞碧莺,徐晓辉,石玉清,施文灶。最后,深深地感谢我的父母,在我成长的每一个足印里,都倾注了他们的心血和汗水。 个人简历个人简历其才省自亡七产子冲西曰一匕、性别女出生年月年月俘姓民族名蒋汉英籍一贯浙江杭州受教育情况时间就读院校专业指导教师学位一信浙自江、与大电学气城工市二程学学院院光电信息工学学士物理与光电信息科技学院一福建师范大学光学丁一程李晖教授工学硕士

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭