数据挖掘技术在肿瘤研究中的应用

数据挖掘技术在肿瘤研究中的应用

ID:38802100

大小:45.50 KB

页数:6页

时间:2019-06-19

数据挖掘技术在肿瘤研究中的应用_第1页
数据挖掘技术在肿瘤研究中的应用_第2页
数据挖掘技术在肿瘤研究中的应用_第3页
数据挖掘技术在肿瘤研究中的应用_第4页
数据挖掘技术在肿瘤研究中的应用_第5页
资源描述:

《数据挖掘技术在肿瘤研究中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘技术在肿瘤研究中的应用王化修1,2(1湖南中医药大学2007级博士研究生,2邵阳医学高等专科学校病理教研室)关键词:数据挖掘;肿瘤中图分类号:R311;R730文献标识码:BTheapplicationofdataminingtechnologyintumorstudyWANGHua-xiuKeywords:datamining;tumorCLCNumber:R311;R730近年来,数据挖掘技术在医学领域中的应用越来越广泛。在疾病诊断、治疗、器官移植、基因研究、图像分析、康复、药物开发、

2、科学研究等方面都获得了可喜的成果。南加州大学脊椎病医院利用InformationDiscovery进行数据挖掘,该技术已应用到肿瘤学、肝脏病理学、肝炎的生存几率预测、甲状腺疾病诊断、风湿病学、皮肤病诊断、心脏病学、神经心理学、妇科学、产科学等医学领域。目前,国内外研究人员在肿瘤研究领域已广泛应用数据挖掘技术,本文主要就此方面的最新进展作一综述。1数据挖掘技术在肿瘤诊断中的应用刘晶等[1]应用决策树分类技术,研究和开发了一种基于数据挖掘技术的大肠早癌诊断系统。该系统首先对所采集的大量激光诱导自体荧光

3、光谱进行处理,并建立相关数据库,然后采用决策树分类方法对样本进行训练和分类,最终进行正常组织和癌变组织的判断,并由系统输出诊断结果。结果表明该系统可有效地用于指导大肠癌症的早期诊断和治疗。毛利锋等[2]应用一种基于决策树的乳腺癌计算机辅助诊断新方法,选取500例乳腺癌病例为数据样本,每个样本由9个细针吸取细胞学指标【肿块密度(ClumpThickness)、细胞大小均匀性(UniformityofCellSize)、细胞形状均匀性(UniformityofCellShape)、边界粘连(Margi

4、nalAd-hesion)、单个上皮细胞大小(SingleEpithelialCellSize)、裸核(BareNuclei)、微受激染色质(BlandChromatin)、正常核(NormalNucleoli)、有丝分裂(Mitoses)】组成,将样本随机分为训练集和测试集,然后利用决策树方法从训练集中学习得到诊断模型,经测试集测试。结果表明决策树的诊断准确率高达97.33%,灵敏度和特异度分别为98.28%和96.74%。决策树方法提取的诊断规则描述简单,应用方便;决策树方法在辅助FNAC诊断

5、乳腺癌的同时,还可判断各参数对乳腺癌诊断贡献的大小;从决策树模型中可见,裸核对乳腺癌诊断起决定性作用,细胞大小均匀性和细胞形状均匀性则可作为诊断的重要指标,因此,决策树方法是一种简便可行的计算机辅助诊断方法,可从病例自动提取诊断规则,具有较广泛的实用价值,可应用于其它疾病的诊断研究。目前,国际上已经把挖掘技术应用于肺癌的诊断中,经大量的研究表明,选取诸如年龄、CT图像中肿瘤的最大半径、肿瘤的位置、钙化程度等18个医学检验指标作为特征值,利用这些特征值对基于粗糙集理论的自主判别算法模型进行训练后,再

6、用特征值不完整的新记录来测试,诊断的正确率非常高[3]。陈卉等[4]研究了数据挖掘技术在计算机辅助肺癌诊断中的应用,通过收集经手术或穿刺活检病理证实的孤立肺结节200例(恶性135例,良性65例),观察2项临床指标(年龄及是否有痰中带血丝)和5项薄层CT指标,并按7∶3的比例将样本随机数字法分配到训练集和测试集中。分别用Fisher线性判别分析、Logistic回归分析、决策树和神经网络方法构建诊断分类器,并用测试样本验证各个分类器。从分类算法的分类准确性、分类器的可理解性以及对诊断的指导意义三方

7、面进行比较,Logisitc回归和神经网络方法具有较高的诊断分类准确性,判别分析、Logistic回归分析和决策树方法具有较好的模型可理解性,基于BP算法的神经网络对实际诊断具有较好的指导作用。2数据挖掘技术在肿瘤发病机制研究中的应用微阵列技术提供了1种可以同时测量成千上万个基因或蛋白表达的手段,为研究基因或蛋白表达及它们的相互调控机制带来了新视野。HeZ等[5]用点有5184个基因或表达序列标签(EST)微阵列膜比较人正常鼻咽和鼻咽癌的基因差异表达,得到了两种组织的基因表达谱,并克隆了一个有显著

8、性表达差异的EST全长,命名为YH1。Chaussabel[6]等发明了一种用文献轮廓挖掘微阵列表达数据的技术,该技术产生一个从文献中获得的词的频率数据库,并且通过分析相关词汇的共发生模式进行数据挖掘。黄仲曦等[7]根据已有的肿瘤转移相关基因cDNA芯片,对大肠癌细胞系及组织标本进行检测,发现了与大肠癌转移密切相关的表达基因51个(上调基因22个,下调基因29个)。进一部研究分析大肠癌转移芯片表达谱,采用基于文献轮廓的数据挖掘方法,从Medline文献数据库中提取基因的相关文献并分

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。