基于jep的癌症分类算法研究

基于jep的癌症分类算法研究

ID:33500829

大小:2.77 MB

页数:80页

时间:2019-02-26

基于jep的癌症分类算法研究_第1页
基于jep的癌症分类算法研究_第2页
基于jep的癌症分类算法研究_第3页
基于jep的癌症分类算法研究_第4页
基于jep的癌症分类算法研究_第5页
资源描述:

《基于jep的癌症分类算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代号:10532学号:S08102017密级:普通湖南大学硕士学位论文基于JEP的癌症分类算法研究TheResearchoncancerclassificationalgorithmwithJumpingEmergingPatternbyLIDanB.E.(HunanCityUniVersity)2008AthesissubmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofEngineeringlnComputerScienceandTechnologyintheGradua

2、teSchoolofHunanUniversitySupervisorLecturer’LUXinguoMay,2011湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:套请日期:2。I1年厂月引日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机

3、构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在——年解密后适用本授权书。2、不保密∥。(请在以上相应方框内打“/”)作者签名:李前别磁辄卡眵蚪El期:2DI1年石月弓\日日期:力9},年厂月多、日l綦-j:JEP的痛症分类算法研究摘要分类是数据挖掘和机器学习领域的一个重要问题,目的是通过训练数据集构建一个分类器来预测新的实例类别。近年来,DNA微阵列的发展为很多领域提供了一种高维数据,主要应用于癌症诊断

4、和预测。跳跃显露模式(JumpingEmergingPattern,JEP)是一种区分能力强的特殊模式,在分类方面有很明显的优越性。随着DNA微阵列和基因模式的快速发展,本文提出一种基于JEP的癌症分类算法。为了进一步提高癌症分类准确率,本文还研究了基于JEP癌症分类的组合分类算法,这在生物学、医学领域具有重要的研究价值和实际意义。本论文主要从基因表达数据的分析着手,其主要工作归纳如下:一、对基因表达数据进行预处理,DNA微阵列产生的数据具有高维性,有很多噪声,本文采用基于信息熵的离散化方法将连续属性离散化,依据最小长度原则找出基因的分割点,计算熵值,筛选出分

5、类特征基因。熵值越小,特征基因分类能力越强。这种离散化方法可以有效消除噪声数据的影响。二、提出一种更具鉴别能力的基因模式,称为增强跳跃显露模式(IJEP),这种模式满足增长率趋近无穷大,且任何子集都不是IJEP的条件。提取IJEP的特征基因是通过基于信息熵的离散化方法获得,并在计算信息熵时,通过引入贝叶斯m一估计以克服小容量样本下频率等于概率的缺陷,从而提高熵的可靠度。三、用边界算法挖掘出有效的IJEP。用BORDER.DIFF算法获得不同的边界对,再用MBD.LLBORDDER算法产生IJEP。有效的缩短了IJEPs的挖掘时间。针对挖掘出的IJEP,提出一种

6、癌症分类算法(CIJEP),同时通过改进相似度量的计算来提高预测的可信度。四、以基于IJEP的癌症分类器作为基分类器,将集成机器学习应用到癌症分类中,提出了Bag-CIJEP、Boost.CIJEP两种算法,在四个数据集上进行实验,实验结果提高了癌症的分类准确率。关键字:DNA微阵列;癌症分类;强跳跃显露模式;相似度量;集成机器学习II二AbstractClassificationlSanlmportantresearchproblemindataminingandmachine.aimedatbuildingaclassifierfromtrainingin

7、stancesforpredictingtheclassesofnew1nstance·RecentlY,thedevelopmentofmicroarraytechnologyhassuppliedalargedlmenslonalitYofdatatomanyfields;ithasbeenmainlyappliedtopredictionanddlagnoslsofcancer·JumpingEmergingPatternisaspecialpatternwhichhasstrongdlscrlmlnatlon·Ithasobviousadvantage

8、inclassification.Th

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。