基于稀疏表示的基因表达谱数据挖掘方法研究

基于稀疏表示的基因表达谱数据挖掘方法研究

ID:32974810

大小:4.76 MB

页数:64页

时间:2019-02-18

基于稀疏表示的基因表达谱数据挖掘方法研究_第1页
基于稀疏表示的基因表达谱数据挖掘方法研究_第2页
基于稀疏表示的基因表达谱数据挖掘方法研究_第3页
基于稀疏表示的基因表达谱数据挖掘方法研究_第4页
基于稀疏表示的基因表达谱数据挖掘方法研究_第5页
资源描述:

《基于稀疏表示的基因表达谱数据挖掘方法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代号:10532学号:S11102025密级:普通湖南大学硕士学位论文基于稀疏表示的基因表达谱数据挖掘方法研究TheResearchonGeneExpressionProfileDataMiningMethodBasedonSparseRepresentationbyDENGMimiB.E.(HainanNormalUniversity)201AthesissubmittedinpartialsatisfactionoftheRequirementsforthedegreeofMasterofEngineeringComputerS

2、cienceandTechnologyintheGraduateSchoolofHunanUniversitySupervisorLecturerCAOZhiMay,2014湖南大学学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名:婶寝耀日期:刻晦6月6IS学位论文版权使用授权书本学位论文作

3、者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权湖南大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密口,在年解密后适用本授权书。2、不保密回。(请在以上相应方框内打“√”)作者签名:冲疆冠导师答名:\舻龟IS期:2D』争年6月bM日期:20J4年6月6日基于稀疏表示的基因表达谱数据挖掘方法研究摘要利用基因表达谱数据进行肿瘤分类是生物信息学领域的研究重点之一。基于基

4、因表达谱,使用现代数据挖掘方法研究肿瘤的发生机制有助于肿瘤的诊断和个性化治疗。但是,基因表达谱数据通常具有高维小样本的特点,这使得很多传统的经典数据挖掘方法不能很好地应用于肿瘤分类。因此,亟需有效的数据处理方法来解决这一难题。近来,受到基于f,范数最小化方法的启发,稀疏表示方法作为一种新颖强大的数据处理方法应运而生。稀疏表示具有鲁棒性强、识别率高等众多优点,本文重点研究了其在肿瘤分类中的应用。主要工作如下:基因表达谱数据高维、高噪和高冗余的特性使得很多经典的分类方法不厶匕BI徊I.K好地用于肿瘤分类。针对这一问题,本文设计了一种基于稀疏

5、表示的基因选择方法来对其进行降维、去噪和去冗余。该方法分为三个步骤,首先利用稀疏表示计算基因与类别之间的相关度,根据相关性对基因进行过滤,选择排名靠前的信息基因。然后基于稀疏表示相关性度量设计了一种最大相似树算法对信息基因进行聚类,得到基因簇,最后在每个基因簇中选出代表基因组成最终的特征基因子集,这种方法能有效选出与分类最相关的基因。该方法不仅能生成更小的特征基因子集,还提高了分类性能。针对目前肿瘤分类算法分类性能和泛化能力不高的问题,本文设计了一种基于K.SVD的稀疏表示分类方法进行肿瘤分类。该方法包括两个阶段,首先通过K.SVD字典

6、学习算法对每一类训练样本进行字典学习,进行去噪和去冗余,从而提取到最能稀疏表示测试样本的训练字典,得到的新训练样本字典具有更强的表示性和判别性;然后将测试样本表示为所有新训练样本字典的线性组合,根据表示系数的判别函数对测试样本进行分类。在七个公共肿瘤数据集上的大量实验也证明了该方法是有效的,比一些典型的方法实现了更好的分类性能。关键字:基因表达谱:肿瘤分类;稀疏表示;最大相似树;K.SVDII硕士学位论文AbstractTheapplicationofgeneexpressiondatafortumorclassificationiso

7、neoftheresearchfocusesinbioinformaticsfield.Basedongeneexpressionprofile,theresearchofgeneexpressiondatausingmoderndataminingmethodswillrevealthemechanismoftumorwhichcanhelptumordiagnosisandspecifictreatment.However,thefactthatthenumberofgenesislargerthanthenumberofsampl

8、esmakesmanyclassicaldataminingmethodsunavailablefortumorclassification.Soanewefficientdataprocessingmet

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。