microrna识别及其与疾病关联预测算法的研究论文

microrna识别及其与疾病关联预测算法的研究论文

ID:32349865

大小:2.01 MB

页数:126页

时间:2019-02-03

microrna识别及其与疾病关联预测算法的研究论文_第1页
microrna识别及其与疾病关联预测算法的研究论文_第2页
microrna识别及其与疾病关联预测算法的研究论文_第3页
microrna识别及其与疾病关联预测算法的研究论文_第4页
microrna识别及其与疾病关联预测算法的研究论文_第5页
资源描述:

《microrna识别及其与疾病关联预测算法的研究论文》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP391学校代码:10213国际图书分类号:681密级:公开工学博士学位论文MicroRNA识别及其与疾病关联的预测算法研究博士研究生:玄萍导师:郭茂祖教授申请学位:工学博士学科:人工智能与信息处理所在单位:计算机科学与技术学院答辩日期:2012年10月授予学位单位:哈尔滨工业大学ClassifiedIndex:TP391,Q811.4U.D.C:681DissertationfortheDoctoralDegreeinEngineeringRESEARCHONMICRORNAIDENTIFICATIONALGORITHMANDDISEAS

2、ERELATEDMICRORNAPREDICTIONALGORITHMCandidate:XuanPingSupervisor:Prof.GuoMao-zuAcademicDegreeAppliedfor:DoctorofEngineeringSpeciality:ArtificialIntelligenceandInformationProcessingAffiliation:SchoolofComputerScienceandTechnologyDateofDefence:October,2012Degree-Conferring-Institution

3、:HarbinInstituteofTechnology摘要摘要microRNA(miRNA)是一类长度约为22nt(核苷酸)的内源非编码RNA,在动植物许多重要的生命过程中起着关键的调控作用,并且与肿瘤等多种疾病的发生发展密切相关。生物信息学在miRNA的研究中起到了重要作用,极大地推动了该领域的迅速发展。本文主要研究miRNA相关问题的计算预测方法,对miRNA前体分类预测、miRNA成熟体位置预测、疾病关联的miRNA预测等问题进行了深入的研究,取得了一些创新成果。主要包括以下四方面的内容:(1)研究了高效的基于支持向量机的miRNA前体分类预测方法。

4、研究miRNA的功能需要先找到miRNA。通过生物实验识别miRNA的方法是耗时和昂贵的,并且难于发现那些表达量较低或者只在特定组织或发育阶段表达的miRNA。因此,使用计算预测方法筛选可能的miRNA候选集合,可以为生物实验提供指导和参考,对推动miRNA的识别具有重要意义。本文结合miRNA前体的特点,提出了基于支持向量机的miRNA前体分类预测方法。好的特征和正反例(真/假miRNA前体)数据集合是建立高效的分类预测模型的基础。因此,本文从真/假miRNA前体中提取得到序列相关特征、结构相关特征和能量相关特征。提出了基于遗传算法的特征选择方法,选取了有

5、代表性的特征子集。由于植物miRNA前体反例数据集的匮乏,本文首次从拟南芥、水稻、大豆的蛋白质编码序列中提取类似茎环的序列作为假miRNA前体序列,并建立反例数据集。针对真/假植物miRNA前体类别不平衡问题,结合集成学习和AdaBoost思想建立了集成分类器PlantMiRNAPred。PlantMiRNAPred分别在拟南芥、水稻、毛果杨、小立碗藓、苜蓿、高粱、玉米和大豆等8个物种中取得了超过90%的准确率,对植物miRNA前体的识别研究具有重要价值。此外,我们还使用人类miRNA前体的数据建立了分类模型HumanMiRNAPred,该模型也取得了更高的

6、预测性能,有助于推动人类miRNA前体的识别研究。(2)研究了准确的miRNA成熟体位置预测方法,能够为新预测得到的miRNA前体候选,预测其中成熟体的位置。基于机器学习的miRNA前体分类预测方法,通常只能预测分类新的miRNA前体,无法预测其中miRNA成熟体的位置。然而,在进行后续生物实验验证前,通常需要给出其中miRNA成熟体的位置,因此本文提出了基于支持向量机的miRNA成熟体位置预测方法。首先将miRNA:miRNA*作为一个整体,以更好的反映miRNA及miRNA*相互结合的特点。其次,从真/假miRNA:miRNA*中提取特征并选取得到有代表

7、性的特征子集。第三,针对真/假miRNA:miRNA*数量相差悬殊的问题,提出了两阶段样本选择方法,依据反例样本(假的miRNA:miRNA*)的-I-哈尔滨工业大学工学博士学位论文分布密度和样本的预测误差,选取有代表性的反例样本,建立miRNA成熟体位置预测模型MaturePred。与现有的方法相比,MaturePred取得了更准确的预测性能,能够为后续生物实验提供更可靠的动植物miRNA成熟体候选。(3)结合miRNA功能相似性的准确度量,提出基于k个最相似miRNA结点的疾病关联miRNA预测算法。miRNA调控的异常是导致肿瘤等多种疾病的重要原因,因

8、此研究miRNA与疾病的关联对研究发病机理是非常重要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。