基于数据挖掘的非编码rna预测模型设计与实现

基于数据挖掘的非编码rna预测模型设计与实现

ID:33174730

大小:2.38 MB

页数:53页

时间:2019-02-21

基于数据挖掘的非编码rna预测模型设计与实现_第1页
基于数据挖掘的非编码rna预测模型设计与实现_第2页
基于数据挖掘的非编码rna预测模型设计与实现_第3页
基于数据挖掘的非编码rna预测模型设计与实现_第4页
基于数据挖掘的非编码rna预测模型设计与实现_第5页
资源描述:

《基于数据挖掘的非编码rna预测模型设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、,},国农业人洲i卜沦义中文摘丝摘要生物计算是计算机科学在生命科学中形成的一个研究领域,通过用计算机科学的知识和相关的算法对生物学领域内的数据进行加_L、存储、检索与分析。随着生物数据的快速增长,如何运用高效的算法来处理这些数据,己经得到了越来越多的关注。本论文进行了生物计算的研究,主要是为了解决非编码核糖核酸(non-codingribonucleicacid,ncRNA)的预测问题。研究方法采用数据挖掘的理论和技术,目的是为了找出能够区分ncRNA的计算方法,同时编写预测软件供用户使用。论文的重点是运用数据挖掘方

2、法中的主成分分析和人工神经网络LM(Levenberg-Marquardt)算法实现了ncRNA的预测。首先利用生物学实验数据总结出ncRNA的特征,作为数据挖掘方法的输入:然后在MATLAB环境卜用统计工具箱和神经网络工具箱对输入的特征进行主成分分析和神经网络训练,用训练好的网络去预测ncRNA:最后,为了实现通用性,运用MATCOM接口与VC实现Windows下供用户实际使用的预测程序。研究的难点在于ncRNA特征的提取和选用恰当的数据挖掘方法。论文运用生物学知识提取了相关特征并用于主成分分析和神经网络的训练中。

3、实际的测试结果表明特征的选择比较恰当,训练结果可以用作ncRNA的预测。论文主要创新点如下:①提出了一种ncRNA预测方法,并且设计出了进行预测的软件:②数据运用人T神经网络快速LM算法训练,使训练和预测结果更为准确;③实现了MATLAB与VC的混合编程,充分利用了两者的优点。关键词:生物计算,数据挖掘,人一卜神经网络,士成分分析,卜{日农业人学硕}_论之英文摘要AbstractBiocomputingorbioinformaticsisanewresearchfieldthatusesknowledgeandalg

4、orithmsofcomputersciencetoprocessandanalysisdataofbiologydatafrombio-applications.Withtherapidincreaseofbiologydata,moreattentionshavebeenputonhowtouseeficientcomputeralgorithmstodealwiththesedataThisthesisstudiesonbioconputnngfield,whichspecificallyfocusesonpr

5、edictionofnon-codingRNA(ncRNA).TheoryandtechniqueofdataminingwereintroducedtosetupacomputationalframeworkthatisabletodistinguishncRNAfromotherkindsofsequences,andpredictionsoftwarewasdesignedtoprovidenon-professionaluserswithaneasypredictiontoolThisthesislaysas

6、trongemphasisonprincipalcomponentsanalysis(PCA)andLMalgorithminartificialneuralnetworkstocompletethepredictionofncRNA,whichisbasedondatamining.First,featuresofncRNAweresununeduptoserveasinputfordataminingprocedureslateron.Second,statisticstoolboxandartificialne

7、uralnetworkstoolboxofMATLABwereusedtocarryoutprincipalcomponentsanalysisandartificialneuralnetworktraining.Finally,userpredictionwasdesignedinVisualC++whileMATCOMservedasinterfacebetweenMATLABandVCtocompletetheuserpredictionprogram.Difficultiesofthisthesisareex

8、tractionofncRNAfeaturesandtheselectionamongdataminingtechniques.DomainknowledgeinbiologywasusedtodistinguishefectivencRNAfeaturesthatcanbereliedonfordataminingonthisspecific

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。