欢迎来到天天文库
浏览记录
ID:33174730
大小:2.38 MB
页数:53页
时间:2019-02-21
《基于数据挖掘的非编码rna预测模型设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、,},国农业人洲i卜沦义中文摘丝摘要生物计算是计算机科学在生命科学中形成的一个研究领域,通过用计算机科学的知识和相关的算法对生物学领域内的数据进行加_L、存储、检索与分析。随着生物数据的快速增长,如何运用高效的算法来处理这些数据,己经得到了越来越多的关注。本论文进行了生物计算的研究,主要是为了解决非编码核糖核酸(non-codingribonucleicacid,ncRNA)的预测问题。研究方法采用数据挖掘的理论和技术,目的是为了找出能够区分ncRNA的计算方法,同时编写预测软件供用户使用。论文的重点是运用数据挖掘方
2、法中的主成分分析和人工神经网络LM(Levenberg-Marquardt)算法实现了ncRNA的预测。首先利用生物学实验数据总结出ncRNA的特征,作为数据挖掘方法的输入:然后在MATLAB环境卜用统计工具箱和神经网络工具箱对输入的特征进行主成分分析和神经网络训练,用训练好的网络去预测ncRNA:最后,为了实现通用性,运用MATCOM接口与VC实现Windows下供用户实际使用的预测程序。研究的难点在于ncRNA特征的提取和选用恰当的数据挖掘方法。论文运用生物学知识提取了相关特征并用于主成分分析和神经网络的训练中。
3、实际的测试结果表明特征的选择比较恰当,训练结果可以用作ncRNA的预测。论文主要创新点如下:①提出了一种ncRNA预测方法,并且设计出了进行预测的软件:②数据运用人T神经网络快速LM算法训练,使训练和预测结果更为准确;③实现了MATLAB与VC的混合编程,充分利用了两者的优点。关键词:生物计算,数据挖掘,人一卜神经网络,士成分分析,卜{日农业人学硕}_论之英文摘要AbstractBiocomputingorbioinformaticsisanewresearchfieldthatusesknowledgeandalg
4、orithmsofcomputersciencetoprocessandanalysisdataofbiologydatafrombio-applications.Withtherapidincreaseofbiologydata,moreattentionshavebeenputonhowtouseeficientcomputeralgorithmstodealwiththesedataThisthesisstudiesonbioconputnngfield,whichspecificallyfocusesonpr
5、edictionofnon-codingRNA(ncRNA).TheoryandtechniqueofdataminingwereintroducedtosetupacomputationalframeworkthatisabletodistinguishncRNAfromotherkindsofsequences,andpredictionsoftwarewasdesignedtoprovidenon-professionaluserswithaneasypredictiontoolThisthesislaysas
6、trongemphasisonprincipalcomponentsanalysis(PCA)andLMalgorithminartificialneuralnetworkstocompletethepredictionofncRNA,whichisbasedondatamining.First,featuresofncRNAweresununeduptoserveasinputfordataminingprocedureslateron.Second,statisticstoolboxandartificialne
7、uralnetworkstoolboxofMATLABwereusedtocarryoutprincipalcomponentsanalysisandartificialneuralnetworktraining.Finally,userpredictionwasdesignedinVisualC++whileMATCOMservedasinterfacebetweenMATLABandVCtocompletetheuserpredictionprogram.Difficultiesofthisthesisareex
8、tractionofncRNAfeaturesandtheselectionamongdataminingtechniques.DomainknowledgeinbiologywasusedtodistinguishefectivencRNAfeaturesthatcanbereliedonfordataminingonthisspecific
此文档下载收益归作者所有