欢迎来到天天文库
浏览记录
ID:33494973
大小:2.27 MB
页数:66页
时间:2019-02-26
《基于web+services生物信息挖掘算法设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号⋯⋯⋯⋯UDC⋯⋯⋯⋯⋯一中南大学密级⋯⋯⋯⋯编号⋯⋯⋯⋯.CENTRALSOUTHUNIVERSITY硕士学位论文论文题目⋯一基王埘点.S鲤m坌懿.生物信息⋯一⋯⋯挖握箕法设让与实现⋯⋯⋯⋯学科、专业⋯⋯⋯信墨与信息处理⋯⋯⋯⋯⋯研究生姓名⋯⋯⋯⋯⋯⋯孔帆帆⋯⋯⋯⋯⋯⋯导师姓名及专业技术职务⋯⋯⋯⋯奎⋯宏⋯副擞援⋯⋯⋯一摘要WebServices是一种面向服务的体系结构,其突出优点是实现了真正意义上的平台独立性察语言独立性。本文采用WebServices的解决方案,开发了一个生物信息挖掘的原型系统,封装了基于基因表达谱
2、数据的关联规则挖掘模块稀启动子识剐模块,并将算法作为Web服务公开发布。系统中基因表达谱关联规受
3、j挖掘模块采用了数据拣掘中的FP.tree算法。实验表明,基于FP.tree的基因表达谱关联规则挖掘算法大大提高了运行效率,运行时间由原来的25小时交成了1.045秒。启动子识别模块实现了基于马尔可夫模型的启动子预测算法,结合隐马尔可夫模型中的前向算法,改进基予马尔可夫理论的启动子预测方法。单纯使用马尔可夫模型平均分类正确度为84.33%,改进后平均分类正确度为85.17%。改进的马尔可夫模型的预测结果显示,以此模型建立的系统能更
4、有效的识别数据集中的三罩巾序列。同时在启动子预测算法的基础上,研究了结合支持向量机和非线性方法的DNA数据特征提取。利用生物信息学中生物功能基团RY和结构基圈MK之间的长程相关进行进~步研究,这种方法更符合生物学特性。WebServices技术作为~种中间层去处理生物信息数据。将算法部分封装在WebServices中,对外只提供用户调用算法接口,可以集成更多功能,具有可扩展性。基于WebServices生物信息挖掘方法能够挖掘出基因表达谱数据中具有生物学意义的关联规则,能够更好的识别启动子序列。为生物和医药技术企业与研究人员提
5、供交流信息的窗口,提供简便快捷的服务平台。关键词关联搜则挖掘,马尔科夫模型,启动孑识别,Hurst指数,W
6、ebServicesABSTRACTWebServicesiSasystemframeworkfacingservice.Theoutstandingstrongpointisimplementedtheplatformandlanguagereallysubstantive."thispaperissuancestheminingalgorithmasaservicebYtheWebServices.Thispaper
7、describesaprototypesystemthatminesbiologyinfbrmations.ThetwomoduleswereencapsulatedintheWebService.OneofthemodulesWitsabledtominingtheassociaterulesingeneexpressiondamsandtheotheroneWasdistinguishedthepromoters.TheminingassociaterulesmoduleusedtheFP—treealgorithmind
8、atamining.TheexperimenttestifiedthatFP-treearithmeticcanenhancecirculateefficiency.Theruntimeshortenedto1.045second,andtheoriginallyruntimewas25hours.Theimprovedpromoterpredictionmodulebased011theforwardalgorithmoftheHiddenMarkovModel,Theaveragedistinguishrateofusin
9、gthepurelyMarkovModelwas84.33%.howevertheimprovedsystemhadtherateof85.17%.羽№predict—resultsoftheimprovedMarkovModelshowedthatthesystemcouldidentifythethreesequenceseffectively.Basedonthepromoteridentificationmethod,thispaperworked011theSVMandDNAsequencecharacterbase
10、donnonlinearmethod.UsingthelongrangecorrelationmethodinthebiologicalfunctiongroupRYandstructuregroupMKonsecondstudy,wasmoreaccordingwithbi
此文档下载收益归作者所有