基于web+services生物信息挖掘算法设计与实现

基于web+services生物信息挖掘算法设计与实现

ID:33494973

大小:2.27 MB

页数:66页

时间:2019-02-26

基于web+services生物信息挖掘算法设计与实现_第1页
基于web+services生物信息挖掘算法设计与实现_第2页
基于web+services生物信息挖掘算法设计与实现_第3页
基于web+services生物信息挖掘算法设计与实现_第4页
基于web+services生物信息挖掘算法设计与实现_第5页
资源描述:

《基于web+services生物信息挖掘算法设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号⋯⋯⋯⋯UDC⋯⋯⋯⋯⋯一中南大学密级⋯⋯⋯⋯编号⋯⋯⋯⋯.CENTRALSOUTHUNIVERSITY硕士学位论文论文题目⋯一基王埘点.S鲤m坌懿.生物信息⋯一⋯⋯挖握箕法设让与实现⋯⋯⋯⋯学科、专业⋯⋯⋯信墨与信息处理⋯⋯⋯⋯⋯研究生姓名⋯⋯⋯⋯⋯⋯孔帆帆⋯⋯⋯⋯⋯⋯导师姓名及专业技术职务⋯⋯⋯⋯奎⋯宏⋯副擞援⋯⋯⋯一摘要WebServices是一种面向服务的体系结构,其突出优点是实现了真正意义上的平台独立性察语言独立性。本文采用WebServices的解决方案,开发了一个生物信息挖掘的原型系统,封装了基于基因表达谱

2、数据的关联规则挖掘模块稀启动子识剐模块,并将算法作为Web服务公开发布。系统中基因表达谱关联规受

3、j挖掘模块采用了数据拣掘中的FP.tree算法。实验表明,基于FP.tree的基因表达谱关联规则挖掘算法大大提高了运行效率,运行时间由原来的25小时交成了1.045秒。启动子识别模块实现了基于马尔可夫模型的启动子预测算法,结合隐马尔可夫模型中的前向算法,改进基予马尔可夫理论的启动子预测方法。单纯使用马尔可夫模型平均分类正确度为84.33%,改进后平均分类正确度为85.17%。改进的马尔可夫模型的预测结果显示,以此模型建立的系统能更

4、有效的识别数据集中的三罩巾序列。同时在启动子预测算法的基础上,研究了结合支持向量机和非线性方法的DNA数据特征提取。利用生物信息学中生物功能基团RY和结构基圈MK之间的长程相关进行进~步研究,这种方法更符合生物学特性。WebServices技术作为~种中间层去处理生物信息数据。将算法部分封装在WebServices中,对外只提供用户调用算法接口,可以集成更多功能,具有可扩展性。基于WebServices生物信息挖掘方法能够挖掘出基因表达谱数据中具有生物学意义的关联规则,能够更好的识别启动子序列。为生物和医药技术企业与研究人员提

5、供交流信息的窗口,提供简便快捷的服务平台。关键词关联搜则挖掘,马尔科夫模型,启动孑识别,Hurst指数,W

6、ebServicesABSTRACTWebServicesiSasystemframeworkfacingservice.Theoutstandingstrongpointisimplementedtheplatformandlanguagereallysubstantive."thispaperissuancestheminingalgorithmasaservicebYtheWebServices.Thispaper

7、describesaprototypesystemthatminesbiologyinfbrmations.ThetwomoduleswereencapsulatedintheWebService.OneofthemodulesWitsabledtominingtheassociaterulesingeneexpressiondamsandtheotheroneWasdistinguishedthepromoters.TheminingassociaterulesmoduleusedtheFP—treealgorithmind

8、atamining.TheexperimenttestifiedthatFP-treearithmeticcanenhancecirculateefficiency.Theruntimeshortenedto1.045second,andtheoriginallyruntimewas25hours.Theimprovedpromoterpredictionmodulebased011theforwardalgorithmoftheHiddenMarkovModel,Theaveragedistinguishrateofusin

9、gthepurelyMarkovModelwas84.33%.howevertheimprovedsystemhadtherateof85.17%.羽№predict—resultsoftheimprovedMarkovModelshowedthatthesystemcouldidentifythethreesequenceseffectively.Basedonthepromoteridentificationmethod,thispaperworked011theSVMandDNAsequencecharacterbase

10、donnonlinearmethod.UsingthelongrangecorrelationmethodinthebiologicalfunctiongroupRYandstructuregroupMKonsecondstudy,wasmoreaccordingwithbi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。