空间环境生物信息学数据的分析方法研究

空间环境生物信息学数据的分析方法研究

ID:34595076

大小:3.04 MB

页数:66页

时间:2019-03-08

空间环境生物信息学数据的分析方法研究_第1页
空间环境生物信息学数据的分析方法研究_第2页
空间环境生物信息学数据的分析方法研究_第3页
空间环境生物信息学数据的分析方法研究_第4页
空间环境生物信息学数据的分析方法研究_第5页
资源描述:

《空间环境生物信息学数据的分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、大连海事大学硕士学位论文空间环境生物信息学数据的分析方法研究姓名:李雨桐申请学位级别:硕士专业:计算机科学与技术指导教师:鲁明羽20090701中文摘要摘要生物信息学是由生物学、应用数学、计算机科学相互交义所彤成的学科,Cr}数掘挖掘作为一个崭新的计算机应用领域在生物信息学叶l有着J1.泛的J避jH。空川环境生物信息学数据的分析方法研究是在生物信息学范畴内,基于当今同渐成熟的太空技术展开,主要用来研究空间环境对水稻种子产生的生物学效应的机制,即针对空间环境诱变因素数据以及生物学实验分析获取的表型组、蛋自质组的变化信息数据进行存储、集成和管理,在

2、此基础上,对数据进行聚类分析、天联规则挖掘,试图找出空间环境诱变的机理及蛋白质约l改变机制。在查阅大量国内外参考文献基础上,本文开展了以下几项工作:构建诱变水稻变化信息的数据库系统,其中包括空间环境诱凶信息、诱变水稻的表型组和蛋白质组信息。构建数据仓库,解决不同组学之间存在的数据不一致、冗余、噪声等问题,为后续的数据分析与挖掘j【作打下良好的基础。提出了基于投票机制的动态聚类融合算法,该算法自动确定聚类个数,利用不同的相似度准则运行k.means算法,实现了动态确定运行次数,并将多次运行得到的结果映射到关联矩阵,使用投票机制获得最终的数据划分。

3、该算法具有对领域知识要求和参数依赖程度低等特点。优化并改进了经典关联规则Apriori算法,该算法针对牛物信息学数抓普遍存在着维数过大、数据量巨大等特点,通过减少数据库记录的扫描次数及频繁项集的生成个数提高算法效率。关键词:生物信息学;数据挖掘;空问环境诱变水稻;聚类融合;关联分析英文摘要ABSTRACTBioinformaticsisacross·disciplinesubjectbybiology,appliedmathematicsandcomputerscience.Howeverasanewfieldofcomputerapplica

4、tions,datamininghasawiderangeofapplicationsinbioinformatics.Theresearchonanalyticalmethodsofspaceenvironmentbioinformaticsdata,whichiSincludedinbioinformaticsareas,basedonthematurityoftoday’Slaunchofspacetechnology,mainlystudiesthemechanismofbiologicaleffectsofthericeseedsth

5、espaceenvironmentcaused.Accordingtothechangeddataincludingspaceenvironmentandthephenotype,proteomicswestore,integrateandmanageofbiologicalexperiments,wetrytofindmechanismofthespaceenvironmentgeneratedandoftheproteomicchangesusingrelevantmcthodssuchasclusteringandassociationa

6、nalysis.Afterreadinglotsofreferences,wecarryoutthefollowingtasksinthispaper:Buildthericemutationdatabasesystem,storingthedataofspaceenvironmentandthephenotype,proteomicsofbiologicalexperiments.Buildadatawarehousetoresolvetheproblemsofdatainconsistencies,redundancy,noiseandot

7、herissuesforsubsequentanalysis.Adynamicclusteringensemblesalgorithmbasedonvotingmechanismisproposed,whichautomaticallydeterminesthenumbersofclustering,usesdifferentsimilaritycriteriatorunk-meansalgorithmmanytimes,thenthefinaldatapartitionisobtainedbythevotingmechanismoverthe

8、associationmatrixthattheresultsaremappedto.Thealgorithmrequireslowknowledge

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。