欢迎来到天天文库
浏览记录
ID:34595076
大小:3.04 MB
页数:66页
时间:2019-03-08
《空间环境生物信息学数据的分析方法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、大连海事大学硕士学位论文空间环境生物信息学数据的分析方法研究姓名:李雨桐申请学位级别:硕士专业:计算机科学与技术指导教师:鲁明羽20090701中文摘要摘要生物信息学是由生物学、应用数学、计算机科学相互交义所彤成的学科,Cr}数掘挖掘作为一个崭新的计算机应用领域在生物信息学叶l有着J1.泛的J避jH。空川环境生物信息学数据的分析方法研究是在生物信息学范畴内,基于当今同渐成熟的太空技术展开,主要用来研究空间环境对水稻种子产生的生物学效应的机制,即针对空间环境诱变因素数据以及生物学实验分析获取的表型组、蛋自质组的变化信息数据进行存储、集成和管理,在
2、此基础上,对数据进行聚类分析、天联规则挖掘,试图找出空间环境诱变的机理及蛋白质约l改变机制。在查阅大量国内外参考文献基础上,本文开展了以下几项工作:构建诱变水稻变化信息的数据库系统,其中包括空间环境诱凶信息、诱变水稻的表型组和蛋白质组信息。构建数据仓库,解决不同组学之间存在的数据不一致、冗余、噪声等问题,为后续的数据分析与挖掘j【作打下良好的基础。提出了基于投票机制的动态聚类融合算法,该算法自动确定聚类个数,利用不同的相似度准则运行k.means算法,实现了动态确定运行次数,并将多次运行得到的结果映射到关联矩阵,使用投票机制获得最终的数据划分。
3、该算法具有对领域知识要求和参数依赖程度低等特点。优化并改进了经典关联规则Apriori算法,该算法针对牛物信息学数抓普遍存在着维数过大、数据量巨大等特点,通过减少数据库记录的扫描次数及频繁项集的生成个数提高算法效率。关键词:生物信息学;数据挖掘;空问环境诱变水稻;聚类融合;关联分析英文摘要ABSTRACTBioinformaticsisacross·disciplinesubjectbybiology,appliedmathematicsandcomputerscience.Howeverasanewfieldofcomputerapplica
4、tions,datamininghasawiderangeofapplicationsinbioinformatics.Theresearchonanalyticalmethodsofspaceenvironmentbioinformaticsdata,whichiSincludedinbioinformaticsareas,basedonthematurityoftoday’Slaunchofspacetechnology,mainlystudiesthemechanismofbiologicaleffectsofthericeseedsth
5、espaceenvironmentcaused.Accordingtothechangeddataincludingspaceenvironmentandthephenotype,proteomicswestore,integrateandmanageofbiologicalexperiments,wetrytofindmechanismofthespaceenvironmentgeneratedandoftheproteomicchangesusingrelevantmcthodssuchasclusteringandassociationa
6、nalysis.Afterreadinglotsofreferences,wecarryoutthefollowingtasksinthispaper:Buildthericemutationdatabasesystem,storingthedataofspaceenvironmentandthephenotype,proteomicsofbiologicalexperiments.Buildadatawarehousetoresolvetheproblemsofdatainconsistencies,redundancy,noiseandot
7、herissuesforsubsequentanalysis.Adynamicclusteringensemblesalgorithmbasedonvotingmechanismisproposed,whichautomaticallydeterminesthenumbersofclustering,usesdifferentsimilaritycriteriatorunk-meansalgorithmmanytimes,thenthefinaldatapartitionisobtainedbythevotingmechanismoverthe
8、associationmatrixthattheresultsaremappedto.Thealgorithmrequireslowknowledge
此文档下载收益归作者所有