dna序列数据挖掘分析的文献总结

dna序列数据挖掘分析的文献总结

ID:11995725

大小:32.00 KB

页数:5页

时间:2018-07-15

dna序列数据挖掘分析的文献总结_第1页
dna序列数据挖掘分析的文献总结_第2页
dna序列数据挖掘分析的文献总结_第3页
dna序列数据挖掘分析的文献总结_第4页
dna序列数据挖掘分析的文献总结_第5页
资源描述:

《dna序列数据挖掘分析的文献总结》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、1.基于DNA序列数据挖掘算法研究岳晓宁井元伟(2009)摘要:引入数据挖掘技术,研究DNA序列数据内在规律性,并给出DNA序列分类问题的算法。综合考虑碱基组的出现概率以及相邻氨基酸之间的关系,从DNA序列片段的个案中密码子分布密度角度出发,提取出已知类别的DNA序列片段的特征;应用分类的逐步判别分析的方法,提出判别能力不显著的变量,给出DNA序列分类的判别函数。仿真结果表明,该算法具有分类计算公式简单且分类结果精度的优点。关键字:DNA序列密码子判别函数数据挖掘频率主要通过分析64个密码子来判断DNA序列的

2、分类2.数据挖掘技术在生物医学领域的应用余辉吕扬生(2003)摘要:阐述了数据挖掘技术基本流程及其在生物医学领域的应用前景,介绍了近年来国内外研究学者运用数据挖掘技术在DNA分析、医学影像数据自动分析以及多种生理参数监护数据分析领域的研究趋势和发展方向。关键字:数据挖掘DNA分析医学数字影像标准医院信息系统医学图像的存档与通讯系统3.聚类和关联规则挖掘在基因表达数据分析中的应用研究马猛钮俊清宁岩郑浩然王熙法(2008)摘要随着DNA微阵列技术的广泛应用,产生了海量基因表达数据。如何利用这些数据研究基因间的调控

3、关系成为当前生物信息学的一个研究热点。关联规则挖掘是数据挖掘领域的一个重要技术,然而直接对基因表达数据进行关联规则挖掘存在两个问题:一是时间和空间复杂度过高;二是获得的规则仅定性表示基因间的调控关系,无法提供关于调控关系强度的信息。本文利用聚类实现数据降维,然后将基因表达水平离散化为七个状态,最后关联分析每个聚类中的基因表达数据。实验结果表明本文的分析方法是有效地。关键字生物信息学;基因表达数据;数据挖掘;聚类;关联规则。4.基于DNA计算的聚类算法研究张鸿雁(博士学位论文2011年山东师范大学)本课题把聚类

4、中的数据对象转化成为图中的节点,那么簇的生成就转化为节点的组合问题,进而把善于解决组合问题的DNA计算应用到聚类中去,在DNA计算应用中是新的尝试,也为聚类分析提供了新的思路和方法。本文的研究内容:1、利用面向对象方法学分析并描述DNA计算的相关概念和技术。1、利用DNA计算进行聚类2、在已提出的基于DNA计算的聚类理论思想的基础上,进一步通过实验来证明其可行性和效果。3、算法复杂度的讨论分为两个方面:一个是在计算机模拟的基础上对基于DNA计算的聚类算法进行了复杂度的讨论,在计算机编程基础上,讨论按照计算机编

5、程的思想分析DNA计算的时间复杂度;另一个是DNA计算算法的复杂度讨论,讨论了生化实验的消耗和反应时间。关键词:DNA计算聚类算法层次聚类网格聚类粘贴模型5.聚类分析方法在DNA序列分类中的应用王显金阳军(2011)摘要:从DNA序列片段中密码子分布密度角度出发,提取DNA序列片段的特征,基于五大类氨基酸出现的频率,应用聚类分析方法对DNA序列片段 进行分类,结果表明,该算法具有分类简单且分类结果精度较高的优点。关键字:密码子 频率 聚类分析主要内容:四种碱基,三个构成一个密码子,所以密码子共有64个,64种

6、密码子出现的频率构成64维特征向量,最终分成5大类。然后计算距离在进行分类。本文对DNA序列信息的提取,主要以生物学意义为基础:根据氨基酸分子中侧链基的急性性质,把氨基酸分成五大类(含终止信息三联体),出于兼顾碱基含量和融入对碱基排列顺序的考虑,采用指针平移法对各类氨基酸在每一个DNA序列出现频率进行统计,得到一个五维特征向量与之对应,降维后得到四维向量,所得向量维数较低,便于计算和操作;使用SPSS统计工具,采用层次聚类法对40个样本进行分类,分类结果精度较高,其中学习样本回代正确率为95%。6.DNA数据

7、库中的关联规则挖掘王鑫(东北师范大学硕士学位论文2007)摘要:随着人类基因组计划的顺利完成和各种后基因组计划的开始实施,涌现出海量的生物分子数据。充分利用这些数据,揭示这些数据的内涵,得到对人类有用的生物学信息,是科学家们所面临的一个严峻的挑战。虽然生物信息学中已经提出了大量有积极意义的方法,但目前大部分的方法还不能获得最优的模式,最准确的预测。本文根据数据挖掘中的关联规则挖掘算法。提出了一种支持度——匹配框架下、挖掘基因DNA序列数据库中非公共的闭合频繁序列之间的关联规则的新型算法。本文使用了来自美国NC

8、BI中RAKalpha和HBsAg基因数据,以实例的形式说明和分析了算法。分析表明,这种算法不仅可以准确、快速的找到所有的DNA序列模式,还可以更好的发现这些模式之间隐含在序列结构中的生物学信息。并且利用这种算法在基因DNA序列数据得到的规则,可以准确的预测新的基因DNA数据的种类和功能。关键词:数据挖掘;关联规则;DNA序列数据库;Apriori算法。第一章引言1.1生物信息学简介1.2数据挖掘的

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。