DNA序列分析系统的开发应用-论文.pdf

DNA序列分析系统的开发应用-论文.pdf

ID:55062274

大小:146.71 KB

页数:3页

时间:2020-05-08

DNA序列分析系统的开发应用-论文.pdf_第1页
DNA序列分析系统的开发应用-论文.pdf_第2页
DNA序列分析系统的开发应用-论文.pdf_第3页
资源描述:

《DNA序列分析系统的开发应用-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、ISSN1009-3044E-mail:xsjl@dnzs.net.cnComputerKnowledgeandTechnology电脑知识与技术http://www.dnzs.net.caVo[.10.No.22.August2014Tel:+86—551-6569096365690964DNA序列分析系统的开发应用李晓艳,张玉冰(河南师范大学计算机与信息工程学院,河南新乡453007)摘要:2O世纪9O年代,人类基因组计划的启动,有力推动了DNA测序工作的发展。寻找某些特征片段(功能片段)在序列中的分布规律,对遗传学、生物

2、信息学等都有重要的应用意义。在教学、研究中发现,应用数学分析软件MATLAB的字符串处理功能,可以容易地达到功能片段分析的目的,本系统通过分析DNA序列链之间的关联程度,构造出特征矩阵,根据模糊c均值算法较准确的对DNA序列的集合进行了分类,同时利用matlab的图像显示功能将聚类的最终结果清楚明了的显示在图像中,使用户能清楚的看到聚类效果。本系统主要研究了DNA链碱基序列分析、多个DNA链特征矩阵提取、模糊c均值聚类算法分类DNA等三大部分。首先该系统对DNA序列的总长度和功能序列的长度进行了测量,利用一维数组确定功能片段在

3、DNA序列中的位置特征,从而完成了对DNA碱基序列的分析;其次该系统对用户给出的数个DNA链进行序列之间的特征分析,统计出每个序列的(A,T,c,G)碱基密度,得到一个特征矩阵,有效的为模糊聚类分析方法提供数据来源。最终该系统应用模糊c均值聚类算法,利用特征矩阵的数值,将数个DNA序列聚类并分为两类。关键词:模糊c均值;特征片段;系统开发中图分类号:TP311文献标识码:A文章编号:1009-3044(2014)22-5220-03l概述自从1953年Watson和Crick提出DNA双螺旋结构模型以来,探索DNA一级结构的工

4、作就广泛开展。根据模糊c均值算法可以较准确的对DNA序列的集合进行分类。模糊c均值聚类算法分类DNA指的是根据模糊聚类的方法,利用特征矩阵的数值,将数个DNA序列分为两类,系统可以显示出分类后的DNA序列所对应的序列号,以及聚类后的分布图像。本系统主要研究了DNA链碱基序列分析、多个DNA链特征矩阵提取、模糊C均值聚类算法分类DNA等三大部分。2运行软件和运行环境2.1运行软件本系统使用maflab7.0或以上版本作为运行库,它所具有的非常低的硬件要求和多平台支持,确保DNA序列分析系统系统各预定功能的实现。2.2运行环境在P

5、II400/64M以上的各种Pc机上运行,可运行于Windows98,Windows2000,WindowsXP,Windows7等操作系统,能打印A3纸张和A4纸张的打印机。3系统分析设计3.1功能需求分析根据DNA序列分析的具体情况,软件需具备以下四大功能:11DNA链碱基序列分析DNA链碱基序列分析指的是对于给定的某个DNA链,对某个功能片段出现的特征做简单的分析。首先测量出DNA序列的总长度和功能序列的长度,然后利用一维数组确定功能片段在DNA序列中的位置特征,系统可以提供出现的次数以及每一个功能序列出现时前后的碱基,

6、并利用图像更加直观的表达。21多个DNA链特征矩阵提取多个DNA链特征矩阵提取指的是对于给出的数个DNA链,找到序列之间的特征,统计出每个序列的(A,T,c,G)碱基密度,得到一个特征矩阵,为模糊聚类分析方法提供数据来源。31模糊C均值聚类算法模糊c均值聚类算法分类DNA指的是根据模糊聚类的方法,利用特征矩阵的数值,将数个DNA序列分为两类,系统可以显示收稿日期:2014—06-30作者简介:李晓艳,女;张玉冰(1991一),男,河南宜阳县人,冬科生,主要研究方向为通信工程。本栏目责任编辑:谢媛媛第1O卷第22期(2014年8

7、月)ComputerKnowledgeandTechnology电脑知识与技术出分类后的DNA序列所对应的序列号,以及聚类后的分布图像。本系统应用数学分析软件MATLAB的字符串处理功能,容易地达到功能片段分析的目的,同时通过分析DNA序列链之间的关联程度,构造出特征矩阵,根据模糊c:均值算法较准确的对DNA序列的集合进行了分类,主要研究了DNA链碱基序列分析、多个DNA链特征矩阵提取、模糊C均值聚类算法分类DNA等三大部分。系统同时也提供了图像属性分析功能,图像表示是应用在DNA序列分析方面的强有力的可视化工具,它能够揭示蕴

8、藏在DNA序列中的结构和功能的生物信息。本系统提供有DNA链碱基序列位置分布图像分析和DNA序列组模糊聚类图像分析两大部分,快捷有效地提取出需要的数据结果。3.2作业流程分析现有的作业流程从导入数据到打印结果共有5个步骤,基本上每一步都要手动干预,最终将数据保存到移动设备中。

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。