DNA序列数值映射方法的研究

DNA序列数值映射方法的研究

ID:38203910

大小:165.16 KB

页数:5页

时间:2019-05-31

DNA序列数值映射方法的研究_第1页
DNA序列数值映射方法的研究_第2页
DNA序列数值映射方法的研究_第3页
DNA序列数值映射方法的研究_第4页
DNA序列数值映射方法的研究_第5页
资源描述:

《DNA序列数值映射方法的研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、生物医学工程学杂志JBiomedEng2005;22(4)∶681~685*DNA序列数值映射方法的研究饶妮妮邱丽君(电子科技大学生命科学与技术学院,成都610054)摘要DNA序列的数值映射是用数学方法、物理方法和数字信号处理方法分析生物分子序列首先要解决的问题。本文分析了现有8种DNA序列数值映射方法的特点和适应性。在此基础上,提出了一种基于DNA序列中碱基出现概率的数值映射方法。大多数蛋白编码序列具有3-碱基周期特性(周期-3性质)。借助于具有周期-3性质的DNA序列的频谱分析,比较了8种数值映射方法的优劣,并证实了新方法的有效性。计算机仿真结果表明,基于复域的映

2、射方法无论从携带原有生物分子序列的信息量,还是数值映射后所得功率谱的效果均优于其它7种映射方法,而DNA序列新数值映射方法能够获得与复域法几乎相同的识别率。关键词DNA序列数值映射3-碱基周期性频谱分析StudyofNumericalMappingMethodsforDNASequencesRaoNiniQiuLijun(SchoolofLifeScience&Technology,UniversityofElectronicScienceandTechnologyofChina,Chengdu610054,China)AbstractThefirstproblemto

3、besolvedistomapDNAsequencesontonumericalsequencesinbio-molecularsequenceanalysisbymathematical,physicalanddigitalsignalprocessingmethods.Thecharactersandtheadaptabilityofeightexistingmappingmethodsareanalyzedinthispaper.AnewnumericalmappingmethodbasedontheprobabilityofbasesinthesegmentDN

4、Asequenceispresented.Mostofthecodingsequencesarecharacterizedby3-baseperiodicity.Furthermore,eightnumericalmappingmethodsarecomparedandthenewmethodisverifiedbymeansofthespectrumanalysisofDNAsequencewith3-baseperiodicity.Thecomputersimulationresultsshowthatthemappingmethodbasedcomplexplan

5、eissuperiortotheothersevenmethodsinreflectingtheoriginalinformationofthebio-molecularsequenceandthequalityoftheobtainedpowerspectra.Theidentificationratethenewmethodattainsisapproximatelywhatthecomplexplanemethodhasachieved.KeywordsDNAsequenceNumericalmapping3-baseperiodicitySpectrumanal

6、ysis[4,5]可行的方法。本文首先将现有8种映射方法按照1引言其自身特点分为3类,再对具有周期-3性质的[6]在用数学方法、物理方法和数字信号处理方法DNA序列进行数值映射后进行傅立叶变换,依据-1对DNA序列进行分析的研究中,首先需要把组成1/3bp频率点上谱峰的高低以及正确识别出周期-DNA序列的四种碱基(A、C、T、G)按照一定的规3性质的识别率高低,对8种映射方法进行了比较。则映射成相应的数值序列。有关研究表明,DNA序现有的8种映射方法均假设了DNA序列中的四个列数值映射方法的优劣会直接影响到最终分析结果碱基等概率出现,这与部分DNA序列的情况不符,[1,

7、2]的生物学意义的解释。随着基因数据库的不断丰无疑,将会损失或掩盖这部分生物分子序列所携带[7]富,对大量序列的进一步研究证实,编码蛋白质的序的有用生物信息。因此,本文提出一种能够反映原列具有周期-3性质,而非编码序列(如内含子等)不序列中碱基出现概率(即碱基在序列中的含量),同具有此性质。尽管已有研究表明,少量较短的编码序时又能继承基于复域映射方法优点的映射方法--概[3]列并不具有周期-3性质,但利用这一性质来识别率法,通过计算机仿真实验,得到了较高识别率,DNA序列中的蛋白质编码序列或基因仍然是一种证实了新映射方法的有效性。*教育部

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。