功率谱与信噪比快速算法研究

功率谱与信噪比快速算法研究

ID:9022849

大小:604.10 KB

页数:34页

时间:2018-04-15

功率谱与信噪比快速算法研究_第1页
功率谱与信噪比快速算法研究_第2页
功率谱与信噪比快速算法研究_第3页
功率谱与信噪比快速算法研究_第4页
功率谱与信噪比快速算法研究_第5页
资源描述:

《功率谱与信噪比快速算法研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、一、功率谱与信噪比快速算法研究本章分别建立Voss,Zcrve以及某实数序列映射下功率谱的快速计算方法.考虑到Voss序列映射给出的四个指示序列之间不是独立,从而利用降维手段Voss映射下功率谱的快速计算方法.新的求解方法,计算整个DNA序列的功率谱序列时只需求解3个指示序列的平方功率谱序列,进一步,只需要求解3个指示序列的离散Fourier变换.而原有公式需要求解4个指示序列的离散Fourier变换.考虑到对于很长的DNA序列,在利用离散Fourier变换计算其功率谱或信噪比时,总体计算量很大.新方法利用指示序列

2、之间的结构,构造处新的求解整个DNA序列的功率谱序列的公式,减少了离散Fourier变换的次数,进而达到功率谱快速计算的作用.数值结果表明,新老方法得到的DNA序列的功率谱序列的结果惊人一致,结果的差值控制在10-12以内.这说明新的计算方法是极为精确的.新老计算方法都能获得清晰的碱基的3-周期的统计现象,适合基因识别问题的理论研究需要.考虑文献[1]给出的推广的频谱信噪比定义,建立了Voss映射下信噪比的快速计算方法.引用“基于大量的计算实验表明,一个没有错误符号的、长度为N的DNA序列的总功率为N2”的结论,信

3、噪比的计算公式不需要进行离散Fourier变换,仅需统计DNA序列中核苷酸符号的位置信息.数值结果表明,新老计算方法得到的DNA序列的信噪比的结果完全一致,结果的差值控制在10-14以内.建立了Zcrve映射下功率谱的计算方法.比较Voss和Zcrve映射下功率谱的结果,发现两者数值上有差异,但形态上完全一致.由于Z-curve映射本身考虑了DNA指标序列的结构,所以其求解总功率谱只需进行3次有限Fourier变换,比传统的Voss映射计算效率有大幅提高.并且Zcrve映射具有优越的生物学意义,其图像能反应出相比V

4、oss映射更明显的碱基的3-周期的统计现象.指出上面提到的推广的频谱信噪比定义在此处依然适用.建立了某实数序列映射下功率谱的计算方法.用某实数序列映射下构造DNA序列的功率谱与信噪比的算法,形式紧凑,数值推导和程序实现简洁明了,特别的,整个计算过程只需计算1次有限傅里叶变换,从而对快速算法的设计有着极为重要的作用.指出上面提到的推广的频谱信噪比定义在此处依然适用.通过考虑离散Fourier变换的线性性质,分析了Zcrve和Voss映射的频谱与信噪比之间的关系.研究发现,Z-curve映射下的总功率谱与Voss的相比

5、,功率谱序列出现差异完全是腺嘌呤核苷酸的分布形态导致的.同时发现Z-curve和Voss映射下的信噪比存在简单的线性倍数关系.1.1Voss序列映射下的功率谱的快速算法考虑到Voss序列映射给出的四个指示序列之间不是独立,从而利用降维手段Voss映射下功率谱的快速计算方法.在DNA序列研究中,首先需要把A、T、G、C四种核苷酸的符号序列,根据一定的规则映射成相应的数值序列,以便于对其作数字化处理.这里采用Voss序列映射方法:1对一个长度为N的任意DNA序列,我们分别利用a,c,t,g,来表示‘A’,‘C’,‘T’

6、,‘G’,令集合I={,,,}ATGC这样DNA的符号序列xx:[1],[2],x⋯,[],[]xNSn∈I可以示x[n]=aun[]+tun[]+cun[]+gunn[],=0,1,2,...,N−1(1.1)ATCG其中⎧1,xn[]=bu[]n=⎨,b∈In,=0,1,2,...,N−1(1.2)b⎩0,xn[]≠b例如,假设给定的一段DNA序列片段为x=ATCGTAGCTGAC,则所生成的四个0-1序列分别为{[]}:{1,0,0,0,0,1,0,0,0,0,1,0}un,A{un[]}:{0,0,0,1,

7、0,0,1,0,0,1,0,0},G{un[]}{0,0,1,0,0,0,0,1,0,0,0,1}:,C{[]}:{0,1,0,0,1,0,0,0,1,0,0,0}un.T这样产生的四个数字序列又称为DNA序列的指示序列,显然(1.2)式成立.值得注意的是unununun[],[],[],[]不独立,满足关系ATCGun[]+unun[]+[]+un[]=1,n=0,1,2,...,N−1(1.3)ATCG为研究DNA编码序列(外显子)的特性,对指示序列分别做离散Fourier变换2πnkN−1−jNUb[k]=∑

8、uneb[],b=ACGTk,,,,=0,1,2,...,N−1(1.4)n=0这样,得到四个长度均为N的复数序列{U[]}k,b∈I.b计算每个复序列{U[]}k,b∈I的平方功率谱,使用文献[3]中的定义,对四个序b列的平方功率谱求和则得到整个DNA序列x的功率谱序列:2222Sk[]=Uk[]+Uk[]+Uk[]+Uk[],n=0,1,2,...,N−

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。