基于后缀数组的肽核酸芯片探针设计

基于后缀数组的肽核酸芯片探针设计

ID:22282041

大小:55.00 KB

页数:7页

时间:2018-10-28

基于后缀数组的肽核酸芯片探针设计_第1页
基于后缀数组的肽核酸芯片探针设计_第2页
基于后缀数组的肽核酸芯片探针设计_第3页
基于后缀数组的肽核酸芯片探针设计_第4页
基于后缀数组的肽核酸芯片探针设计_第5页
资源描述:

《基于后缀数组的肽核酸芯片探针设计》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于后缀数组的肽核酸芯片探针设计-->1绪论1.1引言从1953年JamesD.A设计HTF-MicrobiArray,对人体肠道微生物群落进行高级别分类[13]。但是各个软件设定的探针选择标准不同,适用研宄对象有所差异,涵盖了专门为微生物群落设计的功能芯片探针(HiSpOD、HPD等)、PCR引物、一般的寡核苷酸探针(ProbeSelect、OligoArray等),以及一些比较特殊的探针,例如overgo探针(OHgoSpa)(表1-1),根据这三个标准,蹄选出一组或多组IE标的合格探针集,在相同的杂交环境下使芯片上的探针集与輕标发生特异性结合。这样,蹄选出的才是有效探针。特异性主要

2、是指在杂交环境中探针与非祀标序列的不结合度。其中交叉杂交是一个影响特异性的重要因素,一般使用Kane的两大规则检测交叉杂交程度,即探针与非IE标的配对碱基的百分数2肽核酸(PNA)芯片探针设计算法研究2.1背景及现状肽核酸(PNA)是一种人工合成的聚合物,与DNA和RNA不同,它的骨架是中性的伪肽链N-(2-氨基乙基甘氨酸),其结构见图2-1。它能够与DNA和RNA通过Watson-Cricket碱基互补配对的形式结合[49],而且由于其结合时的独特属性,PNA—直应用于多种生物医学领域,包括基因研究,诊断和治疗实验52]。PNA分子的最常见用途是用作互补核酸序列的探针。与其他核酸探针一

3、样,PNA序列碱基的特异性来自于与IB标的互补配对,但是PNA探针的主要优势在于它的不带电骨架。由于没有传统核酸探针与它们的IB标互补配对时带来的静电斥力,中性PNA骨架使得PNA探针具有更高的亲和力和探针-IE标双链的热力学稳定性。探针的特异性检测是探针设计的一个重要部分,PNA探针的物化性质十分有利于控制探针与IE标结合的特异性[53]。分析认为,传统的DNA或RNA探针,探针与IE标之间的碱基结合主要依靠氯键来抵消两条带负电荷的骨架之间的静电斥力。优化特异性检测需要各参数之间的微妙平衡,例如杂交温度、探针浓度、探针长度和G-C的含量,以及有机溶剂和离子浓度,即使对经验丰富的诊断者来

4、说,也是一个不小的挑战。在这样的情况下,拥有高结合能的PNA探针-IE标双链体,在诊断探针检测的发展占有实质性的优势。PNA-DNA双链具有的高解链温度允许PNA探针降低在IB标中形成二级结构的可能性,并且在严格的杂交环境中提高结合的特异性。这种探针的高亲和力,还允许探针序列的长度更短、在检测中的探针浓度更低、降低成本和减少探针与检测基质和生物样品组分等潜在的非特异性相互作用。在PNA-DNA双链中,错配比起DNA-DNA双链来更不稳定,因此这类探针非常适合应用于区分单间基序列的差异,例如点突变和单核苷酸多态性,比起DNA和RNA探针,这类探针的特异性更强。………..2.2肽核酸(PNA

5、)探针设计流程本论文研究并设计了以下几个基本步骤来设计PNA探针:首先输入IE标所在的物种的整个转录组,例如如果IE标为人类FRDA基因的启动子和外显子1,这里使用的外显子数据和转录组数据是由NCBI提供的;接下来确定IE标为人类FRDA基因的启动子和外显子1,对IE标构造后缀数组(suffixarray)标记IE标中的重复序列片段,然后遍历IE标,越过已标记的重复序列片段,按照用户设定的探针长度范围截取探针,形成候选探针集;继续对探针分别进行特异性、敏感性和一般性检测,如果均达到要求则记录为合格探针,否则标记为不合格探针,流程图如图1所示:芯片探针设计的难点在于特异性的检测,特异性主要

6、是指在杂交环境中探针与非祀标序列的不结合度。探针与非祀标结合程度的检测主要体现在交叉杂交检测和探针低复杂度区域和重复序列的检测。合格探针其序列中-->所包含的低复杂度的序列要尽可能的小,所谓低复杂度的序列是指序列组成上单一或简单重复,如连续单核脊酸序列、连续二核苗酸序列以及连续三核苷酸序列。此外,合格探针其序列组成上必须不包含基因组重复片段,这样才能保证该探针是独一无二的。本文中调用BLAST进行交叉杂交的检测,并对串联重复序列的检测的进行了重点研究。……….3算法应用实例及程序设计......223.1基于后缀数组的检测探针序列串联重复部分......223.2程序设计与实现.....

7、.233.2.1程序功能结构......243.2.2公共类设计......253.2.3程序运行环境和设计结果......263.2.4用户界面设计与介绍......273.2.5算法应用实例......293.3本章小结......314结论与展望......324.1工作结论......324.2未来工作展望......323算法应用实例及程序设计3.1基于后缀数组的检测探针序列串联重复部分的算法应用实例(特异性)为了说明这种

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。