如何查找一个基因的启动子序列

如何查找一个基因的启动子序列

ID:16292213

大小:103.00 KB

页数:16页

时间:2018-08-09

如何查找一个基因的启动子序列_第1页
如何查找一个基因的启动子序列_第2页
如何查找一个基因的启动子序列_第3页
如何查找一个基因的启动子序列_第4页
如何查找一个基因的启动子序列_第5页
资源描述:

《如何查找一个基因的启动子序列》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、如何查找一个基因的启动子序列发表者:刘小丰 (访问人次:6102)刘小丰收集整理定义:启动子是参与特定基因转录及其调控的DNA序列。包含核心启动子区域和调控区域。核心启动子区域产生基础水平的转录,调控区域能够对不同的环境条件作出应答,对基因的表达水平做出相应的调节。区域:启动子的范围非常大,可以包含转录起始位点上游2000bp,有些特定基因的转录区内部也存在着转录因子的结合位点,因此也属于启动子范围。这项搜寻要从UCSC基因组浏览器开始,网址为http://genome.ucsc.edu/cgi-bin/hgGateway。以编码pendrin(PDS)的基因为例来说明上述问题。PDS与

2、耳蜗的异常发育、感觉神经性听力下降以及弥散性甲状腺增大(甲状腺肿)有关。  进入UCSC的主页后,在Organism的下拉菜单中选择Human,然后点击Browser。使用者现在到了人类基因组浏览器入口。本例的搜寻很简单:在assembly的下拉菜单中选择Dec.2001,在position框中键入pendrin,然后点击Submit。返回的页面结果显示一个已知的基因和两个mRNA序列。继续点击mRNA序列的登录号AF030880,出现包含这个mRNA区域的图解概要。为了获得这个区域更清晰的图像,点击紧靠zoomout的1.5X按钮。最后点击页面中部的resetall按钮,使各个路径的设

3、置恢复默认状态。  然而,对于本例的搜寻目的来说,默认设置不是理想的设置。按照视图利用页面底部的TrackControls按纽,将一些路径设置为hide模式(即不显示),其他设置为dense模式(所有资料密集在一条直线上);另一些路径设置为full模式(每个特征有一个分开的线条,最多达300)。在考虑这些路径内究竟存在那些资料之前,对这些路径的内容和表现做一个简要的讨论是必要的,许多这些讨论是由外界提供给UCSC的。下面是对基因预测方法的更进一步讨论,这些信息也可以在其他地方找到。  对于KnownGenes(已知基因)和预测的基因路径来说,一般的惯例是以一个高的垂直线或块状表示每个编码

4、外显子,以短的垂直线或块状表示5′端和3′端非翻译区。  起连接作用的内含子以非常细的线条表示。翻译的方向由沿着细线的箭头指示。  KnownGenes来自LocusLink内的mRNA参照序列,已经利用BLAT程序将这些序列与基因组序列进行比对排列。  AcemblyGenePredictionsWithAlt-splicing路径是利用Acembly程序将人类mRNA和EST序列数据与人类基因组序列进行比对排列而来的。Acembly程序试图找到mRNA与基因组序列的最好的比对排列以及判断选择性剪接模型。假如有多于1个的基因模型具有统计学意义,则它们都全部显示出来。有关Acembly的

5、更多信息可以在NCBI的网站找到(http://www.ncbi.nih.gov/IEB/Research/Acembly/)。  EnsemblGenePredictions路径由Ensembl提供。Ensembl基因通过许多方法来预测,包括与已知mRNA和蛋白质进行同源性比较,abinitio基因预测使用GENSCAN和基因预测HMMs。http://www.ebi.ac.uk/ensembl/  Fgenesh++GenePredictions路径通过寻找基因的结构特征来预测基因内部的外显子,例如剪接位点的给位和受位的结构特征,利用一种动态的程序算法推定编码区域和推定外显子5′端和

6、3′端的内含子区域;这个方法也考虑到蛋白质相似性的资料。  GenscanGenePredictions路径由GENSCAN方法衍生而来,通过这个方法,可以确定内含子、外显子、启动子区域和poly(A)信号。此时,这个方法并不期望查询的序列只出现1个基因,因此可以对部分基因或被基因之间的DNA分隔的多个基因进行准确的预测。  HumanmRNAsfromGenbank路径显示基因库的人类mRNAs与基因组序列的比对排列。  SplicedESTs和HumanEST路径显示来自GenBank的ESTs序列与基因组的序列对齐比较。由于ESTs通常代表了转录基因的片断,一个EST很有可能对应于

7、某个外显子区。  最后,RepeatingElementsbyRepeatMasker这个路径显示的是重复元件,例如散在的或长或短的核元素(SINEs和LINEs),长末端重复序列(LTRs)和低复杂性区域(http://repeatmasker.genome.washington.edu/cgi-bin/RepeatMasker)。一般来说,在将基因预测方法应用于核苷酸序列之前,需要去掉或掩饰这些成分。  回到视图显示的例子,可以

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。