《表达序列分析》PPT课件

《表达序列分析》PPT课件

ID:39703586

大小:1.06 MB

页数:42页

时间:2019-07-09

《表达序列分析》PPT课件_第1页
《表达序列分析》PPT课件_第2页
《表达序列分析》PPT课件_第3页
《表达序列分析》PPT课件_第4页
《表达序列分析》PPT课件_第5页
资源描述:

《《表达序列分析》PPT课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第七章表达序列分析生物信息学表达序列标签(ExpressedSequenceTag,EST)是由大规模随机挑取的cDNA克隆测序得到的组织或细胞基因组的表达序列标签表达序列标签(EST)EST的概念EST是指通过对cDNA文库随机挑取的克隆进行大规模测序所获得的cDNA的5’或3’端序列,长度一般为60~500bp.EST是基因的“窗口”,可代表生物体某种组织某一时间的一个表达基因,故被称之为“表达序列标记”EST技术的形成和发展上世纪80年代,对cDNA序列进行大规模测序的想法就曾提出,但反对者认为cDN

2、A序列缺少重要的基因调控区域的信息。EST技术应用的首次报道是Adams(1991)等从三种人脑组织cDNA文库随机挑取609个克隆进行测序,得到一组人脑组织的EST,分析结果表明其中36个代表已知基因,337个代表未知基因。运用自动化测序技术,大规模生产EST序列。http://www.ncbi.nlm.nih.gov/projects/dbEST/体内:翻译体外研究:反转录连接,转化文库构建技术已经成熟测序成本已经大大降低大数据量分析理念已经形成EST技术流程◆非标准化的cDNA文库的构建。可用于基因表

3、达量的分析◆经标准化或扣除杂交处理的cDNA文库。富集表达丰度较低的基因A.cDNA文库构建cDNA文库的构建随机挑取克隆进行5’或3’端测序序列前处理聚类和拼接基因注释及功能分类后续分析B.序列测定及数据分析测序方向的原则①EST编码蛋白质的信息应满足同源序列比较分析②决定于用EST来进行研究的目的测序方向的选择◆5’端5’上游非翻译区较短且含有较多的调控信息。一般在寻找新基因或研究基因差异表达时用5’端EST较好,而且从5’端测序有利于将EST拼接成较长的基因序列。◆3’端3’端mRNA有一20-200

4、bp的polyA结构,同时靠近ployA又有特异性的非编码区,所以从3’端测得EST含有编码的信息较少,但研究非编码区有品种的特异性,可以作为STS标记.◆两端测序获得更全面的信息。(1)去除低质量的序列(2)应用BLAST、RepeatMasker或Crossmatch遮蔽数据组中不属于表达的基因的赝象序列(artifactualsequences)。●载体序列(ftp://ncbi.nlm.nih.gov/repository/vector)●重复序列(RepBase,http://www.girins

5、t.org)●污染序列(如核糖体RNA、细菌或其它物种的基因组DNA等)(3)去除其中的镶嵌克隆:Back-to-backpoly(A)+tails;Linker-to-linkerinmiddleofthesequence.(4)最后去除长度小于100bp的序列。序列前处理聚类的目的就是将来自同一个基因或同一个转录本的具有重叠部分(overlapping)的ESTs整合至单一的簇(cluster)中。聚类作用:产生较长的一致性序列(consensussequence),用于注释。降低数据的冗余,纠正错误数

6、据。可以用于检测选择性剪切。ESTs聚类的数据库主要有三个:UniGene(http://www.ncbi.nlm.nih.gov/UniGene)TIGRGeneIndices(http://www.tigr.org/tdb/tgi/)STACK(http://www.sanbi.ac.za/Dbases.html)ESTs的聚类和拼接◆looseclustering●产生的一致性序列比较长●表达基因ESTs数据的覆盖率高●含有同一基因不同的转录形式,如各种选择性剪接体●每一类中可能包含旁系同源基因的转录

7、本●序列的保真度低◆stringentclustering●产生的一致性序列比较短●表达基因ESTs数据的覆盖率低●因此所含有的同一基因的不同转录形式少●序列保真度高不严格的和严格的聚类利用cDNA克隆的信息和5’、3’端的序列信息,不同的Cluster可以连接在一起。Cluster的拼接常用的拼接软件◆Phrap(http://www.phrap.org/phredphrapconsed.html)◆CAP3(http://pbil.univ-lyon1.fr/cap3.php)◆d2_cluster(h

8、ttp://www.sanbi.ac.za/)(1)注释:◆序列联配Blastn:searchnucleotidedatabasesusinganucleotidequery.Blastx:searchproteindatabasesusingatranslatednucleotidequery.◆蛋白质功能域搜索(二结构比对)Pfam:ThePfamdatabaseisalargecollectionofpro

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。