资源描述:
《转录组测序结题报告.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、转录组测序结题报告1.mRNA纯化:抽提得到的总RNA首先利用10U的DNaseI(Ambion,美国)在37℃消化1小时;然后利用Micropoly(A)PuristTMmRNApurificationkit(Ambion,美国),进行mRNA纯化:把RNA稀释到250μl的体积,按照Kit的操作步骤(Cat.No:1919)进行;最后得到的mRNA用100μl预热的THE缓冲液洗脱,利用NanoDrop进行定量。2.cDNA合成:cDNA合成是在Ng等2005年发表的方法基础上改进而成(文献1,图1)。第一
2、链cDNA合成利用GsuI-oligodT作为反转录引物,10μg的mRNA作为模板,用1000单位的SuperscriptIIreversetranscriptase(Invitrogen,美国)在42℃作用1小时完成;随后利用NaIO4(Sigma,美国)氧化mRNA的5’帽子结构,并连接生物素;通过DynalM280磁珠(Invitrogen,美国)筛选连接了生物素的mRNA/cDNA,并通过碱裂解释放第一链cDNA;然后通过DNAligase(TaKaRa,日本)在第一链cDNA的5’末端加上接头,然后
3、通过ExTaqpolymerase(TaKaRa,日本)合成第二链cDNA。最后通过GsuI酶切去除polyA和5’端接头。图1.全长cDNA合成示意图3.cDNA测序:合成的cDNA利用超声仪(Fisher)打断到300-500bp的范围,利用AmpureTMbeads(Agencourt,美国)进行纯化。随后纯化的cDNA利用TruSeqDNAXXmplePrepKit–SetA(illumina,美国)制备文库,并利用TruSeqPEClusterKit(illumina,美国)进行扩增。最后在illum
4、ina机器上进行测序反应。测序得到的数据统计见表1.表1.Solexa测序统计样品对照12Reads数目(对)5,500,00010,254,84811,160,428Cleandata5,442,81510,160,13010,998,951(98.96%)(99.08%)(98.55%)平均长度1001001005.EST拼装:利用trinity进行拼装。共得到45,308个ESTcluster(contigs)。具体拼装结果见表2和图2。表2.拼装统计样品XXContig数目45,308Contig平均长
5、度698Contig长度范围201-16,169contiglength16000151291400011369120009436100008000670560004000188820007810200-300301-500501-10001001-20002001-3000>3000图2.Contigs长度分布(横坐标为基因长度分布,纵坐标为基因数量分布)6.数据分析:6.1基因预测:采用EMBOSS工具包(参考文献2)中的’GetORF’对拼装得到的contigs进行基因预测,从不同contigs中找到蛋白
6、编码序列。6.2基因注释:将预测得到的蛋白编码序列与GenBank的NR、GO、KEGG、KOG等数据库利用blastp进行比对,条件为Evalue<1e-5,选择匹配最好的一项作为注释信息。详细结果见annotation.xls,由左至右分别为拼接软件产生的contig名称、基因功能注释、ORF起始与终止位点坐标、正反义链、氨基酸长度、KOG分类。6.3GO分析:GO分析利用GoPipe(参考文献3)进行,预测蛋白首先与Swiss-Prot和TrEMBL数据库进行比对,条件为blastp,Evalue<1e-
7、5,然后比对结果利用GoPipe程序,根据gene2go,得到预测蛋白的GO信息。共有4,823个预测蛋白,匹配28,168项GOterms,如图3所示。详细结果见annotation.xls中“GO”sheet栏。cellular_component450040423801400035003049300025002000150011481020100050092725112720molecular_function400036593500304430002500200012521177150093973810
8、0057845450029627025918917416416213210885755246271710210biological_process40003715348735003000250020092000160615009958157801000637517477426370500114847664432995430图3.GO分布6.4代谢通路构建:利用KEGG数据库(参考文献3