转录组测序从头组装

转录组测序从头组装

ID:40610527

大小:1.29 MB

页数:46页

时间:2019-08-05

转录组测序从头组装_第1页
转录组测序从头组装_第2页
转录组测序从头组装_第3页
转录组测序从头组装_第4页
转录组测序从头组装_第5页
资源描述:

《转录组测序从头组装》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、转录组从头组装大纲背景介绍实验数据质控与过滤组装功能注释研究思路探讨RNA是解密基因组的关键基因型表型DNAProteinRNA什么是转录组?全部转录本全部mRNA4大纲背景介绍实验数据质控与过滤组装功能注释研究思路探讨实验流程TotalRNAEukaryotesProkaryotesEnrichmRNAbyOligoRemoverRNA(dT)RNAfragment(~200nt)RandomhexamerprimedcDNAsynthesisSizeselectionandPCRamplificationIlluminasequencingRNA片段化与CDNA片段化的比较思

2、考样品降解(RNase污染),DNA污染,蛋白污染的评估?1.rRNA比率*28s/18s+≥1.1,RNA完整系数(RIN)≥72.28s和18s条带明显(变性琼脂糖凝胶电泳)3.比率*260nm/280nm+≥2.0(分光光度计测量)。大纲背景介绍实验数据质控与过滤组装功能注释研究思路探讨测序数据说明测序数据以fq格式保存:@readIDTGGCGGAGGGATTTGAACCCCCCCTTTTAAAAAAAAA+BBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBBB碱基质量值=ASCII值–64范围:2-40Qphred=-10log10(e)表1So

3、lexa测序错误率与测序质量值简明对应关系测序错误率测序质量值对应字符1%20T0.1%30^0.01%40h测序数据质控(a)Unbalancedbase(b)Balancedbasecompositiononrawreadscompositiononrawreads.测序数据质控(a)低质量的rawreads.(b)高质量的rawread.数据过滤测序数据过滤与质量统计:1,去接头,去污染,去低质量2,统计Q20%,GC%,Cleanreads数,有效数据量等。质控说明:Q20%>80%有效数据量满足合同要求老师需说明提交数据的类型(指明是Ra

4、wdata还是cleandata)大纲背景介绍实验数据质控与过滤组装功能注释研究思路探讨组装流程组装原理(DeBruijngraph)对于一个给定的read:GTCGAGGread长度:7bps取kmer长度为4bps如下:17组装原理(DeBruijngraph)构建DeBruijn图:18组装原理(DeBruijngraph)简化:19组装原理(DeBruijngraph)纠错:Tipsremoved20组装原理(DeBruijngraph)纠错:Bubblesremoved21组装原理(DeBruijngraph)解开短的重复序列(Ifthere’rereadsa

5、ssigningoneoutgoingbranchforeachincomingbranch…)22组装原理(DeBruijngraph)MapreadstocontigsContigsareconnectedbypairedreadstoformascaffoldinggraph23组装原理(DeBruijngraph)将reads比到scaffolds,根据overlap在gap处延伸24常用组装工具SOAPdenovoAByssIDBATrinitySOAPdenovo数据格式:FastaorFastq运行程序:soapdenovoall-sconfig_file-o

6、output_prefix分步组装:soapdenovopregraph-sconfig_file-ooutput_prefixsoapdenovocontig-goutput_prefixsoapdenovomap-sconfig_file-goutput_prefixsoapdenovoscaff-goutput_prefixSOAPdenovo在项目中的应用1:K大多数情况下设为最高值31取得最好的效果,如果物种杂合率较高,当K较低时得到较好的组装效果。2:R对于重复序列较高的物种建议加,一般加了-R都能取得较好的效果3:D是去除不可靠或连接关系数弱的边,现在1014版本将

7、默认设为1,如果连接的关系数较多,可以将D调高,构建更可靠的contig4:M主要针对杂合问题,程序默认设置为1,对于杂合率较高的物种可适当调高(当杂合率为千分之二,可设M为2,当杂合率为千分之三时,可设M为3)聚类去冗余Scaffold1NNNNNNScaffold2NNNNClusteredbytgiclUnigeneNN28聚类工具TGICLCap3聚类原理1所有scaffolds用mgblast进行相似性比对三个标准过滤:最小overlap长度;最小overlap相似

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。