利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf

利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf

ID:50358940

大小:1.40 MB

页数:35页

时间:2020-03-15

利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf_第1页
利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf_第2页
利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf_第3页
利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf_第4页
利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf_第5页
资源描述:

《利用外显子组测序检测一个家系突变的分析方法介绍201412.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、利用外显子组测序检测一个家系突变的分析方法介绍郑宇2014-12-18提纲•NGS测序简介•分析基本流程–质量过滤–比对–寻找变异–变异质量过滤–变异注释–家系或群体样本综合分析过滤(一)NGS测序简介DNA测序简介•针对单个小扩增片段进行的Sanger测序(1-1000bp)–目前是验证DNA序列突变的金标准•全基因组或全外显子组的第二代测序(Next-generationsequencing,NGS)(Illumina:30-150bp)–优点:是通量高,成本较低–缺点:需PCR易引入误差,容易在高GC和同聚物的区域出现错误,无法对高重复区

2、域和单倍体型或杂合子序列等这些复杂区域进行测序•第三代测序–无需PCR实时测,读长更长,但通量低,准确性有待提高目标序列捕获测序•针对外显子组区域或用户定制的特定染色体区域,主要检测目标区域内的点变异•目标序列捕获测序可用于家系研究,也可用于较大样本量的病例-对照研究。对于已经完成连锁分析的家系,可将疾病连锁区间及附近的DNA区域或外显子序列进行捕获后进行测序•相比全基因组测序更加经济、高效,但由于捕获技术本身的局限性,也不能100%检测所有的外显子或目标区域(二)数据分析基本流程分析目的:变异检测•DNA变异常见类型:–单核苷酸多态(SNP)

3、和短片段插入缺失(Indel)–缺失(deletion)–插入(insertion)–倒位(inversion)–易位(translocation)–拷贝数变异(CNV)NGS数据分析基本流程实验室操作(DNA提取,文库制备…)测序(Illumina/SOLiD…)质量评估(数据产量和质量),加测/重测数据并去除低质量碱基质量差或产量不足序列拼接组装(比对,去重,indel重新比对,碱基质量重新计算)测序比对率,覆盖度,深度评估覆盖度不够变异检测(SNP,Indel…;体细胞,生殖细胞)SNP&IndelSV突变注释(dbSNP,1000g,E

4、SP6500,DGV等,位置,功能,保守性,通路,蛋白互作网络…)突变筛选,可视化生成分析结果报告突变验证,提送临床医生,生产诊断报告第一步:原始下机数据bcl文件转换成fastq文件FASTQfileformatFASTQ文件示例,该文件包含一条序列:@SEQ_IDGATTTGGGGTTCAAAGCAGTATCGATCAAATAGTAAATCCATTTGTTCAACTCACAGTTT+!''*((((***+))%%%++)(%%%%).1***-+*''))**55CCF>>>>>>CCCCCCC65AFASTQ文件将每条序列用四行表示:第

5、一行以“@’”打头,后跟着序列ID,可加上序列描述(类似于FASTA文件的标题行);第二行是序列内容;第三行以‘+’打头,后面的序列ID和描述可有可无;第四行是第二行序列每个位点的质量值,字符个数必须与第二行完全相同。以hiseq2000为例,一个run可产生6Greads(100bp读长)Fastq文件示例>>第二步:测序质量评估及过滤•评估数据产量和质量(Illumina报告示例),并根据需要去除接头污染和低质量序列,如:–FastQC可对Illumina和ABISOLiD测序序列质量进行快速评估(FastQC质量报告示例)–FASTX-T

6、oolkit和Galaxy即可评估序列质量,还可去除污染碱基和低质量碱基并对序列进行质量过滤第三步:将序列比对到参考基因组•目的:对测出的序列片段进行定位,看位于参考基因组上的哪个位置•生成SAM或BAM(二进制)文件–比对工具如:BWA,bowtie2,Illumina的HiseqAnalysisSoftware,SOAP等,我们用的BWAmemBam文件用igv工具展示示例•IntegratedGenomicsViewer(IGV)(http://www.broadinstitute.org/software/igv/home)–浏览大型基

7、因组数据的高性能交互式视图–整合了NCBIrefGene数据、hg19、hg18等不同版本的人类参考基因组–可在本地交互式查看局部比对–可同时查看多个样本的比对,支持多种数据类型第四步:变异检测•运用GATK/MuTect/VarScan/Atlas2/Samtools/SVDetect/Polymutt等工具包,查找SNP和Indel、缺失、插入、倒位、易位、CNV等–我们目前采用GATK工具包–GATK寻找SNP&Indel突变的流程图•GATKBestPractices(http://www.broadinstitute.org/gatk

8、/guide/best-practices)Snp&Indel生成VCF或者GVCF格式结果文件VCF格式vs.GVCF格式VCF格式##filefo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。