全外显子组测序分析中预处理方法和变异识别方法的比较

全外显子组测序分析中预处理方法和变异识别方法的比较

ID:14331811

大小:432.13 KB

页数:18页

时间:2018-07-28

全外显子组测序分析中预处理方法和变异识别方法的比较_第1页
全外显子组测序分析中预处理方法和变异识别方法的比较_第2页
全外显子组测序分析中预处理方法和变异识别方法的比较_第3页
全外显子组测序分析中预处理方法和变异识别方法的比较_第4页
全外显子组测序分析中预处理方法和变异识别方法的比较_第5页
资源描述:

《全外显子组测序分析中预处理方法和变异识别方法的比较》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、全外显子组测序分析中预处理方法和变异识别方法的比较闫瑾,潘琦,任红(重庆医科大学附属病毒性肝炎所,重庆400010)【摘要】目的研究在外显子组数据分析中,使用不同的预处理方法和变异过滤方法对变异识别的影响。方法采用FASTX-Toolkit、Trimmomatic作为预处理方法,修饰后不同的不匹配读长(single-endreads)取舍策略,以及硬过滤(hardfilter)和变异质量得分重新校正(VQSR)作为变异过滤方法对两例全外显子组数据进行变异识别,通过数据覆盖深度(DP)、识别变异的数目、Ti/Tv

2、值和基因型一致性等数据进行比较其效果。结果Trimmomatic预处理后的读长的测序覆盖深度与未预处理的原始数据接近,但明显高于FASTX-Toolkit预处理方法。当DP≥10×、基因型质量分数(GQ)≥20时,经Trimmomatic预处理后识别到的SNV数量比FASTX-Toolkit高,与未预处理组接近。当包含single-end读长时,FASTX-Toolkit组多识别的SNV数量高于(28%)Trimmomatic组(5%)。当样本量较少时,在所有试验组中硬过滤方法滤掉的SNV要少于VQSR。结论T

3、rimmomatic修饰(过滤)原始序列更温和,而FASTX-Toolkit可能过度过滤了原始数据。保留single-end读长有利于下游变异识别。硬过滤相较于变异质量得分重新校准表现出更高的容忍度。[关键词]全外显子组测序;预处理;变异识别[中图法分类号]R857.3;Q344+.12Comparisonofmethodsforpre-processingandvariantsfilteringinanalyzingwholeexomesequencingdataYanJin,PanQi,RenHong(In

4、stituteforViralHepatitis,ChongqingMedicalUniversity,Chongqing,400010,China)【Abstract】ObjectiveToinvestigatehowdifferentmethodsforpre-processingandvariantsfilteringaffectvariantscalling.MethodThroughthecalculationofdepthofcoverage,numberofvariants,Ti/Tvratioa

5、ndnon-referenceconcordance,wecomparetheeffectofFASTX-ToolkitandTrimmomaticinpreprocessingtheexomedata,thestrategiesofsingle-endinclusionand‘Hard’filterandvariantsqualityscorerecalibration(VQSR)invariantsfilterbyusingwholeexomesequencingdatafromtwotestsamples

6、.ResultTrimmomaticpre-processedreadsshowedsimilardepthofcoveragetoreadsthosewithoutpre-processing,butsignificantlygreaterthanthosebyFASTX-Toolkitpre-processedreads.Withdepthofcoverage≥10×andgenotypequality≥20,thenumberofcalledSNVsidentifiedbyTrimmomaticwasgr

7、eaterthanFASTX-Toolkit,butsimilartothosewithoutpre-processing.Withtheinclusionofsingle-endreads,thenumberofvariantsincreasedsignificantlyforFASTX-Toolkitpre-processing(~28%)thanTrimmomaticpre-processing(~5%).Intheallsettings,‘Hard’filteringfilteredlessSNVsth

8、anVQSRfilteringinsmallsamplesize.ConclusionSequencereadsweretrimmedand/orfilteredmoderatelybyTrimmomatic,whereasitseemedtobeover-filteredbyFASTX-Toolkit.Keepingthesingle-endreadsisgoodforvariant

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。