欢迎来到天天文库
浏览记录
ID:48023946
大小:3.83 MB
页数:42页
时间:2020-01-29
《有参转录组结题报告.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、单位+转录组分析网页版结题报告2016/01/29目录1项目信息1.1基本思想1.2实验流程1.2.1样本检测1.2.2文库构建和上机测序1.3信息分析流程1.4样品信息2数据过滤2.1原始数据2.2数据过滤统计2.3测序质量分布2.4测序碱基分布3比对分析3.1比对率分析3.2基因区域分布3.3均一性分析3.4比对文件可视化4表达量分析4.1表达量估计4.1.1表达量分布统计4.1.2饱和度分析4.1.3样品实验的聚类4.2差异表达分析4.2.1差异表达分析统计结果4.2.2差异表达基因聚类图4.2.3差异表达基因统计结果注释5蛋白互作网络6功能分析6.1GO功能分析6.1.1差异表达
2、基因的GO统计6.1.2GO富集分析6.2GO富集DAG图6.3KEGG通路分析7可变剪接分析7.1可变剪切分析7.1.1可变剪切事件分类和数量统计7.1.2可变剪切事件结构和表达量7.2新转录本预测8变异分析9附录9.1参考文献9.2软件与方法说明9.3结果目录1项目信息1.1基本思想安诺优达转录组测序,基于Illumina测序平台,通过研究某个物种在特定状态或者特定时期下所有的mRNA,针对实际样品信息采用灵活的差异分析策略可以找到生物体不同时期、不同组织或不同个体间差异表达的mRNA,再通过软件进行功能注释,最终可以得到mRNA在生物体中参与生命活动的清晰生物信息图谱。1.2实验流
3、程1.2.1样本检测安诺优达对总RNA的样本检测包括以下3种方法:(1)1%的琼脂糖电泳检测RNA样品是否有降解以及杂质;(2)凯奥K5500分光光度计检测样品纯度(凯奥,北京);(3)安捷伦2100RNANano6000AssayKit(AgilentTechnologies,CA,USA)检测RNA样品的完整性和浓度。1.2.2文库构建和上机测序总RNA样本检测合格后,对于真核生物,用带有Oligo(dT)的磁珠富集mRNA,对于原核生物,用试剂盒去除rRNA,向得到的mRNA中加入FragmentationBuffer使其片断成为短片段,再以片断后的mRNA为模板,用六碱基随机引物
4、合成cDNA第一链,并加入缓冲液、dNTPs、RNaseH和DNAPolymeraseI合成cDNA第二链,经过QIAQuickPCR试剂盒纯化并加EB缓冲液洗脱。洗脱纯化后的双链cDNA再进行末端修复、加碱基A、加测序接头处理,然后经琼脂糖凝胶电泳回收目的大小片段并进行PCR扩增,从而完成整个文库制备工作。构建好的文库用IlluminaHiSeq2500进行测序。测序策略为PE125。其实验流程如下:图1实验流程图1.3信息分析流程HiSeq测序所得原始下机序列(RawReads),通过去低质量序列、去接头污染等过程完成数据处理得到高质量的序列(CleanReads),后续所有分析都是
5、基于CleanReads。安诺优达转录组测序信息分析流程主要分为三部分:测序数据质控、数据比对分析和转录组深层分析。其中,测序数据质控包括过滤测序所得序列、评估测序数据质量以及计算序列长度分布等;数据比对分析主要是针对比对到基因组中的序列,根据不同的基因组注释信息依次进行分类和特征分析,并计算相应的表达量;转录组深层分析包括差异表达分析、可变剪接分析、新转录本预测和变异分析等其他个性化分析。具体的信息分析流程图如下:图2信息分析流程图如项目仅有一个样品,无法进行虚线所示的分析内容。1.4样品信息本项目共6个样本,样品信息示例如下:表1样品信息SampleS1GroupG1Descript
6、ion...2数据过滤2.1原始数据Illumina高通量测序结果最初以原始图像数据文件存在,经CASAVA软件进行碱基识别(BaseCalling)后转化为原始测序序列(SequencedReads),我们称之为RawData,其结果以FASTQ(简称为fq)文件格式存储。FASTQ文件包含每条测序序列(Read)的名称、碱基序列以及其对应的测序质量信息。在FASTQ格式文件中,每个碱基对应一个碱基质量字符,每个碱基质量字符对应的ASCII码值减去33(Sanger质量值体系),即为该碱基的测序质量得分。不同Score代表不同的碱基测序错误率,如Score值为20和30分别表示碱基测序
7、错误率为1%和0.1%。其中FASTQ格式示例如下:图3FASTQ文件格式示例(1)第一行以“@”开头,随后为Illumina测序标识别符(SequenceIdentifiers)和描述文字(选择性部分);(2)第二行是碱基序列;(3)第三行以“+”开头,随后为Illumina测序标识别符(选择性部分);(4)第四行是对应碱基的测序质量,该行中每个字符对应的ASCII值减去33,即为对应第二行碱基的测序质量值。2.2数据过滤统计测序
此文档下载收益归作者所有