转录组rnaseq术语解释

转录组rnaseq术语解释

ID:21777052

大小:55.02 KB

页数:6页

时间:2018-10-24

转录组rnaseq术语解释_第1页
转录组rnaseq术语解释_第2页
转录组rnaseq术语解释_第3页
转录组rnaseq术语解释_第4页
转录组rnaseq术语解释_第5页
资源描述:

《转录组rnaseq术语解释》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、RNA-Seq名词解释1.index测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。2.碱基质量值(QualityScore或Q-score)是碱基识别(BaseCalling)出错的概率的整数映射。碱基质量值越高表明碱基识别越可靠,碱基测错的可能性越小。3.Q30碱基质量值为Q30代表碱基的精确度在99.9%。4.FPKM(FragmentsPerKilobaseoftranscriptperMillionfragmentsmapped)每1百万个map上的reads中map到外显子的每1K个碱基上的fragment个数。计算公式为公式中,c

2、DNAFragments表示比对到某一转录本上的片段数目,即双端Reads数目;MappedReads(Millions)表示MappedReads总数,以10为单位;TranscriptLength(kb):转录本长度,以kb个碱基为单位。5.FC(FoldChange)即差异表达倍数。6.FDR(FalseDiscoveryRate)即错误发现率,定义为在多重假设检验过程中,错误拒绝(拒绝真的原(零)假设)的个数占所有被拒绝的原假设个数的比例的期望值。通过控制FDR来决定P值的阈值。7.P值(P-value)即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到

3、的P值,一般以P<0.05为显著,P<0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01。8.可变剪接(Alternativesplicing)有些基因的一个mRNA前体通过不同的剪接方式(选择不同的剪接位点)产生不同的mRNA剪接异构体,这一过程称为可变剪接(或选择性剪接,alternativesplicing)。可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,是导致真核生物基因和蛋白质数量较大差异的重要原因。在生物体内,主要存在7种可变剪接类型:A)Exonskipping;B)Intronretention;C)Alternative5

4、'splicesite;D)Alternative3'splicesite;E)Alternativefirstexon;F)Alternativelastexon;G)Mutuallyexclusiveexon。9.外显子跳跃(Exonskipping)外显子在前体mRNA剪接形成成熟mRNA过程中被跳过,最终没有出现在某些成熟mRNA上,这种剪接机制被称为外显子跳跃。10.内含子保留(Intronretention)前体mRNA在剪接形成成熟mRNA的过程中,部分内含子被保留下来,这种剪接机制被称为内含子保留。11.5'或3'端可变剪接前体mRNA在剪接形成成熟mRNA的过程

5、中,5'端或3'端边界发生不同方式的剪接,这种剪接机制被称为5'或3'端可变剪接。12.基因结构优化由于使用的软件或数据本身的局限性,导致所选参考基因组的注释往往不够精确,需要对原有注释的基因结构进行修正,这一过程称为基因结构优化。13.基因间区(intergenic)指基因与基因之间的间隔序列,不属于基因结构,不直接决定氨基酸,可能通过转录后调控影响性状的区域。14.UTR:(UntranslateRegions)非翻译区域。是信使RNA(mRNA)分子两端的非编码片段。5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子,3'-UTR从编码区末端的终止密码子

6、延伸至多聚A尾巴(Poly-A)的前端。15.ORF(openreadingframe)开放阅读框或开放读码框。是结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。16.CDS(Codingsequence)是编码一段蛋白产物的序列,是结构基因组学术语。DNA转录成mRNA,mRNA经剪接等加工后翻译出蛋白质,所谓CDS就是与蛋白质序列一一对应的DNA序列,且该序列中间不含其它非该蛋白质对应的序列,不考虑mRNA加工等过程中的序列变化,总之,就是与蛋白质的密码子完全对应。17.插入片段大小(insertsize)通过检

7、测双端序列在基因组上的起止位置,可以得到插入片段的实际长度,决定了测序的长度,是信息分析的重要参数。18.分子标记是遗传标记的一种,直接在DNA分子上检测遗传变异。分子标记能对不同发育时期的个体、组织器官甚至细胞作检测,数量极多,遍及整个基因组,多态性高,遗传稳定,不受环境及基因表达与否的影响。目前常见分子标记主要有SNP、InDel、SSR等。19.SNP(SingleNucleotidePolymorphism)即单核苷酸多态性,主要是指在基因组水平上由单个核苷酸的变异所引起

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。