基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点

基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点

ID:41603544

大小:76.60 KB

页数:6页

时间:2019-08-28

基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点_第1页
基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点_第2页
基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点_第3页
基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点_第4页
基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点_第5页
资源描述:

《基于ChIP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、基于ChlP-seq数据HMM方法识别全基因组的差异组蛋白修饰位点摘要目的:表观遗传修饰是调控基因表达和基因组功能的一个主要因素。在不同的表观遗传修饰屮,羞异组蛋白修饰位点(DHMSs)是不同细胞类型、时期和环境影响时,表观遗传动态性质和基因表达调控的一个研究热点。为了测定全基因组的组蛋白修饰,ChlP-seq技术是一种有效的方法。因此,通过比较两个ChlP-seq文库可以识别潜在的DHMSso结果:我们的冃的是识别DHMSs,提出一种称为ChlPDiff的方法来通过ChlP-seq测定的数据全基因组比对组蛋白修饰位点。基于观察的ChI

2、P片段数,提出了一个隐马模型的方法推断每个基因组位置的纽蛋白修饰变化状态。我们通过比对小鼠ESC和NPC细胞的H3K27me3修饰位点来评估ChlPDiff的效果。我们证明了此方法确定H3K27me3的DHMSs具有高灵敏度,特异性和重复性。进一步应用ChlPDiff揭示不同细胞时期的差异II3K4me3和II3K36me3位点。我们研究中的比对有很多有趣的生物学发现。1•介绍真核DNA是被打包到一个出周围环绕组蛋白的DNA的重复核小体组成的染色质结构。组蛋白可以发生大量的翻译后修饰如,甲基化,乙酰化,磷酸化和泛素化。组蛋口修饰影响基因

3、表达和基因组功能。大量实验证明一•些组蛋白甲基化类型在生物学过程小起主要作用。一个典型的例子是在哺乳动物胚胎干细胞通过I13K27mc3抑制发育调控维持干细胞多能性。在癌症中也特异的发现一些表观遗传K27干细胞标记。此外,H3K9me3、H3K9me2和癌细胞中沉默肿瘤抑制基因相关。因此,特异基因组位置的差异组蛋白修饰密度,文中称为差异组蛋白修饰位点“DHMS”,在不同细胞类型,时期和环境影响是比较研究的重点。我们可以用染色质免疫共沉淀(ChIP)来测定组蛋白修饰信号,抗体用于富集修饰位点的DNA片段。在过去的儿年开发了儿种基于ChIP

4、的技术,包拾ChIP-chip,ChIP-PETandChlP-SAGE,用于大规模基因组区域的组蛋白修饰和转录因子结合位点研究。随着最近超高通量测序技术如Illumina/SolexaGA测序的产生,ChTP-seq成为一个主要的高覆盖、高分辨率和低成不的方法。ChTP-seq的基木思想是读取ChIP富集的序列的一端,接着映射这些短读称为tag到基因组上以找到这些片段的基因组位置。一个ChIP文库中有百万个tag标签测序,形成一个代表全基因组与组蛋白修饰位点和转录因子结合位点的ChIP片段数的谱。受到ChlP-seq在单个文库识别组蛋

5、白修饰位点的鼓舞,我们想是否可以通过计算的比较不同细胞类型和实验条件的两条ChlP-seq文库来识别DHMSoMikkelsen等人测定了小鼠ESC、NPC和MEF细胞的H3K4mc3(K4)和K27位点,比较三种类型启动子区域修饰位点的发生。他们研究的局限在于修饰位点是定性的比较而非定量。一个例子说明了这种局限,K4调控Klf4,已知其和基因表达正相关。Klfd在ESC和NPC启动子定性分析中都标记K4,因此不能解释在ESC的Klf4上调。另一方面,定屋比较表明ESC的Klf4启动子的K4密度比NPC多5倍,这和表达变化是一•致的。据

6、我们所知,儿乎没有全基因纽•定量比较两个ChlP-seq文库的文献。受芯片分析的启发,一个简单的解决这个问题的方法是将基因组分为箱bins,计算每个binChlP片段数的倍数变化。然而,fold-change方法对由ChlP片段随机样本的技术变化时敏感的。本文屮,我们提出的方法称为ChlPDiff通过考虑连续bin之间的相关性改进了fold-change方法。我们用隐马模型建立相关性,转移概率用一种无监督方式自动训练。接下来通过训练HMM参数来推断组蛋白修饰状态的变化。为了评估ChlPDiff的性能,我们首先比较Mikkelsen数据E

7、SC和NPC的K27文库。在全基因组识别了4277个k27的DHMS区域。三个标准显示效果是令人满意的:(a)敏感性:2006年在高度保守的菲编码元件屮,80%的从基因表达推断的DHMSs被ChlPDiff确定。(b)特异性:基于非细胞特异性控制比对,我们估计识别的DIIMS区域的假阳性率是0.19%。(c)重复度:检查两个独立的子集的结果的交集,显示3-4百万个tags测序的57.4%的DHMSs在技术上重现,评价结果还表明,在所有三个方面的定性分析,该方法优于fold-change的方法。我们进一步应用ChlPDiff到H3K4me

8、3(K4)和H3K36me3(K36),发现这两种类型组蛋白修饰的DHMSs和研究了他们在干细胞分化潜在的生物的作用。研究中有几个有趣的生物学发现。2.方法2.1确定组蛋白修饰位点给定來个ChlP-seq文

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。