人类转录因子靶基因的数据整合研究

ID:45761242

大小:327.06 KB

页数:49页

时间:2019-11-17

人类转录因子靶基因的数据整合研究_第1页
人类转录因子靶基因的数据整合研究_第2页
人类转录因子靶基因的数据整合研究_第3页
人类转录因子靶基因的数据整合研究_第4页
人类转录因子靶基因的数据整合研究_第5页
资源描述:

《人类转录因子靶基因的数据整合研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、AbstractTheregulationofgeneexpressioncontainsaseriesofbasicandcomplexbiologicalprocesses.Itcanbedividedintofivelevelsofcomplexcontrols,whicharetranscriptionallevel,transcriptionallevel,post-transcriptionallevel,translationallevelandpost-translationallevelOneofthe

2、mostimportantandcomplexregulationshappensatthetranscriptionallevel・BothDNAelementsandtranscriptionfactors(TFs)couldregulatetheinitiationoftranscription.WiththedevelopmentandapplicationofChlP-chipandChlP-seqtechniques,therearehugehigh-throughputdataofgenome-wideci

3、s・regulatoryelementsandbindingTFsavailable・Alargeamountofrawdataorwell-annotateddatawereaccumulatedinthedatabaseofNCBIGEOandENCODE.InordertoobtaintheinformationofTFsandtheirTFtargets,wecollectedandintegratedthesedatasets.WeperfomiedkeywordssearchesovertheGEOandEN

4、CODEdatabasestofindtheTFbindingDNAdatasets,whichexcludeddataofhistonemodificationandgeneraltranscriptionfactors,e.g.H3K4me3andPOLR2A・Basedonthetextminingfromthewebfiles,weobtained958datasetsfromGEOand614datasetsfromENCODE.Wedownloadedalltheraworwell-annotateddata

5、fromthe1567datasetstotally.WehaveconstnictedapipelineforprocessingthecollectedChlP-seqdata.WeperformedsequencealignmentstothereferencegenomewiththeBowtiesoftwareandintegratedthesedatasetswiththeSAMtoolssoftware.ThenweusedtheMACSsoftwaretocallpeaksforeachtranscrip

6、tionfactor.Asaresult,wecollected1,567largescaledatasetsfor234humanTFs.Afteranalysis,weobtainedalargeamountofTFbindingsitepeaksforthe234TFsfromthesedatasets.Throughdataintegrationandanalysis,weprovidedanimportantresourceforfutherstudyofTFtargetsandTFregulation.Key

7、words:TFsTFtargetsChlP-seqChlP-chip摘要AbstractII2.2ChIP数据的收集与整合(17)2.3ChIP数据的分析与处理(20)1绪论1.1转录因子与基因表达调控(1)1.2转录因子-DNA相互作用研究(4)1.3转录因子相关数据库(6)1.4转录因子-DNA相互作用数据库(11)1.5本课题的主要研究内容与意义(14)2转录因子靶基因数据的整合分析(16)2.1数据整合与分析的策略2.4TFBS的peak检测与筛选(24)2.5结果与讨论(30)3全文总结与展望(34)致谢(3

8、6)参考文献(37)附录攻读硕士学位期间发表的论文目录(42)附表(43)1绪论1.1转录因子与基因表达调控基因表达(geneexpression)是一个复杂的牛物学过程,这一过程能将遗传信息以一类有活性II具有生物学功能的大分子形式展示出来⑴。这一过程一般包括基因转录、翻译和蛋白质的加工、组装等。rDNA和tDNA

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
正文描述:

《人类转录因子靶基因的数据整合研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、AbstractTheregulationofgeneexpressioncontainsaseriesofbasicandcomplexbiologicalprocesses.Itcanbedividedintofivelevelsofcomplexcontrols,whicharetranscriptionallevel,transcriptionallevel,post-transcriptionallevel,translationallevelandpost-translationallevelOneofthe

2、mostimportantandcomplexregulationshappensatthetranscriptionallevel・BothDNAelementsandtranscriptionfactors(TFs)couldregulatetheinitiationoftranscription.WiththedevelopmentandapplicationofChlP-chipandChlP-seqtechniques,therearehugehigh-throughputdataofgenome-wideci

3、s・regulatoryelementsandbindingTFsavailable・Alargeamountofrawdataorwell-annotateddatawereaccumulatedinthedatabaseofNCBIGEOandENCODE.InordertoobtaintheinformationofTFsandtheirTFtargets,wecollectedandintegratedthesedatasets.WeperfomiedkeywordssearchesovertheGEOandEN

4、CODEdatabasestofindtheTFbindingDNAdatasets,whichexcludeddataofhistonemodificationandgeneraltranscriptionfactors,e.g.H3K4me3andPOLR2A・Basedonthetextminingfromthewebfiles,weobtained958datasetsfromGEOand614datasetsfromENCODE.Wedownloadedalltheraworwell-annotateddata

5、fromthe1567datasetstotally.WehaveconstnictedapipelineforprocessingthecollectedChlP-seqdata.WeperformedsequencealignmentstothereferencegenomewiththeBowtiesoftwareandintegratedthesedatasetswiththeSAMtoolssoftware.ThenweusedtheMACSsoftwaretocallpeaksforeachtranscrip

6、tionfactor.Asaresult,wecollected1,567largescaledatasetsfor234humanTFs.Afteranalysis,weobtainedalargeamountofTFbindingsitepeaksforthe234TFsfromthesedatasets.Throughdataintegrationandanalysis,weprovidedanimportantresourceforfutherstudyofTFtargetsandTFregulation.Key

7、words:TFsTFtargetsChlP-seqChlP-chip摘要AbstractII2.2ChIP数据的收集与整合(17)2.3ChIP数据的分析与处理(20)1绪论1.1转录因子与基因表达调控(1)1.2转录因子-DNA相互作用研究(4)1.3转录因子相关数据库(6)1.4转录因子-DNA相互作用数据库(11)1.5本课题的主要研究内容与意义(14)2转录因子靶基因数据的整合分析(16)2.1数据整合与分析的策略2.4TFBS的peak检测与筛选(24)2.5结果与讨论(30)3全文总结与展望(34)致谢(3

8、6)参考文献(37)附录攻读硕士学位期间发表的论文目录(42)附表(43)1绪论1.1转录因子与基因表达调控基因表达(geneexpression)是一个复杂的牛物学过程,这一过程能将遗传信息以一类有活性II具有生物学功能的大分子形式展示出来⑴。这一过程一般包括基因转录、翻译和蛋白质的加工、组装等。rDNA和tDNA

显示全部收起
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
关闭