DAVID使用方法介绍

DAVID使用方法介绍

ID:37284175

大小:1.80 MB

页数:23页

时间:2019-05-20

DAVID使用方法介绍_第1页
DAVID使用方法介绍_第2页
DAVID使用方法介绍_第3页
DAVID使用方法介绍_第4页
DAVID使用方法介绍_第5页
资源描述:

《DAVID使用方法介绍》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、DAVID使用说明文档一、DAVID简介DAVID(theDatabaseforAnnotation,VisualizationandIntegratedDiscovery)的网址是http://david.abcc.ncifcrf.gov/。DAVID是一个生物信息数据库,整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。DAVID这个工具在2003年发布,目前版本是v6.7。和其他类似的分析工具,如GoMiner,GOstat等一样,都是将输入列表中的基因关联到生物学注释上,进而

2、从统计的层面,在数千个关联的注释中,找出最显著富集的生物学注释。最主要是功能注释和信息链接。二、分析工具:DAVID需要用户提供感兴趣的基因列表,在基因背景下,使用提供的分析工具,提取该列表中含有的生物信息。这里说的基因列表和背景文件的选取对结果至关重要。1.基因列表:这个基因列表可能是上游的生物信息分析产生的基因ID列表。对于富集分析而言,一般情况下,大量的基因组成的列表有更高的统计意义,对富集程度高的特殊Terms有更高的敏感度。富集分析产生的p-value在相同或者数量相同的基因列表中具有可比性。DAVID对于基因列表的格式要求为每行一个基因ID或者是基因ID用逗号分隔开。基

3、因列表的质量会直接影响到分析结果。这里定性给出好的基因列表应该具有的特点,一个好的基因列表至少要满足以下的大部分的要求:(1)包含与研究目的相关的大部分重要的基因(如标识基因)。(2)基因的数量不能太多或者太少,一般是100至10000这个数量级。(3)大部分基因可以较好的通过统计筛选,例如,在控制组和对照组样品间选择显著差异表达基因时,使用的t-test标准:foldchanges>=2&&P-values<=0.05。(4)大部分是上下调的基因都涉及到特定的某一生物过程,而不是随机的散布到所有可能的生物过程中。(5)一个好的基因列表比起随机产生的一个基因列表,应该含有更丰富的生

4、物信息。(6)在同样的条件下,列表具有高度可重复性。(7)高通量数据的质量能够被其他独立的实验证实。以上(2),(3),(6)&(7)是来自上游的数据标准,DAVID会自动检查其余的各项要求,即(1),(4)&(7)。2.基因背景:在一项研究中,如果一个生物过程不正常,那么通过高通量筛选技术,对该过程共同作用的基因有更大的可能性被选为相关的一组。富集分析正是以此为基础。为检测富集的程度,必须选取一个背景来进行对比。基因背景的选取有一个指导原则,就是必须构建一个足够大的,研究者可能涉及的所有基因的集合。用户使用默认的背景文件(默认为该物种的所有基因),或者是上传一个基因列表文件作为基

5、因背景。3.DAVID为实现各项功能分析,提供了以下4个分析内容(共6个分析工具):(1)GeneNameBatchViewer这个工具能够实现将基因ID迅速翻译成基因名称,从而给研究者对于基因ID列表一个直观的印象,初步判断基因列表是否符合要求目的。图1中显示了该工具的分析结果,具体说明图1中标注。图1GeneNameBatchViewer的分析结果(2)GeneFunctionalClassification这个工具是GeneNameBatchViewer工具的延伸。由于基因名称并不能显著体现基因的功能,所以我们需要更加有效的功能分类工具。该工具基于它们共同的注释信息,而不是基

6、因名称,采用全新的模糊聚类算法,能够实现将功能相关的基因聚到一起作为一个单元,在生物学网络水平上去研究这些基因群。对聚类结果打分,分值越高,代表该组内的基因在基因列表中越重要。同时还提供了2-DView,以热图形式展现聚类到同一组的基因和该组内各个Term之间的关系。结果见图2,将列表中的基因ID作为聚类对象,将功能相关的基因分组显示。图3是以热图形式展示的gene-term关系。图2GeneFunctionalClassification的分析结果图32-DView展示gene-term关系(3)FunctionalAnnotation该工具是DAVID最核心的分析内容,包含了三

7、个子工具:FunctionalAnnotationChart该工具提供gene-term的富集分析。相比于其他富集分析软件而言,DAVID在该功能上最显著的特点是,注释范围的可扩展性:从最初的GO注释,扩展到现在超过40中的注释种类,包括GO注释,KEGG注释,蛋白相互作用,蛋白功能区域,疾病相关,生物代谢通路,序列特点,异构体,基因功能总结,基因在组织里的表达和论文等。用户可以根据需要选择其中的某些或者所有种类的注释信息。结果中以基因列表中富集的Terms为对象,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。