geo数据库简介

geo数据库简介

ID:24722180

大小:5.23 MB

页数:37页

时间:2018-11-14

geo数据库简介_第1页
geo数据库简介_第2页
geo数据库简介_第3页
geo数据库简介_第4页
geo数据库简介_第5页
资源描述:

《geo数据库简介》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、GEO(GeneExpressionOmnibus)数据库简介报告人:沈健2014.3.8近几年来,随着分子生物学技术的发展,微阵列芯片技术已成为生物学研究最重要的实验之一,尤其是基因芯片的广泛应用,产生了海量的数据,为基因研究提供大量高通量数据资料。基因芯片发展历程(DNA&RNA印记杂交)(斑点印迹法)基因芯片概述基因芯片(DNA芯片)是通过微阵列技术,根据核酸杂交的原理,将大量探针分子固定于支持物上,然后与标记的样品进行杂交,通过检测杂交信号的强度及分布来进行分析。基因芯片技术流程基因芯片技术流程基因芯片检测结果什么是GEO数据库随着微阵列芯片技术尤其是基因芯片的广泛应用,产生

2、了海量的数据,为基因研究提供大量高通量数据资料。迫切需要一个统一管理的公共数据库。基因表达数据库(GeneExpressionOmnibus,GEO)隶属于美国国立卫生研究院的NCBI。GEO是当今最大、最全面的公共基因表达数据资源。网址:www.ncbi.nlm.nih.gov/geo/GEO数据库的构成1.用户提交的原始数据2.GEO数据库整理后的数据平台(Platform)平台是描述一联串在特定实验中被检测或被定量分析的因素,同一个提交者、许多样本有关,是关于用于以高通量方式检查样本的物理试剂的信息。比如寡核苷酸探针组,cDNA,SAGE标签,抗体等。平台(Platform)平

3、台数据包含阵列或序列以及阵列平台的简要描述,每一个平台都分配了一个特有的检索号GPL***。例如平台GPL341:http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL341样本(Sample)样本是指以一个平台为基础、描述某个杂交实验或者实验条件的所有特征因素的大量测量信息,即关于被检查的mRNA样本,实验条件,和实验产生的基因表达测量数据信息。每个样品有一个而且只有一个必须先前被确定的亲代平台,同一个提交者,一个平台和许多系列有关。样本(Sample)样本数据描述了每个样本的操作环境、处理方法和分离出的各个成分的丰度测量。每个样

4、本均分配了一个特有的检索号GSM***。例如样本GSM81022http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSM81022系列(Series)系列是把构成某个实验的相关样本集中到一个有生物意义的数据集,同时可能还收集一些已被递呈者注明的重要基因或者分析结果纲要,即样本收集,样本是如何相关的,如何排序的,分析是如何进行的,和聚类数据是如何获得的信息。一个系列中的样品是通过某一共同的属性联结在一起的,同一个提交者,许多样本有关。系列(Series)系列数据将一系列相关的样本联系起来,提供了整个研究的关注点和描述,也包含了描述提取数

5、据、简要结论和分析的表格。每个系列均分配了一个特有的检索号GSE***。例如系列GSE3541http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE3541数据集组(DataSets)GEO存储的是一个分类广泛的、经过多种手段处理和不同方法分析的高通量实验数据。为了说明这些内容,GEO还增添了一个辅助分析工具,该工具可以把被提交的样本归纳集中到有生物学意义和在统计学上可比较的GEO数据集组(GEODataSets),能提供关于一个实验的相关梗概,以此作为下游数据挖掘和数据显示工具的基础。GEO数据集组(Datasets)储存了所有的

6、元数据,提供了GEO数据以“实验为中心”的主要观点。数据集组的检索为GDS***。 例如:GDS2225.表达谱(Profiles)表达谱数据储存了来自于DataSets基因表达谱信息。每一个表达谱都表现为一个能反映一个数据集组中所有样本的基因表达量的统计图。GEO表达谱(Profiles)储存了单个基因表达的数据资料,提供了GEO数据以“基因为中心”的主要看法。数据集组和表达谱的关系在GEODataSets中每个数据集组个体都各自确定一个实验,而在GEOProfiles中每个数据集组都对应多个表达谱个体。对平台上的每个基因(比如基因A),有多个样本)测量值。多个相关样本构成一个数据

7、集,从中可以产生单个或多个基因的表达谱比较图。GEO数据的数据检索——方法从GEO数据库主页面右侧找到搜索栏,直接输入要查找信息的关键词或者检索词,如“mir29a”或者“GDS2225ANDfto”,就会搜索到相应的DataSets和Profiles。从主页面右侧直接打开库浏览器,从中按照不同的“系列”、“平台”、“样本”、“物种”、“历史”来进行选择需要的数据类型。直接从GEO数据库的ftp服务器下载。ftp://ftp.ncbi.nlm.nih.go

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。