欢迎来到天天文库
浏览记录
ID:23622362
大小:2.25 MB
页数:21页
时间:2018-11-09
《实验6 基因芯片数据处理分析与GO分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、实验六:基因芯片数据处理和分析、GO分析实验目的:1.学会使用TM4软件集对芯片数据进行处理和分析,学会使用Cluster进行聚类分析3.学会GO语义及其相关注释的浏览与搜索,学会使用DAVID进行基因集功能富集分析实验内容:一、基因芯片数据处理和分析基因芯片或称微阵列(microarray)能够平行、高通量地检测成千上万基因转录本的表达水平,应用芯片技术可以比较正常和异常细胞中的表达,帮助识别疾病相关基因和药物作用靶标,分析复杂疾病的致病机制,也可以揭示基因间的表达调控关系。基因芯片数据处理包括
2、芯片杂交实验芯片数据采集(扫描)数据基本处理提交数据库生物信息学分析等步骤,涉及很多不同的实验类型。这里介绍TIGR中心开发的TM4软件包,应用MeV、Cluster和TreeView等软件对相关基因表达谱进行聚类分析和差异表达基因的筛选。1、芯片数据的获取与处理芯片杂交试验完成后,借助扫描仪将杂交信号形成TIF图像,通过图像分析软件从中提取原始杂交信号强度值,并将其转换成数字文本文件。但是不同扫描仪产生的数据格式不尽相同,因此,需要对不同平台的数据进行转换和整合。1.1、ExpressC
3、onverter数据格式转换TM4(http://www.tm4.org)的ExpressConverter可将其他格式的数据文件转换为MEV格式以供后续分析。由于该软件的运行需要Java运行环境支持,故第一次使用之前需要预先安装JavaRuntimeEnvironment(http://www.java.com)。完成ExpressConverter安装后,在开始菜单中找到Expressconverter并打开,出现软件主界面(Figure6.1)。Figure6.1ExpressConvert
4、er可以读取Genepix、ImaGene、ScanArray、ArrayVision、Agilent、TAV、Customized、Gal等格式的数据并将其转换成TM4能够使用的MEV格式。这里以Genepix文件转换为例,说明ExpressConverter的使用过程。(1)在”InputFormat”菜单中选择“GenePix”,指定它为读入文件格式。(2)在“File”菜单中选择“Selectinputfiles”,选定一个或多个需要转换的GenePix文件(扩展名为.gpr)。本例从该软
5、件的默认安装目录下,即C:ExpressConvertersamples中选择testdata.gpr文件(Figure6.2)。Figure6.2(3)在界面下方选择“Integrated”,然后在“File”菜单下选择“Startconverting”,开始转换格式,直到界面下方显示“Convertingissuccessful”,完成转换。此时,在原目录中会出现文件名相同但扩展名不同的.mev和.ann文件,它们可用记事本或Excel(推荐)打开。.mev文件包含注释(comments
6、)和数据(data),其中以“#”开头的注解部分包括文件版本号、生成日期、数据的行数等基本信息,数据部分则详细地列出芯片中每个探针的位置、信号强度等杂交信息(Figure6.3)。例如,UID为探针标识号;IA、IB分别表示Cy3(对照)和Cy5(样本)的杂交信号强度;R和C、MR和MC、SR和SC这三对数值指定了探针在芯片中的位置;其他各列参数分别反映对照(A)和样本(B)的杂交背景、面积、信号强度的中值等。Figure6.3.ann文件是一个芯片注释文件,用于存储每个探针的注释信息。其中UID
7、表示探针的标识号,R和C分别表示探针在芯片中的位置,Name和ID分别表示探针所代表的基因名和检索号(Figure6.4)。Figure6.41.2、MIDAS数据过滤和标准化芯片杂交试验所产生的原始数据需要对低质量数据作过滤处理,即表达水平是负值或很小的数据或明显的噪音数据,凡杂交信号值低于阈值的探针应予剔除,使其对应的基因不再进入下游的分析。由于芯片数据一般呈偏态分布,因此还需要对数据进行标准化处理,同时还要消除实验操作造成的系统误差。在TM4中,数据的过滤标准化通过MIDAS软件完成,下载地
8、址为:http://www.tm4.org/midas.html。此软件免安装,下载后解压即可使用。进入该软件所在文件夹,双击Midas.bat文件,便出现MIDAS软件主界面(Figure6.5)。Figure6.5这里以ExpressConverter转换产生的testdata.mev为例,介绍使用MIDAS进行双色(双通道)芯片的数据处理过程。(1)数据读取:点击常用工具栏中左起第5个“ReadSingleDataFile”的图标,然后在右侧参数(Parameters)窗口的
此文档下载收益归作者所有