寻找差异表达的基因

寻找差异表达的基因

ID:14573078

大小:280.50 KB

页数:4页

时间:2018-07-29

寻找差异表达的基因_第1页
寻找差异表达的基因_第2页
寻找差异表达的基因_第3页
寻找差异表达的基因_第4页
资源描述:

《寻找差异表达的基因》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、Ø基因表达谱数据基因表达谱可以用一个矩阵来表示,每一行代表一个基因,每一列代表一个样本(如图1)。所有基因的表达谱数据在“gene_exp.txt”文件中存储,第一列为基因的entrezgeneid,第2~61列是疾病样本的表达,第62~76列是正常样本的表达。图1基因表达谱的矩阵表示Ø寻找差异表达的基因:原理介绍:差异表达分析是目前比较常用的识别疾病相关miRNA以及基因的方法,目前也有很多差异表达分析的方法,但比较简单也比较常用的是Foldchange方法。它的优点是计算简单直观,缺点是没有考虑到差异表达的统计显著性;通常以2倍差异为阈值,判断

2、基因是否差异表达。Foldchange的计算公式如下:即用疾病样本的表达均值除以正常样本的表达均值。差异表达分析的目的:识别两个条件下表达差异显著的基因,即一个基因在两个条件中的表达水平,在排除各种偏差后,其差异具有统计学意义。我们利用一种比较常见的T检验(T-test)方法来寻找差异表达的miRNA。T检验的主要原理为:对每一个miRNA计算一个T统计量来衡量疾病与正常情况下miRNA表达的差异,然后根据t分布计算显著性p值来衡量这种差异的显著性,T统计量计算公式如下:对于得到的显著性p值,我们需要进行多重检验校正(FDR),比较常用的是BH方法

3、(BenjaminiandHochberg,1995)。程序实现:l基因表达谱数据---gene_exp.txtlMatlab软件实现mRNA差异表达分析:MATLAB软件安装好之后,双击系统桌面的MATLAB图标,或在开始菜单的程序选项中选择MATLAB快捷方式,即开始启动MATLAB。初次启动MATLAB后,将进入MATLAB默认设置的桌面平台。桌面平台包括命令窗口、历史窗口、当前目录窗口和工作间管理窗口等窗口(如图2)。图2matlab窗口简介工作空间主要包含了目前用户定义的一些变量,用户可以在命令窗口执行一些特定的命令操作来完成特定的功能。

4、我们首先将工作目录选择到我们数据存放的硬盘目录下,然后导入要分析的基因表达谱数据,进行差异表达分析。在命令窗口输入main_MTDN_end.m程序中的1-21行命令(注意要将程序中的目录改变到自己数据的存储目录下),即可得到差异表达的基因。这段程序主要包含两个函数:mattest和mafdr。mattest函数是进行t检验的,输入的数据为疾病和正常的表达谱数据,返回每个miRNA的T统计量和对应的p值。这个参数还可以利用‘Permute’参数进行随机扰动,'Showhist'参数用来显示T统计量和p值的分布。mafdr函数是用来计算FDR的函数,

5、可以利用参数来选择计算FDR的方法,这里我们利用“BHFDR”参数来选择BH方法对p值进行校正,利用'showplot'参数来显示FDR的图示结果。结果可以在工作空间窗口中通过双击变量进行查看。结果展示:lT-统计量和p值的分布图以及FDR:图3T-score,P-values以及FDR的分布l差异表达mRNA:我们卡的阈值为FDR<0.1;2倍foldchange(Fold_c>2or<1/2),我们识别了11个下调的mRNA和6个上调的mRNA。差异表达基因的层次聚类分析ØmRNA表达谱数据:差异表达17个mRNA的表达数据Ø程序实现:我们接下

6、来利用差异表达mRNA的表达谱进行聚类分析,在命令窗口输入main_MTDN_end.m程序中的23-30行命令,结果会输出利用差异表达mRNA聚类分析的结果。这部分主要是利用一个现有的函数clustergram进行聚类分析,函数的输入数据是差异表达mRNA的表达谱。之后可以利用set函数对行的符号和列的符号进行设定。Ø聚类分析结果展示:Ø

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。