试谈分子生态网络分析研究进展

试谈分子生态网络分析研究进展

ID:9750908

大小:57.50 KB

页数:9页

时间:2018-05-07

试谈分子生态网络分析研究进展_第1页
试谈分子生态网络分析研究进展_第2页
试谈分子生态网络分析研究进展_第3页
试谈分子生态网络分析研究进展_第4页
试谈分子生态网络分析研究进展_第5页
资源描述:

《试谈分子生态网络分析研究进展》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、试谈分子生态网络分析研究进展1分子生态X络的构建  高通量测序、或者功能基因芯片得到的数据都可以用矩阵的形式表现,矩阵的每一行表示一个样品,每一列表示一个分类操作单元(OTU),或者一个基因的表达量,数值的高低表示该OTU(基因)在样品中的含量的高低,矩阵中0或者NA(空缺)表示该OTU(或基因)没有在该样品中被检测到。  1.1以相关分析为基础的X络  以相关分析为基础的X络通常用于物种(功能基因)矩阵中0不是特别多的数据,这便要求样品之间的差距不能太大,一般用于多个重复样品数据构建X络。基于相关分析的X络构建主要分为2个步骤,首先对所有的元素(OTU或者

2、基因)两两做相关分析,一般采用皮尔森相关系数(Pearsoncorrelationcoefficient)、斯皮尔曼相关系数(Spearmancorrelationcoefficient),然后通过选择合理的阈值确定X络的边。根据阈值选择的不同可以大致分为硬阈值和软阈值。  1.1.1硬阈值  人为设定阈值相关系数r0的绝对值=0.6,显著水平P0=0.01。当然也能根据不同的数据,不同的研究目的设置其他阈值。2个元素之间的相关系数绝对值大于阈值r0,显著水平P<时认为这2>  为了避免人为武断地设定阈值的缺陷,Luo等题出了基于随机矩阵理论RM

3、T(randommatrixtheory)的方法构建X络。RMT理论假定了2种极端的最邻边空间分布的矩阵特征值的分布:Gaussianorthogonalensemble(GOE)分布;Poisson分布。前者与随机复杂系统相对应,后者适用于某种特定的系统。通过改变阈值,得到不同阈值对应的邻接矩阵,计算其邻接矩阵的特征值,如果特征值分布近似于Poisson分布则认为这个阈值是合理的,近似于Gaussianorthogonalensemble(GOE)分布则继续调整。最终得到的阈值便认为是合理的构建X络的阈值。这种构建X络的方式能自动获取阈值,能够消除数据中噪

4、音干扰。这种构建方法能在ieg.ou.edu/X站上可以直接进行。Zhou等运用RMT理论构建X络,分析在二氧化碳升高条件下土壤中功能基因以及微生物细菌群落的变化。汪峰等运用RMTX络研究了土壤中微生物分子生态X络结构。  在用硬阈值构建的X络中,2个点之间的只存在有联系或无联系两种情况,因此得到的邻接矩阵是二进制的(0或1),进而得到的X络的边便是无权重的,这样的X络称为无权重X络(unoid函数和poodel),比较实验得到的观测值与随机值之间的差异,保留那些显著与随机不同的点与点之间的关系。Lentend等通过这样的方式构建X络研究耕地中真核细菌群落组

5、成。  1.3有向X络与无向X络  一个物种数量或者基因的表达可能会受到另一个的控制,简而言之就是一个物种先变化,然后过了一段时间导致另一个物种变化。之前提到的X络并不能表现出这一点,因此有向图被运用来描述这种X络,在这种模型中定点表示物种或基因,用带箭头的边表示控制。Ju等拓展了区域相似分析(localsimilarityanalysis),用于具有一长段时间序列的活性污泥中微生物数据,研究时间上同步和滞后的微生物之间的关系。类似的,Deng等在RMTX络基础上提出了改进RMT的方法来构建有向X络,用于研究潜在的时间延迟的微生物关系,揭示出一个物种体的改变

6、后一定时间,会影响另一个物种的改变。  2X络参数  2.1相关定义  为了可以从数学的角度更深入地研究我们所构成的X络,我们用图论中的图(graph)对所构成X络建立模型。图是包含了顶点和边的数学对象,其中顶点代表元素(物种或基因等),边代表它们之间的关系。我们可以用图论中图的一些参数来反应所构建的X络的性质,常用的包括模块性(modularity)、平均聚类系数(clusteringcoefficient)、X络直径(eter)、平均路径长度(averagepathlength)、图密度(Graphdensity)、平均度(averagedegree)等

7、。下面将简要地解释其含义。  模块性:用来衡量一个X络能否自然地划分成模块。模块性值的计算能够采用Nean的方法,数值在0~1之间,且当模块性大于0.4认为X络具有模块结构。  平均聚类系数:聚类系数用来反应一个点的邻点(和这个点有连线的点)之间联系的紧密程度,如果说邻点两两之间都相连,则值为1;如果邻点没有一条连线,则值为0。值得注意的是,这里并不是反应一个点和它邻点联系的程度,而是它邻点之间的联系,有些文章的描述存在一些问题。这个值越高,则说明节点的聚集程度越高。平均聚类系数是X络中所有点聚类系数的平均值,更高的平均聚类系数的X络被发现有模块结构。  X

8、络直径和平均路径长度:最短路径长度指从一个点出发,进

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。