代谢组学研究中样本间区分度的简易评判方法.pdf

代谢组学研究中样本间区分度的简易评判方法.pdf

ID:51243625

大小:377.81 KB

页数:6页

时间:2020-03-22

代谢组学研究中样本间区分度的简易评判方法.pdf_第1页
代谢组学研究中样本间区分度的简易评判方法.pdf_第2页
代谢组学研究中样本间区分度的简易评判方法.pdf_第3页
代谢组学研究中样本间区分度的简易评判方法.pdf_第4页
代谢组学研究中样本间区分度的简易评判方法.pdf_第5页
资源描述:

《代谢组学研究中样本间区分度的简易评判方法.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第41卷分析化学(FENXIHUAXUE)研究报告第7期2013年7月ChineseJoumalofAnalyticalChemistry1000~1005DOI:10.3724/SP.J.1096.2013.00959代谢组学研究中样本间区分度的简易评判方法朱航蓝文贤刘买利(波谱与原子分子物理国家重点实验室,武汉磁共振中心,中国科学院武汉物理与数学研究所,武汉430071)(中国科学院上海有机化学研究所,上海200032)摘要在代谢组学现有数据分析方法的基础上,引入了多元统计分析方法中的多元t检验、类

2、间距计算、组内离差平方和计算等统计方法。结合4个代谢组学研究实例,演示了新引入的统计方法的应用。结果表明:多元t检验可以解答应激组和对照组的代谢组水平之间是否存在“系统差别”,类间距可以提供差别大小,组内离差平方和可以提供离散程度等信息。这些新信息的获取能对模式识别分析所得出的得分图(Scoresplot)作进一步的解释,并为后续实验设计提供参考。关键词代谢组学;模式识别;多元统计分析;显著性检验;类间距;离差平方和;核磁共振1引言代谢组学是继基因组学、转录组学、蛋白质组学后,生命科学研究领域出现的又一

3、门新兴组学技术”。,它为系统研究分子病理、基因功能和系统生物学提供了一种强有力的技术手段。代谢组学通常以生物样品(体液、组织提取物等)中的代谢物为检测对象,以核磁共振(NMR)[2,31、高效液相色谱(HPLC)[41、质谱(MS)和傅立叶变换红外光谱(FT—IR),71,以及色谱.质谱.核磁共振联用技术等为检测手段。由于生物样品组成复杂,所获得的各种谱图中包含着海量信息,很难直观地从谱中获得全部有效信息。计算机技术的飞速发展使得快速分析、处理大量数据成为可能。代谢组学研究中最常用的数据分析方法是模式识

4、别,包括非监督的方法(如主成分分析(PCA))和监督的方法(如偏最小二乘法(PLS)),及在此基础上发展的优化的方法,如偏最小二乘法辨别分析(PLS.DA)、正交偏最小二乘法辨别分析(O—PLS—DA)‘’等。模式识别分析是将样本投射到低维空间中,实现对数据的降维,从而使复杂的数据可视化。在该低维空间中,映射点分布的不同反映了样本组成上的差异。因此,对于分布于低维(二维或者三维)的主成分空间中不同样本的映射点之间是否存在显著性差异的判别尤为重要。当两组样本在空间中映射的分布区域相互靠近,甚至出现部分重叠

5、时,仅凭主观印象作出判断很容易出现错误。在代谢组学研究中,外界刺激能同时引起体液或者生物组织中多种代谢物含量的变化,这些变化通常是相互关联、互相影响的,单一代谢物的统计变化特异性最差,不能正确、全面地反映整体的变化情况。要提高检出率和特异性,需采用多种实验方法对样本进行检{贝4,并衡量组间差异和定量判别样品分散程度。各组样本的分散程度所反映的是样本由于自身个体差异、对外来刺激响应的个体差异、实验仪器误差、主观数据处理等因素造成影响。对分散度的准确描述将有助于评价实验对象的选择是否合适及个体差异的影响。对

6、于分布于二维或三维空间中点的位置需要用2个变量或3个变量描述,因此有必要引入多元统计分析方法,从而获得更加丰富的数据信息,以此提高判断的全面性、准确性和科学性。本研究将多元统计分析中的多元t检验、类间距计算及组内离差平方和计算等方法应用到代谢组学研究中,期望能为判别低维空间中的两组或多组点之间是否存在显著性差异,量化存在显著性差异的组间的差异大小、组内样本分散程度,提供客观、准确的判别方法。2012~9-06收稿;2012—12-23接受本文系国家自然科学基金(No.20635054)资助项目E—mai

7、l:m1.1iu@wipm.ae.en第7期朱航等:代谢组学研究中样本间区分度的简易评判方法2多元t检验、类间距和组内离差平方和计算在代谢组学中的应用2.1多元t检验、类间距和组内离差平方和计算在代谢组学中的实现过程将多元t检验、类间距离计算及组内离差平方和计算等多元统计方法引入代谢组学数据分析的过程:第一步,对大量样本的谱学数据(MS、NMR等)进行模式识别处理(如PCA),得到二维或三维空间得分图I】。得分图中每一个数据点对应一个样本,其坐标值反映的是由原始代谢物重新线性组合后的2种或3种“新的代谢

8、物”(主成分)的含量。第二步,以得分图中提取的各个样本的坐标值为对象,进行多元t检验,以此判断组间是否存在显著性差异。第三步,若组间存在显著差异(p<0.05或p<0.01),计算两组数据之间的欧氏(Euclidean)距离,得到的值即为类间距。通过比较类间距的大小,能够对比不同实验方案对受试对象的影响程度。第四步,根据Ward最小方差法的思想,计算各组数据的离差平方和,通过比较各组数据的离差平方和可以评价样品的相对分散度。2.2多元f检验

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。