欢迎来到天天文库
浏览记录
ID:48005994
大小:256.71 KB
页数:4页
时间:2020-01-12
《基因表达谱富集分析方法研究进展.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、生物技术通讯LETTERSINBIOTECHNOLOGYVol.19No.6Nov.,2008931文章编号:1009-0002(2008)06-0931-04综述基因表达谱富集分析方法研究进展曹文君,李运明,陈长生第四军医大学军事预防医学系卫生统计学教研室,陕西西安710032[摘要]微阵列技术是生物技术变革的核心,允许研究者同时监测成千上万个基因的表达水平,已广泛应用于医学研究。如何挖掘海量基因表达信息中的有用信息并进行生物学专业解释,是基因表达谱数据分析领域所面临的一个重要挑战。不同的研究者提出了各种基于基因集进行富
2、集分析的方法,在此将这些方法大致分为两大类,即bottom-up方法和top-down方法。前者先进行单基因分析,然后根据生物学领域知识注释基因集并进行分析。该方法应用广泛,且结果比单基因分析容易解释。后者先根据生物学领域知识将各基因进行归类,然后进行基因差异表达模式分析。该方法不仅能提高结论的可解释性,而且能达到降维的目的。[关键词]基因表达谱;基因集;富集分析;GeneOntology术语;统计推断[中图分类号]Q789;Q811.4[文献标识码]AProgressonEnrichmentAnalysisApproac
3、hofGeneExpressionProfilesCAOWen-Jun,LIYun-Ming,CHENChang-ShengDepartmentofHealthStatistics,FourthMilitaryMedicalUniversity,Xi'an710032,China[Abstract]Microarraysareatthecenterofarevolutioninbiotechnology,allowingresearcherstosimultaneouslymonitortheexpressionoften
4、softhousandsofgenes,havingbeenwidelyusedinmedicalresearch.Themainchallengefacedbytheresearchersistoextractusefulinformationfromsuchgeneexpressionprofilesandthenimplementbiologicalinterpreta-tionofsuchresults.Atpresent,allkindsofdifferentresearchgroupsbasedonpre-de
5、finedgenesetproposeddifferentenrichmentanalysismethods.Inthispaper,thesemethodswillberoughlydividedintotwocategories:bottom-upapproachandtop-downapproach.Theformerapproachtestedgenesindividuallyfirstthenaggregatedbybiologicalknowledge.Thisapproachwaswidelyused,and
6、itsresultswereeasiertoexplainthantheresultsofthesinglegeneanalysis.Thelatterapproachperformeddomainaggregationbyfirstcombininggeneexpressionsbeforetestingfordifferentiallyexpressedpat-terns.Thismethodcannotonlyincreaseinterpretabilityofanalysisoutput,butalsoreachd
7、imensionreductionpurposes.[Keywords]geneexpressionprofiles;geneset;enrichmentanalysis;GeneOntologyterm;statisticalinference近几年,生物统计学者广泛而深入地研究了筛选差异表达义基因集的基因注释数据库有GeneOntology(GO)、KyotoEncy-基因的统计分析方法,提出比值法、t检验、固定效应模型、混合clopediaofGenesandGenomesorthology[2-5]。(KO)和EN
8、TREZ效应模型等多种针对单个基因进行推断的方法,这些方法统称1.1GO功能注释为单基因分析[1]。这些方法的缺点有:①与微阵列实验固有的噪GO是按严格的生物学背景、采用统一的术语结构注释基因声相比,若组间基因表达量差别较小,则易出现假阴性错误,即及其产品的数据库,包含几千条术语,分为3大分支:分子功能
此文档下载收益归作者所有