资源描述:
《胆固醇损伤内皮细胞差异表达基因的生物信息学分析》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
CN4321262/R中国动脉硬化杂志2005年第13卷第3期259[文章编号] 100723949(2005)1320320259204·实验研究·胆固醇损伤内皮细胞差异表达基因的生物信息学分析彭瑾瑜,朱勋,唐蔚青1,王抒1,黎健1,王仁,郭芳,刘俊文,杨向东(南华大学心血管病研究所,湖南省衡阳市421001;1.北京医院卫生部老年医学研究所,北京市100730)[关键词] 病理学与病理生理学; 胆固醇损伤内皮细胞差异表达基因的分析; 生物信息学分析; 动脉粥样硬化; 内皮细胞; 胆固醇; 细胞色素氧化酶亚基Ⅱ[摘 要] 目的 利用差异表达基因克隆方法(抑制消减杂交)获得大量的动脉粥样硬化相关候选基因和表达序列标签后,探讨如何进行后续基因表达及功能的研究。方法 利用Internet网络上的数据库及生物学分析软件对胆固醇损伤内皮细胞后获得的差异表达基因进行核酸序列和蛋白质序列分析,探索差异表达基因克隆后的研究方法和思路。结果 通过电子延伸得到一个684bp的全长cDNA序列;通过核酸序列分析,该序列定位在线粒体基因组的7587位~8270位,含有一个完整的开放阅读框,编码与氧化磷酸化相关的9个亚基。对其中一个亚基细胞色素氧化酶Ⅱ(COX2)分析得知,细胞色素氧化酶Ⅱ基因编码一段25.6kDa的弱酸性的信号锚蛋白,细胞色素氧化酶Ⅱ蛋白的三维结构是一个典型的椅式结构,它含有一段疏水区域,一个跨膜结构域和一个胞质结构域。运用蛋白的进化分析,得知细胞色素氧化酶Ⅱ蛋白胞质结构域的氨基酸序列在进化过程中高度保守。结论 生物信息学技术是一种高效的获取疾病相关基因信息的方法,利用生物信息学方法对细胞色素氧化酶Ⅱ基因进行分析,获得了基因及其编码蛋白的相关信息,该蛋白参与电子传递,可能与细胞的氧化应激有关。[中图分类号] R363[文献标识码] ABioinformaticAnalysisofDifferentiallyDisplayedGeneinHumanEndothelialCellIn2ducedbyCholesterolPENGJin2Yu,ZHUXun,TANGWei2Qing1,WANGShu1,LIJian1,WANGRen,GUOFang,LIUJun2Wen,
andYANGXiang2Dong(InstituteofCardiovascularDisease,NanhuaUniversity,Hengyang421001;1.DepartmentofBiochemistry,BeijingInstituteofGeriatrics,Beijing100730,China)KEYWORDS BioinformaticsAnalysis; Atherosclerosis; EndotheliumCell; Cholesterol; CytochromeCOxidaseSubunitⅡGene; DifferentiallyDisplayedGeneABSTRACT Aim Tostudythelargeamountofdifferentiallydisplayedgenesandexpressedsequence2tags(EST)ob2tainedbygenecloneisadifficultproblem. Itisimportanttoexploitnewmethodsforfurtherstudy. Methods ESTwereacquiredfromhumanumbilicalveinendothelialcellsinducedbycholesterolbysuppressionsubtractivehybridization(SSH).
Bioinformaticsanalysisofatherosclerosisrelatedgeneswasdonebythebioinformaticaldatabasesandbio2softwaressuchasBLAST,
ExPasyanalysesoftbox,DNAMANsoft,BioEditsoftandRasMolsoft. Results Weobtaineda684bpcompletecDNAse2quencebyelectronicclone,whichwashomogeneoustocytochromeCoxidasesubunitⅡgene(COX2). ThecompletegenomeofCOX2sitedinhomosapiensmitochondrion,andincludedacompleteopenreadingframe(ORF)coding227aminoacids. TheanalysisofitsproteinsequenceindicatedthatCOX2geneencodea25.6kDaprotein,whichwasaweakacidsignalanchor. The
three2dimensionalstructureofCOX2wasarepresentativechair2likestucture,containingahydrophobicityregion,atransmembranedomainandaperiplasmicdomain. TheperiplasmicdomainoftheCOX2proteinsequencewashighconservativeintheprocessof
evolutionsbytheanalysisoftheproteinevolutions. Conclusion WeobtainedtheinformationofCOX2aboutnucleicacidse2quenceandproteinsequencebybioinformaticsanalysis 动脉粥样硬化是一种多基因遗传病,目前对其耗资大、工作量大,而且存在研究的盲目性,制约了相关基因的克隆及功能研究非常重视。用常规的生疾病相关基因在基因组、蛋白质组学方面的研究进物学方法对大量的基因进行表达和功能研究,不仅度。生物信息学是一门综合运用生物学、数学、物理[收稿日期] 2004206224 [修回日期] 2005202228学、信息科学及计算机科学等诸多学科的理论方法 的崭新交叉学科,它应用先进的数据管理技术、数学[基金项目] 国家自然科学基金(3002103);湖南省自然科学基金(02JJY4011);湖南省教育厅青年基金(02B039)[作者简介] 彭瑾瑜,E2mail为pengjinyu21@yahoo.com.cn;朱勋,均为南华大学生命科学与技术学院2000级生物技术专业本科生。通分析模型和计算机软件对各种生物信息进行获取、处理、存储、分配、分析和解释,以达到理解数据中讯作者杨向东,博士,副教授,硕士研究生导师,主要从事心血管疾病相关基因的克隆和细胞凋亡机制研究,联系电话073428281297,E2mail为XDY7@263.net。的生物学含义的目的。应用生物信息学技术进行基因组和蛋白质组学研究是当前的研究热点,生物信 2ISSN100723949ChinJArterioscler,Vol13,No360息学在基因克隆、结构分析以及功能预测中发挥重要作用123。本文利用唐蔚青等4采用抑制消减杂2 结果交(SSH)克隆的多个胆固醇损伤人脐静脉内皮细胞产生差异表达基因或表达序列标签(expressedse2quence2tag,EST),从中挑选出一个EST(GenBank登录号为BI307819)。通过BLAST软件分析获得其全长cDNA序列,该序列包含了与氧化磷酸化密切相关的9个亚基,查询文献后挑选细胞色素氧化酶亚基Ⅱ(COX2)进行生物信息学分析。2.1 内皮细胞差异表达序列标签的同源性利用BLAST软件进行核酸同源性比较,发现其与人线粒体基因(登录号为AY495330.1)同源性达98%,提示该EST是人线粒体的一段基因,基因组的定位分析显示,该基因定位在线粒体基因组的7587~8270位。通过BLASTn获得线粒体的全长cDNA序列,该序列编码与氧化磷酸化相关的9个亚基,通1 材料与方法过PubMed查找相关文献,选取其中一个亚基COX2进行生物信息学分析。1.1 GenBank数据库检索和EST序列拼接2.2 细胞色素氧化酶亚基Ⅱ基因cDNA序列的开经国际互联网进入美国GenBank数据库中,利放阅读框用BLAST(http://www.ncbi.nlm.nih.gov/BLAST/)检利用NCBI中的ORFfinder软件对COX2基因进索人nr数据库和EST数据库,对获得的序列进行相行开放阅读框分析。该基因的最大开放阅读框是从似性检索,拼接后的每一个碱基至少经过2条以上第1位到第683位碱基,编码227个氨基酸,该开放的EST序列的验证。利用NCBI的基因组图谱阅读框起始密码子ATG的+4位碱基为嘌呤碱基(http://www.ncbi.nlm.nih.gov/mapview/)查询目的G,符合Kozak规律:即阅读框起始密码子ATG的周基因在人类基因组的定位。围序列部分,如果23位碱基为嘌呤碱基A或G,则是1.2 cDNA序列的开放阅读框分析和人类基因组的有效的翻译起始位点,否则在+4位必须出现G。定位表明该COX2有一个的完整阅读框(图1,Figure1)。将获得的cDNA序列输入NCBI的开放阅读框分析软件ORFfinder软件(http://www.ncbi.nlm.nih.gov/gorf/),查询是否具有完整的阅读框。1.3 基因编码蛋白质的分子质量、等电点和亲疏水性分析利用互联网上ExPaSy软件包(http://www.ex2pasy.ch/tools/)中ComputepI/MW软件进行蛋白质图1.细胞色素氧化酶Ⅱ基因的开放阅读框分析的氨基酸组成、分子质量和等电点分析。利用Figure1.ORFanalysisofCOX2geneBioEDIT软件(http://www.mbio.ncsu.edu/BioEdit/2.3 细胞色素氧化酶Ⅱ基因编码蛋白的分子质量
bioedit.html)进行亲疏水性分析。和等电点1.4 基因编码蛋白质结构和功能区分析利用ExPaSy软件包中ComputepI/MW软件进
利用Tmpred服务器(http://www.cbs.dtu.dk/services/TMHMM22.0/)对该蛋白的跨膜区进行分行氨基酸组成、分子质量和等电点分析。结果显示,该蛋白为分子质量25.56502品种效益年kDa,等电
析。利用nnPredict软件(http://us.expasy.org/点为4.67,为一略酸性的蛋白质;该蛋白序列含有
tools/)进行蛋白序列的二级结构分析,向蛋白质立较多的中性非极性氨基酸,特别是亮氨酸(Leu)含量
体结构数据库PDB(ProteinDataBank)提交该蛋白质达到14.54%,异亮氨酸(Ile)为9.69%,为其二级结
序列,利用RasMol软件显示细胞色素氧化酶亚单位构的α螺旋和β折叠的形成打下基础。COX2蛋白的三维分子结构。利用PROSITE数据库2.4 细胞色素氧化酶Ⅱ基因编码蛋白的亲疏水性
分析该蛋白序列的模体符(motif),在NCBI中利用 利用BioEdit软件对COX2蛋白进行亲疏水性分
CDD(ConservedDomainDatabase)预测该蛋白结构功析,基于BioEdit软件的亲疏水性分析的计算方式,能域。基线上方+1.5以上代表亲水性,基线下方-1.5以1.5 种属关系分析下代表疏水性。得知该蛋白在30~43位间以及68
利用DNAMAN软件对KOG4767家族蛋白序列~75位间各有一疏水性区域(图2,Figure2)。多重对齐分析。 CN4321262/R中国动脉硬化杂志2005年第13卷第3期261在线(http://smart.embl2heidelberg.de/)分析蛋白质的结构功能域位点显示,该蛋白序列跨膜结构域位于1~83位,胞浆结构域位于95~226位。结合二级结构与功能结构域分析,可知COX2蛋白的跨膜结构域主要以α螺旋为主,胞浆结构域以β折叠为主。在NCBI中利用CDD(ConservedDomainDatabase)预测该蛋白结构功能域显示,COX2蛋白序列含有一胞质结构域和跨膜结构域,该蛋白与KOG4767家族(此家族含有真核生物细胞色素氧化酶亚单位Ⅱ以及一些与能量产生和传递相关的蛋白)以及CyoA家族(COG编号为COG1622,单细胞生
图2.细胞色素氧化酶Ⅱ蛋白序列的亲疏水性分析Figure2.HydrophileandhydrophobeanalysisofCOX2se2物中血红素/铜型细胞色素氧化酶亚基Ⅱ的同源蛋quence白蛋白家族)有较高同源性(图5,Figure5)。2.5 细胞色素氧化酶Ⅱ基因编码蛋白的跨膜区段利用Tmpred服务器对该蛋白的跨膜区进行分析显示:有两个跨膜区段,分别在第26位~第48位和第63位~第85位(图3,Figure3)。图5.细胞色素氧化酶Ⅱ蛋白结构域分析Figure5.StructuraldomainsanalysisofCOX2sequence2.8 细胞色素氧化酶Ⅱ基因编码蛋白的模体符利用PROSITE数据库分析该蛋白序列的模体符(motif)显示,COX2蛋白序列含有多种不同的模体符,其中包括双核铜中心和蛋白激酶C(PKC)模体符。从PROSITE数据库中我们获知COX2蛋白胞质结构域中有一个双核铜中心(在159~207位),其特
图3.细胞色素氧化酶Ⅱ蛋白序列的跨膜区分析Figure3.Trans2membraneanalysisofCOX2sequence征序列为:V2x2H2x(33,40)2C2x(3)2C2x(3)2H2x(2)2M。查询蛋白质结构数据库CATH数据库,得知此2.6 细胞色素氧化酶Ⅱ基因编码蛋白的二级结构双核铜中心结构域是一反平行β桶结构(希腊钥匙用nnPredict软件进行蛋白序列二级结构分析型),见图6(Figure6)。显示,该蛋白序列氨基端的90个氨基酸以α螺旋为主,后130个氨基酸以β折叠为主(图4,Figure4)。图6.细胞色素氧化酶Ⅱ蛋白双核铜中心的三级结构Figure6.ThethirdlystructuraldomainspredictionofCOX2
图4.细胞色素氧化酶Ⅱ蛋白的二级结构 H表示αprotein螺旋结构,E表示β折叠片Figure4.ThesecondarystructurepredictionofCOX2sequence2.9 细胞色素氧化酶Ⅱ基因编码蛋白的三维结构2.7 细胞色素氧化酶Ⅱ基因编码蛋白的结构域向蛋白质立体结构数据库PDB(ProteinData 2ISSN100723949ChinJArterioscler,Vol13,No362Bank)提交该蛋白质序列,利用RasMol软件显示细电子,经双核铜CuA中心传递电子,从而参与电子胞色素氧化酶亚单位COX2蛋白的三维分子结构。传递。同时,我们发现COX2蛋白具有一个PKC的如图7(Figure7)所示,COX2蛋白的三维分子构象图motif,提示COX2胞质域中的离子通道可能受PKC呈现一个典型的椅式结构。的调控,而PKC的激活在细胞增殖和氧化应激的信号传递中具有十分重要的意义6。利用生物信息学一些基本分析方法,我们获得了大量COX2基因及其编码蛋白的相关信息,为进一步研究COX2蛋白与动脉粥样硬化的关系提供了实验依据。在以前的研究中7,我们曾用电子克隆(电子延伸)获得泡沫化细胞差异表达基因的全长cDNA序列;利用生物信息学软件分析了新的人突触相关蛋白(FRG4)抗原表位,用于合成抗原多肽制备抗体。尽管近几年有很多生物信息学相关专著出版,但是该领域知识更新很快,因此我们认为仍有必要介绍用最新软件和方法进行的分析。在实际操作过程中,我们也总结了一些经验:①进行生物信息学图7.细胞色素氧化酶Ⅱ蛋白三维结构示意图 图中深红色弹簧状表示α2螺旋;黄色板状表示β2折叠;蓝色表示β2转角;其分析需要较好的计算机基础,熟悉有关基因、蛋白质他残基颜色为白色分析的基础知识;②由于数据库中数据的生物学功Figure7.Thethree2dimensionalstructuralpredictionofCOX2protein能注释远远落后于自动测序仪产生的大量序列数2.10 细胞色素氧化酶Ⅱ基因编码蛋白及KOG4767据,所以当进行序列同源性分析得到与这类缺乏注释的数据相关的信息时,其信息的可用性受到一定家族蛋白序列多重对齐分析影响;③生物信息学分析的基础是通过人类基因组利用DNAMAN软件对KOG4767家族蛋白序列计划获得的大量核酸和蛋白质数据以及专门的数据多重对齐分析发现,所有参与对比的序列与人的
库,由于数据库及数据处于不断更新的状态,因此我COX2的胞质结构域区段的氨基酸显示出高度的序们用生物信息学分析获得的数据在某些情况下需要列同源性,而该区域正是双核铜中心功能域的位置所在,并且此结构的主链氨基酸V2x2H2x(33,40)2C2x(3)2C2x(3)2H2x(2)2M的序列同源性几乎达100%,进行校正;④极少数的序列可能由于数据库中缺乏相关数据而无法进行分析;⑤生物信息学分析需要可相互操作的生物信息系统,各种类型的数据转换从而强烈提示COX2的双核铜结构域为一重要的功能域5。工具,以及不断改进的统计分析方法和优化算法;⑥生物信息学分析可以成为经典实验的研究指南,但并不能完全取代经典生物学研究方法,很多时候生3 讨论物信息学分析结果要经过实验验证。本文利用生物信息学方法对COX2进行基因序列注释和蛋白质序列的功能注释,从分析结果中得[参考文献]1 赵国屏,等. 生物信息学. 北京:科学出版社,2002知,该蛋白序列是一个分子质量为25.6kDa、等电点2 张成岗,贺福初. 生物信息学方法与实践. 北京:科学出版社,2002为4.67的略酸性蛋白。COX2亚基的N端,含有由两个α螺旋组成的疏水性跨膜结构域,该结构可能有助于细胞色素氧化酶与线粒体膜紧密结合。COX2亚基的胞质结构域中含有一个由反平行β桶构成的双核铜中心CuA,并且通过序列多重对齐分析,COX2亚基及KOG4767家族蛋白的双核铜中心3 李越中,闫章才,高培基. 基因组研究与生物信息学. 济南:山东大学出版社,20014 唐蔚青,王抒,杨向东,陈保生,李凌松. 胆固醇诱导血管内皮细胞基因的差异表达. 中国动脉硬化杂志,2003,11(1):1245 李连之,宋爱新,黄仲贤. 光谱法研究细胞色素C氧化酶CuA结构域蛋白的稳定性. 光谱实验室,2004,21(1):13521376 RenS,ShatadalS,ShenGX. ProteinkinaseCbetamediateslipoproteinin222ducedgenerationofPAI1fromvascularendothelialcells. AmJPhysiolEn2 2docrinolMetab,2000,278(4):E6562662主链氨基酸有高度同源性,从而强烈提示此结构为一重要功能域。我们推测反平行β桶结构可能有利7 闾宏伟,杨向东,何淑雅,杨永宗. cDNA文库基础上运用热启动聚合酶链反应末端延伸快速分离全长cDNA序列. 中国动脉硬化杂志,2002,10(5):3962399(此文编辑 胡必利,文玉珊)于形成非特异性的电子通道,使COX2亚基作为细胞色素C氧化酶电子入口,接受来自细胞色素C的