生物序列特征提取新方法的研究(I)

生物序列特征提取新方法的研究(I)

ID:36360237

大小:3.98 MB

页数:124页

时间:2019-05-10

生物序列特征提取新方法的研究(I)_第1页
生物序列特征提取新方法的研究(I)_第2页
生物序列特征提取新方法的研究(I)_第3页
生物序列特征提取新方法的研究(I)_第4页
生物序列特征提取新方法的研究(I)_第5页
资源描述:

《生物序列特征提取新方法的研究(I)》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中山大学博士学位论文生物序列特征提取新方法的研究姓名:田元新申请学位级别:博士专业:分析化学指导教师:蔡沛祥20060601一定的理论价值。3.结合了小波分析在数据挖掘领域的最新研究成果,建立一种生物序列相似性研究的新方法。通过离散小波变换把数字化的蛋白质序列从时域转化到频域,设定阈值分别把各个频域信号转化为字符串序列,根据最大公共子序列定义序列匹配度,并将它作为相似性的测度。综合不同频域层次序列的相似度全面考察生物序列的相似性。通过对蛋白质序列和基因序列的研究,表明基于离散小波变换的生物序列相似性研究方法不仅能够考察不同物种同一家族蛋白质的相似性情况,而且能够考察同一物种相同基因家族中

2、不同成员之间的相似性情况。本文的研究结果为生物序列相似性研究开拓辟了新的研究思路。4.基于小波包分析提出了一种同源蛋白特征提取的新方法,首次提出将小波包能量作为同源蛋白质的特征向量来研究同源蛋白质序列的进化和变异性。通过对不同物种血红蛋白a链和B链的同源性分析表明,血红蛋白的a比D链更具有保守性。结合两条链的小波包能量谱,结论显示:在猪、牛、马、鸡和鱼等物种中,猪的血红蛋白与人的血红蛋白具有最大的相似性,因此在医学上有望用猪血代替人血来解决血液短缺的问题。对直系同源蛋白和旁系同源蛋白序列的小波包能量谱的研究结果表明,小波包能量可以作为同源蛋白质的特征向量来考察同源序列的遗传和变异性,尤其

3、是对直系同源蛋白具有较好的适应性。由于本方法不需要大量的样本作为训练集,而且属于非参数法,使用简单方便,对于蛋白质的同源研究具有重要理论价值和实践意义。5.基于小波能量特征向量在蛋白质同源性研究中的作用,提出小波能量谱识别蛋白质活性位点的新方法。运用Autosignal软件选择Morlet复小波对数字化的蛋白质序列进行连续小波变换,小波能量谱可用于蛋白质活性位点的识别。同源蛋白质序列的能量最大值通常分布于相同的频率处,小波能量比较集中的区域往往与蛋白质序列的保守位点相对应,它们通常都是蛋白质的活性位点。本文的研究结果为对蛋白质功能的研究开辟了新途径。论文中涉及的程序均使用Matlab程序

4、语言编写。本论文系国家自然科学基金和广东省自然科学基金资助项目。关键词:傅立叶功率谱,小波,小波包,基因,蛋A质,小波能量谱IIThestudyonthenovelmethodofcharacteristicextractionofbiologicalsequencesSpecialty:AnalyticalChemistryName:TianYuanxinSupervisor:Prof.CaiPeixiangAbstractehemoinformaticsisanimportantembranchmentofanalyticalchemistry,whichistheCROSSsubj

5、ectbasedonmultipleknowledge.WiththeaccomplishmentofHumanGenomeProject,moreandmorebiologicaldataarecomingforth.Theproteinsequencesandgenesequencesarealsochemicaldata,andtheyarethenewchallengetoehemoinformatics.inthispaper,wecommitourselvestothecharacteristicextractionofbiologicalsequencesbasedonth

6、evastproteinandgenomedata.Thefollowingfiveproblemswhichbelongtothehotspotsofbioinfornlatjcsareresearched.1.Theperiod一3behaviorofexonisfirstinvestigatedbyFourierPowerSpectrum.Theresultsshowthatmostexonshavenoperiod-3behaviorwhentheyseparatelylieinacertaingene.Aftertheexonsingeneareconnectedtocodep

7、roteins,thelongcoding—proteinsequencesthenshowtheperiod.3behavior.Moreover,theperiod‘3behaviorofexonisrelatedtotheexon’slength,thelopsideddistributionofbasesandthepreferenceofsynonymouscodonsusage.Theexonswhichaccordwi

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。