欢迎来到天天文库
浏览记录
ID:32012690
大小:1.18 MB
页数:35页
时间:2019-01-30
《结构矩阵在生物序列相似性比较中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、大连交通大学硕士学位论文结构矩阵在生物序列相似性比较中的应用姓名:佟晓梅申请学位级别:硕士专业:应用数学指导教师:白凤兰20091216摘要摘要根据DNA初级序列的特性,把DNA初级序列转换成数字序列,即离散的时间序列:八T,G,C用1,2,3,4表示。蛋白质与DNA和RNA一样,也是线性大分子。它是字符集N={AC,D,E,F'G,H,l,l('I々M,N,P,Q,R,S,T’V,W,Y}l-"的字符串。蛋白质序列的比较不仅仅是字符串本身的比较,还要考虑他们的化学结构和化学性质。我们根据20种氨基酸的化学性质以及蛋白质二级结构的相关性质把它们分成四类:亲水,极性,带电荷X=
2、HPC={D,N,S,H,T,C};疏水,非极性z=HA={Y,F,V,l,W,M,L);非极性且体积小B=AS={G,P);其它J=O={R,KE,A,Q)。同理,根据蛋白质初级序列的特征,把蛋白质初级序列转换成数字序列,即离散的时间序列:X,z,B,J用1,2,3,4表示。基于此,本文利用矩阵表示DNA初级序列和蛋白质初级序列的结构,提出结构矩阵,以结构矩阵为基础建立DNA和蛋白质初级序列的相似性比较模型,并且对DNA和蛋白质初级序列进行了相似性研究,发现相似性评估的合理的价值。此外,矩阵的变换增强模型的适应性。关键词:DNA初级序列;蛋白质初级序列;数字序列;结构矩阵;
3、相似性分析人连交通大学理学硕十学位论文AbstractAccordingtothecharacterizationofDNAprimarysequence,DNAprimarysequencesaretransformedintonumericsequencescalleddispersetimesequenceofDNAprimarysequencebyrepresentingAT’GandC,as1,2,3and4.Theproteinisalsothelinearmacro—moleculeassameasDNAandRNA.ItiScharacterstringofc
4、haractersetN={八C,D,E,F,G,H,I,KLM,N,P,Q,R,S,T,V'W,Y}.neproteinsequence’Scomparisonisnotonlycomparisonofstringcharacter,butmustconsidertheirchemicalconstitutionandthechemicalproperty.Theyaredividedintofourkindsaccordingtochemicalpropertiesof20kindsofaminoacidsaswellastheproteinsecondarystruct
5、ure.Namely,hydrophilicity,polarity,electricallychargedX=HPC={D,N,S,H,T,C),hydrophobicity,nonpolarityZ=HA={Y,F,V,I,W,M,L),nonpolarityandsmallB=AS={G,P),othersJ=O={R,KE'AQ).Inasimilarway,accordingtothecharacterizationofprimaryproteinsequence,proteinprimarysequencesaretransformedintonumericseq
6、uencescalleddispersetimesequenceofproteinprimarysequencebyrepresentingX,Z,B,Jas1,2,3,4.’BasedonwhichthispaperemploysthematrixtorepresentthestructureofDNAandproteinprimarysequenceinnature.111eauthorsproposestructuralmatrix.buildupaDNAandproteinprimarysequencemodelbasedonstructuralmatrix,andc
7、arrythroughthesimilarityresearchonDNAandproteinprimarysequence,tofindareasonablevalueforsimilarityassessment.Furthermore,transformationonmatrixenhancestheadaptabilityofthemodel.KeyWords:DNAprimarysequence:Proteinprimarysequence;Numericsequence:Structural
此文档下载收益归作者所有