基于dna序列功能位点识别

基于dna序列功能位点识别

ID:32161771

大小:9.47 MB

页数:56页

时间:2019-02-01

基于dna序列功能位点识别_第1页
基于dna序列功能位点识别_第2页
基于dna序列功能位点识别_第3页
基于dna序列功能位点识别_第4页
基于dna序列功能位点识别_第5页
资源描述:

《基于dna序列功能位点识别》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于DNA序列的功能位点识别中文摘要由于基因序列中的功能位点与基因的调控、转录紧密相关,人们对这些位点进行了广泛的分析。如何从DNA序列中准确地检测出这些功能位点成为了生物信息学中的一项长期热点。本文首先提出了一种基于熵度量的改进位置权重矩阵法,并以此方法对原核生物启动子进行识别。该方法首先运用信息论中的信息熵提取出原核生物启动子的保守位点,然后利用启动子训练集和非启动子训练集构建两个相应的改进位置权重矩阵。根据矩阵中相应于保守位点和关联片段的元素值,对测试序列进行计分,最后根据分值对测试序列进行分类。在大肠杆菌基因序列上的实验结果表明,该算法在敏感性、特异

2、性、关联系数以及精确度方面优于现有的启动子识别算法。第二,提出了一种基于新颖模式识别技术的核小体识别算法。此技术结合了两种方法分别进行模式匹配和序列模糊性的去除。首先运用了电子技术中的镜像匹配滤波器来匹配序列中的模式信息;再运用图像处理中的概率松弛标示进行后续处理,根据位点左右的上下文信息减少或消除序列在测定过程中产生的噪声。将此技术应用到酵母基因组上,得到的核小体分布图表明该算法在识别准确率方面有显著的提高。实验结果同时也揭示出各物种之间核小体分布也许存在着一种共享的序列机制。关键词:DNA序列分析,启动子,位置权重矩阵,熵,保守位点,匹配滤波器,概率松弛

3、标示,核小体。作者:吴琴琴指导老师:王加俊教授AbstractRecognitionofthefunctionalsitesbasedontheDNAsequenceRecognitionofthefunctionalsitesbasedontheDNAsequenceThefunctionalsitesintheDNAsequencearewidelyanalyzedbecauseoftheirrelationwiththegeneregulationandtranscription.Howtorecognizethesefunctionalsitesac

4、curatelybasedontheDNAsequencehasbeenatopicoflong—standinginterestintheBioinformatics.Inthispaper,adetectionalgorithmisfirstlyproposedfortheprokaryoticpromotersusinganimprovedpositionweightmatrix(PWM)methodbasedonanentropymeasure.Inthismethod,theconservativesitesoftheprokaryoticprom

5、otersareextractedaccordingtoanentropymeasure,andthentwoimprovedpositionweightmatricesareconstructedbasedonthetrainingset.Byusingthevaluesofthematrixelementsinthespecificcolumnscorrespondingtotheextractedconservativesites,thetestsequencesarescoredandsubsequentlyclassified.Experiment

6、alresultsonseveraldatasetsshowthattheproposedalgorithmoutperformstheexistingonesinsensitivity,specificity,correlationcoefficientandprecision.Secondlywedevelopanovelpatternrecognitionbasedapproachtoidentifynucleosomepositions.Thistechniquecombinestwomethodsfornucleosomepattemmatchin

7、gandambiguityelimination.FirstlythematchedmirrorpositionfilterisusedtomatchthepattemsintheDNAsequence,andthentheprobabilisticrelaxationlabeling,whichiswidelyusedinimageprocessing,isusedtoeliminatethenoiseintheDNAsequencebythecontextualinformation.Wethenappliedthiscombinedframeworkt

8、otheSaccharomycescerevisia

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。