欢迎来到天天文库
浏览记录
ID:52458920
大小:153.82 KB
页数:5页
时间:2020-03-27
《DNA序列分类的统计分析.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第15卷第2期甘肃科学学报Vol.15No.22003年6月JournalofGansuSciencesJue.2003文章编号:1004-0366(2003)02-0079-05DNA序列分类的统计分析郭艾(华南理工大学应用数学系,广东广州510640)摘要:采用系统聚类分析方法,对已知类别的20种叫A序列中4种碱基的含量及各碱基之间的相关性进行了统计分析,发现不同类别的叫A序列中碱基的排列兵有明显的规律性,由此建立了一种DNA序列分类的方法,井运用统计分析对这种分类方法的合理性给予了检验.关键词:碱基;DNA
2、序列;聚类分析;假设检验中图分类号:O212;C8文献标识码:ADNA序列是由4个字符a,c,g,t按一定顺序排成的,这4个字符表示4种碱基.当前生物信息学最重要的课题之一是研究由这4个字符排成的看似随机的序列中隐藏着什么规律.我们有20个巳知类别的人工制造的DNA序列,其中序列标号1~10为A类,11~20为B类.我们的目的是从已知类别的序列中提取特征,构造分类方法,对其它未知类别的序列进[1]行分类.1DNA序列的聚类分析我们对20个已知类别的人工制造的DNA序列的4种碱基含量个数进行统计得到表1,表2.表1
3、DNA序列A类1.aggcacggmamacgmatmacgagagacttgcacgcattgcacggagacgagggtmgagcttgtctgccgatgtgcmggmgtgg.2.cggaggacgacgatggcggtgggagJggcggactgttcggggggcggcgcgacgccggtgccagcgga.3.gggacggatacggattctggccacggacggaaaggaggacacggcggacatacacggcggcaacggacggaacggagggagggcggcaatcgg
4、tacgg.4.atggcgaacggagxgmccagncgcggtagmadtgcagggcttaggtgcgggtgggtfggggggcgggggcg.5.atggcgaacggagxgmccagncgcggtagmadtgcagggcttaggtgcgggtgggtfggggggcgggggcg.6.gtgagtggggggcggcaggcaggcaggaggcgxmggcgggxmggg4gggacggcggggggmgtgggtattagcggmatggcgcggcacacacacacaca.7.a
5、tggattattgaatggcggaggaagtatccggaataaaatagggcggaaagaactgttttcggaaatggaaaaaggatggcggcaggaaggatatggaggcg.8.atggattattgaatggcggaggaagtatccggaataaaatagggcggaaagaactgttttcggaaatggaaaaaggatgcggcaggaaggatatggaggcg.9.atggattattgaatggcggaggaagtatccggaataaaatagggcggaaag
6、aactgttttcggaaatggaaaaaggatgcggcaggaaggatatggaggcg.10.atggattattgaatggcggaggaagtatccggaataaaatagggcggaaagaactgttttcggaaatggaaaaaggatgcggcaggaaggatatggaggcg.收稿日期:2002-08-0580甘肃科学学报2003年第2期序列号碱基平均方差12345678910a3330304736393931232031.8059.36c19182412261411182330
7、19.5034.85g4446502047444041484542.5064.45t151773212142121171517.1039.98表2NAN序列B类11.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaaattaaatatttatt.12.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatatttttt
8、aggtaagtaatccaacgtttttattactttttaaaaattaaatatttattaaa.13.gttagatttaacgttttttatggaatttatggaattataaatttaaaaatttatattttttaggtaagtaatccaacgtttttattactttttaaaaattaaatattgc.14.gttagatttaacgtttt
此文档下载收益归作者所有