DNA序列分析系统的构建和初步应用

DNA序列分析系统的构建和初步应用

ID:37323328

大小:4.24 MB

页数:112页

时间:2019-05-21

DNA序列分析系统的构建和初步应用_第1页
DNA序列分析系统的构建和初步应用_第2页
DNA序列分析系统的构建和初步应用_第3页
DNA序列分析系统的构建和初步应用_第4页
DNA序列分析系统的构建和初步应用_第5页
资源描述:

《DNA序列分析系统的构建和初步应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中山大学硕士学位论文DNA序列分析系统的构建和初步应用姓名:符志彦申请学位级别:硕士专业:生物化学与分子生物学指导教师:徐安龙2003.5.1中山人学坝』‘学位论义符忠彦DNA序列分析系统的构建和初步应用硕士生:符志彦导师:徐安龙教授中文摘要厂堪与阿波罗登月计划和曼哈顿原子弹计划相提并论的人类历史上的第三大工穗⋯人类基因组计划一经历了5年的辩论和酝酿终于在1990年启动,标志着人类在认识自身,探索生命的奥秘的道路上迈出了意义深远的一步。包括中国在内的6国联合完成这一伟大工程。随着人类基因组计划的实施,通过基因组序列,cONA序列,蛋白质序列测定,分子生物学家提供了大量的

2、有关生物分子的J短用于中国1%人类基因组计划及海洋生物功能基因组的项目中。该系统适合于大规模DNA测序分析。可以对测序过程进行质量监控,降低成本,防止浪费。可以自动完成从测序峰图文件至)JFASTA格式的文件转换,去除载体和引物。利用其中的}?inishing软件包可以对基因组序列进行拼接并进行Fjnjshing的相关工作。陔软件包集成了在1%人类基因组工作中的宝贵经验和各种相关的软件,具有大规模数据处理的能力及友好的用户界面。该系统还包括了一系列对基因组进行注释的软件包:包括:(;c含量统计,EST分布统计,重复序列(Repeats)分布统计,CpG岛分前i统计,基因

3、预测,STS,SNP分布统计等。该系统利用Stackpack软件包对c1)NA序列进行聚类,得到非冗余的基因和基因的多种剪切模式。列+cDNA序列和相应的蛋白序列也可进行一系列的功能注释,包括完整丌放读码框的判定,在公共数批库中搜索同源基因,cSNP,Motif的寻找,分子进化的研究,酶切位点及?级结构的预测等a厂这些信息为进一步进行功能研究提供了基础,x,l—F一步的实验敬汁其有指导意又。∥本系统包括硬件,软件,数据库,使用界面4部分。硬件平台主要为一台SGIOrigin2400,操作系统为IRIX6.5,wEB服务器采用Apache系统。利用免费、高效的MySQL作

4、为数据库系统,采用Pert,JAVA和c++作为软{;#干flWEB界面的丌发工县。本系统包括了许多国际上广泛使用的算法,工具和软件,基于WEB的图形化使用界面。f陔系统是中国参加△耋基国缉迁型的产物,利用浚系统成功的完成了I%人类基因组的拼接和注释工作。发现了在这段区域内的一百多个基因,一千五百多个SNP,并对该段基因组的碱基组分,cpo岛,重复序列进行了统计。另外利用本系统分析了海洋生物cDNA文库中的两万多条cDNA序列。发现了超过5000个新基因及许多有药用开发前景的新基因(http://192.168.0.1ll/)。这些基因对疾病和分子机制的研究有重要的作用

5、。对于未知功能的基因我们也进行了初步的分析。对各文库基因表达丰度的情况有了较全面的了解。为进一步筛选有药用前景的基因提供了信息和指导作用。中山大学倾L学位论义持忠彦在大规模数据分析时的价值。f随着进~步的应用,该系统还将更加完善。X7关键词:厂基因组y生物信息,DNA序列分析系统,数据库,cDNA,e笋ytJ中山人学坝f。学位论义符忠彦ConstructionandAppIicationofaLargeScaIeDNASequencesAnaIysiSSystemFUZhiyanSupervisor:Prof.XUAn[ong,Ph.DAbstractTheHumanG

6、enomeProject,oneofthemostimportantscientificprojectsinthiscentury,startedin1990’s.SixcountriesaroundtheworldincludingChinahavetakenpartinthishistoricalprojecttodecipherthegenome.Thehumangenomeholdsanextraordinarykeyofinforrfiationtounderstandhumandevelopment,physiology,medicineandevoluti

7、on.Alargenumberofdataincludinggenomesequences,eDNAsequencesandproteinsequenceswereproducedwiththisprojectandanewresearcharea--bioinformatics--wasdeveloped.Bioinformatistsusecomputationaltechniquestostoreandmanagebiologicaldatainordertobeeasilysearchedandanalyzed.Herewedes

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。