人类基因组snp数据库的数据整合

人类基因组snp数据库的数据整合

ID:32970241

大小:934.78 KB

页数:53页

时间:2019-02-18

人类基因组snp数据库的数据整合_第1页
人类基因组snp数据库的数据整合_第2页
人类基因组snp数据库的数据整合_第3页
人类基因组snp数据库的数据整合_第4页
人类基因组snp数据库的数据整合_第5页
资源描述:

《人类基因组snp数据库的数据整合》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、上海交通大学硕士学位论文人类基因组SNP数据库的数据整合姓名:汪列申请学位级别:硕士专业:计算机技术指导教师:黄上腾;乐嘉锦20050801附件四上海交通大学学位论文原创性声明本人郑重声明所呈交的学位论文是本人在导师的指导下独立进行研究工作所取得的成果除文中已经注明引用的内容外本论文不包含任何其他个人或集体已经发表或撰写过的作品成果对本文的研究做出重要贡献的个人和集体均已在文中以明确方式标明本人完全意识到本声明的法律结果由本人承担学位论文作者签名汪列日期2005年9月10日1附件五上海交通大学学位论文版权使用授权书本学位论

2、文作者完全了解学校有关保留使用学位论文的规定同意学校保留并向国家有关部门或机构送交论文的复印件和电子版允许论文被查阅和借阅本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索可以采用影印缩印或扫描等复制手段保存和汇编本学位论文保密在年解密后适用本授权书本学位论文属于不保密请在以上方框内打学位论文作者签名指导教师签名汪列黄上腾日期2005年9月10日日期2005年9月13日2上海交通大学工程硕士研究生学位论文人类基因组SNP数据库的数据整合摘要随着人类基因组测序工作的完成单核苷酸多态性SNP已成为遗传学

3、研究的关键内容近年来我国在SNP研究领域已取得重大进展各科研机构在研究过程中积累了大量有价值的科学数据实现这些数据的充分共享将大力推动我国在该领域的研究发展本文的研究目标是实现一个能够反映基因型与临床表型相互关系的SNP数据库用于收集国内各科研机构递交的相关研究数据实现不同来源数据的整合使广大研究人员能够共享这些数据以满足遗传学研究的需要如何实现表型数据和SNP数据在数据库中的整合是本文研究的主要问题本文首先提出了SNP数据库的数据库模式为了整合递交数据本文采用SNP在基因组上的映射位置对SNP进行定义解决了SNP的标准问

4、题同时采用国际通用的编码标准来表达表型数据涉及的生物医学概念本文在数据安全方面实现了细粒度的访问控制在保护递交者知识产权的前提下使数据得到充分共享然后本文实现了一个表型本体为表型数据的整合提供领域知识它涵盖了表型领域的各种概念术语及其相互关系其原始知识取自生物医学领域的大型知识库UMLS本文在关键概念之间构建了有意义的层次关系弥补了UMLS在表型概念表达方面的不足同时本文提出了在数据库中实现本体查询的方法通过一组存储函数来支持本体的SQL查询使数据库应用可以不使用API而直接从本体获取知识利用本体查询可以实现术语表达的复杂

5、概念到数据库标准代码的转换在SNP数据的整合方面本文首先介绍了基于BLAST序列比对算法的SNP聚类过程然后针对BLAST算法在应用中面临的问题本文提出了利用SNP的参考序列来寻找SNP基因组映射的方法该方法通过BLAST搜索基因组数据库并使用LISLongestIncreasingSubsequence算法分析BLAST结果来得到参考序列正确的基因组映射可同时得到多个SNP的基因组映射加快了处理速度本文成功地解决了SNP数据库的数据整合问题对于其他生命科学数据库的建设具有参考和指导意义而本文设计的表型本体经过扩展可以在生

6、物医学的更多领域得到应用关键词单核苷酸多态性表型本体BLAST算法基因组3上海交通大学工程硕士研究生学位论文DATAINTEGRATIONINHUMANGENOMESNPDATABASEABSTRACTAlongwiththecompletionofthehumangenomesequence,SingleNucleotidePolymorphism(SNP)hasbecomeakeyaspectofgeneticsresearch.Inrecentyears,ourcountryhasmadesignificantpro

7、gressintheSNPresearch.Researchinstituteshaveaccumulatedmassscientificdataintheseresearches.Implementofdatasharingwillpromotethedevelopmentofourresearchesinthisarea.Thegoalofthispaperistoimplementadatabasewhichcanrepresenttherelationshipbetweengenotypeandclinicalph

8、enotype.Thisdatabasewillbeusedtocollectresearchdatasubmittedbyresearchinstitutes,andimplementtheintegrationofdatafromdifferentsource.Themassofresearcher

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。