多dna生物信息数据库查询系统的设计与实现

多dna生物信息数据库查询系统的设计与实现

ID:33756408

大小:1.92 MB

页数:56页

时间:2019-02-28

多dna生物信息数据库查询系统的设计与实现_第1页
多dna生物信息数据库查询系统的设计与实现_第2页
多dna生物信息数据库查询系统的设计与实现_第3页
多dna生物信息数据库查询系统的设计与实现_第4页
多dna生物信息数据库查询系统的设计与实现_第5页
资源描述:

《多dna生物信息数据库查询系统的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、国内图书分类号:TP311.13国际图书分类号:681.3工学硕士学位论文V799076多DNA生物信息数据库的查询系统的设计与实现硕士研究生:导师:申请学位:学科、专业:所在单位:答辩日期:授予学位单位:张怀韬’李建中教授工学硕士计算机科学与技术计算机科学与技术学院2005年10月哈尔滨工业大学2玺鎏三些查兰三兰鎏圭兰竺兰三摘要20世纪后期,生物科学技术迅猛发展,数据资源急剧膨胀。为了储存、加工和进一步利用这些数据的需要和以数据分析、处理为本质的计算机科学数据库技术和网络技术的迅猛发展产生了分子生物信息数据库。例如现在国际上的三大核酸数据库Genban

2、k,欧洲分子生物学实验室(EMBL)的数据库和日本的DNA数据库(DDBJ)是被广泛使用的一级生物数据库。这些数据库各自开发一套系统为用户提供数据查询和分析服务,这一定程度利于用户处理数据,但用户需要在多个网站间切换,并且不得不学习和适应不同的系统使用方法,这样对用户来说是极不方便的。针对上面的问题,本文进行了如下的研究工作和贡献,主要贡献有四个方面:1、定义一个统一的B—SQL查询语言,为用户提供一个统一的查询平台,避免了用户在多个数据库间切换还要学习使用不同系统的使用方法的麻烦。2、在BSQL查询语句的转换方面,构造了一个BSQL查询语句转换算法,实

3、现了从BSQL到各个数据源查询语句的转换。3、在查询结果处理方面提出了一种常用查询结果缓存机制,存储在一定时间段内查询次数较多的若干个查询的结果,减少用户的查询时间,提高了用户的效率。4、为了进一步提高用户的工作效率,最后还提出了一种基于内容的关键字提取技术,对不同查询结果进行文摘和关键字提取,并且提出了相似度的概念来衡量不同结果之间相似性。关键词生物信息学;二级生物信息数据库;自动包装器;cache缓存基于内容的关键字提取兰筌篓王些銮耋三兰鍪圭主竺鎏兰AbstractLateinthe20“century,thetechnologyofbioscien

4、cehasmadegreatprogress.thebiologicdataincreasedgreatly.Theneedofstoringandmanagingthesedataandthedevelopmentofthetechnologyofthecomputerdatabaseandnetworkgivebirthtothedatabaseofthenumeratorbioscienceinformation,suchasthethreenucleicaciddatabaseGenbank.EMBLandDDBJ.Eachofthedataba

5、sesdevelopsitsownsystemseparately,providingtheserviceofqueryandanalysis.Itishelpfulfortheusers,buttheusershavetoswitchfromonetoanotherandlearntheusingofthedifferentsystems,whichisdiscommodious.Inordertosolvetheaboveproblems.theauthordidthefollowingwork.nlemainideaofthispaperiscon

6、sistofthefollowingfourparts:I.T21ispaperdefinesauniformB-SQLqueryinglanguage,andprovidesauniformqueryplatform.Withittheusersdon’thavetoswitchfromonebioscienceinformationdatabasetoanotherandlearntheusingofthedifferentsystems.2.InordertotransformtheB—SQL,theRuthorproposesallarithme

7、ticcalledBSQLquerytransformingarithmetic,whichisusedtotransformtheB—SQLtothequeriescorrespondingthedifferentbioscienceinformationdatabases.3.Forthesakeofreducingtheuser’squeryingtimeandenhancingtheefficiency,theauthorproposesacachemechanism.Severalqueryresults,whichareoftenused,a

8、restoredinthecache.4.Intheendtheauthorpr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。