面向生物医学大数据的数据组织存储与检索

面向生物医学大数据的数据组织存储与检索

ID:37092280

大小:5.82 MB

页数:51页

时间:2019-05-17

面向生物医学大数据的数据组织存储与检索_第1页
面向生物医学大数据的数据组织存储与检索_第2页
面向生物医学大数据的数据组织存储与检索_第3页
面向生物医学大数据的数据组织存储与检索_第4页
面向生物医学大数据的数据组织存储与检索_第5页
资源描述:

《面向生物医学大数据的数据组织存储与检索》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、:TP311749分类号单位代码:10密级:11:公开学号120630442宁夏大学专业学位论文茴向生物医学大数据的数据组织存储与检索Dataoranizationstoraeandretrievalforbiomedicalbigggdata学位申请人:卜训松指导教师:杜方教授合作指导教师:刘立波教授申请学位类另0:工程硕士专业领域名称:计算机技术研究方向:数据库技术所在学院:工程学院

2、信息:2018年3月论文完成日期独创性声明本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,论文中不包含其他人已,除了文中特别加以标注和致谢的地方外经发表或撰写过的研究成果,也不包含为获得宁夏大学或其它教育机构的学位或证一书而使用过的材料。与我同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。、研究生签名:k时间:年/月u曰f关于论文使用授权的说明?本人完全了解宁夏大学有关保留、使用学位论文的规

3、定,即.学校有权保留送交论文的复印件和磁盘,允许论文被查阅和借阅,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。同意宁夏大学可以用不同方式在不同媒体上发表、传播学位论文的全部或部分内容。(保密的学位论文在解密后应遵守此协议)研究生签名:时间:年彡月〇曰卜一导师签名:时间:pv年/月D日^^i摘要在语义Web中,资源描述框架(ResourceDescriptionFramework,RDF)己经成为网络资源的标准表示。RDF数据由主语,谓词和宾语

4、组成的三元组组成。根据W3C研宄团队在2016年底发布的统计数据,RDF数据集中的三元组数量在互联网上已经达到520亿条,其中生物医学领域的核心数据集有42个,包含了超过300亿个RDF三元组,这些数据目前正在以指数级的速度在互联网上曰益增长,这些大量与医学相关的数据也催生出了如Uniprot、DrugBank等很多医学领域RDF知识库。本文通过分析目前国内外专家学者对医学领域的RDF大数据研宄的总体概况,梳理、总结了相关文献,结合本课题的实际情况,探讨了分布式系统下的数据存储

5、和RDF査询技术。对RDF大数据分布式存储和査询两个问题的研宄将为医学RDF大数据的高效分析和理解奠定基础。本文研宄并实现了面向生物医学数据的存储和查询系统?。系统分为三大模块,分别为.字典CentOHa模块、基本操作模块和可视化模块。通过对分布式架构的研究,在S系统上部署doop与HBase,在Windows系统上以JavaEE架构为基础,完成针对客户端请求的服务,后台通过字典对比将获取的前台数据转成字典类型的数据,然后去服务器进行相应的操作。系统基本操作模块:插入

6、数据模块:査询模包括、删除数据模块、修改数据模块:可视化模块主要为块和査询结果图转换模块。系统实现了数据在HBase中的存储,通过windows客户端对数据的査询及更新操作以及査询结果的可视化展示。关键词,分布式査询,RDF数:生物医学大数据,分布式存储据IAbstractInthesemanticWebtheResourceDescritionFrameworkDFhasbecomeastandard,p(R)rerent.ffbdsetai

7、WebresourcesRDFdataconsistsotrilesosuectsreicaesandob.ponofpj,pt,ectsjAccordintoheW3Camsiisreleasbtheend2016henumberfrilRDFdanttetatstcedof,totestasetogyptheInternethasreached52billion,ofwhichthecoreinthef

8、ieldofbiomedicaldatasetshave42contains,rethan30billonRDFtriesheseacurrenntheInnerownhemoipltdtaaretltertisittrateof,yoggaexonentialthesealsosawnedalotofiUnDrBmanilmedcalrelateddatasuchasirotugankmedca

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。