基于hdfs的时空数据共享与查询隐私保护的研究与实现

基于hdfs的时空数据共享与查询隐私保护的研究与实现

ID:34061259

大小:4.39 MB

页数:79页

时间:2019-03-03

基于hdfs的时空数据共享与查询隐私保护的研究与实现_第1页
基于hdfs的时空数据共享与查询隐私保护的研究与实现_第2页
基于hdfs的时空数据共享与查询隐私保护的研究与实现_第3页
基于hdfs的时空数据共享与查询隐私保护的研究与实现_第4页
基于hdfs的时空数据共享与查询隐私保护的研究与实现_第5页
资源描述:

《基于hdfs的时空数据共享与查询隐私保护的研究与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据分类号UDC密级学位论文基于HDFS的时空数据共享与查询隐私保护的研究与实现作者姓名:指导教师:申请学位级别:学科专业名称:论文提交日期:学位授予日期:评阅人:孟凡帅王波涛教授东北大学信息科学与工程学院硕士学科类别:工学计算机软件与理论2014年6月论文答辩日期:2014年6月21日2014年7月答辩委员会主席乔建忠教授韩东红副教授张大波教授东北大学2014年6月万方数据AThesisinComputerSoftwareandTheory1IlllIIlllIJlliIl!!lllIIJY2987949ResearchandImplem

2、entationofSpatioTemporalDataSharingandQueryPrivacyProtectionBasedonHDFSByMengFanshuaiSupervisor:ProfessorWangBotaoNortheasternUniversityJune2014万方数据独创性声明本人声明,所呈交的学位论文是在导师的指导下完成的。论文中取得的研究成果除加以标注和致谢的地方外,不包含其他人己经发表或撰写过的研究成果,也不包括本人为获得其他学位而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的说明

3、并表示谢=6■思。学位论文作者签名:筮J屯肿1日期:≯口,垆.么.7q/学位论文版权使用授权书本学位论文作者和指导教师完全了解东北大学有关保留、使用学位论文的规定:即学校有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人同意东北大学可以将学位论文的全部或部分内容编入有关数据库进行检索、交流。作者和导师同意网上交流的时间为作者获得学位后:半年口一年口一年半口学位论文作者签名:缸)乞171{7签字日期:)l穸,午.∥.),节1两年吖导师签名:工“乏涛签字日期2扩//4,6,上垆万方数据东北大学硕士学位论文摘要基于HDF

4、S的时空数据共享与查询隐私保护的研究与实现摘要伴随着科技的发展,社会生活的信息化程度不断提高,在每天的生产生活中都会产生大量的数据,如何有效地存储并查询这些数据对未来的生产生活有重要意义。近年来云计算与云存储的兴起为海量数据的存储与查询提供了更有效地解决方法,越来越多的应用开始向云端迁移。本文依托于“海洋环境信息计算与服务体系框架”的国家海洋公益项目。针对国家海洋局中海量时空数据存储分散与管理复杂的特点,本文研究实现了基于Ⅷ)FS的时空数据共享系统;针对保护用户时空信息查询隐私的研究目标,本文实现了时空数据的查询隐私保护算法。基于HDFS的分布

5、式文件共享系统的框架分为三层:基础层、接口层、服务层。基础层使用ApacheMINA、Java、Mysql、HDFS实现,四者分别负责消息通信、数据传输、用户信息存储、数据存储功能。接口层负责管理基础层资源并向服务层提供服务接口,该层分为数据传输模块、用户管理模块、文件管理模块三个模块。服务层负责系统的业务逻辑处理,该层解析用户消息并调用接口层模块提供的服务执行用户请求。本系统为每个用户指定存储空间,多个用户可以共用同一存储空间,同时共享里面的文件。海洋局存储着海量时空信息,现有的隐私查询算法在进行查询时效率较低,针对这种不足本文提出了空间最近

6、邻与空间范围隐私查询算法。本文在CPIR-V算法的基础上提出了sCP瓜一v算法,该算法通过寻找潜在最近邻点集的关系来压缩计算矩阵,从而减少查询时的计算代价与通信代价,该算法可以在服务端无法获取查询位置的前提下向用户返回包含最近点的空间信息。通过对比试验可以看出SCPIR.V算法在高斯分布与真实数据下可以提高查询性能,在均匀数据下算法查询性能在网格划分较多时较好。本文将CPIR算法应用到空间范围查询中,并在朴素的空间范围查询算法的基础上提出了基于分组的空间范围查询算法。实验结果表明基于分组的查询算法的通信代价没有显著增长,而服务端与客户端计算性能

7、优于朴素查询算法。海洋数据中的时间信息会随着数据的采集不断的增长,现有的隐私数据查询技术无法满足用户需求,为此本文提出了基于CPIR的时间信息隐私查询算法与时间范围隐私查询算法。本文分析了时间信息的基本特征,通过改进朴素时间插入算法提出了基于动态调整的时间插入算法与基于动态哈希的时间插入算法。算法通过设置数据集的数目与排列方式使服务端无法判断查询内容与查询结果。最后本文将三种算法应用到时间范围查一Tl—万方数据东北大学硕士学位论文摘要询中。本文对三种算法进行了实验,当对单一时刻进行查询时,动态哈希算法效率较高;进行范围查询时,在客户端计算时间与

8、通信代价并不显著增加的情况下,动态哈希算法服务端计算时间较短,随着通信带宽与客户端计算能力的提高,动态哈希算法具有更好的性能。关键词:数据共享;隐私保

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。