轨迹数据上的并行查询处理.pdf

轨迹数据上的并行查询处理.pdf

ID:35188052

大小:5.61 MB

页数:157页

时间:2019-03-21

轨迹数据上的并行查询处理.pdf_第1页
轨迹数据上的并行查询处理.pdf_第2页
轨迹数据上的并行查询处理.pdf_第3页
轨迹数据上的并行查询处理.pdf_第4页
轨迹数据上的并行查询处理.pdf_第5页
资源描述:

《轨迹数据上的并行查询处理.pdf》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、博博博士士士学学学位位位论论论文文文轨迹数据上的并行查询处理PARALLELQUERYPROCESSINGONTRAJECTORYDATAAminaBelhassena(啊啊啊米米米娜娜娜)哈哈哈尔尔尔滨滨滨工工工业业业大大大学学学2018年年年06月月月国内图书分类号:TP393学校代码:10213国际图书分类号:681.5密级:公开工工工学学学博博博士士士学学学位位位论论论文文文轨迹数据上的并行查询处理博士研究生:AminaBelhassena(啊米娜)导师:王宏志教授申请学位:工学博士学科:计算机软件与理论所在单位:计算机科学与技术学院答辩日期:2018年06月授予学位

2、单位:哈尔滨工业大学ClassifiedIndex:TP393U.D.C:681.5DissertationfortheDoctoralDegreeinComputerScienceandTechnologyPARALLELQUERYPROCESSINGONTRAJECTORYDATACandidate:AminaBelhassenaSupervisor:Prof.HongZhiWangAcademicDegreeAppliedfor:DoctorofEngineeringSpecialty:ComputerSoftwareAndTheoryAffiliation:Schoolo

3、fComputerScienceandTechnologyDateofDefence:June,2018Degree-Conferring-Institution:HarbinInstituteofTechnology摘要摘要近年来,来自档案、文件、媒体、传感器数据、社交媒体、商业应用、公共网络、数据存储、机器日志数据等诸多领域的大数据前所未有的增长。大量的数据让现有的处理、存储、分析和管理过程面临很大挑战。因此,近年来对于大数据的计算和分析研究广泛展开。地理信息系统GIS利用了全球定位系统GPS工具和传感技术收集了大量的位置数据来描述物体的运动情况,即物体的运动轨迹。一条轨

4、迹即为一串位置点的有序序列,每个位置点被命名为兴趣点,包含了该位置的经纬度、地址名称以及其他描述性信息。为了处理和分析这些数据,应用轨迹数据库(TJDBs)去管理轨迹数据,并从中挖掘出知识来支持决策。同时,轨迹的描述性信息和位置点上的路径也在TJDBs中得到管理,因此,轨迹的查询处理也带来了重大的研究挑战,此外,TJDBs存在大量的物体的移动数据,这就需要对轨迹进行高效的查询处理来支持轨迹中知识提取和轨迹模式匹配。这需要多次的计算和更新的方法去处理。因此,这部分研究在工业界和学术界都是一个丞待解决的问题。对于这种需求,当前还没有相关课题研究与用户生活相关的特殊查询问题。本文针

5、对轨迹领域中的这些挑战,提出了有效的方法,均衡的轨迹数据管理索引,和高效率的查询算法。本文通过使用基于分布式系统的新定量方法加速计算,在实验部分进行了全面的实证分析和详尽的方法评估,这些成果也为未来的研究方向奠定了基础。和以往的方法相比,本文的实验结果保证了提出索引和方法的效率和性能。全文共分五章,结构如下:第1章介绍了本文的主要研究内容和研究目标。重点讨论了相似性度量、空间查询处理类型、以及较大轨迹数据库上TJDBs轨迹数据处理定义和方法。此外,介绍了这些机制在轨迹索引和查询问题中的应用。本章是对本文工作的结构支撑。第2章介绍了并行轨迹数据管理和处理的分布式索引(DTR树)

6、。本章重点讨论使用分布式平台将大型轨迹数据管理转换为成一组索引集合,其中每个索引位于集群中的不同机器中。索引应用了数据存储和数据维护方法。此外,提出一个处理轨迹top-k查询的有效算法。top-k查询是基于距离阈值和一组关键字信息,以找到包含指定的活动关键词的最佳的轨迹序列。为了优化查询算法,提出了一种有效的遍历索引的剪枝方法。-I-DissertationforDoctoralDegreeatHarbinInstituteofTechnology第3章重点研究了频繁路径的查询处理方法,在此方法中,位于集群中不同机器中的索引存储了地理位置对象及其频繁活动文本。因此,本章的目的

7、是处理包括活动在内的每个轨迹对象的分布式数据挖掘算法(Apriori算法)。数据挖掘算法被应用于计算那些存储在R-树划分的叶子节点上的运动物体及兴趣点POI,并通过支持度来选择频繁轨迹和活动,以及构建强关联规则计算它们的置信度。这些结果存储在海量的挖掘倒排表中(MIL),本章利用可追踪性方法对其进行优化,以减少其数量。最后,为了处理所提出的查询,提出了一个高效的并行查询处理算法。算法由两个步骤组成:第一步通过遍历相应的分离索引,有效地访问搜索空间,第二步目标是用优化的MIL列表同步地选择最佳轨迹。第4章

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。