欢迎来到天天文库
浏览记录
ID:33376197
大小:2.14 MB
页数:67页
时间:2019-02-25
《skyline代表点的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、分类号:____________TP311.13密级:______________公开UDC:____________单位代码:______________11646Skyline代表点的研究硕士学位论文论文题目:Skyline代表点的研究杨立龙学号:_________________________1111082080姓名:_________________________杨立龙专业名称:_____________________计算机应用技术____学院:_________________________信息科学与工程学院指导教师:____________
2、_____________董一鸿宁波大学论文提交日期:2014年04月15日万方数据分类号:____________TP311.13密级:______________公开UDC:____________单位代码:______________11646硕士学位论文论文题目:Skyline代表点的研究学号:_________________________1111082080姓名:_________________________杨立龙专业名称:____________________计算机应用技术_____学院:_________________________
3、信息科学与工程学院指导教师:_________________________董一鸿论文提交日期:2014年04月15日万方数据AThesisSubmittedtoNingboUniversityfortheMaster’sDegreeSkylineReprestativeObjectsQueriesCandidate:YangLilongSupervisors:ProfessorDongYihongFacultyofInformationScienceandEngineeringNingboUniversityNingbo315211,ZhejiangP.R
4、.CHINAApril15,2014万方数据独创性声明本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得宁波大学或其他教育机构的学位或证书所使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并表示了谢意。若有不实之处,本人愿意承担相关法律责任。签名:___________日期:____________关于论文使用授权的声明本人完全了解宁波大学有关保留、使用学位论文的规定,即:学校有权保留送交论文的复印件
5、,允许论文被查阅和借阅;学校可以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保存论文。(保密的论文在解密后应遵循此规定)签名:___________导师签名:___________日期:____________万方数据宁波大学硕士学位论文Skyline代表点的研究摘要Skyline查询返回数据集合中不被任意对象支配的对象,描述了数据集的轮廓,在多目标决策、偏好查询等领域具有重要应用。目前Skyline查询受到了学者的极大关注,在集中式环境和分布式环境下开展了卓有成效的工作。然而,Skyline查询存在一个不足,即随着数据属性维度的增大,Skyli
6、ne查询返回的结果集大小无法控制,最坏情况下可能接近原数据集,从而无法为用户的决策提供有效的支持。基于这个背景,在Skyline集中选择有代表性的点显得日益重要。本文在集中式和分布式环境下研究了选择k个skyline代表点的问题,它同时考虑得分与距离两个因素,返回了更具代表的skyline点。本文的主要贡献包括:(1)集中式环境下,定义了新的评价函数作为Skyline代表点的衡量尺度,选取具有k个最大评价函数值的Skyline作为Skyline代表点。新的评价函数兼顾了得分与距离双重属性,满足体现Skyline集分布特性,同时又具有高支配能力的k个数据点的集合
7、,最大化代表点的得分和非代表点与它最近的代表点之间距离的乘积。在二维空间提出了基于动态规划的解决方案,在高维空间采用aR-tree的索引结构存储数据,给出了近似的解决算法。算法维持一个访问列表,每次迭代先计算访问列表中得分与代表距离乘积最大的条目,再判断其是否被支配。若条目被支配则将其剪枝且终止当前迭代;若不被支配则继续迭代,选择条目中得分与代表距离最大的子条目继续计算。(2)分布式环境下,提出了一个适用于分布式的评价函数。提出了FDRA算法,算法利用反馈方法降低了计算开销。分布子节点每次只发送局部最大评价F值的点到中心服务器,服务器再选取具有最大评价值和最小
8、评价值的点pa和pb发送到分布子节点比
此文档下载收益归作者所有