不完整数据上SKYLINE偏好查询技术分析

不完整数据上SKYLINE偏好查询技术分析

ID:39115080

大小:2.18 MB

页数:54页

时间:2019-06-25

不完整数据上SKYLINE偏好查询技术分析_第1页
不完整数据上SKYLINE偏好查询技术分析_第2页
不完整数据上SKYLINE偏好查询技术分析_第3页
不完整数据上SKYLINE偏好查询技术分析_第4页
不完整数据上SKYLINE偏好查询技术分析_第5页
资源描述:

《不完整数据上SKYLINE偏好查询技术分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、哈尔滨工业大学工学硕士学位论文摘要Skyline查询作为一种典型的偏好查询方法,由于它能够从多属性数据集中快速提取用户感兴趣的数据点,该查询技术已经被广泛研究。几乎所有针对skyline查询的方法都假设数据集中不存在属性值缺失问题,然而在实际应用中,例如决策制定、基于位置的服务(LBS)和商品评价数据中,由于设备异常,隐私保护等原因,我们收集到的真实记录数据往往都是不完整的,即存在属性值缺失的问题。我们称存在属性值缺失或元组缺失问题的数据为不完整数据集,本文主要考虑存在属性值缺失问题的不完整数据。传统处理不完整数据的方法主要是填充和修复不完整属性,然而这些方法要么花

2、费太多时间,要么精度不高。对于skyline查询来说每一个属性都可能是该点成为skyline点的决定性因素,如果一个点不被任何其他点支配,该点才能成为skyline点。因此普通填充方法对skyline查询结果影响较大,已有的填充技术都不太适用于skyline查询。目前不完整数据的skyline查询研究并没有引起足够的重视,尤其是针对大规模数据和高维数据,它们存在不完整性的可能性更大,因此针对不完整数据的skyline查询问题研究更加具有实际意义,而且更具有挑战性。本文根据数据集存在的不完整性问题,分析不完整数据自身的特性,提出了不完整数据支配度这一概念,设计了针对静

3、态不完整数据集的EIDS算法,能够极大减少不完整数据之间的属性比较次数,有效提高算法执行效率,节省执行时间开销。然后我们将该问题扩展到动态不完整数据集中,考虑动态数据集的变化特征,在分析传统滑动窗口模型的基础上提出了基于滑动窗口进行分桶策略的sISkyline算法。关键词:偏好查询;skyline查询;不完整数据;动态数据集;-I-万方数据哈尔滨工业大学工学硕士学位论文AbstractSkylinequeryisaclassicalpreferencequery.Duetoitscapacityofretrievinginterestingpointsfrommul

4、ti-dimensionaldatasetsaccordingtomultiplecriteria,skylinequeryproblemhasbeenstudiedbroadly.Almostallthestudiesassumingthatdatadimensionsareallavailable.Howeverinmanyreallifeapplications,likedecisionmaking,location-basedservicesanditemratinginformationandsoon.Becauseofunitexception,priv

5、acyprotectionandotherreasons,almostallthecollectedrealdatasetsareincomplete.Datasetswithmissingattributevaluesormissingtuplesarecalledincompletedataset.Herewemainlyconsiderthecaseofincompleteattributevaluesinadataset.Thetraditionaldatacleaningapproacheslikefillingandrepairingmethod,how

6、evereitherspendtoomuchtime,ortheaccuracyisnothighenough.Inskylinequery,everyattributeisdecisiveindeterminingwhetheronepointcanbedominatedbyotherpoints,andifitisnotdominatedbyanyotherpoints,itisaskylinepoint.Sotraditionaldatacleaningmethodsarenotsuitableforincompletedataskylineproblemfo

7、ritsbiginfluenceonthequeryresult.Currently,skylinequeryresearchonincompletedatahasnotbeenattractedenoughattention,especiallyforthecaseofthelargescaledataset,theyaremuchmoretendtobeincomplete,thereforetheresearchforskylinequeriesonincompletedataismeaningful.Inthispaper,weproposestheid

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。