基于数据源依赖关系信息评价方法的研究

基于数据源依赖关系信息评价方法的研究

ID:32794292

大小:2.38 MB

页数:58页

时间:2019-02-15

基于数据源依赖关系信息评价方法的研究_第1页
基于数据源依赖关系信息评价方法的研究_第2页
基于数据源依赖关系信息评价方法的研究_第3页
基于数据源依赖关系信息评价方法的研究_第4页
基于数据源依赖关系信息评价方法的研究_第5页
资源描述:

《基于数据源依赖关系信息评价方法的研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要每一个网站(又称为数据源)都会提供一些数据值集合,用来反映事实信息,例如一个网上书店,它会提供很多书的信息,包括作者、书名、出版社和书的价格等。那么这些数据值就对应着一个集合,然而,事实和真相之间没有直接的关系。“事实”确实存在,也有可能不存在。而“真相”一定存在并且存在于“事实”的背后,“事实”是可以迷惑人的。不同的数据源通常会提供一些相互冲突的数据值,哪些值刁’是最可靠的值呢,为了提供给用户高质量的数据值,关键是数据集成系统能够解决数据冲突问题,并能够提取出正确的数据值。通常我们认为正确的数据值会被多数的数据源提供,而提供错误数据值的数据

2、源相对是少的。依据这一观点,我们利用选票算法,把被最多的数据源提供的数据值作为正确的数据值,但是一个数据源提供的值无论正确与否,都会被很多其它的数据源复制。在这样一个数据信息化时代,提取准确的数据就变的很棘手。因此真值发现问题受到了日益广泛的关注。本文给出了实现数据源分类,数据冲突处理的具体实现策略,详细描述了捕获数据源提供的数据值的变化特征,辨别数据源的类型,以及观察数据值之间的相似性关系等一系列逻辑结构,来准确的查找特定对象的可靠数据值。关键词:数据源;数据值;数据集成系统;真值;选票算法AbstractEverydatasourceswil

3、lprovidemanydata,whichusedtoreflecttheinfomationofapanicularf-act,suchasanonlinebookstore,itwillproVidealotofbooks’information,includingtheauthor,title,thepressandthepriceofthebook.ThentheseValuesiscoHespondingtoadataset,howeVer,thereisnodirectrelationsbetweenthefactsandthetr

4、uth.”Facts”doesexist,andmaVnotexist.And”truth”mustexistinthef.acts,factsismisleadingsometime.Dif俺rentdatasourceswilloRenproVidesomeconnictingValues,、Vhichisreliable,inordertoof!I、erusersthehighqualityofthedataValue,thekeyisthedatamanagementapplicationscansolVedataconnictingpr

5、oblem,andtoextracttherightValues.WeusuallythinkthatthetruevalueswillbeproVidedbymostdatasource,andthereis1ittlesourcewhichgivethe、vrongdataValue.AccordingtothisView,weuseVotealgoritlun,whichwasthatthemostdatasourcesproVidetheValueasthecorrectValue,butaValueiswhethercorrectlyo

6、rnot,matwillbecopiedbyalotofotherdata.Insuchadatainfomationtimes,extractinga(:curatedatawillbetricky.SothetruthfindingshouldbeputonmoreextensiVeattention.Inthispaper,werealizedataclassification,thespecificimplementationstrategyofcon】11ictingdataprocessing,wealsodescribethedet

7、ailedprocessofcapturethecharacteristicsofaValuedatawhichisconstantlychanging,andobserVethesimilaritybetweentheValuerelationsa芏ldaseriesoflogicalstructureondata,accuratelylocatereliabledataValueofpanicularobject.Keywords:datasources;dataValue;thesystemofdataintegrating;thetrue

8、Value;theVotesalgorithm第l苹绪论第1章绪论1.1数据挖掘的研究现状近十几年来人们利用信息技术生产和搜集数据的能力

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。