利用xml技术解决web数据挖掘中数据异构的问题

利用xml技术解决web数据挖掘中数据异构的问题

ID:34533895

大小:1.37 MB

页数:3页

时间:2019-03-07

利用xml技术解决web数据挖掘中数据异构的问题_第1页
利用xml技术解决web数据挖掘中数据异构的问题_第2页
利用xml技术解决web数据挖掘中数据异构的问题_第3页
资源描述:

《利用xml技术解决web数据挖掘中数据异构的问题》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、·4·ComputerEraNo.92010利用XML技术解决Web数据挖掘中数据异构的问题唐永平(梧州职业学院,广西梧州543002)摘要:讨论了Web数据挖掘中的数据异构问题,通过XML技术建立了一个半结构化数据模型和一个自动抽取模型,以解决Internet上绝大多数因异构、非结构化、动态数据集成问题所导致的Web数据挖掘的困难。关键词:Html技术;XML技术;Web数据挖掘;数据异构UsingXMLTechnologytoSolveDataHeterogeneityProbleminWebDataMini

2、ngTANGYong-ping(WuzhouVocationalCollege,Wuzhou,Guangxi543002,China)Abstract:ThedataheterogeneityprobleminWebdataminingisdiscussed.ByusingXMLtechnologyasemi-structureddatamodelandanautomaticextractionmodelareestablishedforsolvingmostofthedifficultiesinWebdatam

3、iningcausedbyheterogeneous,unstructuredanddynamicdataintegrationproblemsonInternet.Keywords:Htmltechnology;XMLtechnology;Webdatamining;dataheterogeneity0引言的利用带来了困难。有许多基于索引的Web搜索引擎,可以搜索Web,索引Web页面,并可建立和存储大量基于关键词的索万维网作为全球性的信息服务中心,为我们提供了涵盖经引,帮助定位包含某些关键词的Web页面集。借

4、助于这种搜索济、政务、电子商务、教育等方面的海量信息,在这些异构的引擎,用户通过提供一组严格约束的关键词和短语,可以快速Web信息资源中,蕴含着大量的有价值的知识,如何从这些信定位文档。然而,简单的基于关键词的搜索引擎存在诸多问息中得到有用信息是人们急需解决的问题。面向Web数据挖题。首先,任何宽泛的主题都可能包含成千上万的文档,这可掘技术为我们提供了一条有效途径。虽然Web数据挖掘技术能导致搜索引擎返回大量文档条目,其中很多与话题的相关性的应用研究取得了一些令人满意的成果,但是,Web数据的异不大,或包含的内容

5、质量不高;其次,很多与主题高度相关的文构性和特殊性,使其数据形式难以控制,数据集成异常困难。档可能并不包含定义他们的关键词。这表明简单的基于关键基于Xml技术建模为我们解决这一难题提供了思路。词的Web搜索引擎对于Web资源的发现还存在缺陷。而Web1Web数据挖掘及其概述数据挖掘则可以搜索Web结构,依次确定Web内容的重要性,近年来,随着Internet/Web技术的快速普及和迅猛发展,使发现Web内容的规律性和动态性,挖掘Web的访问模式。Web各种信息可以以非常低的成本在网络上获得。由于Internet/

6、数据挖掘可以用来实质性地加强Web搜索引擎的能力,因为WWW在全球互连互通,可以从中取得海量数据,面对如此大Web挖掘可能识别权威Web页面,分类Web文档,解决基于关的信息量,如何从中挖掘出有价值的知识,成为了Web数据挖键词搜索出现的一些含糊缺陷。一般地,Web挖掘任务可分为掘的主要任务。Web数据跟普通的文本数据存在显著的区别,三类:Web内容挖掘(WebContentMining)、Web结构挖掘Web数据是半结构化的或者非结构化的,这种结构给我们对它(WebStructureMining)、Web用法挖

7、掘(WebUsageMining)。???????????????????????????????????????????????????????????????等问题的面向对象的普适计算中间件和自适应中间件模型进大学学报(自然科学版),2008.25(6):592~595行了讨论,分析了他们的特点和适用范围。同时也借鉴了其他[4]丁博,王怀民,史殿习.普适计算中间件技术[J].计算机科学与探索,相关的普适计算中间件技术,论述了普适计算中间件的有关问2007.1(3):241~253题和需求。[5]徐磊.普适计算

8、中间件技术的研究[J].计算机工程,2004.30(20):参考文献:113~1153[1]徐光祐,史元春,谢伟凯.普适计算[J].计算机学报,2003.26(9):1042~[6]徐文拴,辛运帏,卢桂章.普适计算中间件技术的研究与进展[J].计算1050机科学,2007.34(11):1~5[2]李允,罗蕾,熊光泽.面向普适计算的自适应技术研究[J].电子学报,[7]吴

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。