基于web的数据挖掘技术——web内容挖掘的设计与实现

基于web的数据挖掘技术——web内容挖掘的设计与实现

ID:33403160

大小:1.89 MB

页数:49页

时间:2019-02-25

基于web的数据挖掘技术——web内容挖掘的设计与实现_第1页
基于web的数据挖掘技术——web内容挖掘的设计与实现_第2页
基于web的数据挖掘技术——web内容挖掘的设计与实现_第3页
基于web的数据挖掘技术——web内容挖掘的设计与实现_第4页
基于web的数据挖掘技术——web内容挖掘的设计与实现_第5页
资源描述:

《基于web的数据挖掘技术——web内容挖掘的设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、摘要WWW'是个开放的全球性资源,它是世界上最丰富和最密集的信息来源。随着WWW上信91、的爆炸性增长,在如此海量的数据中发现有用的信息变得越来越困难。数据挖掘就是从大量的数据中发现隐含的规律性的内容,解决数据的应用质量问题。充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术最重要的应用。因此,采用数据挖掘技术从WWW上提取隐含的、未知的、非平凡的及有潜在应用价值的信ol,,具有十分重要的现实意义和广泛的应用前景。木文a先简要论述了WWW发展的基本现状以及当前存在的一些问题。随后,简要介绍了数据挖掘技术的基本概念、原理,接着,概要的介绍了本文对于Web数据挖

2、掘所用到的技术一Java和XML技术,在此基础上研究了数据挖掘技术在WWW上的应用,针对Web数据内容挖掘进行了详细地论述。文中通过一个具体的案例详细论述了实现Web数据内容挖掘的一种方法以及对该方法的分析。最后,对全文进行了总结。关键词:WWW,Web数据挖掘,XML第一川。页AbstractTheWorldWideWebisadistributedglobalinformationresourcecontainingalargeamountofdatarelevanttoessentiallyalldomainsofhumanactivity.Giventh

3、ehighrateofthevolumeofdataavailableontheWWW,findingusefulinformationinsuchalargeamountofdatabecomesamoredifficultprocesseveryday.DataMiningisthetermgiventotheautomateddiscoveryofnon-obvious,potentiallyusefulandpreviouslyunknowninformationfromlargedatasources.Soobtainingvaluableinform

4、ationbyDataMiningtechniquesintelligentlyandautomatically,improvingefficiencyoftheWWWhastremendousapplicationvalues.Inthispaper,wefirstgenerallyintroducetheimprovementofWWWandsomeproblemsunsolved.Andthenwedescribethebasicconceptsandtheoriesofdatamining.Thefollowingisdissertatedtheappl

5、icationofdataminingtechniquestotheWorldWideWeb,anddiscussindetailthecontent,characteristic,problemsunsolvedofwebcontentminingandwebusagemining.Andthen,wegenerallyintroducethetechniquesofuseforDataMininginthepaperjavaandxml.Throughaconcretesample,wedescribeindetailoneofthemethodthatre

6、alizeWebDataMining.Finallywemakeaconclusionofthepaper.Keywords:WWW,WebDataMining,XML第一IV-页独创性声明本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。签名:』塑史一-日期:,悴乙月L`f-Q关于论文使用授权的说明本学

7、位论文作者完全了解电子科技大学有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后应遵守此规定)签名:导师签名:日期:2-W't第一U一页基于WEB的数据挖掘技术第一章引言'1.1Internet的由来与发展工nternet即通常所说的因特网或国际互联网,它是一个全球性的巨大的计算机网络体系,它把全球数万个计算机网络,数亿台主机连接起来,包含了难以计数的信息资

8、源,向全世界提供信息服务

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。