基于web的网络信息数据挖掘技术new

基于web的网络信息数据挖掘技术new

ID:33497287

大小:38.58 KB

页数:3页

时间:2019-02-26

基于web的网络信息数据挖掘技术new_第1页
基于web的网络信息数据挖掘技术new_第2页
基于web的网络信息数据挖掘技术new_第3页
资源描述:

《基于web的网络信息数据挖掘技术new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、·情报技术·JournalofInformationNo.3,2005基于Web的网络信息数据挖掘技术徐险峰(吉首大学张家界校区图书馆 张家界 427000)摘 要 分析了数据挖掘与Web挖掘的含义,着重阐述了Web挖掘的内容及其实现技术,简要介绍了Web挖掘的应用。关键词 网络信息挖掘 数据挖掘 Web挖掘  随着Internet技术的迅猛发展,Web已发展成为拥有3亿页 资源发现 面的分布式信息空间,而且这个数字仍以每4至6个月翻一番的↓速度增加。在Web上浏览各种信息,并对这些信息进行加工和利信息选择与处理↓用已成为人们工作和日常生活中必不可少的环节。由于Web是  概括化

2、  一个海量信息源,存在着大量无用或垃圾信息,只有极少部分是↓有用的,因此,如何从Web上挖掘出有用的知识已成为当前研究  分 析  的重点。一种新的信息挖掘技术———Web挖掘可以使用户准确、图1Web挖掘的步骤快捷地从WWW上获取所需信息。2Web挖掘的类型1 数据挖掘与Web挖掘按照挖掘对象的不同,Web挖掘可分为Web内容挖掘(Web数据挖掘(DataMining)是信息技术(IT)领域中最热门的话contentmining)、Web结构挖掘(Webstructuremining)和Web使用题之一。数据挖掘,有时也被称作数据库中的知识发现,从技术挖掘(Webusagem

3、ining)。上来说,就是从大量的、不完全的、有噪声的、模糊的、随机的实际2.1Web内容挖掘 Web内容挖掘(WebContentMining)就是应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在从各种网络资源中找到有用信息的过程。Web上的信息五花八有用的信息和知识的过程。其主要特点是对数据库中的大量数门,传统的Internet由各种类型的服务和数据源组成,包括据进行抽取、转换、分析和其他模型化处理,从中提取辅助决策的WWW、FTP、Telnet等,现在有更多的数据和端口可以使用,比如关键性数据。当数据挖掘技术应用于网络环境下的Web中就成政府信息服务、数字图书馆、

4、电子商务数据,以及其他各种通过为Web挖掘(WebMining)。Web可以访问的数据库。Web内容挖掘的对象包括文本、图象、对于Web挖掘(WebMining)的称法现在多种多样,如网络数音频、视频、多媒体和其他各种类型的数据。现在查找网络资源据挖掘(WebDateMining)、网络知识发现(WebKnowledgeDiscov2使用较多的是搜索引擎,但是搜索引擎一般只对网上的静态信息ery)等,都是指使用数据挖掘技术自动发现和获取网络上的信息。进行“抓取”,而对于由用户提问动态生成的结果或存储于后台Web挖掘的定义比较有代表性的有如下两种:其一,从与WWWWeb数据库中的信

5、息却无能为力,而Web内容挖掘正是对Web有关的资源和行为中抽取感兴趣的、有用的模式和隐含信息;其页面上文本内容及后台交易数据库进行挖掘,从Web文档内容及二,网络信息挖掘技术是数据挖掘技术在网络信息处理中的应其描述中的内容信息中获取有用知识的过程,是普通文本挖掘结用。苏新宁等人认为,Web挖掘就是采用数据挖掘等信息处理技合Web信息特征的一种特殊应用。术,从Web信息资源以及Web使用记录中发掘对特定用户感兴Web内容挖掘的方法有两种:一种是基于代理的检索方法,趣的、有用的信息或知识的过程,其结果可以为用户决策所使用。它是一个人工智能系统。它可以代表某一特定用户,自动地或半We

6、b挖掘可分为如下四个步骤(如图1所示):a.资源发现,即自动地发现和组织基于Web的信息,可以根据用户的基本情况,检索所需的网络文档;b.信息选择和预处理,即从检索到的网络自动检索出用户感兴趣的信息,并组织和翻译好这些信息。有些资源中自动挑选和预先处理得到专门的信息;c.概括化,即从单个代理甚至可以自动学习用户的爱好,并根据用户的爱好为用户检的Web站点以及多个站点之间发现普遍的模式;d.分析,对挖掘索出相关信息。另一种方法是基于数据库的方法。这种方法是出的模式进行确认或者解释。把Web中异构的非结构化的数据集成或组织成结构化的数据,就像关系数据库那样,然后用标准的数据库查询机理

7、和数据挖掘技作者简介:徐险峰,男,1967年生,副研究馆员,研究方向为网络信息资源检索、开发与利用。52©1994-2006ChinaAcademicJournalElectronicPublishingHouse.Allrightsreserved.http://www.cnki.net情报杂志2005年第3期·情报技术·术来访问和分析这些信息。本信息的挖掘,它和通常的平面文本挖掘的功能和方法比较类2.2Web结构挖掘 Web结构挖掘就是挖掘Web潜在的链接似。利用Web文档中

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。