基于多层次数据库的智能web挖掘系统new

基于多层次数据库的智能web挖掘系统new

ID:34141973

大小:220.81 KB

页数:3页

时间:2019-03-03

基于多层次数据库的智能web挖掘系统new_第1页
基于多层次数据库的智能web挖掘系统new_第2页
基于多层次数据库的智能web挖掘系统new_第3页
资源描述:

《基于多层次数据库的智能web挖掘系统new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、第30卷第5期计算机工程2004年3月VoL30抽5ComputerEngineeringMarch2004。软件技术与数据库·文t幼号:1000-3428(2004)05-01193-02文臼标识码:^中目分纽号。TP3,3基于多层次数据库的智能Web挖掘系统李长河,王谁花,张二虎(西安理工大学计算机学院,西安710048)摘耍:从当前Web挖掘的现状出发,提出了菇于知识利用的智能检索综合Web挖掘引攀系统IWMES井葬于IWMES阐述了多层关系数据库的概念,提出r实现〔终WebMl.(Web挖掘语言)设想方案与模型实例关性侧:数据挖拥智能检索;多层次数据库;Web1$Ii语言;W

2、eb挖掘IntelligentWebMiningSystemBasedonMLDBLIChanghe,WANGWeihua,MANGErhu[Abstract]ThisarticleadvancesthesystemmodelofIWMES(IntelligentWebMiningEngineSystem)onthebasisofknowledgeutilimtion,andhaledonIWMES,itdiscussestheconceptofMLDBmidmakesoutconceivingschemeandmodelinstanceofimplementingmeans-Web

3、ML[Kevwords]Dammining(DM);Intelliircntsearch;Multiplelaversdatabase(MLDB):WebML;Webminine1IWMES系统模型IWMES的最终目的就是融合内容挖掘和结构挖掘功能为一体,解决随机的、动态的、不完全的或棍饨数据的数据LA丫ER,LAYER=挖掘,即实现所谓的科能数据挖桐.吹补抑去川妙的劫劫茉足_1oMLIJB1.1IWMES结构IWMES系统模型上要有数据采集器、索引库、预处理器、挖掘综合器、抢掘方脚车和维护系统、用户输出评估界而和多层数据库7大部分组成,具体结构如图1所示。D,W来IR,(])数据采

4、集器。按用户要求从网上采集数据,并将其存入文本数据库中。主要数据途径有MLDB和搜索引攀。(2)索引库。用来存放访问频率比较高的页面信息,主要包括相关关锤词信息、地址和内容等。其主要目的就是为了提高系统效率,作用类似于Cache,索引14'(3)预处理器。1WMES仍然使用传统的挖掘工具,将文本CUBE数据库中的HTML文档和XML文档组织成传统的挖掘工具可用的数据格式,预处理器则是对文本数据库中的数据进行分类、提取并生成数据立方、数据库或数据文件等数据形式。挖}11k'j';合器(4)挖掘综合器。挖掘综合器是一个挖掘W动引擎。它根据挖掘要求和挖掘方法来选择策略,从挖掘方法库中选择,

5、jJ砂一1果维合适的挖掘算法,并使用该方法去执行挖掘任务。关联规则1皿要页面护(5)挖掘方法库和维护系统。挖蒯方法库存放着各种挖:茬掘方法,如料lull-k.专家Zf#'.人1;i}14b}}=rM收;la[i:m14趋M)U势OM对M1侧}N111M其AAO他MW知朋NH系统法、网格计算等算法和解冷If*:ifW#tiEitJa:};rn,ISAnf石川占}h51,n4f.-t.-a七fdtlf5二(b)用户输出与评估界而。将挖掘结果以直观友好的方川户输出、日气占界而式提交给用户,用户对挖掘结果进行评估,如果满意则挖掘过目Iwob拍翻均合双旅(SWMS)程结束,如果用户对挖掘结果不

6、满意,则可以重提挖掘要求,再选择新的方法重新进行挖掘。项目签金:教育部重点实验室墓金资助项目((TKLI0107);陕西省教()多层数据库(MLDB)。其概念就是根据经常出现的基金资助项目(021K093)查询模式,}WebY的原始信急进行概括归纳,形成多层次作者钧介:李长何(、9as-),男,教授,主研方向计算机视觉结构化的数据库,它是此系统模型中对于Web数据进行统一与多媒体信息处理,人工智能、机器人及网络计算新技术;王维花,硕士生;张二虎,在职博士生管理和共享的重要组织形式,直接影响到系统的性能。收鹅日抽:2003-03-31E-mail:chlmaila163.cgn-g3_

7、万方数据1.2IWMES系统的实现关系表等。各站点通过各种转换工具,形成自己的LAYER,作为一个系统,各个儿素之问是相互联系协同工作的。数据库,这些数据库通过Internet构成了一个巨大的全局用户首先通过用户输入界而翰入自己的挖掘要求,包括挖烟LAYER,数据库,虽然可以在LAYER,数据库上完成查询,但哪类网页,希望进行哪些挖掘操作等。一方面从索引库中检对于涉及大量站点的查询,其效率是低一「的,因此,要抽象索信息,如果存在相关数据,则直接从索引库中提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。