基于web数据挖掘的个性化搜索引擎研究综述

基于web数据挖掘的个性化搜索引擎研究综述

ID:33537334

大小:251.36 KB

页数:4页

时间:2019-02-26

基于web数据挖掘的个性化搜索引擎研究综述_第1页
基于web数据挖掘的个性化搜索引擎研究综述_第2页
基于web数据挖掘的个性化搜索引擎研究综述_第3页
基于web数据挖掘的个性化搜索引擎研究综述_第4页
资源描述:

《基于web数据挖掘的个性化搜索引擎研究综述》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、维普资讯http://www.cqvip.com基于Web数据挖掘的个性化搜索引擎研究综述付晓翠.许盈(1.山东农业大学信息科学与工程学院,山东271018;2.山东农业大学机械与电子工程学院,山东271018)摘要:Web数据挖掘是将数据挖掘技术和理论应用于对www资源进行挖掘的一个新兴的研究领域。论述Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍个性化搜索引擎的一些情况,论述Web数据挖掘在个性化搜索引擎中的应用。关键词:Web数据挖掘;个性化;搜索引擎0引言据和无结构的自由文本。Web结构挖

2、掘是从网页的超级链接中发现其结构及其相互关系。通过找到隐藏在Web已成为人们获取信息的一个重要途径。随着一个个页面之后的链接结构模型,就可以利用这个模web信息的日益增长.人们不得不花费大量的时间去型对Web页面重新分类.也可以用于寻找相似的网搜索浏览自己需要的信息。搜索引擎已成为人们最普站基于超级链接的拓扑结构.Web结构挖掘可以进遍使用的信息检索的工具。该工具涉及到信息检索、行网页分类.总结网页和网站的结构。生成诸如网站问数据库、数据挖掘、人工智能、分布式处理、自然语言相似性、网站间关系的信息。处理等多个领域的理论

3、和技术。因而具有综合性和挑W战性但是.目前大多数的搜索引擎提供的服务还不能令用户满意。尤其是个性化的查询请求。因此,个性内容挖掘}I结构挖掘Il使用记象挖掘化搜索引擎成为当前的一个重要研究课题。文本挖掘II多媒体挖掘Il用户访问!1分析定制l模式分析l1web站点1Web数据挖掘综述图1Web数据挖掘分类1,1Web数据挖掘的概念和分类Web数据挖掘是数据挖掘技术与Web相结合的Web使用记录挖掘是从用户“访问痕迹”中获取产物.是一项综合技术.是从www资源上抽取信息f或有价值的信息.是对Web上日志数据及相关数据的挖

4、知识1的过程,是对Web资源中蕴涵的、感兴趣的、未知掘。这些数据包括:客户端数据、服务器端数据和代理的、有潜在应用价值的模式的提取。它反复使用多种数端数据Web使用记录挖掘可分为一般存取路径追踪据挖掘算法,从观测数据中确定模式或合理模型,也是和专用化追踪前者是用KDDfKnowledgeDiscovery将数据挖掘技术和理论应用于对WWW资源进行挖掘inDatabase,从数据库中获取知识1技术理解一般访问的一个新兴的研究领域。根据Web挖掘的对象不同,模式和趋势,例如Web日志挖掘:后者是分析某一时珊Web数据挖掘分

5、为:Web内容挖掘、Web结构挖掘和刻每一个用户的访问模式,网站将根据这些模式自动代Web使用记录挖掘Web数据挖掘分类如图1所示。重建结构。如自适应站点。Web使用记录的挖掘的目Web内容挖掘是从文档内容或其描述中抽取有的是预测用户网上的行为.比较网站的实际使用与期算趣知识的一种过程.是一种基于网页内容元素对象的望的差别.根据用户的兴趣调整网站结构1.2Web数据挖掘的发展现状一Web挖掘。这些元素对象既有文本和超文本数据。也有图形、图像等多媒体数据:既有来自于数据库的结自KDD一词首次出现在1989年8月举行的第l

6、1构化数据.也有用HTML或XML标记的半结构化数届国际联合人工智能学术会议以来曲美国人工智能协二士收稿日期:2007—11—21修稿日期:2008—03~11力作者简介:付晓翠(1979-),女,辽宁沈阳人,助教,硕士,研究方向为数据挖掘、网络技术等MODERNCOMPUTER2008.3维普资讯http://www.cqvip.com实践与经验会主办的KDD国际研讨会已经召开了l3次.规模由原面取得一些进展.但它们与实际应用的需要仍存在很来的专题讨论会发展到国际学术大会.人数由二三十人大的距离。到超过r人,论文收录

7、数量也迅速增加.研究重点也从(4)数据挖掘中的隐私保护与信息安全随着数发现方法逐渐转向系统应用直到转向大规模综合系统据挖掘工具和电信与计算机网络的日益普及.数据挖的开发并且注重多种发现策略和技术的集成.以及多种掘要面对的一个重要问题是隐私保护和信息安全需学科之间的相互渗透其他内容的专题会议也把数据要进一步开发有关方法.以便在适当的信息访问和数挖掘和知识发现列为议题之一威为当前计算机科学界据挖掘过程中确保隐私保护与信息安全.当然.南于的一大热点IBM、NEC等机构对Web数据挖掘进行了Web上存在大量信息.并且Web在当

8、今社会扮演越大量的研究,并取得了一定的成果【uS.Charkrabarti鹤对来越重要的角色.有关Web内容挖掘和因特网上的数超文本数据挖掘进行了研究,并指出基于知识的算法将据挖掘服务.将成为数据挖掘中的一个最为重要和繁会在Web数据挖掘中扮演重要的角色:B.nk2ert。npl荣的子领域对信息的收集和评价方法进行了讨论并引入了结

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。