web挖掘技术在个性化网站中的应用

web挖掘技术在个性化网站中的应用

ID:34511022

大小:254.12 KB

页数:6页

时间:2019-03-07

web挖掘技术在个性化网站中的应用_第1页
web挖掘技术在个性化网站中的应用_第2页
web挖掘技术在个性化网站中的应用_第3页
web挖掘技术在个性化网站中的应用_第4页
web挖掘技术在个性化网站中的应用_第5页
资源描述:

《web挖掘技术在个性化网站中的应用》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、http://www.paper.edu.cnWeb挖掘技术在个性化网站中的应用富丽娜大连理工大学软件学院,辽宁大连(116023)E-mail:forevermonica@gmail.com摘要:针对用户特性向用户提供个性化服务已经成为Web技术的研究热点。本文介绍了Web挖掘和个性化服务的相关概念,重点介绍了Web使用挖掘基本流程,通过一个实例分析阐述Web挖掘技术在个性化网站中的应用。关键词:Web挖据,Web使用挖掘,个性化中图分类号:TP393.41.引言随着Internet的飞速发展,它已成为人们获取信息的一个重要途径,面对丰富的信息内容、巨大的数据量,

2、迫切需要一种新的技术来帮助人们查找所需信息,完成信息的主动推荐。个性化服务技术就是针对这个问题提出的,通过收集和分析用户信息来学习用户的兴趣和行为,从而实现主动推荐的目的。在网上销售系统中,根据数据挖掘思想和方法,利用Web数据挖掘技术,通过发现隐藏在数据中的模式信息和用户的行为模式,可了解不同客户的需求,根据客户的兴趣所在实现个性化服务,对网站实现高效管理、提高商业网站使用效率、实现个性化的信息推送服务都有着重要的意义。本文重点介绍个性化服务技术、Web挖掘技术及其在商业网站中的应用。2.Web数据挖掘2.1Web挖掘的基本概念[1]数据挖掘是指使用算法来抽取信息

3、和模式,是知识发现中的一个很重要的步骤,也是信息技术领域中最热门的话题之一。Web数据挖掘简称Web挖掘,是数据挖掘技术在Web环境下的应用。Web挖掘是指从大量的Web文档集合中发现蕴含的、未知的、有潜在应用价值的、非平凡的模式的过程。Web挖掘是一个极具挑战性的课题,它实现对Web存取模式、[2]Web结构和规则、以及动态的Web内容的查找。2.2Web挖掘面临的问题由于Web上信息的特点,对Web进行有效的信息挖掘、抽取和发现有用的信息具有很大的挑战,同时也面临很多的问题:⑴由于传统的基于关键字检索的搜索引擎方式的局限,再加上网页自身的结构特征,使得Web挖掘

4、比传统的数据挖掘更加复杂。⑵Web文档无分类索引,无任何的排列次序。半结构化数据的复杂程度要高于普通的文本文档,数据结构隐含模式的信息量大,模式变化快,增加了Web挖掘的困难程度。⑶对有用的信息还停留在利用各种搜索引擎进行查找,导致了检索结果质量差、召回率和准确率低,且更新周期长。⑷Web是异质、分布、动态的信息源。数据更新快,无固定的模式,现有的搜索引擎不能发现未知信息和有用的模式,网络信息的利用率低。⑸不能为用户提供个性化的信息检索和查询服务。-1-http://www.paper.edu.cn2.3Web挖掘的分类一般而言,Web挖掘可分为三类:Web内容挖掘

5、、Web结构挖掘和Web使用挖掘。图1[3]给出了Web挖掘的分类。Web挖据Web内容挖据Web结构挖据Web使用挖据Web页面搜索结果一般访问定制的使用内容挖掘挖据模式追踪模式追踪图1Web挖据的分类2.3.1Web内容挖掘(WebContentMining)Web内容挖据是一种基于网页内容的挖据。是从大量的Web数据中发现信息、抽取知识的过程。这些数据既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据[4]和无结构的自由文本。对无结构的自由文本的挖掘称之为文本的知识发现。对多媒体文档[5]的挖掘称之为多媒体数据挖掘。Web内容挖掘有两种策略:直接挖

6、掘文件的内容,或在其他工具搜索的基础上进行改进。采取第一种策略的有锁定网络的查询语言WebLog、WebSQL等,利用启发式规则来寻找个人主页信息的Ahoy等。采取第二种策略的方法主要是对查找引擎的查询结果进行进一步的处理,以得到较为精确和有用的信息。属于该类的有WebSQL及对查找引擎的返回结果进行群集的技术等。2.3.2Web结构挖掘(WebStructureMining)Web数据不同于文本和数据库,有用的知识不仅包含在Web页面内容中,还包含在Web页面间的链接结构与Web页文档内部的结构之中。Web结构挖掘的目的是发现页面的结构和Web结构,并在此基础上对

7、页面进行分类和聚类,揭示蕴含在这些文档结构中的有用模式,从而找到权威页面。2.3.3Web使用挖掘(WebUsageMining)Web使用挖掘是通过挖掘Web日至记录以发现用户访问Web页面的模式、挖掘有用模[6]式和预测用户浏览行为的技术。虽然WWW是一个复杂的、异质的、动态的和庞大的信息源,但每个Web服务器都保留了用户访问的具有较好结构的日志文件,记录了关于客户查找和互动的信息。分析这些信息可以帮助了解客户的行为从而改进网站的结构,或为客户提供个性化的服务。一般模式追踪,通过分析使用记录来了解客户的查找模式和倾向,以改进网站的组织结构。而个人使用模式追踪

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。