基于Web的数据挖掘及其应用研究

基于Web的数据挖掘及其应用研究

ID:36501932

大小:1.65 MB

页数:50页

时间:2019-05-11

基于Web的数据挖掘及其应用研究_第1页
基于Web的数据挖掘及其应用研究_第2页
基于Web的数据挖掘及其应用研究_第3页
基于Web的数据挖掘及其应用研究_第4页
基于Web的数据挖掘及其应用研究_第5页
资源描述:

《基于Web的数据挖掘及其应用研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、研K*m』训【j{Ⅱ究⑩闱二『匕z‘芗硕士学位论文学科门类学科专业指导教师研究生理举系统分析与集成王时绘副教授简钟论文题目基于、№b的墨兰苎塑兰其应用研究摘要数据挖掘(DataMiniIlg)是指从大型数据库或数据仓库中提取隐含的、未知的及有潜在应用价值的信息或模式。它是数据库研究中的一个很有应用价值的新领域,融合了数据库、机器学习、统计学等多个领域的理论和技术。w曲数据挖掘于与传统的数据挖掘有着很大的不同,传统的数据挖掘技术处理的数据对象主要是结构化数据,很少处理异质、非结构化信息,因此,对w曲上的数据进行挖掘具有极大的挑战性,这些使得w曲

2、挖掘成为数据挖掘的一个新主题。而且W曲挖掘为人工智能领域中数据挖掘技术的一个热点,它实现对w曲存取模式、w曲结构和规则,以及动态的web内容的查找功能,是一个更具挑战性的课题。本文首先对数据挖掘及W-eb挖掘技术进行了概述,对W曲数据的特点作了分析和研究;其次,作为应用,首先对个性化网络教育系统的现状做出全面概括,指出当前网络学习环境的特点和不足之处,分析如何才能构建一个良好的个性化的网络学习环境,然后设计将W曲挖掘技术应用于个性化网络教育中的系统架构,为进一步研究w曲挖掘奠定了基础.如何在个性化网络教育中运用W曲挖掘技术是本论文的重点。关键

3、词:数据挖掘W曲挖掘Ⅺv几个性化网络教育湖北大学学位论文原创性声明和使用授权说明原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本声明的法律后果由本人承担。做作者繇高计慨扮存加∥日学位论文使用授权说明本人完全了解湖北大学关于收集、保存、使用学位论文的规定,即:按照学校要求提交学位论文的印刷本和电子版本;学校有权保存学位论文的印刷本和电子版,并提供目录

4、检索与阅览服务学校可以采用影印、缩印、数字化或其它复制手段保存论文:在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。(保密论文在解密后遵守此规定)⋯⋯:俐签名日期:l如6年6月6日导师签名签名日期:扣‘年6月留日1.1课题的研究背景和意义1引言数据挖掘是近年来随着数据库和人工智能技术的发展而出现的一种全新信息技术,也是计算机科学与技术,尤其是计算机网络的发展和普遍使用所提出的而且迫切需要解决的重要课题。数据挖掘是指从数据中提取模式的过程,数据挖掘的提出,让人们最终有能力认识数据的真正价值,即蕴藏在数据中的信息和知识。数据挖掘技术的产

5、生,使得人们可以从大量的数据中发现隐含的规律,从而为决策提供更可靠的依据f”。而w曲技术的出现,为Inte吼et的注入了一个强大的推动力。将数据挖掘应用到w曲上,既是数据挖掘应用扩展的结果,又是w曲发展的需要。web数据挖掘于与传统的数据挖掘有着很大的不同,传统的数据挖掘技术处理的数据对象主要是结构化数据,很少处理上的异质、非结构化信息,因此,对w曲上的数据进行挖掘具有极大的挑战性,这些使得w曲挖掘成为数据挖掘的一个新主题,引起了人们的极大兴趣。有统计数据表明,目前世界上每年web服务器数量都以超过30%的比例增长,而w曲页面以60%的比例增

6、长,在我们每个用户面前汇成了一个信息的海洋。如何能够在最短的时间内找到最适合自己的信息,己越来越成为用户和各运行商日益关注的事情。朗讯科技贝尔实验室总裁耐特拉瓦利在贝尔中国研究院成立时对互联网的发展做出了7大预言,其中有一条就是“因特网将从一个单纯的大型数据中心发展成为一个更加聪明的高智商网络”。如何提高w曲服务质量,了解访问者在网站的活动情况,如何从庞大的用户群的数据海洋中挖掘客户活动信息等,正在成为前沿研究课题之一。对于网站而言,通过收集访问者的各方面信息,比如,浏览者是从哪个网站(入口)进入的(或是直接键入UIu地址);他在哪些页面中停

7、留的时间较长以及分别是多少时间,或由此页面打开的内部链接最多;浏览者最关心的是哪些方面的新闻和消息;他在这个网站上一共停留的时间;以及该浏览者的所在地域等基本信息等等。通过对这些信息的分析,可以了解访问者登陆w曲之后的活动和规律以及web工作情况,比如web的结构(频道、栏目设计)、页面结构、技术体系、各个页面工作效率(页面平均浏览下载时间、发生的错误等)等情况。根据这些信息,更新网站内容和结构,向访问者展示其最感兴趣的内容,并且修改用户不太感兴趣的内容,去除用户从不访问的内容,从而可以提高网站本身的服务水平和质量,使网站达到最好的性价比。如

8、同电视台需要得到各个栏目的收视率一样,这些信息是网站的经济命脉。对于用户来说,从网站获得了个性化的服务,可以更快捷方便地取得自己所取的信息和相应的服务,从而提高了自

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。