欢迎来到天天文库
浏览记录
ID:1223616
大小:1.49 MB
页数:21页
时间:2017-11-08
《11演示毕业论文答辩》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Web数据挖掘在个性化自适应网站中的应用研究信息工程学院计算机科学与技术1班郝雅林★论文结构引言数据挖掘以及Web数据挖掘Web日志挖掘聚类算法基于Web日志挖掘的个性化自适应网站Web日志挖掘在个性化自适应网站中的应用实现背景、意义、研究现状定义、分类、步骤定义、模型、数据类型、预处理、模式分析、模式发现定义、算法工作流程、设计原则、系统架构、主要模块实现环境、过程、动态链接的自动生成、推荐页面★研究背景Web页面复杂,无结构、并且是动态的,导致人们难以迅速地在Web上找出所需要的数据和信息。Web数据挖掘以及在此基础上建立的自适应网站对满足用户的个性化要求有很好的应用效果。在网
2、站的设计实现过程中,能够根据用户的访问兴趣来进行个性化推荐,提高用户对网站的浏览效率,更加有针对性的满足用户的需求。基于Web数据挖掘和自适应网站的优点,在电子商务日臻成熟和以人为本的今天,它有着广泛的应用前景。★研究目的论文主要研究目的是Web日志挖掘在自适应网站中实现动态链接。研究利用Web使用挖掘分析日志以获得信息,并且达到网站的智能,使其自适应的提供个性化推荐服务。★研究方法通过查阅图书馆的相关资料以及利用因特网查找相关领域的最新理论、收集资料以及在指导老师的指导和同学之间的交流和沟通下,完成此论文。论文中采用Web页面聚类挖掘方法实现对日志的分析,并采用在网页中插入ASP
3、代码的方式实现个性化页面的推荐。★论文主要内容本文主要研究内容如下:基于数据挖掘研究,设计一个包括数据净化、用户识别和会话识别等过程的数据预处理过程,构建Web日志挖掘过程模型;定义自适应网站,根据系统实现的目标以及设计所遵循的原则,研究设计系统工作流程、系统框架以及系统主要模块;提出自适应网站进行自动页面调整的方法。★论文创新之处本论文侧重于Web日志挖掘理论框架的研究,在论文中,本人通过对现有的基础理论和方法的学习和研究,特别对数据挖掘中聚类算法的应用进行了较深入研究,并使用ASP代码实现了个性化页面的推荐。Web日志挖掘分类Web挖掘Web内容挖掘Web结构挖掘Web日志挖掘
4、信息检索领域数据库领域数据-文本文档-超文本文档-超文本文档-链接结构-Web服务器日志-代理日志、缓冲日志数据特征-非结构化-半结构化-半结构化-结构化-链接结构-用户的访问数据数据表示形式-有序/无序的单词集合-术语和短语-关系曲线-对象交换模型-关系曲线-网站拓扑结构图-关系表-图方法-统计-机器学习-关联规则及变形-专利算法-关联规则及变形-专利算法-统计-关联规则-聚类应用领域-分类-寻找抽取规则-寻找文本模式-发现频繁子结构-提取Web网站大纲-分类-聚类-站点结构管理-个性化站点★三种Web挖掘比较Web日志挖掘过程模型自适应网站的工作流程自适应网站设计架构自适应网站
5、的系统结构图用户注册前的页面新用户浏览网站时的界面老用户浏览网站时的页面★总结在课题研究中,对基于Web数据挖掘的个性化自适应网站研究完成了以下工作,并取得了一些研究成果:在对Web数据挖掘和基于数据库的数据挖掘对比研究基础上,研究了包含数据净化、用户识别和会话识别等过程的数据预处理模型,并分析了Web日志挖掘的过程。基于对用户感兴趣页面的预测,动态地构建网站结构,自动实现动态链接。采用聚类算法对用户访问模式进行挖掘,并通过在网页中嵌入Asp代码的方式,用程序实现了自动在页面中增加动态链接。★论文需要改进的地方提高用户识别的精度。加强对聚类算法时间复杂度和空间复杂度的优化,缩短大规
6、模日志数据挖掘时间。加强对挖掘结果的分析、比较和评价。总之,尽管上述的研究成果是初步的,限于实际条件有的还没有完全实现,但以后还要继续向这个方向进行开展研究工作。在基于Web日志的用户聚类在个性化服务中的研究具有较强实际应用价值,还要需要进一步深入研究。★致谢本文是在崔虹燕老师的悉心指导下完成的,从选题到成文,崔老师都提出了许多建设性的意见,并在繁忙的工作中抽出时间仔细审阅了全文。她严谨的治学态度、诲人不倦的精神品质令我难以忘怀。最后,要感谢所有给予我无私关怀与支持的所有老师和同学们,四年来一如既往地支持我的学业,对他们的感激之情是无法用语言来表达的。
此文档下载收益归作者所有