教学资源搜索平台web日志挖掘技术研究

教学资源搜索平台web日志挖掘技术研究

ID:33153101

大小:5.68 MB

页数:57页

时间:2019-02-21

教学资源搜索平台web日志挖掘技术研究_第1页
教学资源搜索平台web日志挖掘技术研究_第2页
教学资源搜索平台web日志挖掘技术研究_第3页
教学资源搜索平台web日志挖掘技术研究_第4页
教学资源搜索平台web日志挖掘技术研究_第5页
资源描述:

《教学资源搜索平台web日志挖掘技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据分类号UDC密级工程硕士学位论文教学资源搜索平台Web日志挖掘技术研究朱寿华论文答辩日期地1.生窆旦三Q旦学位授予日期2Q!垒生窆旦三Q旦答辩委员会主席医友垫万方数据广西大学学位论文原创性和使用授权声明本人卢明所呈交的论文,是本人在导师的指导下独立进行研究所取得的研究成果。除已特别加以标注和致谢的地方外,论文不包含任何其他个人或集体已经发表或撰写的研究成果,也不包含本人或他人为获得广西大学或其它单位的学位而使用过的材料。与我一同工作的同事对本论文的研究工作所做的贡献均已在论文中作了明确说明。本人在导师指导下所完成的学位论文及相关的职务作品,知识

2、产权归属广西大学。本人授权,’‘西大学拥有学位论文的部分使用权,即:学校有权保存并向国家有关部门或机构送交学位论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库进行检索和传播,可以采用影印、缩印或其它复制手段保存、汇编学位论文。本学位论文属于:口保密,在年解密后适用授权。可不保密。(请在以上相应方框内打“√”)论文作者签名:铼舟华指导教师签名:I岔I矿华作者联系电话:日期:沙,牛.乡.涉日期矽f吖.乡.2,f电子邮箱:万方数据教学资源搜索平台Web日志挖掘技术研究摘要随着Web应用的不断增多,Web数据库的规模也在

3、不断扩大,其数据量亦逐渐加大。Web日志挖掘利用数据挖掘技术对web服务器的log日志进行挖掘分析,探究同志中潜在的规则与模式,最终将其应用到网站架构设计、个性化服务等方面。Web日志挖掘的过程通常分为三个阶段:数据预处理阶段、模式发现阶段以及模式分析阶段。在整个Web日志挖掘过程中,最为重要的是数据预处理阶段,它能直接影响到后面模式识别与模式分析的算法性能及计算结果。其中会话识别是数据预处理的主要环节,同时也是最为基础、关键的步骤。本文的主要研究工作包括:(1)给出了一种基于动态时间阀值的Web会话识别方法。对目前常用的几种会话识别方法进行了详细的描

4、述,分析了每种方法的优缺点,在参考基于时间的启发式识别方法基础上,提出一1种以站点首页作为新会话的开始,以动态时间阀值来决定会话边界的改进会话识别方法,给出了算法流程图以及具体的实现方法。实验结果表明,改进的会话识别方法不仅ⅡJJ以识别出更多的真实用户会话,而且还能有效地提高会话识别的精确度和识全度。(2)设计'r一个基于Web日志挖掘的教学资源搜索平台。该平台以广西中医药大学学校网站IIS日志为处理对象,选取了2013年7月某天的日志信息作为系统的分析数据。设计了系统的整体架构,对系统各主要模块l万方数据的功能进行了详细的说明,给出了数据表结构和每个

5、环节的流程图,编程实现了原型系统。关键词:Web日志挖掘数据预处理会话识别动态时间阀值万方数据ResearchontheWebLogMiningofTeachingResonrcesSearchingPlatformABSTRACTWiththegrowingnumberofWebapplications,Webdatabasesizeisalsoexpandingitsdatavolumewillgraduallyincrease.WeblogminingusingdataminingtechniquestologmiIlingwebserverlo

6、ganalysis,logintoexplorethepotentialofrulesandpatternsthatwilleventuallyapplytoaspectsofsitearchitecturedesign,personalizedservice.Weblogminingprocessisusuallydividedintothreephases:datapreprocessingstage,patterndiscoveryphaseandpattemanalysisphase.ThroughouttheWeblogminingproce

7、ss,themostimportantisthedatapreprocessingstage,itcandirectlyaffecttheperformanceofthealgorithmandtheresultsbackpatternrecognitionandpatternanalysis.Thisisthemainpartofthesessionidentificationdatapreprocessing,butalsothemostbasic,criticalstep.Themaininnovativeresearchworkincludes

8、:(1)GivesaWebsessionidentificationmethodbasedon

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。