web日志中时态约束浏览模式挖掘算法研究

web日志中时态约束浏览模式挖掘算法研究

ID:34647804

大小:560.72 KB

页数:9页

时间:2019-03-08

web日志中时态约束浏览模式挖掘算法研究_第1页
web日志中时态约束浏览模式挖掘算法研究_第2页
web日志中时态约束浏览模式挖掘算法研究_第3页
web日志中时态约束浏览模式挖掘算法研究_第4页
web日志中时态约束浏览模式挖掘算法研究_第5页
资源描述:

《web日志中时态约束浏览模式挖掘算法研究》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、万方数据第40卷第9期208年9月哈尔滨工业大学学报JOURNALOFHARBININSTITUTEOF7IECHNOLO(;YVoL40No.9S印.2008Web日志中时态约束浏览模式挖掘算法研究宁慧1,李红宇2,吴培莲3(I.哈尔滨工程大学计算机科学与技术学院,哈尔滨150001,E·mail:ninghui@hrbeu.edu.cn;2.哈尔滨师范大学阿城学院,哈尔滨150301;3.哈尔滨工业大学材料科学与工程学院,哈尔滨150001)摘要:为了有效地从海量的Web日志中挖掘出有用的用户浏览模式,将顺序约束和时态约束加入到快速关联规则挖掘算法中,给出了一种基

2、于时态约束的浏览模式挖掘算法FPMBTC.该算法简化了挖掘过程中候选模式的生成操作,对数据库扫描一次,求出所有事务的连续子序列集,利用集合交差运算求得支持度,同时逐步修正会话事务时间得到浏览模式的有效时间,根据网站结构及Web日志不断变化的特点,给出了增量更新挖掘算法.实验结果表明:与类Ap—ori算法相关工作相比,运行时间少,扩展性好,并且挖掘出的模式具有时效性,适合于不断变化的且有时态特点的Web日志信息的挖掘.此研究对于学习和研究Web挖掘技术具有很好的参考价值,对建造实际的Web挖掘系统具有重要的理论意义和实用价值.关键词:Web日志挖掘;频繁访问模武;有效时

3、间中图分类号:TP311文献标识码:A文章编号:0367—6234(2008)09—1474—07AnalgorithmfortemporalconstraintbrowsingpatternmininginWeblogsNINGHui1,LIHong.yul,WUPei.1ian2(1.CollegeofComputerScienceandTechnology,HarbinEngineeringUniversity,Harbin150001,China,E-mail:ninghui@hrbeu.edu.cn;2.AehengCollege,HarbinNormalU

4、niversity,Harbin150301,China;3.CollegeofMaterialsScienceandEngineering,HarbinInstituteofTech∞logy,Harbin150001’,China)Abstract:ToeffectivelyexcavateusefulbrowsingpatternsfrommassWeblogs,thesequentialandtemporalconstraintsareaddedinthequickminingalgorithmbasedontheassociationruleinthispa

5、per.Abrowsingpatternminingalgorithmbasedontemporalconstraints:FPMBTCispresented.Thisalgorithmsimplifiesthegenerationofcandidatepatterns.Thecontinuoussub-sequencesetsofalltransactionswereacquiredbyscan-ningoverthedatabaseonlyonce.Thesupportingdegreeswerecalculatedbytheintersectionanddiff

6、erenceoperationofsets.Atthesalnetime,theeffectivetimeofbrowsingpatternsWagobtainedbythegradualcorrec—tionforthesessiontransactiontime.Onthebasisoftheabove-mentionedprocess,theincrementupdatealgo—rithmWasgivenaccordingtothecharacterofthecontinuouschangeinthestructureofthehomepageandtheWe

7、blogs.Theexperimentalresultsshowthatthealgorithmisabletoexcavatethepatternsinareal-timeway;meanwhile,itneedsshorterrunningtimeandismoreexpandablethantheApriori—likealgorithm.This印一proaehsuitstotheminingofWeblogswhichareincontinuouschangeand诵tlltemporalfeature.andCanpro-videagoo

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。