资源描述:
《基于隐马尔可夫模型的兴趣迁移模式发现_王实》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第24卷第2期计算机学报Vol.24No.22001年2月CHINESEJ.COMPUTERSFeb.2001基于隐马尔可夫模型的兴趣迁移模式发现王实高文李锦涛黄铁军(中国科学院计算技术研究所北京100080)摘要Web挖掘的一个重要研究方向是发现用户的迁移模式.一般来说,用户的迁移具有某种目的性.这种目的性表现为用户对某种概念的兴趣.文中提出基于隐马尔可夫模型的兴趣迁移模式发现方法,用于发现这种带有某种兴趣的用户迁移模式.这种模式实质上是一种特殊的关联规则.在这种方法中,作者首先根据用户的访问记录定义一个隐马尔可夫模型,然后提出一种新的增量发现算法Increase-R用于发现兴趣迁
2、移模式,同时给出了证明以说明该算法可以发现所有的兴趣迁移模式.关键词Web数据挖掘,隐马尔可夫模型,关联规则,迁移模式中图法分类号:TP18MiningInterestNavigationPatternsBasedonHiddenMarkovModelWANGShiGAOWenLIJin-TaoHUANGTie-Jun(InstituteofComputingTechnology,ChineseAcademyofSciences,Beijing100080)AbstractMiningNavigationpatternsisanimportantresearchdirectionin
3、webmining.Thedis-coveredNavigationpatternscanbeusedtohelpthedesignerstounderstandtheusers'accessac-tions,improvethestructuredesign,carryouttheadvertisement,andgettheusers'characteris-tics.Ingeneral,auseraccessesawebsitewithsomeintentions.Theseintentionsrepresenttheinterestinsomeconceptions.Soth
4、euser'sinteresthassomerelationwithhisnavigationpath.Theusers'interestnavigationpathscomposetheusers'interestnavigationpatterns.Inthispa-per,wepresentanewmethodformininginterestnavigationpatternsbasedonthehiddenMarkovmodelinordertodiscoverusers'interestnavigationpatterns.Thesepatternsareakindoft
5、hespecialassociationrulesessentially.Inourapproach,webuildahiddenMarkovmodelaccordingtowebserverlogsfirstly,thenwepresentanewincrementaldiscoveryalgorithmIncrease_Rinordertodiscovertheinterestnavigationpatterns,andwetestifythatthealgorithmcanfindallinterestnavigationpatterns.Keywordswebmining,h
6、iddenMarkovmodel,associationrule,navigationpatterns设计、Web站点的导航设计、电子商务等工作正变1引言得越来越复杂和越来越繁重.从站点经营方来说,他们需要好的自动辅助设World-WideWeb当前正在飞速地发展着,其计工具,可以根据群体用户的访问兴趣、访问频度、上的一些主要工作,例如Web站点设计、Web服务访问时间动态地调整页面结构,改进服务,开展有针收稿日期:2000-01-18;修改稿收到日期:2000-11-06.王实,男,1971年生,博士研究生,主要研究领域为数据挖掘.高文,男,1956年生,博士,教授,博士生导师,主
7、要研究领域为多媒体数据压缩、图像处理、计算机视觉、多模式接口、人工智能、虚拟现实等.李锦涛,男,1962年生,研究员,主要研究领域为智能化家庭信息中心平台研究、数字化家电应用研究.黄铁军,男,1970年生,博士后,主要研究领域为虚拟现实等.2期王实等:基于隐马尔可夫模型的兴趣迁移模式发现153对性的电子商务以更好地满足访问者的需求.解决abilisticgrammar)发现用户迁移模式,并用gram-这种需求的一个有力工具就是Web数据挖掘,即利mar的熵