一种基于云理论的WEB日志定性规则提取方法

一种基于云理论的WEB日志定性规则提取方法

ID:38230706

大小:1.41 MB

页数:4页

时间:2019-05-25

一种基于云理论的WEB日志定性规则提取方法_第1页
一种基于云理论的WEB日志定性规则提取方法_第2页
一种基于云理论的WEB日志定性规则提取方法_第3页
一种基于云理论的WEB日志定性规则提取方法_第4页
资源描述:

《一种基于云理论的WEB日志定性规则提取方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第27卷第2期计算机应用与软件Vol27No.22010年2月ComputerApplicationsandSoftwareFeb.2010一种基于云理论的Web日志定性规则提取方法柳炳祥李海林刘锋(景德镇陶瓷学院信息工程学院江西景德镇333403)摘要通过对Web日志中用户访问模式规则抽取方法的研究,提出一种基于云理论的Web日志定性规则提取方法。该方法分析了影响用户兴趣度的时间因素,利用云模型表示关联规则挖掘中支持度和置信度的“软阈值”,采用云变换过程来实现各页面停留时间定性概念的划分,克服了边界过硬的问题。与传统方式相比,该方法挖掘出的规则是一种基于时间概念的多条件

2、多规则的定性描述形式,能够灵活地反映Web用户访问模式的规律性。关键词  Web日志定性规则云理论关联规则EXTRACTIONMETHODOFQUALITATIVERULESOFWEBLOGBASEDONCLOUDTHEORYLiuBingxiang LiHailin LiuFeng(SchoolofInformationEngineering,JingdezhenCeramicInstitute,Jingdezhen333403,Jiangxi,China)Abstract  AnewextractionmethodofqualitativerulesofWeblogba

3、sedoncloudtheoryisproposedafterstudyingtheextractionmethodofuseraccessmodeintheWeblog.Thenewmethodanalysesthetimefactorwhichinfluencesusersinterestdegreeandusesthecloudmodeltodefinethe“softthreshold”ofsupportdegreeandconfidencedegreeinassociatedrulesmining.Thecloudtransformprocessisusedto

4、realisethedivisionofqualitativeconceptsfortheretentiontimeofeachwebpage,inthiswaytheproblemofoverhardboundaryhasbeenovercome.Comparingwithtraditionalways,therulesminedbythenewmethodisaqualitativeexpressionformbasedonmultipleconditionandmultipleruleoftimeconcept,itisabletoflexiblyreflectth

5、eregularityofWebuseraccessmode.Keywords  Weblog Qualitativerules Cloudtheory Associatedrule了不确定性人工智能的转化,其结果更能符合人类的思维方式。0 引言1 相关概念随着网络和数据挖掘技术的发展,人们为了在网络世界中有目的地获取有用的信息,将数据挖掘的相关理论运用到网络用概念的方法把握量的不确定性,比数学表达来得更真实、知识发现中,出现了Web挖掘。它是一种从万维网资源中和行更具备普遍性。如“聪明人”概念,如果用定量数据来表达此概为中抽取感兴趣的、有用的模式和隐含的信息的技术,一般分

6、为念,有人会认为考查成绩大于85分的人为“聪明人”。这样也Web内容挖掘、Web结构挖掘和Web使用挖掘三类。其中Web有人会质疑:难道获得84.5分的人就不聪明吗?因此,针对概使用挖掘主要是Web日志挖掘,即通过对服务器上的日志记录念的不确定性,文献[3]提出了定性与定量不确定性转换模型,进行分析,发现用户的访问模式,并对其进行分析,最终获取知实现了定性概念与定量数据值之间的不确定性转换———云识或规则。通过分析Web日志数据,可以帮助理解用户的行模型。为,从而改进站点结构,为用户提供个性化服务。目前主要有两定义1设U是一个用精确数据值表示的定量论域,C是U个研究方向,即

7、访问模式的追踪和个性化使用记录的追踪。上的定性概念,若定量值x∈U,且x是定性概念C的一次随机在Web日志挖掘过程中,模式发现是挖掘用户访问信息的实现,x对C的隶属度(确定度)为μC(x)∈[0,1]是具有稳定倾主要途径,最常用的方法是基于数据挖掘关联规则技术的发现向的随机数,则x在论域U上的分布称为云,每个x称为一个云模式,它利用支持度和置信度两个阈值来查找最佳频繁页面集,滴(x,μD(x))。进而在这些页面集中挖掘出符合要求的规则或知识。研究表定义中提及的随机实现是概率意义下的实现,而确定度既[1,2]明,用户

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。