欢迎来到天天文库
浏览记录
ID:9871787
大小:28.50 KB
页数:5页
时间:2018-05-13
《工商管理聚类挖掘在电子商务中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、聚类挖掘在电子商务中的应用聚类挖掘在电子商务中的应用是小柯论文网通过网络搜集,并由本站工作人员整理后发布的,聚类挖掘在电子商务中的应用是篇质量较高的学术论文,供本站访问者学习和学术交流参考之用,不可用于其他商业目的,聚类挖掘在电子商务中的应用的论文版权归原作者所有,因网络整理,有些文章作者不详,敬请谅解,如需转摘,请注明出处小柯论文网,如果此论文无法满足您的论文要求,您可以申请本站帮您代写论文,以下是正文。 [摘要]阐述了在电子商务系统中的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以
2、根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联性较小的网页排除在聚类外。 [关键词]聚类挖掘电子商务关联规则超图 由于Web具有方便、易用、高效的特点,电子商务显示出越来越强大的生命力,同时各种商业Web站点也面临越来越激烈的竞争。聚类挖掘在电子商务中的应用聚类挖掘在电子商务中的应用是小柯论文网通过网络搜集,并由本站工作人员整理后发布的,聚类挖掘在电子商务中的应用是篇质量较高的学术论文,供本站访问者学习和学术交流参考之用,不可用于其他商业目的,聚类挖掘在电子商务中的应用的论文版权归原作者所有,因网络整理,有些文
3、章作者不详,敬请谅解,如需转摘,请注明出处小柯论文网,如果此论文无法满足您的论文要求,您可以申请本站帮您代写论文,以下是正文。 [摘要]阐述了在电子商务系统中的研究和应用中,利用基于关联规则的多层次、超图分割聚类方法,对Web网页和用户进行有效聚类。该方法借助网站层次图,可以根据实际需要,在各个层次上进行聚类分析,仅将高度相关的网页和用户聚在同一类,而将关联性较小的网页排除在聚类外。 [关键词]聚类挖掘电子商务关联规则超图 由于Web具有方便、易用、高效的特点,电子商务显示出越来越强大的生命力,同时各种商业Web站点也面临越来越激烈的竞争。 有
4、效聚类Web用户和网页对改进网站质量、完善电子商务中产品销售策略具有十分重要的意义。在电子商务中,浏览模式相似的用户具有相似的购买习惯,通过聚类挖掘,将这些用户聚集在同一类,可以制定相似的销售策略。根据浏览模式聚集在同一类中的网页,是大多数用户共同访问的网页,在这些网页之间建立超链接,以方便用户使用。 现有的基于浏览模式的Web聚类挖掘研究方法中,只要用户请求了一个网页,便认为用户阅读了该网页,事实上有些被请求的网页用户并不关心,不会认真阅读的。通常一个实用网站包含大量的网页,现有的Web聚类方法将每个网页当作一个被聚项,无论用户访问的频繁与否,总是归入
5、一个类中,结果造成有些类中的网页之间几乎没有相关性。 鉴于以上考虑,本文提出了基于关联规则和超图分割的聚类Web网页及用户的方法,不仅考虑了用户浏览网页的时间长短,还考虑了聚类层次(级别),将不相关网页项排除在聚类之外,使每个类中的网页具有较高的相关性。采用这种方法,可以优化Web站点拓扑结构,指导企业调整营销策略,给客户提供动态的个性化的高效率服务。 一、建立电子商务网站的层次模型 建立电子商务网站的层次模型出于三点考虑。第一,网站中网页内容组织呈现树状结构。第二,在进行关联规则挖掘过程中,可能最下一级挖掘不出达到指定Support的强规则
6、,但是能从上级层次挖掘出达到指定Support的强规则,或根据实际需要在某一个层次进行聚类分析。第三,对于电子商务网站,有些用户虽然访问了某网页,但是对其内容并不感兴趣,可能只是扫一眼就放弃。在此情况下,不应该认为用户认真阅读了该网页,所以应该记录网页的长度,通过计算用户的浏览时间和网页长度的比值来判断用户是否真正认真阅读了该页内容。 层次模型采用树状结构来描述,节点的数据域包含对应网页的层次名称(编号)和网页长度。树根应该取所研究的网站根目录(研究整个网站)或所研究的网站分支的最上层目录。在建立层次模型时,应根据网站的具体情况决定采用的方法。通常情况下
7、,网页文件名能完全反映网页所在的层次,可以采用完全自动方法进行转换。 二、基于关联规则的聚类挖掘 1.预处理 在Web站点中,服务器日志文件记录用户的访问方式、所访问的页面、访问时间、用户IP地址等信息,通过收集Web日志所记录的用户浏览信息可以对网页和用户聚类。首先要对收集到的数据进行预处理,获得每个用户所访问的网页序列。将一个用户对某个特定网站的一次连续浏览(从登录该网站一直到离开该网站)所访问的网页序列称为一个用户浏览事务。如果用户中途访问了另一网站,而后又返回该网站,返回后所浏览的网页序列将组成另一个用户浏览事务。处理后的事务序列将具
8、有如下的形式: u_id(用户标志编号),p_id(页面编号)序
此文档下载收益归作者所有