工商管理web数据挖掘在电子商务系统中的应用

工商管理web数据挖掘在电子商务系统中的应用

ID:9972311

大小:27.50 KB

页数:4页

时间:2018-05-17

工商管理web数据挖掘在电子商务系统中的应用_第1页
工商管理web数据挖掘在电子商务系统中的应用_第2页
工商管理web数据挖掘在电子商务系统中的应用_第3页
工商管理web数据挖掘在电子商务系统中的应用_第4页
资源描述:

《工商管理web数据挖掘在电子商务系统中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、Web数据挖掘在电子商务系统中的应用Web数据挖掘在电子商务系统中的应用是小柯论文网通过网络搜集,并由本站工作人员整理后发布的,Web数据挖掘在电子商务系统中的应用是篇质量较高的学术论文,供本站访问者学习和学术交流参考之用,不可用于其他商业目的,Web数据挖掘在电子商务系统中的应用的论文版权归原作者所有,因网络整理,有些文章作者不详,敬请谅解,如需转摘,请注明出处小柯论文网,如果此论文无法满足您的论文要求,您可以申请本站帮您代写论文,以下是正文。  [摘要]web服务器日志中保存了大量的用户访问电子商务系统的记录,我们从中提取所需的数据,运用数据挖掘技术对所提取的数据进行处理和分析,从而得到用

2、户购物的兴趣和习惯,使电子商务系统更能满足用户的需求。  [关键词]数据挖掘电子商务Web数据挖掘在电子商务系统中的应用Web数据挖掘在电子商务系统中的应用是小柯论文网通过网络搜集,并由本站工作人员整理后发布的,Web数据挖掘在电子商务系统中的应用是篇质量较高的学术论文,供本站访问者学习和学术交流参考之用,不可用于其他商业目的,Web数据挖掘在电子商务系统中的应用的论文版权归原作者所有,因网络整理,有些文章作者不详,敬请谅解,如需转摘,请注明出处小柯论文网,如果此论文无法满足您的论文要求,您可以申请本站帮您代写论文,以下是正文。  [摘要]web服务器日志中保存了大量的用户访问电子商务系统的记

3、录,我们从中提取所需的数据,运用数据挖掘技术对所提取的数据进行处理和分析,从而得到用户购物的兴趣和习惯,使电子商务系统更能满足用户的需求。  [关键词]数据挖掘电子商务频繁访问路径    在电子商务网站模式下,用户购买商品的过程就是在电子商务网站页面中跳转的过程,用户的每个活动其实也就是对网站上的一个页面对象的点击操作,而这些点击操作都被记录在网站的系统日志中,通过对日志文件的分析挖掘,可以找出用户行为模式;在另一方面,电子商务网站的结构组织是不是符合客户购买商品的规律,通过对网站日志的分析也可以得到。所有这些都离不开数据挖掘技术,本文就是通过对电子商务网站服务器日志文件进行分析,从而进一步指

4、导电子商务网站建设。  在Web中使用数据挖掘,数据最直接的来源是Web服务器日志,它非常明确地记录了访问者的浏览行为,在Web使用记录挖掘中有很重要的地位。每当有获取资源的请求到来时,服务器方将会产生Server1095,Error1095和Cookie1095三种类型的日志文件,记录用户访问和交互的基本信息Web日志文件是由一条条的记录组成,记录了用户对Web页面的一次访问,尽管不同Web服务器的记录格式不尽相同,但都包含用户访问的基本信息。Web服务器文件的记录格式:  一、提取数据  客户在浏览网站时,是以点击超链接方式访问电子商务网站,客户的所有的点击行为可以抽象的点击流来表示,客户

5、的操作轨迹都被记录在服务器日志里,因此我们可以大量收集每个客户的行为数据、深入研究,从这些看似“无意义”的数据中得到有价值的信息和知识。我们可以收集并分析客户的浏览行为,使用数据挖掘方法发现客户的使用模式,向客户提供个性化页面的推荐服务。  同时可以删除web日志中与挖掘算法无关的记录,本文中所需要的数据主要是用户名、请求的页面的时间和页面的地址,其它的数据项不需要,因此都可以删除。  二、用户识别  用户识别是点击流数据预处理过程中一项比较困难的任务,但目前已出现了不少来精确识别一个用户的方法,其中最简单但是误差也最大的一种方法就是根据IP进行识别,此外还有一些嵌入sessionID、让用户

6、进行注册、在客户端写入Cookie标识以及使用嵌入代理的方法每种方法都有其自身的优缺点。在Web日志挖掘中,如果只根据服务器端日志确定用户往往会有一定的误差,确定用户的误差会导致对用户访问事务的划分出现不准确,从而使得数据挖掘的结果也出现偏差。可以根据结果所要的精确度,选择不同的方法进行识别,我们一般选择在客户端写入Cookie的方法即可达到比较好效果。  三、会话事务识别  用户会话的数学表示:用户会话S是一个二元组。Userid是用户号,RS是用户在一段时间内请求的Web页面的集合。RS包含用户请求的页面标识符Pid、访问时间。访问时间长度(是指用户访问一个页面所经历的时间)。  S=—公

7、式1  服务器要并发处理多个用户的请求,要从多个相互交织的用户访问事务中正确区分出所有用户访问事务比较困难。一般都是对用户在客户端浏览行为做不同的假设,然后再在此基础上确定用户访问事务。因此确定的用户访问事务并不能保证完全精确。根据对用户访问行为的不同假设,有四种确定用户访问行为及访问事务的模型:页面类型模型(PageTyPeModel)、参引长度模型(ReferenceLengthModel)、

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。