欢迎来到天天文库
浏览记录
ID:12526981
大小:25.50 KB
页数:2页
时间:2018-07-17
《Web挖掘在电子商务中的应用研究.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、Web挖掘在电子商务中的应用研究 [摘要]当今电子商务蓬勃发展,其网站服务器上积累了大量的数据,这些数据隐含着很多对市场分析及预测有用的知识,可以运用web挖掘技术加以获得,从而增强企业的竞争力。本文主要介绍了Web挖掘的概念和分类,论述了电子商务中Web挖掘的过程和方法,最后阐述了Web挖掘技术在电子商务中的应用。 [关键词]电子商务数据挖掘Web挖掘 电子商务采用数字化方式进行商业活动,是在电子网络环境中进行商品和服务的贸易活动。近年来,随着网络的普及和Internet的发展,各企业均积累了大量的数据。如何从这些数据中发现
2、潜在的规律,来帮助制定企业今后的发展战略,是各电子商务平台急待解决的问题。Web挖掘作为数据挖掘的一个重要分支,为上述问题提供了有效的解决途径。 一、web挖掘 数据挖掘就是从大量的、不完全的、有噪声的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的知识的过程。它融合了数据库、人工智能、机器学习等多个领域的理论和技术。Web挖掘是数据挖掘在web上的应用,是指从与web相关的资源和行为中抽取感兴趣的、有用的模式和隐含知识。一般地,Web挖掘可分为三类: 1.Web内容挖掘,是从文档内容或其描述中抽取知识的过程。它又可
3、以分为Web页面内容挖掘和搜索结果挖掘。页面内容挖掘指的就是对Web页面上的数据进行挖掘,而搜索结果挖掘则指的是以某一搜索引擎为基础,对已搜索结果进行挖掘。 2.Web结构挖掘,是从www的组织结构和链接关系中推导知识。它又可以分为外部结构挖掘、内部结构挖掘和URL挖掘。Web结构挖掘的目的是通过聚类和分析网页的链接,发现网页的结构和有用的模式,找出权威页面。 3.Web使用挖掘,即Web日志挖掘,是通过挖掘Web日志记录,发现用户访问Web页面的模式。它又可分为一般访问模式挖掘和个性化服务模式挖掘。 二、Web挖掘的过程 1
4、.数据收集。Web挖掘的数据对象包括服务器日志数据、代理服务器数据、web页面内容、web超链接信息、用户注册信息等,其中服务器日志数据是web挖掘的主要对象。 2.数据预处理。数据预处理是web挖掘的重要步骤,直接影响到最后挖掘结果的正确性和准确性。它通常包括以下几个方面: (1)数据清洗,是指根据需要删除与web挖掘任务无关的数据,过滤掉不需要的记录。(2)反蜘蛛化。现在互联网上有大量的蜘蛛程序,它们模拟用户在各网页间爬来爬去。但它们并不代表真实的电子商务用户,因此需要把服务器日志中的蜘蛛记录过滤掉,以更真实地反映实际情况。(
5、3)客户认证,是从服务器日志中识别出访问网站的每个用户。(4)会话识别。会话是指客户在一次访问中所访问的所有web页面,通过分析可以得到,用户对电子商务站点的兴趣所在。(5)路径补全。由于客户端缓存的存在,会造成一些重要的访问信息被遗漏,所以需要对用户访问的前后页面进行推理,补全访问路径。2 3.模式发现,是运用各种方法,发现隐藏的模式和规则。常用的方法有:关联分析,分类分析,聚类分析,序列分析。 4.模式分析。模式分析是找出所发现模式集合中的有用模式,以便对决策提供支持。如果所有模式均不令人满意,则需要重新挖掘。 三、Web挖
6、掘的方法 1.关联分析,用于发现同一事件中不同数据项的相关性。常用的Apriori算法分为两步,首先找出满足最小支持度阈值的频繁项集;然后由它们形成满足最小置信度阈值的强关联规则。可以将web挖掘得到的关联规则用于改进电子商务站点的结构,将相关联的商品放在一起,减轻用户过滤信息的负担,增加交叉销售。 2.分类分析,通过学习已被告知类标号的训练集,得到分类器模型,然后将其用于对其它数据的分类。常用的方法有贝叶斯分类法、决策树技术和支持向量机技术。 3.聚类分析,使用划分方法、层次方法、基于密度的方法、基于网格的方法等技术,使同一类
7、中的对象之间具有很高的相似度,而不同类中的对象高度相异。经聚类分析,可以对电子商务平台中的具有相似浏览模式的用户提供个性服务,以满足该类消费群体的特殊需要。 4.序列分析,是挖掘频繁出现的有序事件或子序列模式,侧重于数据项间的前后关系。在电子商务平台上,可以帮助企业预测用户未来的购买行为,指导企业制定销售计划。 四、Web挖掘在电子商务中的应用 1.提供个性化服务。通过分析用户的访问模式,对用户进行聚类和分类,为每一类用户提供迎合其兴趣的个性化服务,提高电子商务平台的人性化设计,从而提高用户的满意度,留住老用户;对具有潜在消费能
8、力的用户,通过提供个性化服务,可以刺激他们的消费,提高电子商务平台的亲和力。 2.优化web站点结构。通过分析用户的浏览路径,用有向图来表示用户的整个页面访问过程,图中的顶点代表页面,图中的边代表页面的访问顺序。通过w
此文档下载收益归作者所有