欢迎来到天天文库
浏览记录
ID:33340751
大小:706.98 KB
页数:7页
时间:2019-02-24
《基于电子商务的web数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、文章编号:1007—1423(2015)09—0012—07DOI:10.3969/j.issn.1007—1423.2015.09.003基于电子商务的Web数据挖掘研究张素智,曲旭凯,张琳(郑州轻工业学院计算机与通信工程学院,郑州450002)摘要:随着电子商务的高速发展,互联网、无线网络、移动网络的大面积覆盖,电子商务不仅潜移默化地影响着传统的商业模式,而且产生海量的Web数据,成为目前新的研究热点。电子商务“大数据”中隐藏的巨大的价值与Web数据挖掘技术在数据分析方面的作用使得二者自然的结合在一起。Web数据挖掘在电商巨量
2、数据的分类、聚类、数据解释等方面发展迅速,与此同时,Web数据挖掘仍面临数据复杂性、计算复杂性、系统复杂性等方面的挑战。关键词:电子商务:大数据:Web数据挖掘基金项目:国家自然基金项目(No.61201447)0引言1面向电子商务的Web数据挖掘随着计算机网络技术的飞速发展和互联网的大面1.1Web数据挖掘积普及.电子商务已悄然融入到我们日常生活中的方(1)Web数据挖掘简介方面面.影响人们的消费理念.并逐步取代传统商务模数据挖掘是从大量有噪声或模糊的随机数据中发式在商业领域中.电子商务是一种新兴的商务贸易模现有效的、可理解的、
3、隐含其中的、潜在有用的知识或式I”它是一种以互联网为主体.信息技术为核心的现模式。数据挖掘是一种深层次的数据分析方法,结合代商业模式。电子商务的出现促进了传统商务模式的当前各行各业自动化的发展进程.数据挖掘被运用到越网络化进程.改变了公众的消费环境.现实了商务的活来越多的领域中如在生物医学中对遗传信息、DNA数动的数字化、智能化据的分析,在GIS系统中对地理位置、地貌特征的挖掘电子商务以其方便、快捷等优点赢得了广大用户任务等四数据挖掘在经济领域的应用成为目前人们关的青睐.网上交易数额逐年上涨.但是伴随着电子商务注以及学者研究的热点
4、通过对网络中产生的巨量数据活动的发展.各种问题的出现引起了人们的重视如进行分析、处理,数据挖掘可以为企业提供客户群体的今.电子商务平台、购物网站等大量的出现.为我们提分类、产品销售预测、企业发展规划等方面的支持。供各种各样的商务信息我们面对这些数量巨大、类型进行数据挖掘的研究不仅仅是在理论层面上的论不一、结构多样的信息.并且想从中找到对自己价值或证和阐述.关键在于把研究的成果应用于实际中对于是与我们自身需求相关的信息困难重重.将数据挖掘在企业中应用数据挖掘.最主要的目的是为企业管理技术应用于电子商务势在必行数据挖掘技术是一种者提供
5、决策支持.为企业提高效益、获取利润提供帮从大量的、不完全的、有噪声的、随机的、模糊的数据中助。在数据挖掘过程中面临着一个棘手的问题就是待提取隐含在其中的、人们事先不知道的.但又具有潜在处理的数据是海量的.而待挖掘与通过处理后发现的价值的信息和知识的技术[21知识模式匮乏阁如何使数据挖掘在商业领域发挥更大@现代计算机2015.03下③数据预处理⑦模型管理数据预处理是数据挖掘任务中最为关键的一个阶数据挖掘任务通过使用数据挖掘的技术得到知识段,也是最为消耗数据的一步。数据预处理包括对数据应用规模小、数据模式管理困难,但在少数情况下是相的
6、分析、数据转换、数据的清洗、技术选择等.主要是为对比较稳定的在一个挖掘任务中构建的模型生命周了降低数据中的“噪声”,解决数据缺省、冗余、和数据期有限.并不是一劳永逸的。在实际应用中.需要不断不一致的问题Web中数据挖掘任务面对的是巨量地迭代和反复.从不同的数据集中进行挖掘.调整算法的复杂数据,需要运用多种技术对数据进行预处理.为和参数进行反复的训练,结合实际业务需求动态地修挖掘工作做好准备。所以,数据预处理阶段是数据挖掘正构建的模型[2o1通过数据挖掘构建的模式是重要文成败的关键㈣件集合.包含重要的商业数据和企业信息。在进行数据④
7、挖掘模型构建与评估挖掘过程中应格外重视挖掘结果、挖掘模型等数据的构建模型主要是将数据进行规格化的处理.使用存储.数据库管理员需要根据实际情况分配用户访问不同的算法、调整参数来优化挖掘任务全面考虑影响权限.避免不必要的损失出现建模的各种相关因素,从模型的可用性、准确性、普适1.2电子商务中Web数据挖掘的问题性等方面进行全面的考察在确定模型构建方式并完电子商务中产生的Web巨量数据种类多、格式复成模式构建任务后需要对模型进行评估模型的评估杂.与传统格式化数据仓库存储的数据相比较其最大不单单是利用工具软件对构建的模型的效率、精确度的特
8、点就是半结构化Web中的数据在站点中以进行测试和验证.需要分析方法的辅助来衡量所发现HTML文本的形式存储,数据格式各异。在进行挖掘任模式的意义和提高其在实际业务的应用㈣模型评估务时,对图像、视频、音频等数据进行处理时。主要有以是一个重复的过程.模
此文档下载收益归作者所有