欢迎来到天天文库
浏览记录
ID:32371099
大小:215.97 KB
页数:4页
时间:2019-02-03
《基于webgis的电子商务数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、维普资讯http://www.cqvip.com第2O卷第3期测绘学院学报VoI.2ONo.32003年9月JournalofInstituteofSurveyingandMappingSept.2003文章编号:1009—427X(2003)03—0180—03基于WebGIS的电子商务数据挖掘研究毛克彪,覃志豪,陈晓燕。,李昕。(1.南京大学国际地球系统科学研究所,江苏南京210093;2.南京大学城市资源系,江苏南京210093;3.南京大学计算机系,江苏南京210093)摘要:文中对Ansari等提出的
2、基本的电子商务应用框架做了进一步的细化和补充,详细分析了数据收集和数据挖掘问题,包括数据来源、数据类型、数据收集器工作、数据转化、数据库建立和搜寻规则构建等。在此基础上,探讨了数据挖掘技术在基于WebGIS的电子商务中的具体应用。最后讨论了将数据挖掘技术应用于电子商务数据挖掘的最终日的和目前尚面临的一些困难。关键词:WebGIS;电子商务;数据挖掘;应用框架中图分类号:P282文献标识码:A数据挖掘是一种从海量数据中发现蕴藏在1.1商务数据定义数据内的规律的技术。电子商务是数据挖掘最理在商务数据定义部分,主要对
3、产品属性等相想的应用领域之一,因为它能提供大量的具有丰关的数据信息进行定义,如产品说明、产品价格富属性的数据,一方面在于它的理想性,另一方面等,在电子商务系统中,使用者一般通过等级和分在于它的实用性和迫切性。将数据挖掘应用到电类技术建立全体商品的架构。从数据挖掘观点来子商务,需要一个完善的应用框架的支撑。Suhail看,这种基于分类架构并为产品定义丰富属性的Ansari等人[2提出了一个电子商务数据挖掘的应做法在建立数据仓库阶段是很有用处的。用框架,文中对该框架作了细化和补充,并讨论了1.2系统一顾客接口该框架
4、的各个组成部分。然后在此基础上探讨数系统一顾客接口部分是顾客与系统的接口。据挖掘技术在基于WebGIS的电子商务中的具从顾客角度看,它是一系列通过超级链接组织在体应用。最后讨论了将数据挖掘技术应用于商务一起的网页。通过这些网页,顾客可以浏览商品‘数据挖掘的最终目的和目前尚面临的一些困难。将商品放人或移出购物篮、检索商品或获得帮助等。从设计者角度看,这部分不仅应当设计出方1应用框架便实用的网页,而且应当为每个网页定义一些属文中所讨论的数据挖掘和电子商务的集成系性,如登记性网页、浏览性网页、搜索性网页等。统框架如图
5、1所示。该框架主要由4部分组成,从数据挖掘角度看,方便实用的网页能够更好地即商务数据定义部分、系统一顾客接口部分、数据搜集顾客信息。通过为网页定义属性,可以更好收集器部分和数据挖掘分析部分(包括数据转换、地记录顾客的浏览路径,以便进行分析。数据仓库的建立和挖掘分析)。连接这4个部分1.3数据收集器的是3个主要的数据流,即商务数据的组织表示、数据收集器是数据挖掘分析流程中的核心部顾客信息和应用结果。分,它运用各种模式来发掘算法和建立规则或模型。在电子商务领域内,它不仅可以在很大范围内自动搜集数据,而且可以得到许多
6、在其它领域内不可能得到的数据信息。数据收集器主要收集与顾客有关的所有信息,这些信息有4个来源:顾客特征、顾客会话的特征记录、顾客在会话中的浏图1电子商务数据挖掘系统框架览路径以及顾客在会话中的购物过程和购物结收稿日期:2003—01—05;修回日期:2003—06一l1’基金资助:国家重点基础研究发展规划项目(2001CB309404);海外青年学者合作研究基金(40128001);教育部科学技术重点项目作者简介i毛克彪(1977一),男,湖南沅江人,硕士生,研究方向为空间数据挖掘、遥感数字图像以及高光谱应用。
7、维普资讯http://www.cqvip.com第3期毛克彪等:基于WebGIS的电子商务数据挖掘研究果。顾客特征是顾客的登记信息,如年龄、性别、3)对用户浏览路径的分析收入等。顾客一个会话的特征可记录并保存在服电子商务系统设计通常是按照常识和自己的务器的日志文件中。在该文件中,一个会话对应习惯设计网页和网页之间的超级链接,但是这样着一个字串。该字串包含一些诸如客户端IP地的设计可能并不符合顾客的习惯。于是,后期的址、会话建立时间、会话释放时间等信息。在应用调整或重新设计就成为一件很重要的事情。该字串时,一个难
8、点是怎样把不同的顾客区别开Theusinger和Huberl3介绍了他们在一个对顾来。IP地址不能用来区分顾客,因为处在同一个客浏览路径进行数据挖掘项目中的经验和技术。防火墙之后的所有客户端都用同一个IP地址来他们认为,基于时序的关联规则和预测模式是最登录服务器,更不用说那些共用同一个客户端的有用的,而在建立预测模式时,可以运用决策树、多位顾客。顾客在一个会话中的浏览路径可以形回归分析
此文档下载收益归作者所有