资源描述:
《基于关联规则算法的移动商城系统设计与实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
硕士学位论文论文题目:基于关联规则算法的移动商城系统设计与实现作者姓名江平指导教师何熊熊教授学科专业控制工程培养类别全日制工程硕士所在学院信息工程学院提交日期2017年3月27日万方数据 浙江工业大学硕士学位论文基于关联规则算法的移动商城系统设计与实现作者姓名:江平指导教师:何熊熊教授浙江工业大学信息工程学院2017年3月万方数据 DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterDesignandImplementationofMobileMallSystemBasedonAssociationRulesAlgorithmCandidate:PingJiangAdvisor:Prof.XiongxiongHeCollegeofInformationEngineeringZhejiangUniversityofTechnologyMarch2017万方数据 浙江工业大学学位论文原创性声明本人郑重声明:所提交的学位论文是本人在导师的指导下,独立进行研究工作所取得的研究成果。除文中已经加以标注引用的内容外,本论文不包含其他个人或集体已经发表或撰写过的研究成果,也不含为获得浙江工业大学或其它教育机构的学位证书而使用过的材料。对本文的研究作出重要贡献的个人和集体,均已在文中以明确方式标明。本人承担本声明的法律责任。作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权浙江工业大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。本学位论文属于1、保密□,在一年解密后适用本授权书。2、保密□,在二年解密后适用本授权书。3、保密□,在三年解密后适用本授权书。4、不保密□。(请在以上相应方框内打“√”)作者签名:日期:年月日导师签名:日期:年月日万方数据 浙江工业大学硕士学位论文基于关联规则算法的移动商城系统设计与实现摘要随着移动用户的激增以及4G网络和WIFI技术的广泛应用,移动电子商务作为一种新的商务模式,能够满足不同地域、不同年龄和不同需求的消费者,受到很多企业和用户的喜爱,目前已被广泛用于各类商务活动之中。移动商城以其商品数量大、商品种类多、搜索便捷、商品廉价以及不受时间和空间限制等优势吸引众多用户,成为大多数人的首选购物方式。然而,移动商城系统用户量、商品种类和数量的增加,将导致用户无法在短时间内快速、精准地找到所需的商品。针对上述问题,本文设计了基于关联规则算法的移动商城系统。以PHP5.0和MySQL为开发平台,选定模型-视图-控制器(MVC:Model-View-Controller)架构模式,采用ajax技术实现异步交互,利用数据挖掘中的关联规则算法,使用JavaScript和php编程语言开发,实现了移动商城系统能够根据近期交易记录和购物篮中商品信息,为用户推荐相关的商品,帮助用户快速、准确定位商品信息,提高网购效率。本论文主要工作如下:1.分别概述数据挖掘技术和关联规则挖掘技术,并介绍其基本原理,实现过程,同时进行总结分析,并指出本文所提出的改进关联规则算法的研究方向;2.对关联规则挖掘的经典算法Apriori进行全面分析,通过分析算法实现过程中的局限性,提出一种基于Apriori改进的关联规则挖掘算法。该算法不需要产生候选项集,只需扫描一次事务数据库,以频繁项集矩阵的形式存储事务数据并对其约简计算,占用存储空间少,处理事务数据速度快。对其理论分析,并通过实验验证了基于Apriori改进的关联规则挖掘算法在保证时间复杂度和空间复杂度较低的同时,具有更高的挖掘效率;3.对移动商城系统进行需求分析、架构设计、功能模块设计和数据库设计,并完成主要功能模块的实现。功能模块包括商品购买、商品退货售后、用户信息管理、积分活动和商品推荐。重点研究了商品推荐模块,通过对用户订单交易信息的收集,采用改进的关联规则算法,挖掘出商品之间的关联规则,为用户有针对性地推荐商品。i万方数据 浙江工业大学硕士学位论文关键词:移动商城,关联规则,MVC模式,数据挖掘,Apriori算法ii万方数据 浙江工业大学硕士学位论文DESIGNANDIMPLEMENTATIONOFMOBILEMALLSYSTEMBASEDONASSOCIATIONRULESALGORITHMABSTRACTWiththeproliferationofmobileusers,andthewideapplicationof4GnetworkandWIFItechnology,asanewbusinessmodel,mobilee-commerceismeetingmoreandmoreconsumerswhoarefromdifferentregions,differentagesanddifferentdemands,anditispopularwithsomanybusinessesandusers,nowadays,ithasbeenwidelyusedinvarioustypesofbusinessactivities.Mobilemallattractsalargenumberofuserswiththelargenumberofproducts,thevarietyofcategories,theconvenienceofsearch,thecheapnessofcommoditiesandthelackoftimeandspaceconstraintsandotheradvantages,whichleadstheonlineshoppingbymobiledevicestobecomethepreferredwayformostpeople.However,owingtotheincreaseofmobilemallsystemusersandcommoditytype,userscan’tfinddesiredgoodsquicklyandaccurately.Aimingattheaboveproblem,thispaperdesignsamobilemallsystembasedonassociationrulealgorithm.ThissystemadoptsMVC(ModelViewController)model,andusesJavaScript,PHPandAjaxtechnologytoachieveasynchronousinteractionbasedonthedevelopmentplatformwhichusePHP5.0andMySQL.Thissystemcanrecommendrelatedproductsforusers,helpuserspositionproductinformationquicklyandaccurately,andimprovetheefficiencyofonlineshopping.Themainworkofthispaperisasfollows:1.Thisthesissummarizesdataminingandassociationruleminingtechnology,simultaneouslyintroducesitsbasicprinciple,therealizationprocess,andthesummaryanalysis,andfinallypointsoutresearchdirectionofassociationrulesalgorithm.2.Thisthesishasaoverallanalysisoftheclassicalalgorithm-Aprioriofassociationrulesmining,andproposesanimprovedassociationruleminingalgorithmbasedonAprioribyanalyzingthelimitationofApriori.Improvedalgorithmdoesnotneedtoproducethecandidateiii万方数据 浙江工业大学硕士学位论文itemsets,onlyscanstransactiondatabasetostoretransactiondatawithfrequentitemsetsmatrixformandcalculateitsreduction,occupieslessstoragespace,anddealswithtransactiondataservicesquickly.Basedonthetheoreticalanalysis,thealgorithmbasedonAprioriimprovedassociationruleminingalgorithmisprovedtohavehigherminingefficiencywhileensuringtimecomplexityandspacecomplexity.3.Thisthesisintroducesdemandanalysis,architecturedesignandfunctionmoduledesignofmobilemallsystem.Themainfunctionmodulesarerealized,andfunctionmodulesincludepurchaseofgoods,goodsreturncustomerservice,customerinformationmanagement,integrationactivitiesandcommodityrecommendation.Thisthesisfocusesontheresearchofcommodityrecommendationmodule,andusestheimprovedassociationrulealgorithmtofindouttheassociationrulesamongthecommoditiesandrecommendproductsforusersthroughthecollectionoftheinformationofusers’ordertransaction.Keywords:mobilemall,associationrules,MVCmodel,datamining,Apriorialgorithmiv万方数据 浙江工业大学硕士学位论文目录摘要..................................................................................................................................................i第1章绪论.................................................................................................................................11.1研究背景与意义.................................................................................................................................11.2研究现状.............................................................................................................................................21.2.1国外研究现状....................................................................................................................................................21.2.2国内研究现状....................................................................................................................................................31.3论文主要内容与结构.........................................................................................................................41.3.1论文主要研究内容.............................................................................................................................................41.3.2论文结构............................................................................................................................................................5第2章相关理论知识概述.........................................................................................................62.1数据挖掘技术.....................................................................................................................................62.1.1数据挖掘概述....................................................................................................................................................62.1.2数据挖掘过程....................................................................................................................................................72.2关联规则挖掘技术.............................................................................................................................72.2.1关联规则的内容.................................................................................................................................................72.2.2关联规则挖掘过程.............................................................................................................................................92.3电子商务模式...................................................................................................................................102.4本章小结............................................................................................................................................11第3章基于关联规则算法的移动商城系统研究...................................................................123.1问题描述与分析...............................................................................................................................123.2关联规则挖掘的经典算法及研究...................................................................................................123.2.1Apriori算法的描述..........................................................................................................................................123.2.2基于Apriori算法的实例应用.........................................................................................................................133.2.3基于Apriori算法实例应用的局限性.............................................................................................................153.3基于改进Apriori算法的移动商城系统的研究.............................................................................163.3.1基于改进的Apriori算法.................................................................................................................................163.3.2基于改进Apriori算法在移动商城系统中的应用.........................................................................................173.3.3基于改进Apriori算法在移动商城中应用的优势.........................................................................................213.4基于Apriori算法与改进算法的实验分析.....................................................................................223.5本章小结...........................................................................................................................................24第4章基于关联规则算法的移动商城系统的设计与实现..................................................254.1移动商城系统的需求分析...............................................................................................................254.1.1系统功能性需求分析.......................................................................................................................................254.1.2系统非功能性需求分析...................................................................................................................................274.2移动商城系统关键技术介绍...........................................................................................................284.3移动商城系统总体设计...................................................................................................................314.3.1系统技术架构设计...........................................................................................................................................314.3.2系统功能模块设计...........................................................................................................................................32万方数据 浙江工业大学硕士学位论文4.4移动商城系统数据库的设计...........................................................................................................344.5移动商城系统功能模块的实现.......................................................................................................384.5.1商品购买模块的实现.......................................................................................................................................384.5.2商品退货售后模块的实现...............................................................................................................................414.5.3用户信息管理模块的实现...............................................................................................................................434.5.4积分活动模块的实现.......................................................................................................................................444.5.5商品推荐模块的实现.......................................................................................................................................464.6本章小结...........................................................................................................................................48第5章总结与展望...................................................................................................................495.1总结...................................................................................................................................................495.2展望...................................................................................................................................................49参考文献.......................................................................................................................................51致谢...............................................................................................................................................55万方数据 浙江工业大学硕士学位论文第1章绪论1.1研究背景与意义随着我国网络购物的市场规模不断壮大,传统零售业增长缓慢甚至面临负利润的挑战。未来网络购物已成为一种趋势,尤其在互联网发展如此迅速以及人们的生活水平不断[1]提高的情况下,网络购物已成为一种生活习惯,具有方便、快捷、高效的特点。尽管网络购物极大的提高了购物的效率,商品的种类和数量增长速度的加倍,为用户提供更多丰富的选择,用户很难花费少量的时间和精力在网上买到喜欢的商品。如何有效利用这些海量商品数据,找出对用户有价值的信息,帮助用户快速准确地找到喜欢的商品,从而提高网购的效率,是一个很值得研究的问题,数据挖掘技术可以解决这样的问题。[2]数据挖掘是从大型数据库中提取人们不易发觉的、有效的、可信度高的、有实用价值的信息的过程,涉及多个学科领域中挖掘相关的知识,应用前景非常可观。数据挖掘技术通过对低层次的数据记录进行统计、分析和推理,从而找到数据之间的相关规则,以帮[3-4]助商业家作出更准确的判断,创造更大的价值。在如今用户至上的时代,网络购物的网站需要从“以网站站点为中心”向“以用户为中心”的转变,用户浏览了哪些页面,搜索了哪些关键词商品,加入了哪些商品进入购物车,对哪些商品进行了购买等等,这些信息都能被网站记录下来,产生的数据信息庞大且存在有价值的信息,而从这些庞大的数据中找到有价值的信息可以通过数据挖掘技术实现。在大数据时代下,数据庞大,同时数据的更新也很迅速,如何从大量的数据中快速地找出有价值的信息并及时应用到商业中产生价值,是本文研究的重点。当数据快速变化时,如果商家能在短时间内挖掘出数据里的价值,及时获得最新的有价值的数据,利用数据挖掘技术中的关联规则找出最新的商品的关联性,及时推荐合适的商品给用户,能提高商品销售额,从而为商家带来更多的利润。本文通过研究Apriori关联规则算法,针对Apriori算法的比较耗时、效率不高的特点,提出一种改进的Apriori算法,可以解决这方面的问题,并将改进的算法应用到移动商城系统的商品推荐模块中,从而可以更快找出商品的关联性,为用户推荐更适合的商品。1万方数据 浙江工业大学硕士学位论文1.2研究现状1.2.1国外研究现状在1970年,国外开始出现电子商务活动,到90年代早期,随着因特网的商业化和万维网的广泛应用,“电子商务”这个概念开始被人提出来。在1991年,美国Dell公司将商品通过网络销售方式卖给消费者,获得了显著的销售业绩,到1998年5月,其网络销售额就达到了500美元。亚马逊的网上书店在1996年营业额收入一千多万美元,而到1998年收入达到4亿美元。电子商务的兴起带来商品销售额的剧增,引起很多大型企业的关注[5-7]。国外对数据挖掘的研究比较早,其相关的理论研究也已经比较成熟。1989年,在美国底特律召开第十一届国际联合人工智能学术会议,该会议上“数据库中发现知识”一词被首次提出,会议主要探讨人工智能的话题。在1995年加拿大蒙特利尔召开的国际会议上,UsamaFayad首次提及数据挖掘的概念,以及后来每年都会召开的国际学术会议上都有涉[8-9]及到数据挖掘内容。文献[10]中将数据挖掘应用于医疗决策上,提出一种预测建模决策树算法,对眼内肿瘤进行鉴别判断。文献[11]中研究了使用数据挖掘方法预测医院心脏骤停后的生存原因,通过经典分析和数据挖掘分析之间的比较显示了数据挖掘方法对分类变量的重要性。文献[12]中提出了一种基于计算机的模块化方法,用于使用数据挖掘方法来描述和比较医疗问题。这些是将数据挖掘技术应用到医疗领域,从而让数据挖掘理论与实践相结合,帮助解决更多的现实问题。文献[13]中对数据挖掘在电子支付系统中的作用中将数据挖掘应用到计算机科学领域,并研究对电子支付系统中数据进行挖掘。数据挖掘技术作为一门交叉学科,还被应用到其他领域中。加州理工学院喷气式推荐实验与天文科学家一起合作开发出一个SKICAT系统,该系统可以帮助天文学家找到遥远的类星体,这是人工智能技术在空间科学和天文学上首次成功应用的实例。在生物学研究上,利用数据挖掘技术实现对DNA进行处理分析。对银行或保险公司经常遇到的诈骗行为采用数据挖掘技术进行预测。IBM公司开发出的AS(AdvancedScount)系统对NBA的比赛数据的分析,也是利用数据挖掘技术的,可以很好地帮助教练调整战术的组合。数据挖掘技术中,对关联规则算法的研究也取得了一定的成果。文献[14]中针对基于链表的关联规则挖掘算法的研究,提出一种新的关联规则挖掘算法,通过使用逻辑和集合理论操作生成关联规则,并以实例分析其算法的高精度和低成本。文献[15]中对加权关联规则挖掘算法进行研究,提出了支持反单调性的加权支持置信框架,在此基础上,提出加权布尔关联规则挖掘算法和加权模糊关联规则挖掘算法,采用Apriori算法的修剪策略,2万方数据 浙江工业大学硕士学位论文提高生成的频繁项集的效率。文献[16]中针对基于改进的关联规则挖掘算法的混合网络推荐系统,提出并调查了基于加权关联规则挖掘算法和文本挖掘的新方法,是对结果增加语义知识的改进算法,与现有方法相比,具有更高的效率。文献[17]中对市场篮子分析,使用关联规则挖掘来确定市场数据的变化趋势。通过提出的关联规则算法,可以捕捉动态的用户信息数据,帮助随时检查用户的行为,以便零售商做出正确的判断,从而提高销售量。在国际上,关联规则挖掘的研究已进入成熟的阶段,出现很多实用的挖掘系统。Hanjiawei教授提出了FP-Growth关联规则算法,开发出一个交互式且多层次的挖掘系统,也可简称为DB-Minerls,使用该系统可以从数据库中挖掘更深层次的信息。SGI制造出一款EnternriesMiner数据挖掘软件,该软件更多被用于传统零售企业中,帮助零售企业挖掘交易数据,提取出零售产品的关联规则。1.2.2国内研究现状移动电子商务只有借助移动通信技术才能实现,其发展在一定程度上受到制约。目前国内移动电子商务主要应用于在线支付、手机银行、移动查询、线上阅读等。移动电子商务在我国的发展可以概括为三个阶段:第一个阶段是完全静态的电子商务,只能实现发短信、上传和下发邮件等简单操作功能;第二阶段,移动电子商务是基于WAP、J2ME等技术基础上实现的,它将移动终端与互联网紧密联系起来;第三阶段随着2009年3G网络的出现,移动电子商务融合当前最新最前沿的技术如智能移动终端、数据库、计算机网络等,平台的安全性和很好的交互体验能力极大地提升了移动电子商务平台。从2009年到2013年期间,移动电子商务用户的规模突飞猛进,到2012年底,手机用户超过9亿,移动互联网用户达到5亿多,到2013年移动网民用户6亿多,仅一年,移动网民用户就新[18-20]增一个多亿。国内对数据挖掘的研究起步比较晚,其相关理论的研究还处在初始阶段。在1993年国家自然科学基金上首次同意研究数据挖掘领域的项目,该项目是在国家基金的扶持下进行的。目前,很多高校和科研单位开展了对数据挖掘的研究工作,如北京系统工程研究所研究了将模糊方法应用到知识发现中;北京大学针对数据立方体代数开展深入研究;复旦大学、浙江大学、中科院数学研究所、华中理工大学、中国科技大学等共同优化和改造了关联规则算法;北京大学智能科学系的唐世渭和杨冬青教授带领团队开发出一个基于空间数据挖掘的客户分析系统模型;南京大学徐洁馨、陈栋等人开发出一款实用的数据挖掘系[21-22]统原型工具Knight;复旦大学施伯乐教授带领团队开发出数据挖掘工具集AMINER。国内大学成为数据挖掘研究的主要科研机构,能够专注于学习和研究数据挖掘的相关3万方数据 浙江工业大学硕士学位论文理论和算法。湖南大学杨翠明等人对关联规则算法与数据库分解间的联系展开重点研究。在聚类挖掘领域中,复旦大学周水庚、周傲英等人提出一种快速聚类算法,使用此算法可以帮助提高处理大量数据的效率。郗洋结合云计算对聚类算法进行研究,还取得了一定的成效。何清将云计算和物联网技术运用到数据挖掘中,并且研究分布式和并行计算应用在数据挖掘技术中的相同点和不同点。丁悦、张阳等人研究以图形的方式进行数据挖掘,讲述了这样方式进行挖掘的特点、实践意义、实际过程中的应用以及所面临的问题等。唐晓东在基于关联规则映射的生物信息网络多维数据挖掘算法中,对生物网络信息的大规模数据集进行挖掘,提出的算法能够有效提高挖掘的精度、减少内存、加快计算速度。以上都是基于学者对数据挖掘算法的研究及相关的改进,通过对算法的深入研究,使其算法质量[23-24]达到更好,更有效地应用于实践中。1.3论文主要内容与结构1.3.1论文主要研究内容本文选用MVC架构模式,使用JavaScript前端语言和php后端语言,采用ajax技术进行异步交互,设计并实现移动商城系统。本文研究经典的Apriori关联规则算法,根据其算法存在的不足,提出一种基于Apriori改进的算法,并通过实验验证改进算法的有效性,将改进的算法应用于移动商城系统,找出商品的关联性,帮助用户快速、准确定位商品信息,提高网购效率。论文主要研究内容包括:(1)深入研究经典关联规则算法Apriori,并分析其算法在实例应用中存在的不足。(2)对于Apriori算法需要对事务数据库进行多次扫描,产生大量的候选频繁项集,耗时又占内存的缺点,提出一种基于Apriori改进的算法,该算法对事务项目进行二进制编码,将事务数据映射到一个频繁项集矩阵中,通过对该矩阵进行分析计算从而找出所有的频繁项集。并以T1014D100K数据集和UCI标准数据集Mushroom两种类型数据库进行测试,验证Apriori改进的算法的优越性。(3)对移动商城系统进行需求分析、架构设计、功能模块设计和数据库设计,并完成对主要功能模块的实现。重点介绍商品推荐模块的实现过程,通过对用户订单交易信息的收集,使用改进的关联规则算法,挖掘出商品之间的关联规则,为用户有针对性地推荐商品。4万方数据 浙江工业大学硕士学位论文1.3.2论文结构本论文共分5章,每章的主要内容包括:第一章阐述基于关联规则算法的移动商城系统的研究背景和意义,综述了电子商务以及数据挖掘在国内外的研究现状,概述了本论文的主要研究内容与结构。第二章概述了与本论文相关的理论知识。首先介绍了数据挖掘技术,主要包含数据挖掘概述和数据挖掘过程;其次是关联规则挖掘技术,也是本文的研究重心,介绍关联规则的内容和关联规则挖掘过程;最后分析了电子商务的模式,找出本文系统所使用的电子商务模式。第三章基于关联规则算法的移动商城系统研究。首先提出问题描述与分析,分析系统存在的问题和需要如何解决的方法;接着对关联规则挖掘的经典算法进行研究,描述Apriori算法,对算法进行实例应用并分析其局限性;再接着在经典算法的基础上,提出一种改进Apriori算法,介绍与分析该算法在移动商城系统中的应用以及优势;最后将Apriori算法与改进算法使用两种数据集进行实验测试,论证改进的算法的有效性。第四章基于关联规则算法的移动商城系统的设计与实现。首先对移动商城系统功能性需求与非功能性需求进行分析;其次介绍了移动商城系统使用到的关键技术;接着对商城系统进行总体设计,包含系统技术架构设计和功能模块设计;接着又对移动商城系统的数据库进行设计;最后完成系统主要功能模块的实现,功能模块有商品购买、商品退货售后、用户信息管理、积分活动、商品推荐等,其中商品推荐模块是本文的重点研究模块,在此模块中,结合第三章提出的改进算法,可以找出商品的关联性,为用户网上推荐相关的商品。第五章主要对本论文的研究内容进行总结,并提出了对基于关联规则算法的移动商城系统的下一步研究工作。5万方数据 浙江工业大学硕士学位论文第2章相关理论知识概述2.1数据挖掘技术2.1.1数据挖掘概述数据挖掘,通俗来讲,就是从大量的、不完整的、不清晰的、随机的真实数据库中,提取出人们不易察觉的、无法预知的、有潜在的利用价值的信息和知识的过程。数据挖掘涉及的领域非常广泛,在学术和商业方面都有着很大的研究价值。在学术研究上,涉及的领域包含数据库、统计学、高能计算机、人工智能等;在智能商业上,数据挖掘应用在商业领域的主要功能是利用数据挖掘技术对商业交易的相关数据进行提取、转换和模型化处[25]理分析,从而找出有利用价值的数据信息,促进商业的利润最大化。狭义上来讲,数据挖掘是对数据进行深度分析的过程。在过去,计算机还没有普及,数据的分析主要使用在科学研究方面,用来分析处理些简单的、少量的数据。如今,随着互联网的快速发展,在各个领域中产生大量的数据,数量庞大是无法通过肉眼就能找出其有用的数据信息的,因此对大规模的数据进行深层次的分析,得到很多企业的认可和重视[26]。企业纷纷花费大量的人力和财力对数据信息进行深入的研究,期望找出提高企业的销售业绩和利润,这样从数据中得到有价值的信息的激烈竞争中,数据挖掘这个词被很多人熟悉。数据挖掘的任务就是找出隐藏在数据库中具有一定的模式和规则的数据,并将挖掘的结果以用户的角度展现出来,不仅能够使用户更容易理解,还能充分利用数据库中的数据[27]资源,让决策者能得到用户的及时反馈并作出相应的处理。数据挖掘具有以下的特点:1)数据挖掘系统中处理的数据量非常庞大;2)相比较于一般的数据查询工具,数据挖掘并不限制于简单的数据查询和维护,而是能够从庞大的数据中找到隐藏的有价值的数据,从而有针对性地查询,找到用户感兴趣的数据;3)在实际需求中,数据变化快速,新的数据替换原来的数据,数据挖掘技术能够对这样变化的数据作出各种响应,帮助用户做出相关选择;4)数据具有动态性,数据挖掘技术能够使用相关的规则方法从数据中找出潜在的价值,随着数据的不断更新,挖掘出的结果也会相应地变化;6万方数据 浙江工业大学硕士学位论文5)在基于大样本的统计规律中,挖掘出的规则并不适用所有的数据,而是存在一定的临界值,只有达到该临界值,则规则有效,因此使用数据挖掘技术能够挖掘出更多的新规则。2.1.2数据挖掘过程数据挖掘就是一个知识发现的过程,其挖掘的过程主要包括:信息收集、数据清洗与[28]集成、数据变换、数据挖掘以及模式评估与知识表示。(1)信息收集:从确定好的数据分析对象中提取出所需要的特征信息,选择合适的收集信息方法将特征信息存储到数据库中。(2)数据清洗与集成:数据挖掘的核心就是从没有规律的大量数据中发掘出有价值的知识。数据清洗与集成能较好的保证数据的质量,保证挖掘出的知识的可靠性。数据清洗是清理噪声数据、移除重复性的数据、修缮不完整的数据的操作过程。数据集成是把不同来源的数据组合在一起,确保数据类型一致的操作。(3)数据变换:通过多种方式如数据概化、规范化等将数据转换成适合于数据挖掘的形式。(4)数据挖掘:选择合适的方法如统计分析、事例推理、关联分析、模糊集、遗传算法、神经网络等对数据库中的信息进行挖掘,找出有用的信息。(5)模式评估与知识表示:通过相关专业行家验证评估挖掘出的结果的准确性,再将挖掘出的准确信息以用户可见的形式展现出来。2.2关联规则挖掘技术关联分析是由R.Agrawal在1993提出的,侧重于确定数据中不同领域之间的联系,[29]找出满足给定的支持度和置信度的多个域之间的依赖关系。例如90%的客户在购买面包和黄油的同时也会购买牛奶,即是当客户有多大的倾向去购买某些东西的时候也会去买另外一些东西。因此,找出所有类似这样的规则,对应确定市场策略是很有价值的。2.2.1关联规则的内容[30]关联规则挖掘是数据挖掘的一项重要的任务。其目的是从事务数据库、关系数据库中发现项目集或属性之间的相关性、关联关系、因果关系。以下是对关联规则概念的介绍:7万方数据 浙江工业大学硕士学位论文在事务数据库D中,每个事务T是由一些项目组成的集合,形如I={I1,I2,I3...In}就是项目的集合,其中每个事务都有一个唯一的标识符。项目的集合称为项集,对于k个项目的项目集可以称为k_项集。[31]支持度(Support):在事务数据库D中,出现项目集X的事务数占整个事务总数的比例,换言之,是项集X在总事务中出现的频率,记为sup(X),使用公式定义为:X出现次数sup(X)P(X)(2-1)事务总数T支持计数:是指事务数据库D中总事务数中包含项集的事务数,也是支持度与事务总数的乘积。[32]置信度(Confidence):在事务数据库D中,同时存在项目集X和Y的事务与只sup(XY)存在项目集X的事务之间的比例,即,可定义为:sup(X)P(YX)XY出现次数/事务总数TConf(XY)P(Y|X)P(X)X出现次数/事务总数T(2-2)sup(XY)XY出现次数sup(X)X出现次数在事务数据库中,如果项集X出现的频率大于或等于已给定的最小支持计数时,说明该项集满足最小支持度,则为频繁项集,反之则为非频繁项集。如果项集X不属于其他任何项集的子集则该项集为极大项目集。频繁k_项集的集合通常记为Lk。关联规则可以表示为XY,其中XI,YI,XY,XY的支持度sup(XY)不小于已给定的最小支持度min_sup,置信度conf(XY)不小于已给定的最小置信度min_conf。关联规则挖掘就是从数据库D中找出既符合所给定的最小支持度也满足给定的最小置信度的所有关联规则。[33-34]依据不同的标准可以将关联规则进行如下几个分类:(1)根据规则中的数据维数进行划分,为单维和多维两种。单维关联规则挖掘的数据负责处理单个属性之间的联系;多维关联规则挖掘的数据处理的是多个属性间的联系。(2)根据规则中数据抽象层次划分,为单层和多层关联规则。单层关联规则只是考虑某一种层次的属性或项之间的关联性,而多层关联规则是对不同层次属性或项间的关联性进行综合考虑。比如IBM台式机=>Sony打印机,是属于单层的关联规则,台式机=>Sony打印机,就是属于一种高层次的多层关联规则。(3)根据规则中数据的变量类型划分,包含布尔型和数值型。布尔型关联规则是对8万方数据 浙江工业大学硕士学位论文种类化的、离散的数据进行处理,显示变量是否存在,数值型关联规则是对数值型字段处理,可以进行动态分割,也可以直接对数据进行处理,并且在数值关联规则中数据也可以包含种类变量。2.2.2关联规则挖掘过程关联规则挖掘就是从事务数据库中找出强关联规则的过程,其挖掘过程分为两步[35-36]:(1)从事务数据库中找出所有的频繁项集(FrequentItemSet):根据关联规则概念,频繁项集的产生与事先给定的最小支持度有关,对于从数据库中找出的候选项集的支持度只有大于或者等于事先给定的最小支持度,该项集才能成为频繁项集。(2)由频繁项集找出强关联规则:从找出的频繁项集中,求取项集的置信度,并依据给定的最小置信度,找出符合条件的强关联规则。其关联规则挖掘过程如图2-1所示:开始扫描数据库生成候选项集和记录项集的支持度否判断候选项集的支持度是否大于最小支持度?是生成频繁项集不通过通过最小置信度检测通过关联规则生成结束图2-1关联规则挖掘过程在关联规则挖掘过程中,通过找出频繁项集可以快速找出关联规则,因此挖掘频繁项9万方数据 浙江工业大学硕士学位论文集是关联规则挖掘的研究重心。本文重点研究关联规则算法,如何快速、有效地从大量数据集中挖掘出所有的频繁项集,并将其算法应用于本文移动商城系统中,其详细的算法过程将在下章进行研究。2.3电子商务模式电子商务模式是利用互联网环境,基于对应的技术基础下的一种商务运作方式和盈利[37]模式,主要的电子商务模式有以下几种:(1)B2B模式B2B(BusinesstoBusiness),是商家与商家之间建立的商业联系。商家们通过大家提供的商品形成一个互补的发展机会,从而建立商业伙伴的关系。B2B模式是历史比较长久、发展比较完善的商业模式,能很快的带来利润和回报,而它的利润则来源于相对廉价的信息成本所带来的各种费用的下降,以及供应链和价值链整合的好处。B2B的优势是降低采购成本、降低库存成本、节省周转时间、扩大市场机会等,由于B2B这种经营模式的种种优势,受到越来越多业内人的关注和重视。(2)B2C模式B2C(BusinesstoConsumer),是商家与顾客之间建立的商业关系,就是商家将商品直接卖给用户的商业零售模式,主要使用在线销售模式,以互联网方式向消费者销售商品和服务,并保证完成安全交易的实现。例如当当、卓越、优凯特就是这种类型的商业模式。(3)C2B模式C2B(ConsumertoBusiness),是通过聚合分散分布且数量庞大的用户形成的一个强大的采购集团,以此改变B2C模式中的用户一对一交易的弱势地位,以此可以享受到以大批发商的价格购买单件商品的利益。其运行的机制是通过提出相关的需求将消费者群体聚集在一起,进行群体内部商议,并制定明确的需求计划。接着选择合适的商家或者企业群体,将群体讨论的结果与其商家或企业进行议价谈判,在双方达到统一意见之后可以进行购买,当收到购买到的商品,消费者群体可以进行自觉分配,即完成整个购买的交易。(4)C2C模式C2C(ConsumertoConsumer),是个人与个人之间进行交易的电子商务模式,就是一个消费者通过网络交易将某件商品卖给另一个消费者。国内比较大型的网站如淘宝、拍拍、易趣就是采用这种商业模式。C2C的优势是利用了物流,让消费者自己解决付费、运输以及验货等问题。10万方数据 浙江工业大学硕士学位论文(5)O2O模式O2O(OnlinetoOffline),就是将线下交易与互联网结合在一起,让互联网成为线下交易的平台。随着移动技术的成熟,智能手机已经成为个人的一个延伸,不仅是信息载体,也是身份识别的终端,在此需求可行的情况下,人们开始尝试将网上生活与线下服务进行对接,由此引出线上到线下的服务。O2O未来发展将是为消费者服务提供跨界无缝的、良好体验的服务,意味着零售服务的融合。本文移动商城系统采用的商业模式是B2C模式。2.4本章小结本章主要对相关理论知识进行概述,分别讲述了数据挖掘技术和关联规则挖掘技术,数据挖掘技术中介绍了数据挖掘概述和数据挖掘过程,关联规则挖掘技术中则介绍了关联规则的内容和关联规则挖掘过程,还介绍了电子商务的模式。这些为下一章基于关联规则算法的移动商城系统研究提供铺垫。11万方数据 浙江工业大学硕士学位论文第3章基于关联规则算法的移动商城系统研究3.1问题描述与分析本文的移动商城系统可实现网上在线购物和退货的功能,只需要拥有移动设备,在有网的情况下就可以随时随地进行网上交易,方便、快捷的优势使得移动商城系统赢得许多消费者的青睐。随着使用该系统的用户不断增加,系统中商品种类和数量不断添加,给用户更多选择商品的机会,同时移动商城系统商品信息的增多,给用户利用有限的屏幕快速准确地找到所感兴趣的商品带来了困难,为解决这样的问题,方便用户在短时间内找到喜欢的商品,本文引用了数据挖掘技术,采用了其中的关联规则算法对移动商城系统的商品数据进行挖掘,找出商品之间的关联性,从而为用户及时推荐相关联的商品。目前已经出现一些关联规则算法用来挖掘事务数据间的关联性,但其算法都有一定的不足,算法挖掘的时间过长或挖掘出的数据间的关联性不够准确,本文先通过研究Apriori关联规则算法,找出其算法存在的瓶颈,并针对其算法存在的问题,提出一种改进的算法,从而尽可能地避免Apriori算法的局限性,能够为用户更快速、更及时地推荐相关联的商品。3.2关联规则挖掘的经典算法及研究3.2.1Apriori算法的描述关联规则的挖掘主要是找到事务数据库中的频繁项集和由频繁项集来生成关联规则。Apriori算法是一种经典的挖掘关联规则频繁项集的算法。该算法采用从少到多、由简单[38]到复杂循序渐进的方式,搜索事务数据库中的项目相关联系。1、概率的基本性质(1)对于任何一个数C,如果数A和数B同时出现的概率P(AB)>C,则P(A)>C;(2)对于任何一个数C,如果数A出现的概率P(A)=j时,F[i,j]=0根据定义和Apriori算法性质,推出以下性质:性质1:如果B(Ii)、B(Ij)进行位“与”运算,结果显示“1”的个数小于最小支持计数,则项集{Ii,Ij}为频繁2_项集。性质2:在频繁项集矩阵中,任意一行或一列的元素值小于最小支持计数时,则该行或列所包含的元素不会成为频繁项集,不需要考虑。改进Apriori算法的找出频繁项集的过程:(1)先给定出数据库中的最小支持度,将事务数据库进行一次扫描,并对每个项目16万方数据 浙江工业大学硕士学位论文进行编码,得到频繁1_项集。数据库中的每个事务记录由事务编号和项目集组成,先把事务记录中各个项目的信息排序,事务的个数对应编码的长度,每个事务在代码中对应着一个位置,如果某个项目出现在某个事务中,则该项目上对应元素值设为‘1’,否则为‘0’。获取各个项目的编码后,通过编码中‘1’的个数可知该项目的支持计数,从而找出支持度小于最小支持度的项目可以移除,即可得到频繁1_项集。(2)构建(T-1)行*T列的频繁项集矩阵,得到频繁2_项集。这里构建的是(T-1)行而不是T行,主要是因为T行上获取的元素值都为0,可以忽略。矩阵中元素的取值是通过项目的二进制代码即B(Ii)与B(Ij)的位“与”运算获得的,前提情况下i必须小于j,计算结果为出现‘1’的个数Sij,如果出现‘1’的个数小于最小支持度计数,则Sij=0。(3)对频繁项集矩阵进行排项处理,得到频繁k_项集。检查频繁项集矩阵,如果有某一行或者某一列的元素值都为0,根据性质2,将该行或列移除。对于矩阵中任意F[i,j]不为0的元素,其{Ii,Ij}都是频繁2_项集。当频繁项集矩阵中存在F[i,j]>0,F[j,w]>0,F[i,w]>0,则可以找出扩展出{Ii,Ij,Ik}候选3_项集,如果B(Ii)、B(Ij)、B(Ik)三者间的位“与”运算结果得到的‘1’的个数大于或等于最小支持计数,则{Ii,Ij,Ik}候选3_项集就是满足条件的频繁3_项集,依次类推,可以找出满足最小支持度的频繁n_项集,直到不再产生新的频繁项集为止。3.3.2基于改进Apriori算法在移动商城系统中的应用为更好清楚Apriori改进算法的过程,以一个具体事例进行说明。给定出一个事务数据库D,如表3-2,有9条记录,每条记录包含有事务编号和项目集,假定最小支持计数为2,对应最小支持度为2/9=22%,找出最大项的频繁集,由给定的最小置信度为50%,找出其关联规则。17万方数据 浙江工业大学硕士学位论文表3-2事务数据库D事务标号项目集001I1,I2,I5,I6002I2,I4003I2,I3004I1,I2,I4005I1,I3006I2,I3007I1,I3008I1,I2,I3,I5009I1,I2,I3从表中可知事务数据的个数为9,则二进制代码的长度为9,事务项目包含有I1、I2、I3、I4、I5、I6,对应的二进制代码分别为B(I1)、B(I2)、B(I3)、B(I4)、B(I5)、B(I6),通过扫描一次事务数据库,得到每个事务项目的二进制代码和支持度计数,由于项目I6的支持计数小于最小支持计数,不符合条件,故事务项目总共有5个,即所有的频繁1_项集L1={{I1},{I2},{I3},{I4},{I5}},找到所有的频繁1_项集后,将其五个项目按照顺序进行存储,处理结果如表3-3所示:表3-3项目的二进制代码及支持计数项目B(Ij)二进制代码支持计数I1B(I1)1001101116I2B(I2)1111010117I3B(I3)0010111116I4B(I4)0101000002I5B(I5)1000000102将频繁1_项集中的任意一个子项集与其他的子项集的二进制代码进行位“与”运算,并记录运算结果中出现‘1’的次数,得到Sij,并将其赋值给F[i,j],没有出现‘1’的则为0,构建出4*5的频繁项集矩阵,如下表3-4所示:18万方数据 浙江工业大学硕士学位论文表3-4频繁项集矩阵项目I1I2I3I4I5I104412I200422I300001I400000在频繁项集矩阵中,元素F[1,4]和F[3,5]的值小于最小支持计数,则将其值取为0,其余的都为频繁2_项集。再遍历矩阵,找到行I4和I5所有元素为0的,将其两行移除,约简之后的频繁矩阵如下表3-5所示:表3-5更新约简后的项集矩阵项目I1I2I3I4I5I104402I200422得到频繁2_项集后,可以再次扫描约简后找出候选3_项集,如频繁2_项集{I1,I2},由于F[1,3]=40,F[2,3]=40,可得到候选3_项集{I1,I2,I3},再计算B(I1)、B(I2)、B(I3)三者的位“与”运算结果的二进制代码为000010011,得到项集{I1,I2,I3}的支持计数为3,大于最小支持计数,则项集{I1,I2,I3}为频繁3_项集。而F[1,4]=0,F[2,4]=20,则候选项集{I1,I2,I4}不是频繁3_项集,依照这样的方法找出其他的频繁3_项集,最后得到的所有频繁3_项集为L3={{I1,I2,I3},{I1,I2,I5}},而|L3|=2<4,不能再进行扩展,算法结束。生成关联规则:通过以上两组3_项频繁集得到候选关联规则,如表3-6所示:19万方数据 浙江工业大学硕士学位论文表3-6所有候选关联规则候选关联规则置信度候选关联规则置信度I1,I2I3(*)2/4=50%I1,I2I5(*)2/4=50%I2,I3I1(*)2/4=50%I2,I5I1(*)2/2=100%I3,I1I2(*)2/4=50%I5,I1I2(*)2/2=100%I1I2,I32/6=33%I1I2,I52/6=33%I2I3,I12/7=29%I2I5,I12/7=29%I3I1,I22/6=33%I5I1,I2(*)2/2=100%扫描数据库,计算出每条候选关联规则的置信度,并与最小置信度进行比较,得出关联规则,如表带(*)部分则为符合条件的关联规则。关联规则的置信度的计算公式表示如下:假如{A,B}为最大频繁项集,得到两条关联规则AB和BA,取{A}的支持度为a,{B}的支持度为b,{A,B}的支持度为c,则sup(A,B)cAB:conf(AB)P(B/A)(3-1)sup(A)asup(A,B)cBA:conf(BA)P(A/B)(3-2)sup(B)b以上表中的置信度就是通过此方法计算得出的。由于给定的最小置信度是50%,因此只有带(*)符合条件的关联规则。移动商城系统中保留有大量用户的足迹,如用户访问过哪些网页,搜索过哪些商品的关键词,完成哪些商品的交易订单等等,随着用户的访问量增多,这些数据变得越来越来多,表面上看这些数据没什么作用,但是使用合适的数据挖掘技术中的关联规则算法进行挖掘,能找到很多有用的、有潜在价值的信息,可以通过这些数据更好地了解用户的购买行为,本文的移动商城系统就是利用以上改进Apriori算法对系统数据库中存储的大量历史交易数据集进行处理,清除无用的数据集,对有用的数据集进行算法的挖掘,找出数据中的频繁项集,再由指定的最小置信度,找出数据的强关联规则,由关联规则结果结合现有的数据分析为使用该移动商城系统的用户提供在线推荐相应商品的服务。20万方数据 浙江工业大学硕士学位论文3.3.3基于改进Apriori算法在移动商城中应用的优势相比较Apriori算法,本文改进Apriori算法在移动商城应用的优势主要体现在时间复杂度和空间复杂度两个方面。(1)时间复杂度分析Apriori算法需要多次重复扫描数据库,才能找出频繁项集,而在获取项目集的支持度和从候选项集中找出频繁项集需要进行大量的模式匹配操作,耗时长。而改进的算法只需要对数据库扫描一次,消耗的时间主要集中在对事务数据库的扫描和对搜索项目集矩阵的执行次数,扫描数据库的时间是由数据库的长度决定,其平均执行时间为O(n),而搜索项目集矩阵的执行次数是由矩阵中项目的个数和频繁项集的长度决定,即平均执行时间为O(N*N*L),N为项目的个数,L为频繁项集的长度。在Apriorin算法中,其平均执行时间为O(2),很明显,改进的算法的时间复杂度要小于Apriori算法的复杂度。而在移动商城系统中,要为用户在线推荐相应商品的过程分为两步,就是先要找出商品之间的关联性,再根据用户的最新购买记录和购物篮信息,为其推荐对应商品。由于数据的更新速度很快,使用旧的数据对商品挖掘的作用不是很大,所以需要实时对最新的数据进行挖掘,对挖掘的效率会有一定的要求,使用更少的时间找出商品间的关联规则就能更早的留住客户,抓住客户的购买欲望。(2)空间复杂度分析在Apriori算法中存储的数据主要是交易记录,并且在挖掘频繁项集的过程中还需要将候选项集放在单独的空间进行存储。而改进的算法在空间上主要存储的是频繁项集矩阵,矩阵的大小取决于数据库的长度。在频繁项集矩阵里,只有上三角记录了项目集的支持计数,下三角区域的值都为0,所有只有上三角占据存储空间,大大减少存储空间。在使用算法挖掘频繁项集的过程中,数据所占的存储空间少可以使挖掘效率更高,花费时间更少。对于数据量很大的情况下,其改进的算法更有优势。通过以上时间复杂度和空间复杂度的分析,改进Apriori算法减少了扫描事务数据库的次数,不需要产生大量的候选项集,利用频繁项集矩阵直接获得频繁项集,改进了Apriori算法存在的一些不足。21万方数据 浙江工业大学硕士学位论文3.4基于Apriori算法与改进算法的实验分析本文的实验测试环境为笔记本电脑一台,操作系统为Windows7,内存为4G,数据库采用的是MySQL,使用C++语言进行编写算法,在VC++6.0编程环境中实现。为测试Apriori改进算法的优越性能,本文使用T1014D100K数据集和UCI标准数据集Mushroom两种类型数据库进行测试,其中T1014D100K数据集是通过IBM数据生成器产生,UCI标准数据集Mushroom从UCIMachineLearningRepository上免费得到。表3-7给出这两种类型数据集的主要参数,包括事务数据库、事务数、项目数和平均事务长度。表3-7测试数据库参数事务数据库事务数项目数平均事务长度T1014D100k100000100010Mushroom81242623本文的测试的过程为:首先测试两种数据集,在相同的测试环境下,分别采用不同的最小支持度测试Apriori算法和改进的算法的执行时间的变化。1、使用T1014D100k数据集,在不同的最小支持度情况下,Apriori算法和改进的算法的执行时间的变化如下图3-2所示:160改进的算法Apriori算法140120(s)100执行时间80604000.050.10.150.2支持度图3-2T1014D100k数据集上不同支持度下执行时间变化22万方数据 浙江工业大学硕士学位论文2、使用Mushroom数据集,在不同的最小支持度情况下,Apriori算法和改进的算法执行时间的变化如下图3-3所示:140改进的算法Apriori算法120100(s)8060执行时间402000.20.250.30.350.40.45支持度图3-3Mushroom数据集上不同支持度下执行时间变化接着选取T1014D100k数据集,取最小支持度为0.5,在相同的测试环境下,采用不同的事务记录数测试两种算法执行时间的变化,如下图3-4所示:50改进的算法45Apriori算法403530(s)25执行时间20151050123456789事务记录数(x10000)图3-4T1014D100k数据集上不同事务记录数下执行时间的变化由图3-2和图3-3可得出,改进的算法执行时间在不同的支持度下都明显小于Apriori算法,随着支持度的降低,其算法执行的时间增加,在支持度较低的情况下,改进的算法23万方数据 浙江工业大学硕士学位论文执行的时间增长速度也小于Apriori算法。这主要原因是,在支持度比较低时,Apriori算法中产生的候选项集比较多,进行连接和模式匹配上需要消耗大量的时间。由图3-4可得出,在同样的数据集的情况下,随着事务数据库的规模增加,其算法的执行时间也会增加,在数据库不是很大的情况下,两种算法执行的时间相差不多,但是随着数据库规模的扩大,改进的算法执行时间要远小于Apriori算法。根据上面数据实验对比,改进的算法挖掘效率要高于Apriori算法,并解决了一些Apriori算法存在的局限性,具有明显的优势,故可将Apriori改进的算法应用到移动商城系统商品推荐模块中。3.5本章小结本章主要是基于关联规则算法的移动商城系统研究,先进行问题描述与分析,接着研究关联规则挖掘的Apriori经典算法的描述、算法的实例应用以及算法存在的局限性,提出一种改进Apriori算法,并详细讲解改进算法的过程、改进算法在移动商城系统中的应用以及应用的优势。通过Apriori算法与改进的Apriori算法的实验测试,验证改进Apriori算法的有效性。24万方数据 浙江工业大学硕士学位论文第4章基于关联规则算法的移动商城系统的设计与实现4.1移动商城系统的需求分析对移动商城系统进行需求分析是设计整个系统的前提,需求分析的制定能让开发者更好地了解客户的需求和目的,更好地把控和设计该系统,系统主要从功能性需求和非功能性需求两个方面进行分析。4.1.1系统功能性需求分析本系统主要从包括商品购买模块、用户信息管理模块、商品退货售后模块、积分活动模块和商品推荐模块进行介绍。(1)商品购买模块用户使用移动设备进行购买商品的交易时,需要有商品分类、商品搜索、商品详情、商品列表、购物车等几个主要部分。商品分类存在一级和二级分类,二级分类更加细化用户的需求,让用户更快速地查找相关商品。商品搜索可以通过搜索关键字找到相关的商品,还可以查看历史搜索记录和热门搜索的关键字进而进行相关的搜索。商品列表可以以水平和垂直两种方式展示简短的商品信息,用户可以看到更多的商品。商品详情介绍具体商品的详细信息,如商品的名称、价格、规格、商品优惠劵、用户的评价信息等,通过了解这些信息,用户对是否购买商品可以更好地作出判断。购物车是供用户存放选购的商品,当用户决定购买某个商品可以将商品加入购物车,在购物车中可以选择商品删除,可以对商品进行增加和减少数量的操作,还可以选择“立即购买”按钮直接进入付款页面完成购买交易。(2)用户信息管理模块用户信息管理模块主要处理跟用户有关的信息,包括用户个人资料、用户钱包和支付密码的设置。用户个人资料包括个人头像、个人昵称、个性签名和收货地址,这些可以根据个人喜25万方数据 浙江工业大学硕士学位论文好进行更改,收货地址中可以进行添加、编辑、删除和设置默认地址等操作,以便用户在完成交易时选择收货地址,配送人员能及时完成配送。用户钱包中可以查看用户的可用余额、交易明细等信息,用户可以使用余额购买商品,如果余额不足可调用微信接口,进行微信支付,还可以进行提现和充值等操作。当用户购买商品到付款阶段时,为确保交易安全性需要输入支付密码,支付密码需要提前设置,而支付密码的设置需要先绑定有效的手机号后再进行设置,当设置成功支付密码后,也可以根据需要对密码进行更改。(3)商品退货售后模块当用户收到商品发现商品有破损或其他原因需要退货时,商品退货售后模块可以解决此问题。用户退货首先需要进行退货申请,申请中要填写退款金额、申请原因、退货说明、上传商品图片凭证等相关信息,提交请求到服务器,让商家了解退货缘由,以便作出对应处理。当用户完成退货申请后,在等待商家处理的过程中可以查看退货进度,并作对应回复和处理。退货进度有审核中、修改申请、同意退款、等待商家确认、退货完成等过程。在退货时将商品通过快递方式寄还给商家,还需填写商品物流信息。修改申请是在商家没审核完可以进行的操作,一旦商家审核通过就不能修改。(4)积分活动模块积分活动模块目的是增强用户与移动商城系统的互动性,使用现有的积分去兑换商品以激起用户的消费积极性,提高商家的销售额。积分的获取的途径有两种,一是完成每天的签到,可以得到一定量的积分,二是完成每单网上交易,系统自动赠送相应的积分,根据每单交易的额度的不同,赠送的积分也会相应的区别。在积分商城中,需要足够的积分和填写的详细的收货地址可以成功完成商品的兑换。(5)商品推荐模块商品推荐模块主要是通过获取相关的用户历史交易信息数据,并对数据进行清洗,移除不需要的数据,提取有用的数据,并将其数据转换成关联规则能够识别的形式,运用关联规则算法进行挖掘分析,找出商品的关联规则,将其关联规则写入规则数据库中,并结合近期的交易记录和购物篮中商品信息,找出合适的商品以页面展示方式推荐给用户。关联规则算法的挖掘是该模块的核心,如何快速精准地找出关联商品,对于关联规则算法的选择是至关重要的。26万方数据 浙江工业大学硕士学位论文4.1.2系统非功能性需求分析(1)系统可扩展性分析本系统目前属于B2C模式,即商家对消费者的电子商务模式,在后期系统会延伸C2C(消费者对消费者)的模式,在买家和卖家的角色上做好区分,这样的转型是可以完成的。本系统主要想做成在全国范围内的大型移动连锁超市,商品的实体店的地点覆盖全国,但目前实体店的地点只定位在当前所在的城市,后期会扩向其它城市,由于网站开发使用的是MVC模式,使得模型层、视图层和控制层相互独立,更改某个需求功能时会变得更容易,因此这样的需求转变在开发中是可以完成的。(2)系统技术可行性分析移动商城系统采用MVC开发模式,前端主要使用的是HTML5、JavaScript/jQuery、Ajax等技术,后台使用的是当前流行的php开发语言,数据库使用的是MySQL数据库。在开发环境上,前端开发使用的是sublimetext2,后台使用的是PHP5.5,这些可以通过网上下载安装,因此在开发技术上是完全可行的。(3)系统操作可行性分析本系统面向的对象是所有的微信用户,登录微信,用户通过扫描相应的二维码、输入系统网址或者通过好友分享即可进入系统进行浏览。在完成交易最后付款上,系统有余额支付和微信支付两种方式,余额支付设置了支付密码,微信支付是调用微信端的支付接口。而在积分兑换交易上是通过积分进行兑换商品,不涉及金额的交易。并且在涉及金额的交易时,所涉及的金额也不会很大,安全性能够得到保障。(4)系统页面的美观性本系统的页面结构清晰友好、简洁大方,使用较少的内容展现更多的信息,在涉及到文字的内容时,尽可能做到精简省略,页面的主题的颜色保持统一的红色,当涉及到同样的话题不同的内容时,对于有很多内容需要展示时均采用对称的方式展现出来,让用户浏览的视觉得到良好的体验。(5)系统页面的响应速度在系统开发过程中,将页面的样式和javaScript脚本文件分别放在单独的文件里面,再由结构页面调用,在编写代码过程中避免重复的代码出现,对于图片的处理尽量保证占用更少的内存,所有的图片在页面中只是部分显示出来,其余的会被隐藏,在需要的时候进行展现出来,以减轻系统负担,加快页面的响应速度。27万方数据 浙江工业大学硕士学位论文4.2移动商城系统关键技术介绍(1)HTML5技术HTML(HyperTextMarkupLanguage),一种超文本网页标记语言,而HTML5为第五代超文本网页标记语言,它是为推动web标准化而发展的,是在2004年被[46]WHATWG首次提出,并在2007年被W3C接纳,正式成为新一代HTML标准。HTML5[47-48]技术有很多新优势,如:a)新增的语义化标签使结构层次更加清晰,更容易理解;b)新增的音频、视频标签将大大降低播放声音和视频的难度,无需引用Flash插件,直接引入video和audio两个标签即可完成声音和视频的播放;c)新增的WebStorageAPI接口实现离线缓存,在一定程度上减轻服务器的负担,将数据存储在本地,随时需要可以随时取出,方便快捷;d)新增的canvas标签,可进行二维和三维动态绘图;e)新增的WebSocketAPI接口实现双向通信,用户获取数据不需要重新刷新页面,新的数据会自动通过服务器推送到用户界面上;f)跨平台性,支持当前的主流浏览器,同时支持电脑端和移动智能端设备;g)提高可用性和友好的用户体验;h)CSS3新增的很多动画属性,可以实现很好看的动画效果。随着移动智能设备的普及,移动互联网已经成为日常生活不可缺少的部分,移动应用的开发也成为当前热点。移动互联网最大的特点就是它的移动性,随时随地都可以进行,HTML5技术的新特性和跨平台特点正好符合移动平台开发的需求,因此HTML5[49]技术在移动端应用上有很重要的作用。(2)JavaScript/jQueryJavaScript是一种客户端脚本语言,是一种动态、弱类型、基于原型的语言,广泛[50]用于客户端Web开发,常用于给HTML网页添加动态功能,也可用于服务器端编程。一个完整的JavaScript实现是由ECMAScript、文档对象模型(DOM)和浏览器对象模型(BOM)几个部分组成的。JavaScript脚本语言不同于服务端脚本语言,可以在用户的浏览器上运行,在不需要服务器支持下能够独立运行。JavaScript是为使用动态网页制作而诞生的一种编程语言,或者称为描述语言。在HTML基础上,使用JavaScript可以开发交互式Web网页,JavaScript的存在让网页和28万方数据 浙江工业大学硕士学位论文用户间有了一种实时性的、动态的、交互的关系,也让网页拥有更多活跃元素和精彩内[51-52]容。jQuery是一个快速简洁的JavaScript库,使用户能够更方便地处理html文档、事件和动画效果,还能为网站提供Ajax交互。jQuery的优势在于,它的文档说明全面,各种应用解释详细,还有很多成熟的插件可以免费使用。jQuery的特点是,它可以使用户[53]的结构和内容分离,即不需要插入一堆js来调用命令,只需要定义id即可。jQuery是继prototype之后又一个优秀的JavaScript框架,其宗旨是写更少的代码、做更多的事情,是一个轻量级的js库,兼容CSS3,还兼容当前的主流浏览器。(3)AjaxAjax即AsynchronousJavaScriptandXML,通过在后台与服务器进行部分数据交换,Ajax可以使网页实现异步更新,意味着无需加载整个页面,只需对网页的部分内容进行更新,这样可以加快网页的响应速度,及时响应用户的行为,提高用户的体验性,吸[54]引更多用户的关注。Ajax这种技术允许网页从服务器请求少量的信息,而不是整个页面的信息,在浏览器与服务器端之间使用异步传输数据的方式被称作异步JavaScript和XML。Ajax的核心是XMLHttpRequestAPI,可以分析和操作服务端的响应,监视请求的进度,使用纯Ajax或FormData对象提交表单和上传二进制文件,可以创建异步或同步请[55]求,在Webworkers中可以使用Ajax。(4)PHPPHP(HypertextPreprocessor),是英文超级文本预处理语言的缩写,是一种HTML内嵌式的语言,在服务器执行的嵌入HTML文档的脚本语言,主要用于处理动态的网[56]页,广泛应用于网页程序的开发上。其特性包括:a)PHP的安装可以比CGI或者Perl更快速地执行动态网页;b)相比较其他的编程语言,PHP是将程序内嵌到HTML文档中完成执行的,执行效率比完全生成html标记的CGI要快;c)PHP具有非常强大的功能,能实现所有CGI可以实现的功能;d)PHP支持大部分流行的数据库以及操作系统,最重要的是PHP还可以用C、C++进行程序的扩展。[57]PHP的优势表现在:a)源代码的开放性,即全部的PHP源代码能够被大众看到并且获得到;b)其免费性,有些程序的开发源代码需要收费才能获得,会给开发过程带来一定29万方数据 浙江工业大学硕士学位论文的阻碍;c)其快捷性,程序开发快、运行快、技术本身编辑简单、容易上手、实用性强;d)其跨平台性强,在UNIX、LINUX、WINDOWS、MACOS系统下都可以运行;e)高效率地运行,PHP消耗的系统资源特别少。(5)MySQLMySQL是一种比较实用高效的数据库,是目前最受欢迎的开源SQL数据库管理系统,原来是由瑞典MySQLAB公司开发的,后来被升阳微系统收购,成为Oracle旗下产品。MySQL是一个关系数据库管理系统,关系数据库把数据保存在不同的表中,而不是把所有的数据放在一个大仓库中,这样大大提高了开发的速度和灵活性。其特性主[58]要有:a)MySQL是开源的,不需要支付任何费用就可以使用;b)MySQL支持大型的数据库,可以处理拥有上千万条记录的大型数据库;c)MySQL使用的是标准的SQL数据语言形式;d)MySQL同时支持多种操作系统和多种编程语言;e)PHP是当前很流行的网页开发语言,而MySQL能够很好地支持PHP语言;f)MySQL能够被修改,通过GPL协议可以改变其源代码来开发自己的数据库系统。(6)MVC模式MVC全名是ModelViewController,是一种软件架构模式,分为模型(Model)、视图(View)和控制器(Controller)三个部分。[59]MVC作为一种编程模式,可以使用MVC设计思想创建网页应用程序。模型是应用程序核心,用于处理应用程序数据逻辑的部分,根据不同业务逻辑需求,更新模型中的数据;视图是用于显示数据并呈现给用户的部分,用户可以根据具体需求,将需求数据在视图层中输入,后台控制器会对传过来的请求进行处理;控制器是用来处理用户的输入请求的部分,当控制器接收用户通过界面发送过来的请求时,会根据数据业务逻辑执行请求服务并及时更新业务模型的状态。MVC这样的分层方式便于管理复杂的应用程序,同时[60]简化了应用程序的开发。MVC作为一种框架模式,它强制性地将应用程序的输入、处理和输出独立出来,分[61]成三部分:模型、视图和控制器,能够相互独立地处理各自的任务。视图即是用户在网站上直接看到的并与之交互的界面,不仅包括HTML静态页面,还包括PHP、ASP、JSP等动态页面。MVC的分离性决定了它能为应用程序提供很多不30万方数据 浙江工业大学硕士学位论文同的视图。模型表示数据和业务逻辑规则,与数据格式没有关系,一个模型可以提供多个视图的数据,这样只需写一次应用于模型的代码就可以被多个视图复用,避免代码的重复性。控制器是处理用户的输入并且调用模型和视图去完成用户的需求。当控制器接收到用户的请求后,不会亲自处理用户的输入请求,而是指派模型和视图层去完成用户的请求。控制器不输出任何东西,也不做任何处理,但是对于调用哪个模型构建去处理请求和确定用哪个视图显示返回的数据,控制器起到决定作用。4.3移动商城系统总体设计4.3.1系统技术架构设计移动商城系统是基于MVC开发模式下,无需安装相关软件,通过微信关注,即可进入访问。系统主要使用JavaScript前端语言和php后端语言进行开发,通过ajax实现客户端与服务端的异步交互,使用MySQL数据库管理数据,系统的架构如图4-1所示:数据库系统服务器...微信客户端图4-1系统架构如图4-1所示,系统主要由微信客户端、系统服务器和数据库三大部分构成。微信客户端主要使用移动设备,采用手动触屏和移动键盘与系统进行交互,运用JavaScript完成前端的相关业务逻辑,并利用AJAX技术实现与服务器之间的数据的传递,最后将请求结果在客户端展现出来,供使用者浏览。系统服务器是系统功能模块实现的核心部分,用31万方数据 浙江工业大学硕士学位论文于处理复杂的功能业务逻辑,当接收到微信客户端的远程请求时,服务端会依据相应的请求从数据库中获取对应的数据,再次返回服务端进行相应的业务逻辑处理后,将请求结果返回到客户端。数据库是系统平台建立的基石,该部分主要用于集中存储数据,系统中数据主要以表格的形式进行存放,如果数据不存在,系统就是一个空壳子,不能展示具体的内容。4.3.2系统功能模块设计移动商城系统主要从以下五个模块进行设计,分别是商品推荐模块、商品购买模块、用户信息管理模块、商品退货售后模块和积分活动模块。系统功能模块如图4-2所示:移动商城系统商品推荐模商品购买模用户信息管商品退货售积分活动模块块理模块后模块块离线支付查看积分关联在线商品商品商品商品购物用户用户申请获取密码退货兑换规则推荐分类搜索列表详情车资料钱包退货积分设置进度商品生成关联关联数据数据规则规则准备清洗挖掘导入图4-2系统功能模块(1)商品推荐模块商品推荐模块包含离线关联规则生成和在线推荐两部分。离线关联规则生成主要是根据系统用户历史交易数据找出商品的关联规则,在线推荐主要是由用户的近期交易信息和购物篮商品信息,根据离线关联规则获取关联性商品为用户推荐商品。本系统的商品推荐模块将采用关联规则的方法为用户进行商品相关推荐,而关联规则32万方数据 浙江工业大学硕士学位论文的发现首先需要系统的交易数据,其次需要关联规则算法对数据进行分析和计算,这些过程比较耗时,可以离线处理,定期更新,不会影响系统的正常使用。离线关联规则生成部分主要包括数据的准备、数据的清洗、关联规则的挖掘和关联规则的导入。数据的准备:主要是从数据库中将该商城系统中所有用户交易信息导出,使其对这些信息的访问不再依赖系统的数据库。数据的清洗:主要是将导出的用户交易信息进行清洗、整理,将不需要的数据删除,合并同类数据,将有用的数据转换合适的数据格式,以便后面的关联规则的挖掘。关联规则的挖掘:将已经清洗好的数据使用合适的关联规则算法进行挖掘,找出频繁项集,再根据最小置信度,找出商品的关联规则。关联规则的导入:将获得的商品关联规则结果进行结构化存储,写入规则数据库中,供在线推荐使用。在线推荐部分主要是根据已发现的商品规则为用户推荐合适的商品并在页面上展现出来。当为用户推荐商品时需要有规则头和规则体,规则头是用户近期购买商品的记录、加入购物车商品信息等,规则体就是已经发现的商品关联性。在线推荐部分就是使用这些原本储存在数据库中的信息与规则库中的关联规则进行对比分析从而为用户进行推荐。(2)商品购买模块商品购买模块包括商品分类、商品搜索、商品列表、商品详情和购物车五个部分。商品分类:就是将商品以关键字的形式进行分类,有两级分类,通过分类查找商品可进入到商品列表中。商品搜索:通过搜索关键字找到对应系列的商品,可以手动输入关键字,也可以点击最近搜索的关键字,还可以点击热门搜索的关键字进行搜索。商品列表:是以水平和垂直两种方式对商品进行展示,商品还可以按照综合、最新、销量和价格进行排序。商品详情:记录商品的详细信息,包括商品名称、价格、规格、优惠券、图文详情、用户对商品的评价信息等,还可以对商品进行收藏、将商品加入购物车、领取优惠券、选择规格直接购买等操作。购物车:显示用户已选择的想要购买的商品,可以增减商品数量、删除商品,也可以选中商品进入付款页面进行结算。(3)用户信息管理模块33万方数据 浙江工业大学硕士学位论文用户信息管理模块包括用户资料、用户钱包和支付密码设置几个部分。用户资料:涉及用户的个人头像、个人昵称、个性签名,个人头像可以从手机相册中选择更改,昵称和签名通过手动输入进行更改,还有收货地址的设置,可以有多个收货地址,需要填写详细的地址,可以进行修改、删除和选择。用户钱包:可以查看用户余额,浏览交易明细,也可以进行提现和充值。提现是将现金转入微信钱包中,充值也是通过微信进行余额充值。支付密码设置:在支付密码设置之前,需要先绑定有效的手机号码,以发送短信的方式确认绑定成功。支付密码的设置需要填写只有自己知道的密码,密码设置成功后,即可在用户进行交易后付款时输入支付密码可成功使用余额支付。(4)商品退货售后模块商品退货售后模块包含有申请退货和查看退货进度两个部分。申请退货:当用户收到购买的商品后,发现商品有破损或其它由商家引起的原因,可以在订单详情里点击“申请退货”进行退货,退货还需要填写退款金额、申请原因、退货说明和上传凭证。查看退货进度:用户进行退货,跟商家之间会有相应的退货流程,包含审核中、取消退货、同意退款、等待商家确认和退货完成。在审核的过程中,用户还可以取消退货,一旦商家同意退货,就不能取消退货,当商家同意退款后,还需要用户填写物流信息,将商品寄还给商家。(5)积分活动模块积分活动模块包含有获取积分和积分兑换商品两个部分。获取积分:有两种方式可以获得积分,一种是完成每天的签到,即点击“领积分”的按钮,可以获得5个积分;一种是完成购买商品交易成功后系统会赠送一定数量的积分。积分兑换商品:在积分商城中,展示的商品都可以通过相应的积分换得,在积分兑换商品的过程中,首先足够的积分是必须的,再次就是需要填写收货地址,以便用户收到兑换的商品。4.4移动商城系统数据库的设计数据库在移动商城系统中是一个信息载体,本系统使用的是MySQL数据库,操作的语言为SQL语句,MySQL数据库开源、免费、易维护的特点,是当前比较流行的数据库,34万方数据 浙江工业大学硕士学位论文是很多应用程序开发的首选。在本系统中涉及到的数据库表比较多,展示几个主要的表,分别是搜索关键词表、商品信息表、分类中的一级分类表、分类中的二级分类表、评价列表、用户信息表、购物车表、积分兑换物品表等,以下是这些表的字段设计:(1)搜索关键词表,如表4-1:表4-1搜索关键词序号名称类型长度小数点允许空值注释1idint110否关键词ID2kvarchar1000是关键词3sorttinyint40是排序4timesint110否搜索次数5search_timeint110是最后搜索时间(2)商品信息表,如表4-2:表4-2商品信息序号名称类型长度小数点允许空值注释1idint110否商品ID2titlevarchar3000否商品标题3pointvarchar3000是商品卖点4pricedecimal92否一口价5market_pricedecimal92是市场价6shop_idint110是所属店铺id7trade_codingvarchar500是商品编码是否预售1:是0:8is_preselltinyint40否不是是否平台自营1:是9is_owntinyint40否0:不是是否支持7天退货10service_sorttinyint40是1:支持0:不支持状态1:显示2:放入11statustinyint40否仓库3:等待发布-1:删除12addtimeint110是添加时间13updatetimeint110是修改时间14pic_pathvarchar2550是主图路径15sku_idint110是默认skuid35万方数据 浙江工业大学硕士学位论文(3)分类中的一级分类表,如表4-3:表4-3分类中的一级分类序号名称类型长度小数点允许空值注释1idint110否ID2namevarchar500是分类名称3icon_touchvarchar1000是点击后的图标4icon_untouchvarchar1000是未点击时的图标5typetinyint40是类型6category_idint110是分类表主键ID7parent_idint110是上级分类的id状态1:启用2:禁用8statustinyint40是-1:删除9sortint110是排序(4)分类中的二级分类表,如表4-4:表4-4分类中的二级分类序号名称类型长度小数点允许空值注释1idint110否Id2namevarchar500是分类名称3urlvarchar1500是链接地址4icon_touchvarchar1000是点击后的图标5icon_untouchvarchar1000是未点击时的图标6typetinyint40是类型7parent_idint110是上级分类的id二级分类左边原点的8tag_colorvarchar500是颜色状态1:启用2:9statustinyint40是禁用-1:删除(5)评价列表,如表4-5:36万方数据 浙江工业大学硕士学位论文表4-5评价列表序号名称类型长度小数点允许空值注释1idint110否唯一id2order_idbigint200是订单id3buyer_idbigint200是评论人4goods_idint110是商品id5sku_idint110是SKUid6commentvarchar5000是评论内容7push_commentvarchar5000是追评内容8reply_commentvarchar5000是店家回复9pic_pathvarchar10000是晒图10score_leveltinyint40是评分级别11addtimeint110是评论时间状态1:生效-1:删12statustinyint40是除(6)用户信息表,如表4-6:表4-6用户信息序号名称类型长度小数点允许空值注释1user_idint110否用户id2user_namevarchar500是用户名3namevarchar1000是姓名4mobilevarchar200是手机手机验证1:是0:未5mobile_verifytinyint40是验2:失败6logovarchar2550是用户logo7signvarchar2550是个性签名8update_timeint110是修改时间状态1:正常2:锁定9statustinyint40是-1:删除10platform_idint110是平台id是否已设置支付密11paypwd_statustinyint40是码1:已设置0:未设置(7)购物车表,如表4-7:37万方数据 浙江工业大学硕士学位论文表4-7购物车序号名称类型长度小数点允许空值注释1idint110否购物车ID2buyer_idint110是买家id3shop_idint110是店铺id4goods_idint110是商品id5sku_idint110是skuid6numint110是商品数量7activity_idint110是活动id8added_pricedecimal92是加入时价格9addtimeint110是添加时间10updatetimeint110是修改时间状态1:显示-1:11statustinyint40是删除2:失效(8)积分兑换物品表,如表4-8:表4-8积分兑换物品序号名称类型长度小数点允许空值注释1idint110否唯一id2goods_namevarchar500否物品名称3goods_urlvarchar2550否物品图片4integral_costint110否需要积分总共可以兑换数5totalint110否量6exchange_numint110否已兑换数量个人限制兑换次7limitint110否数8statusint110否1上架,0下架9add_dateint110否添加时间10shop_idint110否所属店铺4.5移动商城系统功能模块的实现4.5.1商品购买模块的实现在商品购买模块中,完成商品购买交易的流程如图4-3所示,实现用户购买商品的过程如下:38万方数据 浙江工业大学硕士学位论文微信登录系统系统首页最近关键字热门关键字商品分类商品搜索手动输入关键字商品列表商品详情,选购物车择规格确认订单否是否填写收货地址?添加收货地址是收银台付款否余额是否充足?使用微信支付是使用余额支付否是否设置支付密码?设置支付密码是输入密码完成交易图4-3商品购买流程图S1浏览商品:用户通过微信进入移动商城系统,进入商城的首页查看商品。S2查找商品:用户使用商品分类和搜索关键字查询,商品分类页面中左侧是一级分类,右侧为二级分类,由二级分类下的关键词可以查找相关商品。在商品搜索页面中,可以选择最近搜索结果、热门搜索结果、手动输入关键词进行查找。S3查看商品:通过查找到的商品以列表的形式展示,点击具体商品即可进入商品详39万方数据 浙江工业大学硕士学位论文情页面查看商品的详细信息。S4确认商品下单:有两种方式可以对商品下单,一种是在商品详情页面选择商品规格后,点击“立即购买”按钮,另一种是在商品详情页面选择规格后将商品加入购物车,在购物车页面实现商品订单的确认。S5选择收货地址:如果收货地址管理页面没有地址,需要填写详细收货地址信息,再回到订单确认页面选择地址;如果存在收货地址且不止一个,可以进行选择,选择完成点击确定。S6选择付款方式:在订单页面确定好收货地址后,点击“确定”按钮,进入收银台付款页面。在此页面中,可以使用微信支付和余额支付两种方式付款。如果余额不足,会有显示,无法使用余额付款,只能选择微信支付;如果余额充足,可以使用余额支付。S7输入支付密码:在使用余额支付的过程中,需要输入支付密码。如果没有设置支付密码,需要去设置密码页面进行设置;如果已经设置支付密码,可以直接输入密码。S8完成交易:在收银台页面完成付款后,会跳转到另一个页面,页面显示已成功支付,则表明交易已完成。在商品详情中,可以实现将商品进行收藏的功能,页面底部有个收藏的按钮,当按钮为灰色,表示商品没有被收藏,当按钮为红色时,表示商品已被收藏。当点击灰色的收藏按钮后,按钮颜色会变成红色,表示商品被收藏,而当点击红色的收藏按钮后,按钮颜色变成灰色,表示商品被取消收藏。其商品收藏过程如图4-4所示:进入商品详情收藏按钮为红色收藏按钮为灰色商品已收藏,点击商品没有收藏,点收藏按钮击收藏按钮向服务器发送取消向服务器发送加入收藏请求收藏请求按钮变灰色,表示按钮变红色,表示已取消商品已被收藏商品从收藏夹中移商品被收藏在收藏除夹中图4-4商品收藏过程40万方数据 浙江工业大学硕士学位论文4.5.2商品退货售后模块的实现在商品退货售后模块中,图4-5为商品退货售后流程,主要是实现用户将商品退还给商家,商家将退款退给用户的过程。用户收到商品,打算退货商家同意退款点击订单详情中“申请退填写物流信息,将商货”按钮品寄还给商家进入退货页面,填写退货信商家收到商品完成确息认,将退款打给用户退货请求发送服务器,等待退货完成商家处理商家审核中修改退货申请图4-5商品退货售后流程S1申请退货:用户退货需要进入订单详情页面点击“申请退货”按钮,进入退货页面。S2填写相关退货信息:申请退货页面填写相关信息,包含退款金额、申请原因、退款说明、上传凭证。其中退款金额不能超过实付的交易金额,上传凭证需要上传和商品有关的图片,最多可以传四张,图片大小不超过1M。S3提交退货申请:在申请退货页面,点击“提交”按钮,向后端服务器发送退货请求。S4等待商家处理:在退货请求已发送,商家还未进行处理时,可以对退货申请进行修改。S5商家处理中:商家根据用户填写的退货缘由,如果理由合理会同意用户的退货申请。S6填写物流信息:商家同意用户的退货请求,用户需要将商品寄给商家,需要填写物流信息,包括本人手机号码、物流公司名称和快递单号,填写完提交到服务端,等待商41万方数据 浙江工业大学硕士学位论文家回应。S7商家将退款打给用户:商家收到商品后,检查商品无误后会将商品退款及运费一起退还给用户。商品退货售后实现过程的效果如图4-6至图4-10所示:图4-6申请退货图4-7等待商家处理图4-8商家处理中图4-9填写物流信息42万方数据 浙江工业大学硕士学位论文图4-10商家收到退货商品4.5.3用户信息管理模块的实现用户信息管理模块主要包含三个部分,分别是用户资料、用户钱包和支付密码设置。用户资料部分可以查看用户头像、昵称和个性签名,还可以对其进行更改,除此之外,还存放用户的收货地址,而用户的收货地址可以添加新的地址、删除地址、更改地址和设置默认地址,方便用户更好地选择。用户钱包部分可以查看用户余额、用户进行交易的收支明细等,在我的钱包页面中有“提现”和“充值”两个按钮,可以实现将余额转入到微信钱包中,从微信中提取部分现金到余额里,方便用户操作。支付密码的设置用于余额付款方式支付,在涉及现金交易的过程中,为确保财产的安全性,需要设置支付密码,如果手机号未绑定,需先绑定手机号,再进行支付密码设置。绑定手机号:输入有效手机号,点击“发送验证码”按钮,向服务端发送验证请求,请求成功后返回对应的验证码,将其验证码输入并点击“提交”按钮,向服务端发送绑定手机请求,请求成功后即完成手机号的绑定。设置支付密码:在成功绑定手机号之后,进入支付密码设置页面,输入支付密码和确认支付密码,点击“提交”按钮,向服务端发送设置支付密码请求,请求成功后即完成支付密码的设置。如图4-11为支付密码设置过程。43万方数据 浙江工业大学硕士学位论文进入用户隐私页面设置支付密码否是否绑定手机号输入有效手机号码,码?发送验证码是填写手机验证码提交到服务器,完成手机进入支付密码设置页号的绑定面填写支付密码和确认支付密码点击“提交”按钮,向服务器发送请求请求成功后完成支付密码发设置图4-11设置支付密码的流程4.5.4积分活动模块的实现在积分活动模块中,可以实现获取积分和积分兑换商品两个功能。获取积分:点击“领积分”按钮,进行签到可以获得5个积分,但每天只能领一次,当完成一次交易后,系统还会根据消费的金额赠送相应的积分。积分兑换商品:用户可以用获得的积分去兑换相应的商品。在积分商城中,不同的商品兑换需要的积分数量不同。当现有的积分不足够兑换所需的商品时,是不能兑换成功的,需要去获得更多的积分才能进行兑换。当积分充足可以兑换商品时,进行兑换时需要填写收货地址,如果没有收货地址,需要去添加收货地址后才能兑换成功。积分兑换商品的流程如图4-12所示:44万方数据 浙江工业大学硕士学位论文进入积分商城点击商品的“兑换”按钮否积分是否充足?不能兑换商品是获得足够的积分弹出提示,点击“确定”按钮否是否有收货地跳转到收货地址址?页面是回到积分商城页面添加收货地址进行兑换商品图4-12积分兑换商品的流程用户已经成功兑换的商品可以在兑换记录中查看到,只需点击“兑换记录”按钮,即可进入兑换记录商品的页面浏览用户所兑换的商品。积分商城页面效果如图4-13所示,兑换商品积分不足的效果如图4-14所示。图4-13积分商城页面图4-14积分不足45万方数据 浙江工业大学硕士学位论文4.5.5商品推荐模块的实现(1)数据准备本文需要的移动商城系统所有用户历史交易数据是由用户订单信息表和订单明细信息表组成。现在很多数据库的软件都支持数据库复制技术,可以采用数据库复制技术,将用户订单表和订单明细表复制到推荐数据库中,通过对订单表和订单明细表联合查询得到某个时间范围内的全部订单号和商品号列表内容,而这些就是所需要的数据。在进行关联规则挖掘之前还需统计交易集的长度、平均交易集的长度。以上数据是为关联规则算法计算作准备的,还有一些数据不用于算法计算,但在数据清洗、商品推荐时需要使用,这些数据是商品信息表、购物车信息表、用户信息表。(2)数据清洗数据的清洗包含:去除没有意义的数据、移除能够确定的噪声数据、根据关联规则挖掘需要的数据格式对数据进行整理。没有意义的数据即是存在数据库中,不会对挖掘结果产生影响,但会降低挖掘的效率的数据,而一次性只购买一件商品订单数据就属于没有意义的数据,可以删除。噪声数据即是存在数据源中,会对挖掘结果产生负面影响的数据,而一次性购买大量的商品的订单就是这类型的数据,也可以删除。数据库中商品的ID、用户的ID、订单的ID等都是int类型,将所有商品的ID以形如I1,I2,I3……In的格式命名。(3)关联规则的挖掘对数据进行清洗整理后成为形如“订单ID号+商品命名编号”的内容文件,将此文件使用第三章研究出的改进Apriori算法进行挖掘。挖掘的步骤:首先对整理的内容文件扫描,对每个命名编号的商品进行二进制编码,编码中的“1”代表出现对应的订单ID号,“0”代表没有出现对应的订单ID编号,并计算每个商品的编码中记录“1”的个数,再由给定的最小支持计数,将不符合条件的商品删除。其次建立(商品编号数-1)行*商品编号数列矩阵,对商品的编码进行两两位“与”运算,并计算“1”个数,将其计算结果填写在对应的矩阵中。将矩阵中所有的非零元素与给定的最小支持计数比较,对于小于最小支持计数的元素清零。其余不为零的则为该数据库的所有2_频繁项集。接着对建立好的频繁矩阵进行处理分析,将所有元素都为零的某一行或者某一列删46万方数据 浙江工业大学硕士学位论文除,对于矩阵中任意F[i,j]不为0的元素,其{Ii,Ij}都是频繁2_项集。如果存在F[i,j]>0,F[j,w]>0,F[i,w]>0,并且Ii、Ij、Ik三者之间的二进制编码的位“与”运算结果得到的‘1’的个数满足给定的最小支持计数,则{Ii,Ij,Ik}候选项集就是满足条件的频繁3_项集,依此类推,可以找出满足最小支持度的频繁n_项集,直到不再产生新的频繁项集为止。最后将找出的商品所有的频繁项集通过求取置信度,再由给定的最小置信度指标进行判断,找出符合条件的所有商品关联规则,其置信度的公式如(2-2)所示。(4)在线推荐将符合条件的商品关联规则结果导入到推荐数据库中,结合用户近期交易记录以及购物车中商品列表,为用户推荐适合的商品,以动态网页方式在购物车页面上的猜你喜欢的列表里展示出来。其商品推荐模块的流程如图4-15所示:导出用户订单信息表和订根据给定的最小置信度结单明细表合频繁项集生成关联规则筛选出订单号和商品号的将关联规则结果导入推荐所有列表数据数据库中清洗数据并完成数据格式找出关联商品通过页面展转换示给用户由改进的Apriori关联算法快速找出所有的频繁项集图4-15商品推荐模块的流程关联商品在页面展示的效果如图4-16所示:47万方数据 浙江工业大学硕士学位论文图4-16关联商品在页面展示的效果4.6本章小结本章主要介绍移动商城系统的设计与实现,首先介绍系统的需求分析,分别从功能性和非功能性两个方面进行分析,接着介绍系统关键技术、系统的技术架构设计和功能模块设计以及数据库的设计,对于系统功能模块的设计,重点讲解,并且详细介绍了商品购买模块、商品退货售后模块、用户信息管理模块、积分活动模块和商品推荐模块的实现过程,而商品推荐模块主要是基于第三章关联规则算法的基础上实现的。48万方数据 浙江工业大学硕士学位论文第5章总结与展望5.1总结本论文主要讲述的是基于关联规则算法的移动商城系统设计与实现,研究的重点是关联规则算法和移动商城系统,移动商城系统除了可以进行在线交易,还为用户设置了积分活动模块,让用户能更好地与系统进行互动;还有退货售后服务,可以让用户更加放心地使用该系统进行交易。通过研究Apriori关联规则算法,对其进行改进,通过实验验证改进的算法的有效性,将其改进的算法应用到移动商城系统中,找出商品的关联规则,再根据用户近期的交易和购物篮的商品信息为用户推荐合适的商品。对于关联规则算法的研究中,首先在第二章介绍数据挖掘技术和关联规则挖掘技术的相关知识;其次深入研究Apriori经典关联规则算法,分析该算法在处理大量数据过程中的存在的局限性;接着在Apriori算法的基础上,提出一种改进的算法,并介绍改进的算法在移动商城系统中的应用以及分析其算法的优势;最后将Apriori算法与改进的算法进行比较,通过选取两种数据集进行实验测试,并验证了改进算法的优势。对于移动商城系统的研究,先对移动商城系统进行需求分析,接着多系统进行总体设计和数据库的设计,最后主要完成了商品购买模块、商品退货售后模块、用户信息管理模块、积分活动模块和商品推荐模块的实现。其中商品推荐属于重点模块,该模块使用第三章提出的Apriori改进算法找出商品的关联规则,结合分析用户的最新交易和购物篮的商品信息,为用户在线实时推荐适合的商品。5.2展望本论文基于关联规则算法的移动商城系统设计与实现中,完成移动商城系统基本功能的设计与实现,对系统功能设计还不够全面细致,有待完善,论文中针对数据挖掘技术侧重研究关联规则算法,并将该算法运用到移动商城系统中,而在数据挖掘中还有很多算法可以挖掘,因此今后研究工作主要从以下几个方面着手:(1)进一步完善并细化系统的功能,如可以添加一些抢购活动、特价活动等,可以增加一些获得积分的途径,使系统提供的服务可以更好的满足用户的需求;(2)增强系统页面的视觉效果,简化操作步骤,加强用户的体验性;49万方数据 浙江工业大学硕士学位论文(3)对关联规则算法再进行深入研究,找出更好的算法,能够更好地为移动商城系统服务,创造更好的价值;(4)研究数据挖掘中的遗传算法、决策树方法、聚类算法等,找出其中的算法是否可应用到移动商城系统中,产生更多实用的商业价值。50万方数据 浙江工业大学硕士学位论文参考文献[1]仲伟伫,席菱聆,武瑞娟.基于ACSI模型的网络购物满意度影响因素实证研究[J].软科学,2014,28(2):100-105.[2]王梦雪.数据挖掘综述[J].软件导刊,2013,12(10):135-137.[3]王元卓,贾岩涛,刘大伟,等.基于开放网络知识的信息检索与数据挖掘[J].计算机研究与发展,2015,52(2):456-474.[4]李涛,曾春秋,周武柏,等.大数据时代的数据挖掘——从应用的角度看大数据挖掘[J].大数据,2015,1(4):57-80.[5]RogersM,RajkumarTM.Developingelectroniccommercewebsitesforthevisuallyimpaired[J].InformationSystemsManagement,1999,16(1):15-25.[6]GruhnV,DubinskyyM.Softwareprocessesforthedevelopmentofelectroniccommercesystems[A].ProcofIEEEInternationalWorkshoponIntelligentDataAcquisitionandAdvancedComputingSystems:TechnologyandApplications[C].Lviv:IEEE,2003:518-522.[7]AldinN,BrehmerP,JohanssonA.Businessdevelopmentwithelectroniccommerce:refinementandrepositioning[J].BusinessProcessManagementJournal,2004,10(1):44-62.[8]KouG,LiuX,PengY,etal.Multiplecriterialinearprogrammingapproachtodatamining:models,algorithmdesignsandsoftwaredevelopment[J].OptimizationMethods&Software,2003,18(4):453-473.[9]YeC,ZhangG.Applicationresearchondataminingmethodsininformationcommunicationmodeofsoftwaredevelopment[A].ProcofInternationalWorkshoponEducationTechnologyandComputerScience[C].Wuhan:IEEE,2011:31-36.[10]JegelevičiusD,LukoševičiusA,PaunksnisA,etal.Applicationofdataminingtechniquefordiagnosisofposterioruvealmelanoma[J].Informatica,2002,13(4):455-464.[11]LeDF,MunteanC,CuggiaM,etal.Predictingsurvivalcausesafteroutofhospitalcardiacarrestusingdataminingmethod[J].StudiesinHealthTechnology&Informatics,2004,107(2):1256-1259.[12]MikutR,ReischlM,BurmeisterO,etal.Datamininginmedicaltimeseries[J].BiomedizinischeTechnik/biomedicalEngineering,2006,51(51):288-293.[13]PattanaikS,GhoshPP.Roleofdataminingine-paymentsystems[J].EprintArxiv,2010,7(2):262.[14]ZhangL,ZhangJL.Associationrulesminingalgorithmbasedonlinkedlist[J].AppliedMechanics&Materials,2013,380:1649-1651.[15]TanJ.Weightedassociationrulesminingalgorithmresearch[J].AppliedMechanics&Materials,2012,241:1598-1601.[16]WanaskarU,VijS,MukhopadhyayD.Ahybridwebrecommendationsystembasedontheimprovedassociationruleminingalgorithm[J].JournalofSoftwareEngineering&Applications,2014,06(8):32-36.[17]KaurM,KangS.Marketbasketanalysis:identifythechangingtrendsofmarketdatausingassociationrulemining[J].ProcediaComputerScience,2016,85:78-85.51万方数据 浙江工业大学硕士学位论文[18]YiSL.PotentialconstructiveproposalforChinesemobilee-commerce[A].ProcofInternationalConferenceonFuzzySystemsandKnowledgeDiscovery[C].Sichuan:IEEE,2012:2198-2202.[19]MuniandyM,EeWK.User'sperceptionontheapplicationofhapticsinmobilee-commerce[A].ProcofInternationalConferenceonResearchandInnovationinInformationSystems[C].KualaLumpur:IEEE,2013:91-96.[20]谢姝君.中国移动电子商务的发展现状及机遇[J].电子商务,2015(9):8-9.[21]王海燕,王慧颖.数据挖掘研究进展及其发展趋势[J].科技广场,2009(9):237-238.[22]AlmasoudAM,Al-KhalifaHS,Al-SalmanA.Recentdevelopmentsindataminingapplicationsandtechniques[A].ProcofTenthInternationalConferenceonDigitalInformationManagement[C].Jeju:IEEE,2015:36-42.[23]DeepaVK,GeethaJRR.Rapiddevelopmentofapplicationsindatamining[A].ProcofIEEEInternationalConferenceonGreenHighPerformanceComputing[C].Nagercoil:IEEE,2013:1-4.[24]闫燕.数据挖掘在中国的现状和发展分析[J].科技信息,2014(5):292-292.[25]李明江,唐颖,周力军.数据挖掘技术及应用[J].中国新通信,2012(22):66-67.[26]刁宇峰.关于数据挖掘技术的研究现状及发展方向分析[J].信息化建设,2016(6):116.[27]ChenX,LuoY,ZhuF.TheApplicationofdatamininginFFEofthefashionproductdevelopment[A].Procofthe2010InternationalSymposiumonComputationalIntelligenceandDesign[C].Hangzhou:IEEE,2010:215-217.[28]PrasadY,ReddyKR.Dataminingwithbigdata[J].IEEETransactionsonKnowledge&DataEngineering,2014,26(1):97-107.[29]AhmedS,PaulR,HoqueASML.Knowledgediscoveryfromacademicdatausingassociationrulemining[A].ProcofInternationalConferenceonComputerandInformationTechnology[C].Dhaka:IEEE,2014:314-319.[30]张剑凯,齐金平.关联规则在移动电子商务推荐系统中的应用[J].信息技术与信息化,2013(5):109-111.[31]杨秀萍.大数据下关联规则算法的改进及应用[J].计算机与现代化,2014(12):23-26.[32]方炜炜,杨炳儒,宋威,等.基于布尔矩阵的关联规则算法研究[J].计算机应用研究,2008,25(7):1964-1966.[33]DhandeKA,UmaleJS,KulkarniPA.Contextbasedtextdocumentsharingsystemusingassociationrulemining[A].ProcofIndiaConference[C].Pune:IEEE,2014:1-6.[34]ZulkarNineMSQ,AzadMAK,AbdullahS,etal.Applicationofassociationruleminingforreplicationinscientificdatagrid[A].ProcofInternationalConferenceonElectricalandComputerEngineering[C].Dhaka:IEEE,2014:345-348.[35]王培吉,赵玉琳,吕剑峰.基于Apriori算法的关联规则数据挖掘研究[J].统计与决策,2011(23):19-21.[36]张玺.数据挖掘中关联规则算法的研究与改进[D].北京:北京邮电大学,2014.[37]谭晓林,谢伟,李培馨.电子商务模式的分类、应用及其创新[J].技术经济,2010,29(10):6-11.[38]KwanR,LakeD.Onassociationrulesmininginthecontextofwirelessnetworks[A].ProcofComputerScienceandElectronicEngineeringConference[C].Colchester:IEEE,2015:111-116.[39]SoniKK,AgrawalJ,SharmaS,etal.Associationruleminingbasedondensityandregionalminimum52万方数据 浙江工业大学硕士学位论文support[A].ProcofFifthInternationalConferenceonCommunicationSystemsandNetworkTechnologies[C].Gwalior:IEEE,2015:968-975.[40]郭涛,张代远.基于关联规则数据挖掘Apriori算法的研究与应用[J].计算机技术与发展,2011,21(6):101-103.[41]付沙,周航军.关联规则挖掘Apriori算法的研究与改进[J].微电子学与计算机,2013(9):110-114.[42]ZhangW,MaD,YaoW.Medicaldiagnosisdataminingbasedonimprovedapriorialgorithm[J].JournalofNetworks,2014,9(5):1339-1345.[43]AsifM,AhmedJ.Analysisofeffectivenessofaprioriandfrequentpatterntreealgorithminsoftwareengineeringdatamining[A].ProcofInternationalConferenceonIntelligentSystems,ModellingandSimulation[C].KualaLumpur:IEEE,2015:28-33.[44]LiT,LuoD.ANewImprovedAprioriAlgorithmBasedonCompressionMatrix[M].Berlin:SpringerInternationalPublishing,2014.[45]张增敏,谢嘉.基于数据挖掘技术的B2C电子商务系统研究与实现[J].山东农业大学学报自然科学版,2011,42(3):451-455.[46]DuP,SongY,DengL.Areal-timecollaborativeframeworkfor3DdesignbasedonHTML5[A].ProcofInternationalConferenceonComputerSupportedCooperativeWorkinDesign[C].Nanchang:IEEE,2016:215-220.[47]黄永慧,陈程凯.HTML5在移动应用开发上的应用前景[J].计算机技术与发展,2013,23(7):207-210.[48]李慧云,何震苇,李丽,等.HTML5技术与应用模式研究[J].电信科学,2012,28(5):24-29.[49]黄磊,张媛.HTML5新特性在移动平台中的应用研究[J].数字技术与应用,2015(9):102.[50]平淑文,潘珏羽,张学金,等.基于HTML5和JavaScript轻量型动画框架开发[J].计算机技术与发展,2013(12):5-10.[51]PhilipsL,MeuterWD,RooverCD.Poster:tierlessprogramminginJavaScript[A].ProcofIEEEInternationalConferenceonSoftwareEngineering[C].Florence:IEEE,2015:831-832.[52]李昕煜.基于JavaScript的WebGIS前端开发及优化[D].长春:吉林大学,2015.[53]王玄玄.浅谈JQuery如何控制页面[J].中国科技信息,2015(15):80-81.[54]熊文,熊淑华,孙旭,等.Ajax技术在Web2.0网站设计中的应用研究[J].计算机技术与发展,2012,22(3):145-148.[55]DissanayakeNR,DiasGKA.BestpracticesforrapidapplicationdevelopmentofAJAXbasedrichInternetapplications[A].ProcofInternationalConferenceonAdvancesinICTforEmergingRegions[C].Colombo:IEEE,2014:63-66.[56]韦鲲鹏,葛志辉,杨波.PHPWeb应用程序上传漏洞的攻防研究[J].信息网络安全,2015(10):53-60.[57]权治,宋晶晶.基于PHP的动态网站研究与实现[J].计算机与网络,2015,41(11):52-55.[58]Sa'AdahU,AkhmadJ,HisyamM.ImplementingsingletonmethodindesignofMVC-basedPHPframework[A].ProcofElectronicsSymposium[C].Surabaya:IEEE,2015:212-217.[59]李容.基于MVC模式的Web应用研究[J].软件导刊,2010,09(1):19-21.[60]AnzuresgarciaM,SanchezgalvezLA,HornosMJ,etal.MVCdesignpatternbased-developmentofgroupware[A].InternationalConferenceinSoftwareEngineeringResearchandInnovation[C].Puebla:53万方数据 浙江工业大学硕士学位论文IEEE,2016:71-80.[61]李军军,傅宏,张丽,等.基于MVC模式的Web框架设计关键技术研究[J].电脑知识与技术,2011,07(4):2308-2309.54万方数据 浙江工业大学硕士学位论文致谢在整个研究生的学习期间以及论文的写作上,对于给予我帮助的老师,同学以及家人,在此表达我真挚的感谢。首先我要感谢我的导师何熊熊教授。何老师在我的研究生期间,在学业和生活上都给予我帮助和指导,让我能及时找准自己的研究方向并专注钻研擅长的行业,还有何老师对待科研的专注和严谨态度,深深影响着我,激励着我向更优秀的自己前进。感谢何老师对我的论文创作提出的宝贵建议以及后期的指导。其次我要感谢的是研究生期间去实习的公司的领导和同事,谢谢他们提供我又一个学习的平台,教我很多技术上的知识,在论文的创作上提供了很多资源,让我在论文的写作上受益颇多。再次我要感谢我研究生期间的师兄师姐们还有同学,在学业和生活上给予我帮助,让我的研究生的生活变得多彩,尤其对毕业论文提出的宝贵意见,对我受益匪浅。最后我要感谢我的家人,虽然身在异地,与家人在一起的时间甚少,但对我的生活和学业也经常关注,给予我关心和支持。55万方数据