基于多核集群的电子商务应用并行化研究

基于多核集群的电子商务应用并行化研究

ID:32732397

大小:4.25 MB

页数:50页

时间:2019-02-15

基于多核集群的电子商务应用并行化研究_第1页
基于多核集群的电子商务应用并行化研究_第2页
基于多核集群的电子商务应用并行化研究_第3页
基于多核集群的电子商务应用并行化研究_第4页
基于多核集群的电子商务应用并行化研究_第5页
资源描述:

《基于多核集群的电子商务应用并行化研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学位论文独创性声明IIIIIIIIIIIIIIiiIIIIIIIIIIIIIY2376677本人承诺:所呈交的学位论文是本人在导师指导下所取得的研究成果。论文中除特别加以标注和致谢的地方外,不包含他人和其他机构已经撰写或发表过的研究成果,其他同志的研究成果对本人的启示和所提供的帮助,均已在论文中做了明确的声明并表示谢意。学位论文作者签名:刍塑&学位论文版权的使用授权书本学位论文作者完全了解辽宁师范大学有关保留、使用学位论文的规定,及学校有权保留并向国家有关部门或机构送交复印件或磁盘,允许论文被查阅和借阅。本文授权辽宁师范大学,可以将学位论文的全部或部分内容编入有关数据库并

2、进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后使用本授权书。学位论文作者签名:刍斑指导教师签名:签名日期:油f3年o/.,目17H辽宁师范大学硕士学位论文摘要并行计算的出现为单机时代计算瓶颈带来了划时代的解决方案,同时带动了并行集群的发展。如今随着计算机集群的逐步发展,并行平台的种类也逐渐增多,各个平台有特有的并行优势。云计算是一种基于因特网的超级计算模式,它将计算任务分割分布在大量计算机构成的集群上,获取超强计算能力、存储空间和信息服务,是目前最为流行的计算模式。近年来,电子商务市场从

3、卖家市场转向买家市场,促使电商之间激烈的竞争。客户关系维系是企业发展的立足点,是企业盈利的前提。企业想要对客户进行准确的分析就要对客户进行分类,传统的分类方法是基于经验归类或简单统计的方法,然而在面对海量数据时,单机计算能力举步维艰。本文针对此,将并行计算的思想引入到电子商务客户分类研究领域来解决上述问题。设计了多数据表关联算法对数据进行预处理,把从电子商务网站上获得的商品信息和历史交易记录中的数据关联在一起,转换成适合数据挖掘的形式。同时设计了客户分类方法,选取FCM模糊聚类算法对预处理后的客户数据分析。数据表关联的传统方式是使用本地并行数据库,但面临多个因特网下的海量

4、数据表关联时力不从心。云计算模式的Hadoop集群能解决因特网下的海量数据表关联问题,Hadoop集群的高效性适用于大型数据密集型任务的计算,应用于诸多领域。本文基于Hadoop集群实现了多个海量数据表的关联,并对实验数据进行详尽对比,对比结果表明Hadoop集群的高性能性在处理海量数据表连接方面有明显的并行效率。数据预处理之后的数据分析中,选取了多元统计分析中应用广泛的FCM模糊聚类分析算法对客户数据分类。与传统的基于经验或简单统计的分类方法相比,拓宽了指标体系,由单一指标拓宽到客户消费模式多个指标。以凡客诚品的交易数据为例进行试验,按照客户消费模式将客户分为四类:优质

5、客户、一般客户、小客户及潜在客户。实验结果验证了FCM算法对数据聚类效果及MATLAB多核并行集群在并行处理复杂算法的高效性。本文设计的方法可以运用到金融领域的大规模数据处理及客户分类分析中,具有一定的应用价值。关键词:并行计算;云计算;Hadoop集群;MATLAB集群;海量数据表关联;电子商务客户分类基于多核集群的电子商务应用并行化研究E-commerceapplicationsbasedonmulti-coreclusterparallelizationAbstract刀搀emergenceofparallelcomputingbroughtepoch—making

6、solutionstostandalonecomputingerabottleneck,whichalsodriventheparallelclusterdevelopment.Nowadays,诹tllthedevelopmentofcomputerclusters,parallelplatformtypesgraduallyincreased,eachplatformhasuniqueadvantagesinparallel.CloudcomputingisanIntemet-basedsuper-computingmodel,whichsplitdistribute

7、dcomputingtasksonthecomputercluster,getsuper-computingpower,storagespaceandinformationservices.Itisthemostpopularcalculationmode.Forthepastfewyears,thee-commercemarketfromsellersmarkettobuyersmarket,promptingaratracebetweenelectricitysuppliers.Customerrelationshipis

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。