欢迎来到天天文库
浏览记录
ID:53029987
大小:946.20 KB
页数:3页
时间:2020-04-14
《基于云平台的并行关联规则挖掘算法分析-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2015年6月1日现代电子技术Jun.2015第38卷第11期ModernElectronicsTechniqueVo1.38No.11基于云平台的并行关联规则挖掘算法分析穆俊(临沧师范高等专科学校信息科学与技术系,云南临沧677000)摘要:自云计算技术出现之后,数据挖掘技术取得了突破性发展。数据挖掘系统不仅实现了低成本、高效率运行,并且系统储存空间和系统可扩展性也在不断扩大,大大提高了数据挖掘效率。这里简要阐述了基于云平台的并行关联规则挖掘算法分析的研究意义,并对基于Hadoop的数据挖掘系统和数据算法设计进行了详细介绍。关键词:数据挖掘;关联规则;云平台;Hadoop中图分类号:
2、TN702—34;TP391文献标识码:A文章编号:1004·373X(2015)11-0123—03AnalysisofparallelassociationruleminingalgorithmbasedoncloudplatformMUJun(DepartmentofInformationScienceandTechnology,LincangTeachers’College,Lincang677000,China)Abstract:Abreakthroughdevelopmentofdataminingtechnologieswasacquiredaftercloudcompu
3、tingtechnologyap—peared.Thedataminingsystemrealizestheoperationoflowcostandhighefficiency,andexpandssystem’sstoragespaceandscalabilitygradually,SOdataminingefficiencyisimprovedgreatly.Inthispaper,researchsignificanceofparallelassociationruleminingalgorithmbasedoncloudplatformisexpoundedbriefly,d
4、ataminingsystemanddataalgorithmdesignbasedonHa—doopareintroducedindetail.Keywords:datamining;associationrule;cloudplatform;Hadoop随着计算机网络技术、信息技术以及无线通信技术用价值的信息或者是知识,然后对这些信息或者是知识在各个领域和各个行业中的应用,数据库也得到了广泛进行整理和分析的过程。一直以来,在对数据信息和应用,并且其所积累的数据量也越来越大,几乎都达到知识进行挖掘的过程中,所采用的都是依靠大规模计算了TB级,甚至,有一些数据量已经达到了PB级。由于机
5、和数据挖掘设备对海量数据中的有效信息和知识进这些数据都相对比较复杂,属于异构结构,并且这些数行挖掘和分析,这种数据挖掘方式,虽然也能够对数据据大多有噪声,数据量巨大,所以很难被直接利用。因信息和知识进行有效挖掘和分析,但是这种数据挖掘方此,通过高效率、低成本的挖掘方式将有用的数据信息法比较繁琐,过程比较复杂,并且成本也比较大,不利于从这些数据中挖掘出来进行有效利用,成为当前数据挖普及应用。而基于云平台的并行关联规则挖掘技术,则掘技术领域最为重要的研究课题。一直以来,虽然相关为数据挖掘技术的提升带来了新的解决方案,通过计算研究人员都致力于对这些数据挖掘技术的研究,但是由机网络技术、信息技
6、术以及无线网络通信技术的结合,于受到科学技术以及自身技术水平等方面因素的限制,实现了数据挖掘和计算的虚拟化。。与传统数据挖掘一直没有研究出有效的解决方案,而云计算的出现,则为和计算技术相比,基于云平台的云计算技术具有更加强数据挖掘技术的研究带来了突破。本文对基于云平台的大的计算能力和更加庞大的储存空间,并且由于实现了并行关联规则挖掘算法进行详细分析,为进一步提升数数据挖掘和计算的虚拟化,其运行成本更低,灵活性更据挖掘技术水平提供科学有效的参考依据。强。可以说,云计算的出现,实现了海量数据挖掘和计1数据挖掘算的改革创新,使企业能够利用更低的成本获取更加有价值的数据信息,这对于提升企业决策
7、的合理性和科学数据挖掘也被称为是数据库中的知识发现(Know1.性,进一步提升企业的经济效益,推动企业更好、更快发edgeDiscoveryinDatabases,KDD),主要指的是从大量展具有极为重要的影响作用。的、有噪声的、异构的和复杂的海量数据中挖掘出有利对于任何一个企业来说,如果能够从海量数据中挖掘出有利用价值的信息,并能够对这些信息进行有效分收稿日期:2014.12.05析和整理,就能够为企业的决策带来强有力的支持,使基金项目:云南
此文档下载收益归作者所有