基于云计算的海量数据挖掘研究

基于云计算的海量数据挖掘研究

ID:21791483

大小:24.50 KB

页数:5页

时间:2018-10-24

基于云计算的海量数据挖掘研究_第1页
基于云计算的海量数据挖掘研究_第2页
基于云计算的海量数据挖掘研究_第3页
基于云计算的海量数据挖掘研究_第4页
基于云计算的海量数据挖掘研究_第5页
资源描述:

《基于云计算的海量数据挖掘研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于云计算的海量数据挖掘研究  摘要随着互联网的快速普及,以及移动互联网和智能终端设备的广泛使用,产生了大量的互联网数据。云计算和大数据技术应运而生。近年来,每年产生的海量数据是20世纪末期十几年数据的总和,这些数据冗杂。为了更好的提升数据分析质量和数据挖掘效率,加强基于云计算数据挖掘的研究与计算机方针意义重大。仿真技术的应用极大优化了数据挖掘的工艺流程。本文浅析了研究基于云计算海量数据的必要性,针对海量数据挖掘研究的主要方法,提出了研究基于云计算的海量数据挖掘基本原则。  【关键词】云计算数据挖掘

2、研究原则计算仿真  云存储技术和大数据技术的发展使得海量数据的挖掘极具现实意义和指导意义。对于电子商务而言,海量数据挖掘可以了解不同消费者的消费习惯和消费原则。对这些大数据的云计算可以帮助商家更好的为消费者提供电子商务服务。对于各行各业,基于云计算海量数据的挖掘研究,需要正确的研究方法和挖掘手段的使用。深度挖掘有效提升了挖掘的质量和挖掘效率,对于海量数据的信息筛选作用效果明显。  1研究基于云计算海量数据挖掘的必要性  1.1有利于获得网络价值信息  网络数据之间存在一定的弱关联性,通过网络数据有价

3、值信息的筛选和分析,有利于更好的发展互联网网络和服务水平。当然,由于互联网网络平台准入门槛较低,充斥着大量的网络垃圾信息。云计算技术是以大数据为依托,结合相关数学模型仿真,实现网络数据的高效管理。研究数据挖掘可以从海量信息中提取最有价值的网络数据和相关信息。  1.2有利于提升信息获取效果  互联网的快速普及,应用在各行各业,极大改变了不同行业的经营模式和运作效率。对于互联网用户而言,互联网数据蕴含了自身的网络行为和思想。一些行业为了不断提升网络平台的服务质量,做到“投其所好”,就要在第一时间识别出

4、网络用户的基本用网习惯和用网需求。借助云计算数据挖掘,可以让不同行业在最短时间获取相关信息,提升获取效率。  1.3有利于推动大数据技术应用  大数据技术的应用需要云存储技术和大数据管理技术呈现匹配性的发展。大数据技术的核心任务之一,就是利用对海量网络信息的数据挖掘,理清数据之间的弱关联性,并不断提升网络数据的管理质量。云计算是一种以计算仿真为实现手段的信息处理形式,研究基于云计算的海量数据挖掘,有利于推动大数据技术应用,实现大数据技术的系统化发展。  2基于云计算海量数据挖掘研究的主要方法  2.

5、1数据关联性挖掘法  在对云计算环境下的海量数据进行价值提取与细节分析时,关联性数据挖掘,可以将发散的网络数据集中化。弱关联挖掘法一般分为三个步骤:首先,确定挖掘数据的范围,收集所要处理的数据对象。明确关联性研究的属性。其次,海量数据的预处理。对数据进行噪声处理,保障挖掘数据的完整性和真实性,将预处理结果保存在挖掘数据库中。最后,塑造训练的数据挖掘。利用排列组合进行实体阈值分析。  2.2数据模糊性学习法  模糊性学习法是一种重要的数据挖掘方法,其挖掘原理就是假设云计算平台下存在一定数量的信息样本,

6、对任意一个样本进行指标描述,计算所有样本的标准差,实现数据的高度压缩与挖掘价值信息操作。数据模糊性学习法应用在海量数据的挖掘的关键是模糊录属函数的筛选与确定,进而实现基于云计算的海量数据挖掘价值信息的模糊化实际操作。网络数据的结点信息需要在激活的条件下收集。  2.3Apriori计算挖掘法  基于云计算海量数据挖掘方法的主要形式之一就是Apriori算法基础上的数据挖掘。与其他算法不同,Apriori算法最大的技术优势在于可以有效避免海量数据的复杂性和冗繁性带来的数据挖掘算法收敛性较差的缺陷。利用

7、计算仿真模拟,在节省投入成本的前提下,大大提升了海量数据的挖掘速度。  3基于云计算的海量数据挖掘的基本原则  3.1准确性原则  云计算为数据挖掘提供了平台,对于海量数据的挖掘,特别是深度挖掘,挖掘结果的准确性直接影响数据的后期使用,对于互联网后期的优化意义重大。在基于云计算的海量数据挖掘,无论采取何种方法和算法,必须保障数据分析结果的准确性。一方面,验证挖掘方法选择的准确性和匹配性。另一方面,通过不同数据挖掘手段,对最后结果进行偏差分析,已找到影响准确性的关键因素。  3.2便捷性原则  云计算

8、平台主要借助计算机进行计算仿真和挖掘程序运算。对于海量数据的挖掘分析需要具备的便捷性。一方面,基于云计算平台海量数据挖掘的流程要在实践分析过程中不断优化流程,提升挖掘的时间效率。另一方面,数据挖掘的方法和手段的选择要具有可控性强的特点。利用人力和财力的投入,可以实现海量数据的便捷挖掘,避免操作过难对数据挖掘任务的延迟。  3.3安全性原则  由于互联网信息需要包含个人的基本真实信息。对于云计算海量数据挖掘的安全性直接影响被挖掘海量数据在云计算平台的安全性。近几年来,一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。