欢迎来到天天文库
浏览记录
ID:53075924
大小:185.54 KB
页数:2页
时间:2020-04-16
《数据挖掘研究现状及发展趋势-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第3O卷第9期(下)赤峰学院学报(自然科学版)V0I.30No.92014年9月JournalofChifengUniversity(NaturalScienceEdition)Sep.2014数据挖掘研究现状及发展趋势张莉(合肥工业大学,安徽合肥230009;淮北职业技术学院,安徽淮北235000)摘要:随着网络技术的不断迅速发展,大型数据库开始不断出现,而如何从大量数据中获取有特定意义的知识成为了当前技术需要解决的重要问题,由此出现了数据挖掘这种新型的信息处理技术.主要从数据挖掘概念出发,介绍了数据挖掘中的几种比较常见的处理方法的
2、概念与特点;同时也详细的总结了当前情况下在这一方面的研究现状,并最终指出了该技术在未来几年的发展方向.关键词:数据挖掘;信息处理;发展方向中图分类号:TP181文献标识码:A文章编号:1673—260X(2014)09—0014—021引言现在运用在数据挖掘技术中的具体算法包含有神经网随着信息时代的到来,科学技术不断进步,网络新技术络算法、决策树算法、遗传算法、关联规则等算法,下面对这不断出现,社会生活中的各行各业都积累大量的数据,形成些具体的算法进行简单的介绍.了大数据仓库.而在这些有大量数据组成的大数据仓库中需2.1神经网络法要通
3、过利用一定的发现方法来对其中对企业或者社会的发神经网络法实际上可以认为是一种通过训练学习得来展有意义的信息进行发现,以往的信息挖掘的方式一般通的非线性预测模型,这一模型的建立是在对生物的神经系过信息检索或者数理统计的方法,但是这样大数据量的条统结构及其功能的模仿的基础之上的,这一模型能够实现件很难得到希望的结果,因此我们就迫切的需要可以自动多种数据挖掘的任务,比如说数据分类分析、数据聚类、特地或者智能地把这些等待处理的数据信息转换成为有意义定条件的数据挖掘等,其主要的学习方式在权值的修改上的参考信息,而为企业进行决策服务【1_.就是在
4、这样一种环境有着明显的体现.利用神经网络法的最为主要的特点就是具下,一种崭新的技术即数据挖掘技术(简称DM技术)开始有较强的抗干扰性、适应范围广,另外一个较为显著的优点发展起来.就是有着联想记忆的能力;但是也存在着一定的缺点,就是DM是一种涉及到多学科领域的信息处理技术,其不仅在处理高维变量过程中预测结果不会那么精确,也不可以仅融合了数据库的技术,同时也结合了许多当今时代最新直接查看其中间学习的具体过程.在实际应用中神经网络法的研究成果.本文主要对数据挖掘应用中采用的比较重要的一般情况下应用于DM的聚类技术中[21.算法及其缺点进行一
5、一介绍,并对当前数据挖掘领域的国2.2遗传算法内外研究现状进行了细致的总结与叙述,最终指出了数据应用于数据挖掘过程中的遗传算法是机器学习方法,挖掘领域的发展趋势及主要问题所在.这一方法是以达尔文的生物进化理论作为理论基础.根据生2数据挖掘相关算法物进化理论中的“适者生存”的思想,其最为突出的好处在简单的说所谓的数据挖掘是指从数据信息仓库中提取于能够处理几乎所有形式的数据,而且也能够采用并行的出有意义、能够对企业决策提供参考的知识,而这一数据仓方式来处理不同形式的数据,并对数据具有较强的适应性;库一般情况下会具有数据量大、含有噪声、模糊
6、、随机等特不足之处在于实现过程中所需的参数太多,编码过程困难,点.利用图形来表示数据挖掘过程如图1所示.计算量大等.在实际应用中一般用遗传算法解决其他技术不能解决的问题.日吨囤一目+园-因唧E2.3关联规则算法图1数据挖掘过程关联规则主要认为是发现事物与事物的相互依赖关系如上图所示,其数据挖掘的过程主要包含的步骤是,首及其相互的关联性.在对数据中的关联规则挖掘过程中存在先进行在大量数据中进行目标数据的提取,在提取出有效着2个重要的参数,即最小支持度以及最小可信度.从这一数据之后,要对这些原始数据进行去噪等数据处理操作.之方面的数据挖掘
7、的意义而言,数据挖掘的最终目的便是要后对数据进行转换处理,比如说连续的数据转换成离散的从源数据库中提取能够符合以上提到的两种参数要求的关数据,或者把离散的数据转化成连续的数据;最终采用数学联规则.的或者非数学的方法对数据中存在的知识进行提取;在完3研究现状成了知识提取之后,由于其最终面向的是客户,所以必须对3.1国外研究现状得到的知识进行解释和评价处理.知识发现(简称KDD)和数据挖掘(简称DM)在当今的一l4一这一方面研究领域中已经逐渐成为了最为重要的研究方向近年来,随着这方面研究的不断深入,数据挖掘技术也之一.知识发现技术的概念是
8、在美国上世纪八十年代末一次已经在社会中的各个方面都得到了广泛的应用[6],比如说人工智能会议上提出的.之后在二十世纪九十年代中期在蒙商业、医学、科学研究等各个方面都存在着很多的应用数据特利尔的第一届知识发现与数据挖掘国际
此文档下载收益归作者所有