欢迎来到天天文库
浏览记录
ID:48005915
大小:822.05 KB
页数:1页
时间:2019-07-09
《数据挖掘在中国的现状和发展分析_闫燕.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、2014年第5期SCIENCE&TECHNOLOGYINFORMATION○百家论剑○科技信息数据挖掘在中国的现状和发展分析闫燕(1.河北大学数学与计算机学院,河北保定071002;2.石油物探学校,河北涿州072750)【摘要】数据挖掘作为人工智能与数据库分析研究的新领域,近些年来,数据挖掘技术理论和应用研究得到了进一步的发展,并引起了国内外研究人士的高度关注。而随着计算机对数据的采集、处理、存储能力的不断提高,数据量也在不断增加,传统数据分析工具难以满足现如今的数据处理需求,数据挖掘技术在这种形势下诞生
2、了。中国科研人员对数据挖掘进行几年的研究,并在理论研究与实际应用方面获得了一定的成绩,但是相关数据挖掘技术成功的应用还是偏少。笔者从阐述数据挖掘技术的相关概念入手,分析了数据挖掘在我国的研究现状,并探讨了数据挖掘在我国未来的发展方向。【关键词】数据挖掘技术;分析研究;分支方向;发展意见0引言教授所领导的研究小组参与了亚太数据挖掘的国际会议,并在数据挖掘编程大赛中获得了冠军;中国香港大学的电子商业科技研究院的黄数据挖掘作为一门交叉性的学科是现阶段全球范围内数据库、信哲学教授所发表的论文获得了亚太数据挖掘国际会
3、议论文大奖[4]。息决策系统以及数据仓库领域中最前沿的研究趋势,引起了国内外许多领域的科研人员与工商界的高度关注。数据挖掘最早出现在20世3数据挖掘在我国的未来发展方向纪的80年代后期,并在90年代初期得到了飞速发展。现如今,数据挖3.1目前,数据挖掘已经成为了计算机界科学领域的一大亮点。对于掘技术已经被广泛运用到各个领域中,其中一些典型性应用有加州理数据挖掘以及知识发现的研究热度在不断增加,它们的研究和开发总工学院的喷气推进实验室和天文学家工作研发的SKLCAT等系统,可体水平也在不断提升。预计在21世纪
4、,数据挖掘和知识的研究将会形以协助天文学家观察到遥远的类星体。这些都属于人工智能技术在空成新的高潮,而研究的焦点可能会集中在以下五个方面。其一,发现数间技术以及天文学方面的成功应用。数据挖掘技术在我国社会发展中据语言的形式化描述,即分析研究专用在知识发现中的数据挖掘语也有一定的实际应用。本文针对数据挖掘在我国的研究现状与未来发言,也可能会和SQL语言一样朝着标准化与形式化的方向发展。其展方向进行研究,为加强数据挖掘技术在我国的发展提供参考资料。二,寻找数据挖掘中的可视化方式,使得用户能够理解知识发现的实1数
5、据挖掘技术的相关概念际过程,也便于在实际的知识发现中顺利完成人机交互工作。其三,针对计算机网络环境下的数据挖掘技术进行研究,尤其是在Internet上数据挖掘指的是从不完整的、大量的、存在噪音污染的、模糊的、建立数据挖掘服务器,并和数据库中的服务器进行有效地配合。其四,随机的应用数据中,提取隐藏在其中不为人知的、却具有潜在作用的强化对所有非结构化数据资料的开采,例如,图形数据、文本数据、声知识与信息的一个过程。人们将数据视为形成知识的根源,原始数据音数据、视频图像数据以及综合多媒体数据等非结构化数据的开采。
6、是可以结构化的,例如,关系数据库中存储的数据文本、图形或是图像其五,维护隐私权益方面的研究。数据挖掘能够从不同角度与层次上数据等,甚至是分布于计算机网络上的异构型数据可以结构化。数学来考虑数据,这将会对数据的安全性与私密性产生一定的影响。因此型、非数学型可以作为发现知识的实际方式,也可以是演绎方式或者在如何维护隐私权益的基础上,对数据挖掘进行充分的研究也是未来归纳方式。知识的发现能够被用于数据信息的管理,优化查询、支持决的发展重点[5]。策以及对过程的控制,还能够用于数据信息自身的维护和管理。数据3.2通过
7、对数据挖掘在我国的现状研究,不难发现我国已经对数据挖掘和传统型分析之间的本质区别在于数据挖掘是在没有明确假设挖掘进行了较为全面的研究,并获得了一定的研究成果。为了促进数条件的基础上挖掘信息,并发现知识[1]。据挖掘在我国的基础理论研究和实际应用,笔者有一下几点考虑。其数据挖掘所获得的信息具备了:先未知、可实用以及有效性等显一,加大对复杂型数据挖掘技术的研究力度,现阶段数据挖掘所处理著特征。数据挖掘并不是为了代替传统的分析统计技术,相反的,数据的数据类型从简单的结构化数据朝着复杂的半结构化数据方向发展,挖掘是
8、传统分析统计方法学的扩展。数据挖掘使得数据库技术进入了并从单维和低维已经上升为高维、多维。其二,加强对人机交互能力解一个更为高级的发展阶段,它能够查询以往的数据,也可以找到以往释机制的完善。应该将用户所需要解决的具体问题转化成数据挖掘工数据间的潜在联系,进而推动数据信息的传播。作人员可以理解并能够解决的问题,将挖掘的结果以用户能够理解的2数据挖掘技术在中国的研究现状形式表达出来。对于算法的研究主要应趋向于易理解、
此文档下载收益归作者所有