数据挖掘在中国的现状和发展研究_bi_管理信息化_1848

数据挖掘在中国的现状和发展研究_bi_管理信息化_1848

ID:11778437

大小:47.00 KB

页数:13页

时间:2018-07-14

数据挖掘在中国的现状和发展研究_bi_管理信息化_1848_第1页
数据挖掘在中国的现状和发展研究_bi_管理信息化_1848_第2页
数据挖掘在中国的现状和发展研究_bi_管理信息化_1848_第3页
数据挖掘在中国的现状和发展研究_bi_管理信息化_1848_第4页
数据挖掘在中国的现状和发展研究_bi_管理信息化_1848_第5页
资源描述:

《数据挖掘在中国的现状和发展研究_bi_管理信息化_1848》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据挖掘在中国的现状和发展研究_BI_管理信息化0引言   近年来,随着计算机对数据的生成、收集、存贮和处理能力的大大提高,数据量与日俱增,传统的数据分析工具对海量数据的处理力不从心,数据挖掘技术应运而生。   中国科研工作者近几年来积极开展了对数据挖掘的研究,并在理论研究和实际应用上取得了一定的成绩,但是有关数据挖掘的成功应用还比较少。本文通过对中国有关数据挖掘研究文章数量的统计,对数据挖掘在中国发展的现状及发展趋势进行分析和研究,通过分析有关论文的发表,对数据挖掘在中国的理论研究和实际应用提出建议。1数据挖掘的应用与研究发展   数据挖掘是指从存放在

2、数据库、数据仓库或其他信息库中的大量数据中挖掘有用知识的过程。数据挖掘是一门新兴的边缘学科,近年来引起了中国学术界和产业界的广泛关注。   数据挖掘出现于20世纪80年代后期,90年代有了突飞猛进的发展。2001年,GartnerGroup的一次高级技术调查将数据挖掘和人工智能列为“未来三到五年内将对工业产生深远影响的五大关健技术”之首,并且还将并行处理体系和数据挖掘列为未来五年内投资焦点的十大新兴技术前两位。美国麻省理工学院在2001年1月份的《科技评论》(TechnologyReview)提出将在未来5年对人类产生重大影响的10大新兴技术,其中第3项

3、就是数据挖掘。   数据挖掘技术已被广泛的应用于各个领域,其中一些典型应用如加州理工学院喷气推进实验室与天文科学家合作开发的SKICAT系统,能够帮助天文学家发现遥远的类星体,是人工智能技术在天文学和空间科学上的第一批成功应用之一;生物学研究中用数据挖掘技术对DNA进行分析利用数据挖掘技术识别顾客的购买行为模式,对客户进行了分析;对银行或商业上经常发生的诈骗行为进行预测IBM公司开发的AS(AdvancedScout)系统针对NBA的数据,帮助教练优化战术组合等。   数据挖掘技术汇集了来自机器学习、模式识别、数据库、统计学以及管理信息系统等学科的成果。

4、多学科的相互交融和相互促进,使得数据挖掘这一新学科得以蓬勃发展。2数据挖掘在中国的研究趋势分析   1995年在加拿大召开了第一届知识发现和数据挖掘国际学术会议,由于数据库中的数据被形象地比喻为矿床,数据挖掘一词很快流传开来。1995年以来,国外在数据挖掘和知识发现方面形成了热门研究方向,其中发表论文比较集中的期刊如:(DataMiningandKnowledgeDiscovery)(数据挖掘和知识发现),(ArtificialIntelligenceReview)(人工智能评论)等。   国内学者也对数据挖掘的理论和应用进行了许多研究。本文通过对发表论

5、文的研究成果进行统计研究,以分析数据挖掘的在中国的研究与应用,这实质上也是一种数据挖掘思想的体现,这个过程就类似于数据挖掘过程。   为了比较全面地反映中国在数据挖掘方面的研究成果及现状,笔者分别对科学引文数据库(SCI)、工程索引数据库(El)以及清华全文期刊数据库(CNKI)进行了检索,检索内容为在中国期刊发表的相关文章以及被SCI和El检索的中国有关数据挖掘方面的研究文章。这些检索的统计结果是本文研究分析的基础。   通过检索并对各年所发表的有关数据挖掘的文章进行分类归总,可以得到表1的结果。表1有关“数据挖掘”的论文发表统计   通过对检索结果的

6、分析,可以得到以下4点结论:   1)国内期刊正式发表有关数据挖掘的文章是在1997年,共发表了3篇文章,同年SCI共检索了2篇中国的数据挖掘的研究文章,在SCI数据库能够检索到的国际上发表最早的有关数据挖掘的文章是在1993年,这表明中国关于数据挖掘方面的研究在时间上与国际上差距并不大。   2)国内发表的有关数据挖掘论文的数目近年来逐年快速上升,SCI和El所检索的文章数目也在逐年快速增加,这说明中国数据挖掘的研究近几年来迅速加强。   3)对数据挖掘的研究可以大致分为两方面:理论研究和应用研究。理论研究正在逐步深人并与解决实际问题相结合。   4)

7、数据挖掘是一门应用性很强的学科,数据挖掘应用的领域非常广阔,几乎涉及到各个行业,包括天文学、生物学、经济管理、金融、保险、电力、石油化工、地理地质等领域。这些应用的需求就更进一步地推动了理论研究的发展。3数据挖掘技术的研究   对数据挖掘的理论研究主要在以下六个方面:OLAP技术、面向属性的归纳法、关联规则、分类和预测、聚类和与数据仓库的集成技术。有关研究成果见表2。表2有关数据挖掘技术统计表   3.1OLAP技术   联机分析处理(On-LineAnalyticalProcessing,OLAP)是关系数据库之父E.F.Codd博士在1993年提出的

8、。OLAP可以在使用多维数据模型的数据仓库或数据集市上进行,使用数据立方体结构,

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。