资源描述:
《数据挖掘与智能化信息处理研究_林建勤》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第20卷第3期贵州大学学报(自然科学版)Vol.20No.32003年8月Journ吐ofGuiZhouUniversity(NaturalSeienees)Aug.2(X)3文章编号1000一5269(2(X)3)03一0294一05数据挖掘与智能化信息处理研究林建勤’,林筑英2.,.(1贵阳市金筑大学计算机系贵州贵阳5005;2贵州师范大学数学与计算机系,贵州贵阳5001),、a摘要数据挖掘(DatMining)是智能化信息处理中一个很有价值的课题它融合了数据库、。、人工智能机器学习和统计学等多个领域的理论和技术本文介绍数据挖掘系统的体系结构数、,。据挖掘的任务方法及应用讨论了数据
2、挖掘研究的发展趋势;知识发现;;决策支持关键词数据挖掘人工智能中图分类号TP272文献标识码A0引言,,、在信息处理领域数据挖掘(DataminngDM)是数据库系统和新的数据库应用的一个有希望的欣欣。,,、、、向荣的学科前沿事实上数据挖掘是一个跨学科的知识领域汲取了数据库技术人工智能机器学习神经网络、统计学、模式识别、知识库系统、知识获取、信息检索、高性能计算、数据可视化和信息科学等方。,面的成果由于数据挖掘带来的显著的经济效益和应用的越来越广泛因此吸引了一大批研究者和开发,、。者使其成为目前智能化信息检索研究开发和应用最活跃的分支之一本文将从智能化信息处理的视,、、,。角重点讨论数
3、据挖掘技术的任务方法系统结构及其在智能化信息处理中的应用模型和发展前景数据收集和数据创建1信息处理技术自然演化的结果〔自20世纪60年代和更早)一原始文件处理,自20世纪60年代以来信息处理技术已经系统地从原始的文件处理演化到复杂数据库管理系统(7。年代)一层次和网状数据库系统、。,的功能强大的数据库系统到70年代数一关系数据库系统:一一数据建模工具实体联系模型等,据库系统的研究和开发已经从层次和网络十树散一索引和数据组织技术;B列等、一查询语言:sQL等数据库系统发展到开发关系数据库系统数:一用户界面表单服告等、。-查询处理和查询优化据建摸工具索引和数据组织技术等到:一事务管理恢复和
4、并发控制等,ITP80年代中期数据库技术的特点是广泛接一联机事务处理(O),、受关系技术研究和开发新的功能强大的高级数据库系统。、(8o年代中期至现在)基于web的数据库系统数据库系统等并涉及分布性多样性和数型:、。一高级数据模扩弃关系面物(9年代至现在)、、,n质财富对象对象一关系演绎一基于xML的数据库系统据共享以及异种数据库和基于Itemet的;、、一面向应用空问的时问的多一W山挖掘全球信息系统。随着信息化建设的不断深媒体的、主动的、科学的、知识库,、人数据库技术被广泛应用于商业管理政数据仓库和数据挖掘、,府办公科学研究和工程开发等领域人们(8。年代后期至现在)一数据仓库和OLA
5、P技术,积累的数据越来越多激增的数据资源背后一数据挖掘和知识发现,隐藏着许多重要的信息人们希望能够对其,进行更高层次的分析以便更好地利用这些新一代综合信息系统(200年至今)。数据因此迫切需要有一种技术能够帮助,图人们从数据中发掘出其内在的规律从中及l信息技术自然演化结果g1NatalnesevolventresultofinfoationFiuremrm介收稿:一一日期20030616:一,,:,,。作者简介林建勤(1957)女副教授主要研究方向数据库技术人工智能数据挖掘一,,,:,,。林筑英(1948)女教授主要研究方向网络多媒体技术智能教学系统数据挖掘,:第3期林建勤林筑英数据挖
6、掘与智能化信息处理研究,,“”“”,时发现有用的知识充分地提高信息的利用率在数据矿山中找到蕴藏的知识金块数据挖掘(Dat。,。Mining)由此应运而生它是信息处理技术自然演化的结果演化过程如图1所示2数据挖掘信息检索和信息处理智能化数据挖掘的前—身即知识发现(KnowledgeDiscovery),它源于人工智能的机器学习领域,其实质的内涵,。,a是在一个已知状态的数据集(DatSeO上通过设定一定的学习算法从数据集中获取所谓的知识目前,,人工智能领域中的知识发现技术已经发展到了成熟的阶段即用数据库管理系统来存储数据用机器学习,,。的方法来分析数据挖掘大量数据背后的知识两者的结合促成
7、了数据挖掘的产生数据挖掘可视为数据,,Ke库中知识发现DD(KnowledgeDiscovryinDatabases)过程的一个基本步骤是自动的或方便的模式提取、。,这些模式代表隐藏在大型数据库数据仓库中的知识从数据仓库观点数据挖掘可看作联机分析处理,,(OLAP)的高级阶段是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程这些模型和关。、、、。系可以用来做出预测数据挖掘可用在信息管理过程控制科学研究决策支持等许多方面它涉及,,多学科