欢迎来到天天文库
浏览记录
ID:34824183
大小:1.52 MB
页数:56页
时间:2019-03-11
《试析粗糙集理论在农业决策支持系统知识发现中的应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、西南农业大学硕士学位论文粗糙集理论在农业决策支持系统知识发现中的应用姓名:吴习宇申请学位级别:硕士专业:农业机械化工程指导教师:余建桥20050501西南农业大学硕士学位论文摘要摘要农业生产信息决策支持系统是以现代信息技术手段,针对农业领域的半结构化决策问题而建立的为农业管理人员、农业科研工作者和广大农民做出正确决策提供帮助的人机交互系统。由于农业生产信息集数据量大、涉及因素复杂、涵盖面十分广泛等,使得农业生产信息决策支持系统的知识发现研究存在一定的困难。目前.农业领域的知识发现研究主要使用模糊集理论、遗传算法等方法。但由于这些技术在得到决策规则和推理过程中都需
2、要数据先验知识的介入,而且获取的结果也不易于评价和解释,造成知识获取的“瓶颈”问题。粗糙集理论是由波兰数学家z.Pawlak于20世纪80年代初提出的⋯.是一种新的处理模糊和不确定性知识的数学工具,它是在无需提供数据的先验知识基础上,以从分类的观点、集台近似、近似分类与不可分辨性的概念为基础,通过知识约简,导出问题的决策或分类规则,它已经在机器学习、决策分析、过程控制、模式识别与数据挖掘等领域获得了广泛的应用‘”。与传统的不确定数据处理方法相比。租糙集理论其最大的特点是无需提供数据的任何先验知识,因此对问题的不确定性描述较为客观。为此可以利用粗糙集理论来解决在农
3、业领域的知识发现中的不易于评价和解释缺陷,解决知识获取中的难题。本文探讨了智能决策支持系统中的知识表达以及根据粗集理论分析处理海量信息中信息的有用特征并对其进行提取·并通过分析、推理、简化产生最小决策规则。另外利用粗集理论中的决策逻辑构造了决策表表达知识化简的算法,形成了从粗集理论到决策知识实际化简。并围绕如何根据农业领域的数据特性实现其知识发现,展开研究和讨论,提出了基于粗糙集理论的农业决策支持系统知识发现方案。本论文的研究思路是按照知识发现的基本步骤进行的:(1)理解该领域知识和相关的先验知识,明确系统目标;(2)进行数据整理和预处理,包括不完整数据的补齐、
4、不精确数据的定性描述和数据的离散化、模糊化处理等;(3)利用某种数据处理方法对数据进行简化,确定系统的有用特征参数或变量,化简系统并建立相应的数学模型或逻辑规则:(4)测试扒数据中挖掘或建立的数学模型或逻辑规则.并解释得到的模式结果,并进一步加工、综合系统,运用挖掘到的知识来解决客观问题。基于上述从数据中挖掘知识的特点和任务,目前广泛采用的数据处理方法有粗糙集理论方法、概率统计方法、模糊逻辑方法、人工神经网络方法、聚类分析方法、遗传算法、回归优化等。对不准确、不完整、不确定数据的知识发现,由于粗糙集理论具有有效地提取最佳分类特征,运算量小,精度高,并消除冗余属性
5、。1等特点,在农业领域数据的知识发现中具有一定的优势,本文重点研究了粗糙集理论运用于知识发现中的数据预处理、数据约简、规则提取和系统的增量式学习,并提出了基于粗糙集理论的决策支持系统知识发现模型。主要研究内容和成果包括以下几个方面:西南农业大学硕士学位论文摘要首先,针对粗糙集理论中数据预处理的数据补齐和离散化问题展开讨论,介绍了若干数据补齐的方法,并分析了离散化的实质,对离散化问题进行了分类研究.提出了一种基于信息熵的数据离散化分析方法,该方法根据专家先验知识确定决策表的条件属性和每个连续属性概念分层的最大维数,应用遗传算法来获取最大信息增益的属性划分阈值,以解
6、决农业数据处理阶段属性值的离散化和域值的优化问题。有效地解决了当信息系统数据较多而导致的知识规则显著增加、错误规则产生、过度依赖算法工具而忽略了专家的先验知识、知识库维护困难等问题。其次,知识约简是粗糙集理论的核心内容之一,本文重点探讨了粗糙集的属性约简方法。在已知研究成果中,Skovrron提出的可辨识矩阵为求取最佳约简提供了很好的思路,该方法将信息表中所有有关属性信息都浓缩进了一个矩阵中,可通过该矩阵方便地得到决策表的属性核。由于基于可辨识矩阵的属性约简算法是将属性组合情况进行搜索并变为逻辑公式的化简,在建立析合取范式时数据量较大,造成计算量增大,因此本文针
7、对农业领域数据特点提出了一种改善其数据属性约简速度的新型算法.有效地解决了这一问题。第三.针对决策支持系统的知识挖掘任务,结合前面的研究结果提出了一种基于粗糙集理论的决策支持系统知识发现系统模型。此外,当有新样本加入数据集的时候,新样本所包含的信息可能是现有规则库中已含有的.也可能是全新的,甚至可能是跟某些规则不相容的a在后两者情况下,原有的规则库不能包含新样本的信息.要保证规则库能符合扩大了的数据集,就必须对规则库中的一个或多个规则进行修正,从而得到基于新数据集的规则库方法。本文针对此问题提出了基于粗糙集的增量式规则提取算法,实现了递增式学习.当增加新的例子时
8、,不必更新整个系统,只需
此文档下载收益归作者所有