欢迎来到天天文库
浏览记录
ID:37372597
大小:4.33 MB
页数:113页
时间:2019-05-23
《基于语义的粗糙集理论和模型研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、ResearchonRoughSetTheoryandModelswithSemanticsPresentedbyXiuyiJiaSupervisedbyProfessorJiajunChenandAssociateProfessorLinShangAdissertationsubmittedtotheGraduateSchoolofNanjingUniversityfortheDegreeofPh.DDeparrtmentofComputerScienceandTechnologyNanjingUniversityNanjing,May
2、2011南京大学博士论文摘要经典粗糙集理论中所处理的数据都是以信息表或决策表的形式存在的,表中的对象以属性-值对的形式来表示。信息表由对象集合和属性集合所组成,当把属性集合分为条件属性集合和决策属性集合时,这类信息表又称之为决策表。在实际应用中,由于标准的信息表可能无法或者很难把应用中的一些语义表示出来,相同的数据可能带有不同的语义,从而使得用户在选择学习方法时面临着困难,无法应用标准的学习方法或者标准的学习方法得到的结果并不符合用户的需求。现有的很多工作没有系统地从语义角度来研究,对用户在理论上的指导性不强,需要用户必须具备一定的专业知
3、识。本文从用户的需求语义、决策语义、模型中的约简语义和数据的序关系语义角度对粗糙集理论和模型中的一些问题进行了研究。第一,粗糙集理论中存在多种属性约简定义,本文系统的分析了其共性和异性,从语义角度泛化了属性约简的定义,从而使得定义的泛化属性约简能够解释现有的多种属性约简定义,用户可以依据实际应用,定义出或选择出与需求相关的属性约简,从而求得合适的结果。由于在带有决策语义的决策粗糙集模型中,定义在区域保持上的属性约简在理论性和可解释性上存在困难,本文针对这个问题,在泛化属性约简定义的基础上,提出了一种基于风险最小化的属性约简,该约简考虑了决
4、策粗糙集模型中的决策语义,分析了属性变化所带来的区域变化的根本原因,使得定义出的约简能够帮助用户作出风险损失最小的决策。第二,经典粗糙集理论中知识的表达方式是以规则的形式存在的,对信息表的学习通常是先经过属性约简,再从中抽取规则。针对这个学习过程,本文从属性约简和属性值约简语义角度出发,分析两种层面上的规则和两种约简之间的关系,提出并论证了求属性依赖实际上是求属性约简的过程,提取分类规则实际上是求属性值约简的过程。先进行属性约简再抽取分类规则的学习过程有可能会丢失一些有用的知识,属性值约简并不依赖于属性约简,用户应依据自己的需求选择合适的
5、学习过程。第三,本文针对最常见的带有序关系语义的信息表,研究了优势关系粗糙集模型下的增量学习问题,提出了一种增量求核算法和增量抽取规则的算法,能够大大提高学习的效率。另外,通过研究数据本身所具有的一些特性,详细分析了算法运行效率和数据分布特点之间的关系,明确了算法的适用性。第四,本文将带有三枝决策语义的粗糙集方法应用在自然语言处理中的垃圾邮件过滤问题上,三枝决策方法能够通过把疑似垃圾邮件交给用户来决策的方式从而降低邮件的错南京大学博士论文分率,使得结果更加符合现实情况。基于垃圾邮件过滤这一实际问题背景,我们从决策风险最小化的角度来审视三枝
6、决策粗糙集模型,通过建立一个合适的决策风险最优化问题,解决该最优化问题便能够自动学习出决策粗糙集模型所需的损失函数和边界参数(这些值的确定在现有的工作中是需要专家给定的)。本文第一次从自动学习损失函数方面进行研究,并提出了一种自适应学习算法。关键词:粗糙集理论,决策粗糙集模型,语义,属性约简,增量学习南京大学博士论文ABSTRACTDataisusuallypresentedbyaninformationtableoradecisiontableinroughsettheory,whiletherowsshowallobjectsandt
7、hecolumnspresentthevaluesofeachobjectongivenattributes.Ifthesetofattributesisdividedintoaconditionattributesetandadecisionattributeset,thenthiskindofinformationtableisalsocalleddecisiontable.Inmanyapplications,aStheclaSsicalinformationtablecannotexpressallinformation,such
8、aSsomedifficultsemanticsincorrespondingapplications,itisdifficulttogettheproperresultfromtheclas
此文档下载收益归作者所有