基于粗糙集与云决策树的数据挖掘理论研究与应用

基于粗糙集与云决策树的数据挖掘理论研究与应用

ID:33905159

大小:5.77 MB

页数:156页

时间:2019-03-01

基于粗糙集与云决策树的数据挖掘理论研究与应用_第1页
基于粗糙集与云决策树的数据挖掘理论研究与应用_第2页
基于粗糙集与云决策树的数据挖掘理论研究与应用_第3页
基于粗糙集与云决策树的数据挖掘理论研究与应用_第4页
基于粗糙集与云决策树的数据挖掘理论研究与应用_第5页
资源描述:

《基于粗糙集与云决策树的数据挖掘理论研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、申请上海交通大学博士学位论文.IS30<《工基于粗糙集与云决策树的数据挖掘理论研究与应用作者姓名:张树瑜pD2。;9罗护孑6导师姓名:朱仲英教授学科专业:控制理论与控制工程系别:自动化系上海交通大学2005年11月t-,奎1}yjDissertationSubmittedtoShanghaiJiaoTongUniversityforPH.D.RESEARCHONTHETHEORYANDA-PPLICAnONOFDAI'AMININGBASEDONROUGHSETSANDCLOUDDECISITONTREECandidate:ZhangShuyuSupervisor:Profess

2、orZhuZhongyingMajor:ControlTheoryandControlEngineeringDepartment:AutomationShanghaiJiaoTongUniversityNovember,2005,■【,●●●●●●●-~●.曩'附件四上海交通大学上海父逋大芋学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已经注明引用的内容外,本论文不包含任何其他个人或集体己经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。

3、学位论文作者签名:弓位柳渝日期:形年7月7日、■、j,√L●J.-----T●--._.附件五上海交通大学学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权上海交通大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。,保密瓯在土年解密后适用本授权书。本学位论文属于不保密口。(请在以上方框内打“√")学位论文作者签名:弓锰柑渝指导教师签名:铲砌铉日期:D6年J月7Et日期:。占年,月-7日\1\\上海交

4、通人学博l:学位论文摘要基于粗糙集与云决策树的数据挖掘理论研究与应用摘要随着信息技术以及数据仓库技术的发展,在商业企业、科研机构以及政府部门出现了海量的、不同形式存储的数据,对数据挖掘方法在智能化和准确度方面提出了更高的要求。决策树方法因其具有可理解性高,计算量相对较小等特点而受到人们的欢迎。经过多年的发展,决策树方法经已经取得了很人进步,内容也得到了很大充实,但实际中的数据大多都具有随机性或不确定性,具有精确描述特征的决策树!f1纳学习已经不能适应一个系统中不精确知识自动获取的要求,而云模型方法在处理模糊性和不确定性的问题方面具有自己的独特性。云决策树的推理使得决策树这种优良方

5、法可以应用于更多的数据分析中,发挥更大的作用。另外,决策树在处理冗余属性方面还存在许多问题,而粗糙集理论的属性约简是处理冗余属性很好的方法。对属性进行约简就是去除与决策属性不相关的条件属性,这样对于不同的数据集,尤其是大型数据集,可使决策树的规模明显减小,节点数量明显减少,从而使得决策树方法可理解性高、分类速度相对较快、计算复杂度相对较小以及分类准确率相对较高的特点得到充分体现。粗糙集理论在处理不确定性问题或知识获取时,由于通过确定的数学公式描述直接对数据进行分析与处理,即不需要提供一个先验知识(如隶属函数),从而避免了主观性的影响,因此可作为其它理论如模糊集理论的一个有效补充,

6、但粗糙集理论本身并不包含处理不确定性和不精确原始数据的机制。云决策树虽然包含处理不确定性和不精确原始数据的机制,但需要给出一个隶属度或隶属函数(先验知识),具有相当的主观性。因此,如果它们二者能够有机结合,对丁组成的新系统,不仅符合人类认知的表达,而且具有客观性。本文首先在粗糙集知识约简的基础上对云决策树进行了推理,说明该方法适用于不确定性数据的决策问题;然后,将粗糙集分类器与云决策树方法有机结合,组成了比单独的粗糙集分类器或决策树方法性能更好的系统,在仿真结果中取得了令人满意的效果;最后,将研究成果应用于基于J2EE平台的数据挖掘系统中。本文工作主要包含以下内容:(1)主要研究

7、粗糙集的扩展应用。为了对逻辑概念中的概率进行分析,引入流向网络的确定性流向分析代替概率的思想,并利用一个简单实例来阐明这个思想。由于实际中没有一种普遍的关于冲突情况的数学模型被大家认可,本文在另外一种基于粗糙集理论方法的基础上来进行分析,并利用~个冲突情况下投票分析的简单实例来阐明这种方法的有效性。从粗l≤譬上海交通人学博上学位论文摘要糙隶属函数定义出发研究粗糙整体部分关系逻辑,给出了粗糙整体部分关系逻辑的相关定义及性质,为整体部分关系逻辑关于复杂结构的推理提供了一种新的思路。(

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。