数据库中挖掘决策偏好信息的粗糙集方法研究

数据库中挖掘决策偏好信息的粗糙集方法研究

ID:38264207

大小:94.70 KB

页数:3页

时间:2019-05-26

数据库中挖掘决策偏好信息的粗糙集方法研究_第1页
数据库中挖掘决策偏好信息的粗糙集方法研究_第2页
数据库中挖掘决策偏好信息的粗糙集方法研究_第3页
资源描述:

《数据库中挖掘决策偏好信息的粗糙集方法研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、第29卷第6期计算机工程2003年4月Vol.29№6ComputerEngineeringApril20031·博士论文·文章编号:1000—3428(2003)06—14—03文献标识码:A中图分类号:TP311数据库中挖掘决策偏好信息的粗糙集方法研究程岩(复旦大学管理学院信息管理系,上海200433)摘要:获取决策者的决策偏好信息是多属性决策问题的关键所在,这种偏好信息往往隐藏在大量历史数据中。数据挖掘技术是知识自动获取的一个重要手段。该文基于粗糙集理论提出了一个自动发现决策偏好信息的算法,利用该算法挖掘出的偏好信息采用i

2、f…then规则的形式,因此更容易被决策者所理解。关键词:数据挖掘;多属性决策;粗糙集ResearchontheMethodofMiningDecisionPreferentialInformationinDatabasesCHENGYan(DepartmentofInformationManagement,ManagementSchool,FudanUniversity,Shanghai200433)【Abstract】Acquiringpreferentialinformationofdecisionmakeristheke

3、yformultipleattributedecisionproblem,alotoftheseinformationishiddeninhugeamountofhistoricaldata.Dataminingisatechnologyforautomaticacquiringknowledge.Inthispaper,byintegratingthetheoryofroughsets,amethodofminingdecisionpreferentialinformationisdeveloped.Thepreferenti

4、alinformationinferredfromhistoricaldataisasetof“ifthen”decisionrule,soitismoreunderstandable.【Keywords】Datamining;Multipleattributedecision;Roughset获取决策者的偏好信息是多属性决策问题的关键所在,通判断该公司的还贷款的风险较低。从形式化的角度来形容,可常,这种信息以模型参数的形式给出,例如指标的权重或各种以将决策表描述为一个五元组S=,其中形式的阈值。在实际工作

5、中人们更希望这种决策偏好信息以更U={u1,u2,⋯,uN}是决策实例的集合;数据记录的属性间往容易被理解的形式表示出来,从而方便人们的决策。往存在决定和被决定的关系,令C为决定属性的集合,称为条事实上,决策者的偏好信息是通过他每一次决策实例中件属性集,D为被决定属性的集合,称为决策属性集,且要求体现出来的,只是这些信息隐藏在大量的实例中而没有被明确CÇD=Æ;令A=CÈD,每个决策就是根据属性集C提供的信地表示出来。例如,审批贷款的决策中,大量历史数据会体现息来判断某一事件(或行为)在决策属性D上的取值;V表出这样一条偏好信息

6、:“如果公司所在地在发达地区,即便它示所有属性可取值的集合;f:U×A®V是一个信息函数,该的赢利率一般,那它的风险依然很低”。函数为某个数据记录的某个属性赋予一个特定的值,例如[5]数据挖掘技术可以从大量数据中自动发现人们需要的决f(ui,a)=l,表示记录ui在属性a上的取值为l。策信息,因此,可以利用它从大量决策实例中发现决策者的决表1贷款风险决策表策偏好信息。条件属性集C决策属性D决策实例地理赢利率所属风险[2]示例学习是数据挖掘的一个重要手段,但许多示例学习位置行业方法仅适用于从理想的数据环境下挖掘出确定性知识。而在实

7、公司1X中等A较低公司2Y中等B中等际工作中,人们并不是在每一次决策中都严格遵守决策偏好,⋯⋯⋯⋯⋯这是由决策问题本身的非结构化因素及信息不完全所造成的,公司n⋯⋯⋯⋯因此,隐藏在大量决策实例中的决策偏好信息往往是一些具有一定可信度阈值的统计规律。在信息不完全的环境下,数据记录间存在着不分明关系,粗糙集理论是在信息不完全环境下进行知识发现的一个令BÍA,属性集B上的不分明关系R(B)定义为:2有力工具,但传统的粗糙集模型不能处理数据集中具有不同可R(B)={(ui,uj)ÎU∣"aÎB,f(ui,a)=f(uj,a)}。不分明关

8、系是集信度阈值的统计规律,另外,直接利用粗糙集模型挖掘出的知合U上的等价关系,它将集合U划分为一些等价类。令uiÎU,识概括能力很低,知识的解释能力不是很高。记录ui在属性集B上的等价类定义为:RB(ui)={ujÎU∣"aÎB,本文结合作者近几年关于基于粗糙集

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。