资源描述:
《基于粗糙集理论的疾病综合诊断》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、http://www.paper.edu.cn基于粗糙集理论的疾病综合诊断1122杨广夏波王晓龙张保华1中国矿业大学理学院,江苏省徐州市,2210082中国矿业大学机电工程学院,江苏省徐州市,221008E-mail:yg2005017@163.com摘要:疾病的综合诊断对于医生来说是非常重要的,而综合诊断实质上是权系数的确定问题。本文提出了一种基于粗糙集理论的权系数确定方法,将权系数确定问题转化为粗糙集中属性重要程度评价问题,建立了关于组合预测方法的关系数据模型并计算出组合预测模型的权系数。该方法克服
2、了传统权系数确定方法的主观性,避免了线性或非线性极值问题的数值计算,使得组合预测方法更具客观性。本文案例证明了此方法的有效性。关键词:疾病诊断;组合预测;粗糙集1.引言人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内各种元素含量。附表3是确诊病例的化验结果,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确定为健康人的结果。需要解决的问题是:能否根据表3的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。2.
3、基本假设与符号说明2.1问题假设①假设在各种元素含量中的极少数超高值为偶然性数值,是不合理的,在数值计算中可以不予考虑或者以普通值代替。②假设健康人体内的元素含量不会出现大的波动。③假设病例只存在患病与不患病两种状态,不存在介于两者之间的状态。2.2符号说明n:模型中样本总个数u:第i个样本ip:需要观测的指标个数c:需要观测的第i个指标ic:第i个样本第j个指标的数据ijF:每一个主成分的线性加权值iA:病症情况判断值:得病(赋值0),健康(赋值1)1http://www.paper.edu.cn3.
4、问题的分析和模型的建立3.1粗糙集理论的相关概念[1][2]粗糙集理论(roughsettheory)是一种处理模糊和不确定知识的数学工具,能处理定性、定量因素。该理论的主要特点是不需提供问题所需处理的数据集合以外的任何先验信息,仅根据观测数据删除冗余信息,分析不完整知识的程度——粗糙度、属性间的依赖性和重要性,生成分类或决策规则等。本文应用该理论来确定患肾炎病人各项病因指标中的权系数,将权系数确定问题转化为粗糙集中属性重要性评价问题,利用粗糙集理论中的知识依赖性和属性重要性评价方法,计算出各项病因指标
5、权系数。该方法不需要建立解析式的数学模型,完全由数据驱动来确定各优化目标的权系数,克服了传统权系数确定方法的主观性,避免了线性或非线性极值问题的数值计算,使综合目标函数更具有客观性,也更符合具体的规划方案。(1)知识和知识系统。研究对象构成的集合是非空有限集,称为论域U;R是上一个等价关系称为知识。R产生等价类[]x{yRx:yyU,},等价类集合RUR/{[]xxU},称U的知识系统。Rx(){[]xxXxU,},称为知识系统UR/RR下集合X的下逼近,是X中可用知识系统UR/的知识精
6、确表示部分;Rx(){[]xxX,xU},称为在知识系统UR/下集合X的上逼近,说明可用知R识系统UR/的知识RX粗糙地表示X。令()XcardRx[()]/cardRx[()]反映知识系R统UR/对集合X的可表示程度。(2)知识的依赖度。设R、Q均是U上的等价关系,为说明与Q之间的不确定关系,定义知识R对知识Q的依赖程度()R为QQR()RcardQx[([])]/cardU()(3.1)显然0()1R,()R的数值大小反映了知识R对知识Q的依赖程度。QQ(3)属性的重要
7、性。研究对象集合U是论域,条件属性集为C,决策属性集合为D,条件属性集C中的条件属性c对于决策属性D的重要程度定义为i()c()D()D(3.2)Dicc[]ci显然()c越大,属性c的重要性越高。Dii3.2粗糙集理论确定多目标综合模型权系数的方法m多目标综合模型为AwFii(3.3)i1多目标综合模型由m个最优化目标函数综合构成,w是第i个最优化目标函数的权系i数;权系数满足条件www1。12m确定权系数首先建立关系数据模型。将各个最优化目标函数作为条件属性,条件属性可
8、以表示为集合C{,FF,,F};将综合最优化目标函A视为决策属性,决策属性集合12mDA{},不同的优化方案下得到的综合目标优化值u为研究对象A的一条信息,显然ku(FF,,,F;A),那么就构成了论域U{,uu,,}u,也称为样本集合。这k12kkmkk12n时研究对象u的属性为Fu()c,Au()A,其中(im1,2,;kn1,2,)。kikikkk由u构成的二维信息表就是多目表综合最优化模型的关系数据模型。k