欢迎来到天天文库
浏览记录
ID:35985310
大小:142.50 KB
页数:4页
时间:2019-04-29
《数据标准化方法.doc》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、数据标准化方法问题1:将一个人的体重和身高相加在一起有无什么意义?答:量纲(就是单位)不同的量相加是没有意义的。不加处理就将两个不同量纲的量相加这是数学建模的大忌!问题2:如何将一个人的体重G和身高H这两个指标综合为一个指标用以评价一个人身材?答:通常考虑加法模型和乘法模型。乘法模型在这里不太适合,故考虑加法模型,一般采用加权组合的方式,即,这里,但是这样就犯了一个严重的错误。因此需要先对进行预处理→无量纲化,也就是数据标准化方法。数据标准化方法主要有以下三种:(1)规范化方法对序列进行变换:则新序列且无量纲。一般的数据需要时都可以考虑先进行规范化处理。(2)正规化方法对序列进行变换:,
2、这里,则新序列的均值为0,而方差为1,且无量纲。(3)归一化方法对正项序列进行变换:则新序列且无量纲,并且显然有。归一化方法在确定权重时经常用到。针对实际情况,也可能有其他一些量化方法,或者要综合使用多种方法,总之最后的结果都是无量纲化。例1:DVD分发问题中满意度的量化现有20种DVD要分发给100个会员,规定如果要向某人发放DVD,则一次发给3张,问如何对这些DVD进行分配,才能使会员获得最大的满意度?DVD编号D001D002D003D004D005D006……DVD现有数量812210840……会员偏好C0001002000……C0002109007……C0003060007……
3、C0004000040……C0005500004……………注:表中的数字越小表示会员的偏爱程度越高,数字0表示对应的DVD当前不在会员的订单中。解:我们考虑三种方法进行变换,然后对它们进行比较。(1)利用公式(2)利用公式(3)利用模糊数学中的隶属函数的概念,选取合适的函数,对满意度进行量化,这里为待定常数令代入可得。三种量化方法的比较:结论:方法1可行;方法2不太可取;方法3可行。注意:无论采用哪一种方法,对每一个会员的满度度均需要作归一化处理,使得每一个会员对选中的DVD的满意度之和等于1,(算出的每人的满意度或综合满意度都应该介于0-1之间)。例2:长江水质的定量综合评价(2005
4、年赛题)下表是《地表水环境质量标准》,给出了水质类别的分类标准。序号 分类 标准值 项目Ⅰ类Ⅱ类Ⅲ类Ⅳ类Ⅴ类劣Ⅴ类1溶解氧(DO) ≥7.5(或饱和率90%)653202高锰酸盐指数(CODMn)≤2461015∞3氨氮(NH3-N ≤0.150.51.01.52.0∞4PH值(无量纲)6---9下表给出了17个观测点的水质情况。序号点位名称断面情况主要监测项目(单位:mg/L)水质类别pH*DOCODMnNH3-N本月1四川攀枝花干流7.6 6.8 0.2 0.1 II 2重庆朱沱 干流(川-渝省界) 7.63 8.41 2.8 0.34 II 3湖北宜昌南津关
5、干流(三峡水库出口) 7.07 7.81 5.8 0.55 III 4湖南岳阳城陵矶 干流 7.58 6.47 2.9 0.34 II 5江西九江河西水厂 干流(鄂-赣省界) 7.34 6.19 1.7 0.13 II 6安徽安庆皖河口 干流 7.52 6.54 3.2 0.22 II 7江苏南京林山 干流(皖-苏省界) 7.78 6.9 3.1 0.11 II 8四川乐山岷江大桥 岷江(与大渡河汇合前) 7.66 4.2 5.8 0.53 IV 9四川宜宾凉姜沟 岷江(入长江前) 8.01 7.63 2.4 0.25 II 10四川泸州沱江二桥 沱江(入长江前) 7.63 4.02 3
6、.6 1.06 IV 11湖北丹江口胡家岭 丹江口水库(库体) 8.63 10.2 1.8 0.1 I 12湖南长沙新港 湘江(洞庭湖入口) 7.42 6.45 4.3 0.99 III 13湖南岳阳岳阳楼 洞庭湖出口 7.73 6.26 1.4 0.21 II 14湖北武汉宗关 汉江(入长江前) 8 6.43 2.4 0.17 II 15江西南昌滁槎 赣江(鄱阳湖入口) 6.64 5.18 1.1 0.92 III 16江西九江蛤蟆石 鄱阳湖出口 7.28 6.87 2.7 0.15 II 17江苏扬州三江营 夹江(南水北调取水口) 7.29 6.9 1.6 0.15 II 分析水质的
7、类别的确定可知:它是由首要污染物决定的。请根据以上数据对长江当前的水质情况做出定量的综合评价。解:1、数据的标准化处理溶解氧是极大型指标(指标越大,水质越好),PH值是居中型指标,其余两种是极小型指标,统一进行极小型处理。(1)溶解氧:(共有17个观测点)(2)PH值:然后对进行规范化处理,即:得到规范化矩阵,这里且无量纲。2、确定四种指标的权重(变权函数的确定)原则是能有效的区分六类水。权重矩阵3、综合评价指标4、评价结果对比与排
此文档下载收益归作者所有