《随机数学模型》课件

《随机数学模型》课件

ID:39182075

大小:908.51 KB

页数:27页

时间:2019-06-26

《随机数学模型》课件_第1页
《随机数学模型》课件_第2页
《随机数学模型》课件_第3页
《随机数学模型》课件_第4页
《随机数学模型》课件_第5页
资源描述:

《《随机数学模型》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、一、引例1981年生物学家格若根(W.Grogan)和维什(W.Wirth)发现了两类蚊子(或飞蠓midges).他们测量了这两类蚊子每个个体的翼长和触角长,数据如下:翼长触角长类别1.641.38Af1.821.38Af1.901.38Af1.701.40Af1.821.48Af1.821.54Af2.081.56Af翼长触角长类别1.781.14Apf1.961.18Apf1.861.20Apf1.721.24Af2.001.26Apf2.001.28Apf1.961.30Apf1.741.36Af数学模型9.7分类问题问:如果抓到三只新的蚊子,

2、它们的触角长和翼长分别为(l.24,1.80);(l.28,1.84);(1.40,2.04).问它们应分别属于哪一个种类?解法一:把翼长作纵坐标,触角长作横坐标;那么每个蚊子的翼长和触角决定了坐标平面的一个点.其中6个蚊子属于APf类;用黑点“·”表示;9个蚊子属Af类;用小圆圈“。”表示.得到的结果见图1图1飞蠓的触角长和翼长数学模型思路:作一直线将两类飞蠓分开例如;取A=(1.44,2.10)和B=(1.10,1.16),过AB两点作一条直线:y=1.47x-0.017其中X表示触角长;y表示翼长.分类规则:设一个蚊子的数据为(x,y)如果y≥

3、1.47x-0.017,则判断蚊子属Apf类;如果y<1.47x-0.017;则判断蚊子属Af类.数学模型分类结果:(1.24,1.80),(1.28,1.84)属于Af类;(1.40,2.04)属于Apf类.图2分类直线图数学模型•缺陷:根据什么原则确定分类直线?若取A=(1.46,2.10),B=(1.1,1.6)不变,则分类直线变为y=1.39x+0.071分类结果变为:(1.24,1.80),(1.40,2.04)属于Apf类;(1.28,1.84)属于Af类哪一分类直线才是正确的呢?因此如何来确定这个判别直线是一个值得研究的问题.一般地讲,

4、应该充分利用已知的数据信息来确定判别直线.数学模型再如,如下的情形已经不能用分类直线的办法:数学模型1.距离判别法1.1欧氏Euclideandistance距离判别法1.2马氏(P.C.Mahalanobis)距离判别法1.3海明Hamming距离判别法两个合法代码对应位上编码不同的位数称为海明距离。合理的距离如果用dij表示第i个样品和第j个样品之间的距离,那么对于一切i,j和k,dij应该满足如下三个条件:①dij≥0,当且仅当i=j时,dij=0(非负性)②dij=dji(对称性)③dij≤dik+dkj(三角不等式)显然,欧氏距离满足以上三

5、个条件。欧氏距离的缺点欧氏距离虽然简单,但也有明显的缺点。它将样本的不同属性(即各指标或各变量)之间的差别等同看待,这一点有时不能满足实际要求。马氏距离优缺点1)马氏距离的计算是建立在总体样本的基础上的,这一点可以从上述协方差矩阵的解释中可以得出,也就是说,如果拿同样的两个样本,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离通常是不相同的,除非这两个总体的协方差矩阵碰巧相同;2)在计算马氏距离过程中,要求总体样本数大于样本的维数,否则得到的总体样本协方差矩阵逆矩阵不存在,这种情况下,用欧式距离计算即可。3)还有一种情况,满足了条件总体样本数

6、大于样本的维数,但是协方差矩阵不可逆,比如三个样本点(3,4),(5,6)和(7,8),这种情况是因为这三个样本在其所处的二维空间平面内共线。这种情况下,也采用欧式距离计算。4)在实际应用中“总体样本数大于样本的维数”这个条件是很容易满足的,而所有样本点出现3)中所描述的情况是很少出现的,所以在绝大多数情况下,马氏距离是可以顺利计算的,但是马氏距离的计算不稳定,不稳定的来源是协方差矩阵,这也是马氏距离与欧式距离的最大差异之处。优点:不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关; 由标准化数据和中心化数据(即原始数据与均值之差)计算出的二

7、点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。 缺点: 夸大了变化微小的变量的作用。2.Fisher判别法Fisher~判别的基本思想是将k个总体的所有p维空间的样本点投影到一维空间上,使投影后组与组之间尽可能的分开,然后利用方差分析的方法推出判别函数。为了简单起见,通常利用线性的判别函数u(x)=aTx.寻找一个最恰当的方向a,使在这个方向上,组间方差与组内方差的商最大求解最优判别方向等价于求解带约束函数优化问题可以证明:Fisher判别法根据各个样本均值在最优方向上的投影值从小到大将样本集重新编号,假设序号仍然为G1~Gk。定出

8、Gj和Gj+1的分界值uj,j=1~k-1,比如:确定样本类别:Bayes判别法距离判别法虽然简单,便于使用

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。