蠓虫分类问题的数学模型

蠓虫分类问题的数学模型

ID:33262983

大小:148.57 KB

页数:8页

时间:2019-02-23

蠓虫分类问题的数学模型_第1页
蠓虫分类问题的数学模型_第2页
蠓虫分类问题的数学模型_第3页
蠓虫分类问题的数学模型_第4页
蠓虫分类问题的数学模型_第5页
资源描述:

《蠓虫分类问题的数学模型》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、蠓虫分类问题的数学模型摘要:本文针对Af和Apf两类蠓虫的分类问题分别利用马氏距离法、Fisher判别法和Bayes判别法建立了三个数学模型。首先,利用马氏距离公式建立起样本到两类间距离公式,通过两个距离的大小,样本靠近哪个样本,则判给哪个样本。再采用Fisher判别法,将所有可能组合构成的区域Rn分成两个互不相交的部分,则未知类别的样品落在哪个部分,就判属于那一类。建立此模型的主要目的就是为了将Rn划分成两干个互相不重叠的部分,即找出区域分界面,在数学上就是找出曲面的函数,即判别函数。最后,再结合实际情况,根据误判对损失的影响大小利

2、用Bayes判别法对于以上建立的模型进行优化与改进,是各种损失按概率的加权求和达到最小1.问题重述两种蠓虫Af和Apf巳由生物学家W.LGrogan和W.W.Wirth(1981年)根据它们的触角长度和翼长加以区分。现测得6只Apf和9只Af蠓虫的触角长度和翼长识别的依据是蠓虫的触角和翅膀的长度的数据(见下表),现在要根据数据,制定一种方法,正确区分两类蠓虫;并且将建立的模型将用于已知触角长和翼长三个待定的样本进行识别。且在假设Af是宝贵的传粉益虫,而Apf是某种疾病的载体的情况下,对模型加以改进。Af123456789触角长度1.2

3、41.361.381.381.381.41.481.541.56翼长1.721.741.641.821.91.71.821.822.08Apf123456触角长度1.141.181.201.261.281.30翼长1.781.961.862.002.001.962.模型的假设和符号的设定2.1.模型的假设(1)任意的触角长度和翼长属于Af和Apf的概率相等;(2)任意触角长度和翼长随机组合;(3)两类蠓虫总体都服从二维正态分布;(4)同一种误判造成损失相等;2.2符号的说明(1):表示总体,i=1,2;(2):x到的马氏平方距离,i=

4、1,2;(3):判别函数,i=1,2;(4):总体的概率密度函数;(5):将来自的样品误判来自于后带来的损失。其它需要用到的符号,在后面再做说明。3.模型准备之所以将蠓虫归为同一类(Af或Apf),是因为它们之间有相同或相近之处,从指标上来讲大小比较接近。而本题的指标有两个(触角长和翼长),对于接近长度应有个准确的算法。如果用欧氏距离为各指标差的平方和,显然不尽合理。因为所选单位或类型不同(如米与厘米,质量与体积),对同样两个样品前后的欧氏距离影响很大,且不同的样本点之间的距离的变化不均匀。为克服这一不应有的现象,可以采用马氏距离对于

5、触角长和翼长两个指标,它们对于判别样本x属于哪一类,一般都有影响。但一般影响不会相同,总有一些指标影响大,一些指标影响小,因此按主要指标进行判别效果应比较好。同时,由于指标之间有一定的相关性,因而主要差异并不一定是某个指标,而经常是指标之间的某个线性组合。只有在这个方向上,样本点分得最开,因而容易区分。以下Fisher判别法将这一思想付诸实施,将所有样本上点向某一条直线投影,在这条特殊的直线上,样本的投影点最分散,最能清楚的反应出分类情况。3.模型的建立模型一:马氏距离判别法(1):下面给出相关定义:定义:若x、y来自均值向量为、协方

6、差矩阵为的总体的两个样本,则x、y之间的马氏平方距离为:,x与G的马氏平方距离为:。(2):距离判别的思想:有两个总体,给定一个待判样品,我们要判断它来自哪个总体,通过比较样本到总体的距离大小,距哪个总体距离小就属于哪个总体。这里都是基于马氏平方距离。(3):距离判别模型:因为两总体协方差相等,即有,所以x到两总体马氏平方距离的差为:=记:再结合上面距离判别思想很容易有下面的距离判别准则:实际生活中,总体的分布往往是不知道的,我们只有根据样本去判断总体,所以我们只有用估计值代替上面各个式子中的相关变量,假设,i=1,2…,是来自的样本

7、,,i=1,2,…,的样本,我们用、、、、S分别来估计总体的均值、协方差,即用它们分别替换上面式子中的、、、、,其中:,,,,。模型二:Fisher判别方法(1)设从两类蠓虫Af和Apf中抽取了若干样品(n围向量)Af类G1:xi(1)(i=1、2、3......m1)Apf类G2:xi(2)(i=1、2、3......m2)其中m=m1+m2令a为Rn中任一方向,则Rn中点x在这条直上的投影是U(x)=a'x,这时上述数据在a上的投影为:Af类G1:a'xi(1)(i=1、2、3......m1)Apf类G2:a'xi(2)(i=1

8、、2、3......m2)样本组间方差:G=α=12mα(a'xpα-a'xp)2=a'[α=12mα(a'xpα-a'xp)(a'xpα-a'xp)']a≜a'Ba样本组内方差:E=α=12mα(a'xpα-a'xp)

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。