第10-11讲 模式识别

第10-11讲 模式识别

ID:42154291

大小:209.00 KB

页数:18页

时间:2019-09-09

第10-11讲 模式识别_第1页
第10-11讲 模式识别_第2页
第10-11讲 模式识别_第3页
第10-11讲 模式识别_第4页
第10-11讲 模式识别_第5页
资源描述:

《第10-11讲 模式识别》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、模式识别—Patternrecognition模式识别的定义模式:某类事物区别于其他事物的一组特征。模式识别(PatternRecognition):是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。模式识别过程化学模式识别化学组成:各类天然产物组成不同。有自己的特征组成属于统计模式识别统计模式识别中应注意的问题多测量指标,有的数据大,有的小大的一定重要,小的一定不重要吗?数据预处理一般情况下,对于有不同量纲测量的研究体系预处理经常采用的方

2、法中心化:对数据的每一个属性列,将每个样本减去所有样本的该属性列的平均值自标度化:对数据的每一个属性列,将每个样本减去所有样本的该属性列的平均值,并除以该列的方差。即均值为0,方差归一。标准化:标准化的处理方法很多,对不同的仪器有不同的方法。如在色谱中,采用面积归一化。以减少进样误差的影响。具体操作时,按样本,将所有数值加和,然后每个数值除以该和。而对质谱,则常用最大归一化的方法,具体操作时,按样本,每个数值都除以样本的最大值。无监督的模式识别在建立分类模式之前,不知道样本的分类信息根据样本自身的特征在空间的自然聚集情

3、况,根据物以类聚的原则,来判断样本的分类情况,聚在一起的被称为一类。一般以距离来判断样本间的差别情况,例如欧式距离经常作为无监督模式识别的计算依据PCA一般情况下,描述一个样本的特征会有很多。如果将一个特征看做是空间的一维,每个样本是高维空间的一个点难,人类无法想象高维空间办法:在高维空间中找到一个合理的平面,将高维空间向低维空间投影如何找到超平面应该找怎样的超平面:样本散度最大的超平面。PCA逐一找散度最大的方向验证PCA找的最大散度方向以2类问题为列,设样本类间的差别较大,而类内的差别相对较小。PCA寻找的最大散度

4、方向上,正好就应该是样本的差异化最大的方向。样例x0.91.10.80.8722.21.92.1y1.21.00.921.11.811.91.72.5t11.4861.4851.2161.3932.6942.8982.5453.253t2-0.2080.075-0.081-0.1580.1420.2210.149-0.273原数据图PCA后完善程序—PCA的plot思考PLOT是对得分矩阵T的被选2列作图得分矩阵T已知被选的2个主成分需要确定在牛顿迭代法的画图程序的基础上实现解析红木数据7种红木数据,原始数据,经过PC

5、A分解,效果?经过数据过滤,经过PCA分解,效果?数据预处理,KNNKNearestNeighbor有监督的方法找最有发言权的一组样本投票表决和未知样本距离近的样本,就是最有发言权的.表决结果result=sum(vi/di),di是第i个样本与未知样本的距离vi=1ifsi是第一类elsevi=-1result>0第一类,否则第二类KNN算法描述获得先验知识矩阵X和Y,保存备用获得预报的样本矩阵X1,一行一个样本让i=0取X1的第i个样本,记作si计算si与所有先验样本的距离,得到一个向量,记作distance从di

6、stance中,找到k个最小的样本,记录其距离值和对应的样本编号,以得到其分类信息根据投票表决公式,计算投票值result,对样本进行归类,并保存i增1,取下一个样本,转到d),直到样本预报结束

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。