模式识别与机器学习期末考查试题及参考答案

模式识别与机器学习期末考查试题及参考答案

ID:12751398

大小:41.00 KB

页数:9页

时间:2018-07-18

模式识别与机器学习期末考查试题及参考答案_第1页
模式识别与机器学习期末考查试题及参考答案_第2页
模式识别与机器学习期末考查试题及参考答案_第3页
模式识别与机器学习期末考查试题及参考答案_第4页
模式识别与机器学习期末考查试题及参考答案_第5页
资源描述:

《模式识别与机器学习期末考查试题及参考答案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、模式识别与机器学习期末考查试卷研究生姓名:入学年份:导师姓名:试题1:简述模式识别与机器学习研究的共同问题和各自的研究侧重点。答:(1)模式识别是研究用计算机来实现人类的模式识别能力的一门学科,是指对表征事物或现象的各种形式的信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程。主要集中在两方面,一是研究生物体(包括人)是如何感知客观事物的,二是在给定的任务下,如何用计算机实现识别的理论和方法。机器学习则是一门研究怎样用计算机来模拟或实现人类学习活动的学科,是研究如何使机器通过识别和利用现有知识来获取新知识和新技

2、能。主要体现以下三方面:一是人类学习过程的认知模型;二是通用学习算法;三是构造面向任务的专用学习系统的方法。两者关心的很多共同问题,如:分类、聚类、特征选择、信息融合等,这两个领域的界限越来越模糊。机器学习和模式识别的理论和方法可用来解决很多机器感知和信息处理的问题,其中包括图像/视频分析(文本、语音、印刷、手写)文档分析、信息检索和网络搜索等。(2)机器学习和模式识别是分别从计算机科学和工程的角度发展起来的,各自的研究侧重点也不同。模式识别的目标就是分类,为了提高分类器的性能,可能会用到机器学习算法。而机器学习的目标是通过学

3、习提高系统性能,分类只是其最简单的要求,其研究更侧重于理论,包括泛化效果、收敛性等。模式识别技术相对比较成熟了,而机器学习中一些方法还没有理论基础,只是实验效果比较好。许多算法他们都在研究,但是研究的目标却不同。如SVM在模式识别中研究所关心的就是其对人类效果的提高,偏工程。而在机器学习中则更侧重于其性能上的理论证明。试题2:列出在模式识别与机器学习中的常用算法及其优缺点。答:(1)K近邻法KNN算法作为一种非参数的分类算法,它已经广泛应用于分类、回归和模式识别等。在应用KNN算法解决问题的时候,要注意的两个方面是样本权重和特

4、征权重。优缺点:非常有效,实现简单,分类效果好。样本小时误差难控制,存储所有样本,需要较大存储空间,对于大样本的计算量大。(2)贝叶斯决策法贝叶斯决策法是以期望值为标准的分析法,是决策者在处理风险型问题时常常使用的方法。优缺点:由于在生活当中许多自然现象和生产问题都是难以完全准确预测的,因此决策者在采取相应的决策时总会带有一定的风险。贝叶斯决策法就是将各因素发生某种变动引起结果变动的概率凭统计资料或凭经验主观地假设,然后进一步对期望值进行分析,由于此概率并不能证实其客观性,故往往是主观的和人为的概率,本身带有一定的风险性和不肯

5、定性。虽然用期望的大小进行判断有一些风险,但仍可以认为贝叶斯决策是一种兼科学性和实效性于一身的比较完善的用于解决风险型决策问题的方法,在实际中能够广泛应用于组织系统改革、企业效益、市场开发、证券投资等诸多领域。使用时根据决策者的侧重点,结合变异系数,综合使用货币因素的贝叶斯决策、或效用函数的贝叶斯决策法,都会得到自己想要的结果。(3)DES加密算法DES是DataEncryptionStandard(数据加密标准)的缩写,它为密码体制中的对称密码体制,又被称为美国数据加密标准,是1972年美国IBM公司研制的加密算法。DES是

6、一个分组加密算法,他以64位为分组对数据加密。同时DES也是一个对称算法:加密和解密用的是同一个算法。它的密匙长度是56位(因为每个第8位都用作奇偶校验),密匙可以是任意的56位的数,而且可以任意时候改变。其中有极少量的数被认为是弱密匙,但是很容易避开他们。所以保密性依赖于密钥。优缺点:具有极高安全性,分组比较短,密钥太短,密码生命周期短,运算速度较慢。(4)决策树学习算法决策树算法是一种混合算法,它综合了多种不同的创建树的方法,并支持多个分析任务,包括回归、分类以及关联。决策树算法支持对离散属性和连续属性进行建模。优缺点:决

7、策树算法高效快速且可伸缩,可轻松实现并行化,这意味着所有处理器均可协同工作,共同生成一个一致的模型。这些特征使决策树分类器成为了理想的数据挖掘工具。在数据挖掘的各种方法中,决策树归纳学习算法以其易于提取显式规则、计算量相对较小、可以显示重要的决策属性和较高的分类准确率等优点而得到广泛应用。决策树的这种易理解性对数据挖掘的使用者来说是一个显著的优点。然而决策树的这种明确性可能带来误导。比如,决策树每个节点对应分割的定义都是非常明确毫不含糊的,但在实际生活中这种明确可能带来麻烦。对决策树常见的批评是说其在为一个节点选择怎样进行分割

8、时使用“贪心”算法。此种算法在决定当前这个分割时根本不考虑此次选择会对将来的分割造成什么样的影响。(5)C均值算法C均值算法是通过不断调整聚类中心使得误差平方和准则函数取得极小值。优缺点:能够动态聚类,是一种无监督学习算法,算法简单,速度快,局部搜索能力强,能够有效处理大型数

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。