机器学习专题课件.ppt

机器学习专题课件.ppt

ID:57444382

大小:2.77 MB

页数:115页

时间:2020-08-19

机器学习专题课件.ppt_第1页
机器学习专题课件.ppt_第2页
机器学习专题课件.ppt_第3页
机器学习专题课件.ppt_第4页
机器学习专题课件.ppt_第5页
资源描述:

《机器学习专题课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、序有一位计算机科学家曾经和很多其他学科的科学家们在一起合作,大家互相介绍各自的工作的时候,这位计算机科学家苦心构思了这么一个例子,他说:我的工作就是要让计算机认识这个,然后他画了下面这幅图,严格的说是写了这组严格对齐的数字000000000000000000000000000000000000000001100000000011000110000000001100011000000000110001100000000011000110000000001100011000000000110001100000000011111111100

2、0000011111111100000000000011000000000000001100000000000000110000000000000000000000000000000000000桑克(sank):“一台计算机若不能进行学习,就不能说它具有智能”Simon(1983):学习就是系统中的变化,这种变化使系统比以前更有效地去做同样的工作。无统一的机器学习定义。机器学习是研究如何使用机器来模拟人类学习活动的一门学科。稍严格的提法是:ML是一门研究机器获得新知识和新技能,并识别现有知识的学问1、机器学习的定义人工智能主要是为了研

3、究人的智能,模仿其机理将其应用于工程的科学。在这个过程中必然会问道:“机器怎样做才能像人类一样具有学习能力”。机器学习广泛应用于机器人、图像处理、语音识别、数据挖掘等领域。机器学习的发展有利于推动其他领域的发展。2、为什么要研究机器学习?预测难:学习后知识库发生了什么变化,系统功能的变化的预测。归纳推理:是论证的前提支持结论但不确保结论的推理过程(演绎推理保真);而且,归纳的结论是无限多的,其中相当多是假的,给生成的知识带来不可靠性。判断难:机器目前很难观察什么重要、什么有意义。3、实现的困难54系统学习性能评价分类精度:是否能够对输

4、入的数据进行正确、精确的分类。解答的正确性和质量:无论是用于分类的,还是解决问题的系统都有解答正确性问题。同时,正确性不一定保证有好的质量,好的质量包括:可读性、稳定性等多方面的因素。学习的速度:学习速度是一个很重要的系统指标。它不仅仅影响系统的设计,同时,影响系统的实现。一个很费时的学习方法,某种意义上也是很难实现的。因为,通常花费大量时间所进行的操作表现在对学习样本量的要求、系统空间的要求、系统硬件性能的要求上。6环境学习环节知识库执行环节学习是建立理论、形成假设和进行归纳推理的过程。整个过程包括:信息的存储、知识的处理两部分三、

5、机器学习模型学习系统环境学习环节知识库执行环节学习系统所感知到的外界信息集合,也是学习系统的外界来源对环境提供的信息进行整理、分析归纳或类比,形成知识,并将其放入知识库存储经过加工后的信息(即知识)根据知识库去执行一系列任务,并将执行结果或执行过程中获得的信息反馈给学习环节学习模型输入x输出约束条件机器学习的分类根据是否需要已知类别的样本进行学习,机器学习可以分为两大类:有教师学习(监督学习)无教师学习(非监督学习和强化学习)监督学习 supervisedlearning利用已知类别的样本去训练算法从而调整分类器的参数,这样的学习

6、过程叫做监督学习。监督学习的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个很好的预测。常见的监督学习算法有:决策树adbost算法朴素贝叶斯算法回归算法支持向量机训练集学习系统测试系统测试集模型测试结果监督学习示意图体重翼展脚蹼后背颜色种属11000.1125.0无棕色红尾鵟23000.7200.0无灰色鹭鹰33300.0220.3无灰色鹭鹰44100.0136.0有黑色普通潜鸟53.011.0无绿色蜂鸟上表是用于区分不同鸟类需要使用的四个不同的属性值,分别选取的是体重、翼展、脚蹼和后背颜色作为评测基准。这些测

7、量的四种值成为特征,也叫属性。数据X={x1,x2,x3,x4}表示一组数据标签labelY={y1,y2,y3,y4}训练集T={(x1,y1),(x2,y2),(x3,y3)}测试集{(x4,y4)}特征损失函数,训练误差,测试误差经验风险最小化与结构风险最小化交叉验证选取特定的机器学习算法进行分类,首先需要做的是训练算法,既学习如何分类。通常我们为算法输入大量已分类数据作为算法的训练集。训练集就是用于训练机器学习算法的数据样本集合,表1是包含5个样本集合的训练集,每个训练样本有4中特征和一个目标变量,目标变量是机器学习算法的预测

8、结果既F(x),其中x为一组输入样本。损失函数在监督学习中,给定x,根据F(x)给出相应的输出,而这个输出是预测输出,和真实值y可能一致,也可能不一致。用一个损失函数或者代价函数来度量预测错误的程度。损失函数是F(x)和

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。