欢迎来到天天文库
浏览记录
ID:58586155
大小:2.30 MB
页数:45页
时间:2020-10-20
《机器学习与深度学习简介ppt课件.pptx》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、机器学习简介与应用1卷积神经网络自编码器机器学习与深度学习提纲2机器学习与深度学习PART013什么是机器学习?4机器学习:对研究问题进行模型假设,利用计算机从训练数据中学习得到模型参数,并最终对数据进行预测和分类。其基础主要是归纳和统计。机器学习常用算法5决策树:将输入空间分成不同的区域,每个区域有独立参数的算法。决策树算法充分利用了树形模型,根节点到一个叶子节点是一条分类的路径规则,每个叶子节点象征一个判断类别。先将样本分成不同的子集,再进行分割递推,直至每个子集得到同类型的样本,从根节点开始测试,到子树再到叶子节点,即可得出预测类别。此方法的特点是结构简单、处理数据效
2、率较高。缺点:决策树往往会产生过拟合问题机器学习常用算法6随机森林:以决策树为基础的一种更高级的算法。工作原理是生成多个分类器/模型,各自独立地学习和作出预测。随机森林中每个决策树都有一个自己的结果,通过统计每个决策树的结果,选择投票数最多的结果作为其最终结果。所以理论上,随机森林的表现一般要优于单一的决策树。优点:抗过拟合能力:通过平均决策树,降低过拟合的风险性。只有在半数以上的基分类器出现差错时才会做出错误的预测,非常稳定。机器学习常用算法7支持向量机:建立一个最优决策超平面,使得该平面两侧距平面最近的两类样本之间的聚类最大化,从而对分类问题提供良好的泛化能力。红色两条
3、线是两类数据的边界,但容错性较低,如果取绿色线作为分类线,那么对于此类数据,应该是最好的分类线。机器学习常用算法8Boost&Bagging:构建多个弱学习算法,形成多个弱分类器,得到多种比较粗糙的分类规则,然后将这些弱分类规则组织成强分类规则。Boost:采用改变训练数据的概率分布,针对不同的训练数据分布调用弱学习算法学习一组弱分类器。在多次迭代的过程中,当前次迭代所用的训练数据的概率分布会依据上一次迭代的结果而调整。也就是说训练数据的各样本是有权重的,这个权重本身也会随着迭代而调整。不同分布的训练数据进入不同学习法则后,得到的各基本分类器通常经过线性组合,形成强分类器。
4、例如,像Adaboost和xgboost,最后的强分类器都是弱分类器的加性组合。机器学习常用算法9Bagging:训练几个分类器(弱学习器),然后让这几个分类器的输出当做分类投票,选择票数最多的那个输出作为最后的输出。对每个分类器,输入数据都是从原始训练数据中可重复的采样,每个分类器的输入服从相同的分布,且各输入之间相互独立。而Boost中,各训练数据的分布不独立,每个分类器的输入样本之间也不独立。BoostBagging样本选择训练集不变有放回方式采样样本权重错误率越大,权重越大权重相同预测函数分类误差小的分类器会有更大的权重所有预测函数的权重相等并行计算各个预测函数只能
5、顺序生成各个预测函数可以并行计算从简单线性分类器到深度学习10:激活函数深度学习特点:增加中间层、低层特征转化为高层特征深度学习网络往往包含多个中间层问题:根据繁华程度(x1)、交通便利度(x2)、与市中心距离(x3)、楼层(x4)预测房价高低深度学习11深度学习(Deeplearning)是一种实现机器学习的技术,是机器学习重要的分支。其源于人工神经网络的研究。深度学习模型是一种包含多隐藏层的神经网络,通过组合低层特征形成更加抽象的高层特征。机器学习深度学习受人脑神经元工作机理的启发:深度学习动机12良好的特征表达,对最终算法的准确性起了非常关键的作用识别系统主要的计算和
6、测试工作耗时主要集中在特征提取部分特征的样式一般都是人工设计的,靠人工提取特征数据预处理特征提取特征选择预测与识别传统模式识别方法深度学习动机13自动选取特征获得好的特征是识别成功的关键目前存在大量人工设计的特征,不同研究对象特征不同,特征具有多样性,如SIFT(尺度不变特征变换),HOG(方向梯度直方图)等特征手工选取特征费时费力,需要启发式专业知识,很大程度上靠经验和运气是否能自动地学习特征?物体部件:对于人工而言特征提取是十分困难的不一定特征越多越好,需要多少个特征由学习确定深度学习动机14层次网络结构:高层特征或图像,往往是由一些基本结构(浅层特征)组成。高层的特征
7、是低层特征的组合,从低层到高层的特征表示越来越抽象,越来越能表现语义或者意图。2006年,加拿大多伦多大学教授、机器学习领域的泰斗GeoffreyHinton在《科学》上发表论文提出深度学习主要观点:1)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;2)深度神经网络在训练上的难度,可以通过“逐层初始化”(layer-wisepre-training)来有效克服,逐层初始化可通过无监督学习实现的。浅层学习局限:有限样本和计算单元情况下对复杂函数的表示能力有限,
此文档下载收益归作者所有