深度学习的基本理论与应用

深度学习的基本理论与应用

ID:43646940

大小:10.05 MB

页数:42页

时间:2019-10-11

深度学习的基本理论与应用_第1页
深度学习的基本理论与应用_第2页
深度学习的基本理论与应用_第3页
深度学习的基本理论与应用_第4页
深度学习的基本理论与应用_第5页
资源描述:

《深度学习的基本理论与应用》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、深度学习的基本理论与应用HaishanLi2018年5月14日目录概述深度学习简介深度学习的训练过程深度学习的具体模型及方法深度学习的应用概述2012年6月,《纽约时报》披露了GoogleBrain项目,吸引了公众的广泛关注。这个项目是由著名的斯坦福大学机器学习教授Andrew和在大规模计算机系统方面的世界顶尖专家Jeff共同主导,用16000个CPUCore的并行计算平台训练一种称为“深层神经网络”(DNN,DeepNeuralNetworks)的机器学习模型,在语音识别和图像识别等领域获得了巨大的成功。2012年11月,微软在中国天津的一次活动上

2、公开演示了一个全自动的同声传译系统,讲演者用英文演讲,后台的计算机一气呵成自动完成语音识别、英中机器翻译,以及中文语音合成,效果非常流畅。据报道,后面支撑的关键技术也是DNN,或者深度学习(DL,DeepLearning)。2012.6“谷歌大脑”项目2012.11微软智能同声传译概述2013年1月,在百度的年会上,创始人兼CEO李彦宏高调宣布要成立百度研究院,其中第一个重点方向就是深度学习,并为此而成立InstituteofDeepLearning(IDL)。这是百度成立十多年以来第一次成立研究院。2013年4月,《麻省理工学院技术评论》杂志将深度

3、学习列为2013年十大突破性技术(BreakthroughTechnology)之首。百度首席科学家吴恩达2014年12月19日表示,百度在深度学习领域的发展已经超过了谷歌与苹果,如果这项技术真具有划时代的革命意义,那么百度就此开启并且引领了语音2.0时代,也即是人工智能时代的一个重要分支,改变搜索,更改变交互。概述全球爆发人工智能产业浪潮概述三大因素推劢人工智能快速发展概述当前处亍行业应用大规模起量阶段目录概述深度学习简介深度学习的训练过程深度学习的具体模型及方法深度学习的应用深度学习简介识别系统主要的计算和测试工作耗时主要集中在特征提取部分;特征

4、的样式目前一般都是人工设计的,靠人工提取特征;手工选取特征费时费力,需要启发式专业知识,很大程度上靠经验和运气;不能够自动地学习特征Low-levelsensingPre-processingFeatureextract.FeatureselectionInference:prediction,recognition传统的模式识别方法(浅层学习):深度学习简介传统的模式识别方法(如BP算法)如BP算法,随机设定初值,计算当前网络的输出,然后根据当前输出和样本真实标签之间的差去改变前面各层的参数,直到收敛比较容易过拟合,参数比较难调整,而且需要不少技巧

5、;训练速度比较慢,在层次比较少(小于等于3)的情况下效果并不比其它方法更优;反馈调整时,梯度越来越稀疏,从顶层越往下,误差校正信号越来越小;收敛易至局部最小,由于是采用随机值初始化,当初值是远离最优区域时易导致这一情况;需要有标签数据来训练,但大部分数据是无标签的;深度学习简介2006年,加拿大多伦多大学教授、机器学习领域的泰斗GeoffreyHinton在《科学》上发表论文提出深度学习主要观点:1)多隐层的人工神经网络具有优异的特征学习能力,学习得到的特征对数据有更本质的刻画,从而有利于可视化或分类;2)深度神经网络在训练上的难度,可以通过“逐层初

6、始化”(layer-wisepre-training)来有效克服,逐层初始化可通过无监督学习实现的。采用逐层训练机制的原因在于如果采用BP机制,对于一个deepnetwork(7层以上),残差传播到最前面的层将变得很小,出现所谓的gradientdiffusion(梯度扩散)深度学习简介本质:通过构建多隐层的模型和海量训练数据(可为无标签数据),来学习更有用的特征,从而最终提升分类或预测的准确性。“深度模型”是手段,“特征学习”是目的。与浅层学习区别:强调了模型结构的深度,通常有5-10多层的隐层节点;明确突出了特征学习的重要性,通过逐层特征变换,将

7、样本在原空间的特征表示变换到一个新特征空间,从而使分类或预测更加容易。与人工规则构造特征的方法相比,利用大数据来学习特征,更能够刻画数据的丰富内在信息。从历史数据中学习知识,从而对未来做预测深度学习简介好处:可通过学习一种深层非线性网络结构,实现复杂函数逼近,表征输入数据分布式表示。ImageNet图像分类结果目录概述深度学习简介深度学习的训练过程深度学习的具体模型及方法深度学习的应用深度学习的训练过程第一步:采用自下而上的无监督学习EncoderDecoderInputImageClasslabelFeaturesEncoderDecoderFea

8、turesEncoderDecoder逐层构建单层神经元每层采用wake-sleep算法进行调优。每次仅调整

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。