深度学习算法.ppt

ID：56381660

大小：1.27 MB

页数：19页

时间：2020-06-14

资源描述：

《深度学习算法.ppt》由会员上传分享，免费在线阅读，更多相关内容在PPT专区-天天文库。

1、浅谈深度学习DBN和CNN算法报告人：龚再文院系：自动化学院时间：2015.7.42006年，加拿大多伦多大学教授、机器学习领域的泰斗G.E.Hinton和他的学生R.R.Salakhutdinov在science上发表了一篇文章（用神经网络实现数据降维），开启了深度学习在学术界和工业界的浪潮。这篇文章有两个主要观点：多隐层的人工神经网络具有优异的特征学习能力，学习得到的特征对数据有更本质的刻画，从而有利于可视化或分类；深度神经网络在训练上的难度，可以通过“逐层初始化”（layer-wisepre-training）

2、来有效克服，在这篇文章中，逐层初始化是通过无监督学习实现的。深度学习的浪潮深度学习（DeepLearning）是机器学习研究中的一个新的领域，深度学习是当下最热门的方向之一。其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。深度学习热潮爆发以来，诸多研究者都在不懈地努力着，希望能够把它应用于解决计算机视觉的各种任务上，从高层次（high-level）的识别（recognition），分类（classification）到低层次（low-level）的去噪（denoise

3、）。让人不禁联想起当年的稀疏表达（sparserepresentation）的热潮，而深度学习如今的风靡程度看上去是有过之而无不及。深度学习也有横扫high-level问题的趋势，high-level的很多方向都在被其不断刷新着数据。作为强大的特征（feature）学习工具，在给定足够多的训练集的情况下，它可以帮助用户学习到这个任务下的具有很强分辨能力的特征。深度学习的浪潮深度学习可通过学习一种深层非线性网络结构，实现复杂函数逼近，表征输入数据分布式表示，并展现了强大的从少数样本集中学习数据集本质特征的能力。多层的好

4、处在于可以用较少的参数表示复杂的函数。深度学习的实质，是通过构建具有很多隐层的机器学习模型和海量的训练数据，来学习更有用的特征，从而最终提升分类或预测的准确性。因此，“深度模型”是手段，“特征学习”是目的。区别于传统的浅层学习，深度学习的不同在于：强调了模型结构的深度，通常有5层、6层，甚至10多层的隐层节点；明确突出了特征学习的重要性，也就是说，通过逐层特征变换，将样本在原空间的特征表示变换到一个新特征空间，从而使分类或预测更加容易。与人工规则构造特征的方法相比，利用大数据来学习特征，更能够刻画数据的丰富内在信息。

5、深度学习的实质深度学习在近期赢得了很多关注，特别是百度也开始发力深度学习后（InstituteofDeepLearning），更是在国内引起了很多关注。在计算能力变得日益廉价的今天，深度学习试图建立大得多也复杂得多的神经网络。很多深度学习的算法是无监督或半监督式学习算法，用来处理存在少量未标识数据的大数据集。常见的深度学习算法包括：受限波尔兹曼机（RestrictedBoltzmannMachine）深度信念网络（DeepBeliefNetworks）卷积神经网络（ConvolutionalNeuralNetwor

6、ks）堆栈式自动编码器（StackedAuto-encoders）深度学习算法深度学习算法ConvolutionalNeuralNetworks卷积神经网络DeepBeliefNetworks深度信念网络DBNs由多个限制玻尔兹曼机（RBM）层组成。RBM被“限制”为一个可视层和一个隐层，层间存在连接，但层内的单元间不存在连接。隐层单元被训练去捕捉在可视层表现出来的高阶数据的相关性。DeepBeliefNetworks典型的神经网络类型深度信念网络的框架DeepBeliefNetworks分别单独无监督地训练每一层R

7、BM网络，确保特征向量映射到不同特征空间时，都尽可能多地保留特征信息；在DBN的最后一层设置BP网络，接收RBM的输出特征向量作为它的输入特征向量，有监督地训练实体关系分类器。而且每一层RBM网络只能确保自身层内的权值对该层特征向量映射达到最优，并不是对整个DBN的特征向量映射达到最优，所以反向传播网络还将错误信息自顶向下传播至每一层RBM，微调整个DBN网络。RBM网络训练模型的过程可以看作对一个深层BP网络权值参数的初始化，使DBN克服了BP网络因随机初始化权值参数而容易陷入局部最优和训练时间长的缺点。上述训练模

8、型中第一步在深度学习的术语叫做预训练，第二步叫做微调。最上面有监督学习的那一层，根据具体的应用领域可以换成任何分类器模型，而不必是BP网络。DBN训练模型的过程DeepBeliefNetworksCDPseudo，对比散度算法伪代码伪代码中涉及到的后验概率可以由能量模型和极大似然估计求出DeepBeliefNetworksNotesOnCDPs

当前文档最多预览五页，下载文档查看全文

侵权申诉



1 1 2 3 4 5 / 19



此文档下载收益归作者所有

当前文档最多预览五页，下载文档查看全文

温馨提示：
1. 部分包含数学公式或PPT动画的文件，查看预览时可能会显示错乱或异常，文件下载后无此问题，请放心下载。
2. 本文档由用户上传，版权归属用户，天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容，确认文档内容符合您的需求后进行下载，若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误，付费完成后未能成功下载的用户请联系客服处理。

深度学习算法.ppt

深度学习算法.ppt

相关文章

相关标签