深度学习进阶笔记之四 深入理解googlenet

深度学习进阶笔记之四 深入理解googlenet

ID:14098127

大小:1.36 MB

页数:46页

时间:2018-07-26

深度学习进阶笔记之四  深入理解googlenet_第1页
深度学习进阶笔记之四  深入理解googlenet_第2页
深度学习进阶笔记之四  深入理解googlenet_第3页
深度学习进阶笔记之四  深入理解googlenet_第4页
深度学习进阶笔记之四  深入理解googlenet_第5页
资源描述:

《深度学习进阶笔记之四 深入理解googlenet》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、UCLoud中国云三强:www.ucloud.cn深度学习进阶笔记之四

2、深入理解GoogLeNet引言TensorFlow是Google基于DistBelief进行研发的第二代人工智能学习系统,被广泛用于语音识别或图像识别等多项机器深度学习领域。其命名来源于本身的运行原理。Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,TensorFlow代表着张量从图象的一端流动到另一端计算过程,是将复杂的数据结构传输至人工智能神经网中进行分析和处理的过程。TensorFlow完全开源,任何人都可以使用。可在小到一部智能手机、大

3、到数千台数据中心服务器的各种设备上运行。『机器学习进阶笔记』系列将深入解析TensorFlow系统的技术实践,从零开始,由浅入深,与大家一起走上机器学习的进阶之路。GoogLeNet主要是直径经典的LeNet-5算法,主要是Google的team成员完成,paper见GoingDeeperwithConvolutions.相关工作主要包括LeNet-5、Gaborfilters、Network-in-Network.Network-in-Network改进了传统的CNN网络,采用少量的参数就轻松地击败了AlexNet网络,使用Network-

4、in-Network的模型然后大小约为29MNetwork-in-Networkcaffemodel.GoogLeNet借鉴了Network-in-Network的思想,下面会详细讲述下。UCLoud中国云三强:www.ucloud.cnNetwork-in-Network左边是我们CNN的线性卷积层,一般来说线性卷积层用来提取线性可分的特征,但所提取的特征高度非线性时,我们需要更加多的filters来提取各种潜在的特征,这样就存在一个问题,filters太多,导致网络参数太多,网络过于复杂对于计算压力太大。文章主要从两个方法来做了一些改良:

5、1,卷积层的改进:MLPconv,在每个local部分进行比传统卷积层复杂的计算,如上图右,提高每一层卷积层对于复杂特征的识别能力,这里举个不恰当的例子,传统的CNN网络,每一层的卷积层相当于一个只会做单一任务,你必须要增加海量的filters来达到完成特定量类型的任务,而MLPconv的每层conv有更加大的能力,每一层能够做多种不同类型的任务,在选择filters时只需要很少量的部分;2,采用全局均值池化来解决传统CNN网络中全连接层参数过于复杂的特点,而且全连接会造成网络的泛化能力差,Alexnet中有提高使用dropout来提高网络的

6、泛化能力。UCLoud中国云三强:www.ucloud.cn末尾作者设计了一个4层的Network-in-network+全局均值池化层来做imagenet的分类问题.classNiN(Network):defsetup(self):(self.feed('data').conv(11,11,96,4,4,padding='VALID',name='conv1').conv(1,1,96,1,1,name='cccp1').conv(1,1,96,1,1,name='cccp2').max_pool(3,3,2,2,name='pool1')

7、.conv(5,5,256,1,1,name='conv2').conv(1,1,256,1,1,name='cccp3').conv(1,1,256,1,1,name='cccp4').max_pool(3,3,2,2,padding='VALID',name='pool2').conv(3,3,384,1,1,name='conv3').conv(1,1,384,1,1,name='cccp5').conv(1,1,384,1,1,name='cccp6').max_pool(3,3,2,2,padding='VALID',name='p

8、ool3').conv(3,3,1024,1,1,name='conv4-1024').conv(1,1,1024,1,1,name='cccp7-1024').conv(1,1,1000,1,1,name='cccp8-1024').avg_pool(6,6,1,1,padding='VALID',name='pool4').softmax(name='prob'))网络基本结果如上,代码见GitHub-ethereon/caffe-tensorflow:CaffemodelsinTensorFlow.UCLoud中国云三强:www.ucl

9、oud.cn这里因为我近期工作变动的问题,没有了机器来跑一篇,也无法画下基本的网络结构图,之后我会补上。这里指的提出的是中间cccp1和ccp2(crosschan

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。