基于深度学习的图像识别进展百度的若干实践

基于深度学习的图像识别进展百度的若干实践

ID:37943603

大小:3.26 MB

页数:9页

时间:2019-06-03

基于深度学习的图像识别进展百度的若干实践_第1页
基于深度学习的图像识别进展百度的若干实践_第2页
基于深度学习的图像识别进展百度的若干实践_第3页
基于深度学习的图像识别进展百度的若干实践_第4页
基于深度学习的图像识别进展百度的若干实践_第5页
资源描述:

《基于深度学习的图像识别进展百度的若干实践》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、专题第 11 卷第4 期2015 年 4 月基于深度学习的图像识别进展:百度的若干实践都大龙余轶南罗恒等关键词:深度学习图像分类物体检测百度公司概述:深度学习和图语音搜索、图像识别等领域,涵2.深度学习不是一个黑箱盖几十项产品。今天,用户在百系统。它像概率模型一样,提供像识别度平台上的几乎每个服务请求,一套丰富的、基于联接主义的建近年来在人工智能领域最都被深度学习系统所处理。模语言(建模框架)。利用这套受关注的,非深度学习莫属。自人工智能的特征之一是学习语言系统,我们可以表达数据内2006年吉奥夫雷·辛顿(Geoffery的能力,即系

2、统的性能是否会随在的丰富关系和结构,比如用卷Hinton)等在《科学》(Science)杂着经验数据的积累而不断提升。积处理图像中的二维空间结构,[1]志发表那篇著名的论文开始,所以,大数据时代的到来给人用递归神经网络(RecurrentNeu-深度学习的热潮从学术界席卷到工智能的发展提供前所未有的机ralNetwork,RNN)处理自然语言了工业界。2012年6月,《纽约遇。在这个时代背景下,深度学等数据中的时序结构。时报》披露“谷歌大脑(Google习在包括图像识别等方面所取得3.深度学习几乎是唯一的Brain)”项目,由著名的斯

3、坦福大的突破性进展并非偶然。端到端机器学习系统。它直接学机器学习教授吴恩达(Andrew在百度的实践中,我们认识作用于原始数据,自动逐层进行Ng)和大规模计算机系统世界顶到深度学习主要在以下三个方面特征学习,整个过程直接优化某级专家杰夫·迪恩(JeffDean)共具有巨大优势:个目标函数。而传统机器学习往同主导,用1.6万个CPU核的1.从统计和计算的角度往被分解为几个不连贯的数据预并行计算平台训练深度神经网络看,深度学习特别适合处理大处理步骤,比如人工抽取特征,(DeepNeuralNetworks,DNN)的数据。在很多问题上,深

4、度学习这些步骤并非一致地优化某个整机器学习模型,在语音和图像识是目前我们能找到的最好方法。体的目标函数。别等领域获得巨大成功。它集中体现了当前机器学习算法让计算机识别和理解图像,国内方面,2013年1月,百的三个大趋势:用较为复杂的模是人工智能最重要的目标之一。度成立深度学习研究院,公司型降低模型偏差(modelbias),用尤其是在移动互联网时代,智能CEO李彦宏担任院长。短短两年大数据提升统计估计的准确度,手机上的摄像头将人们日常看到时间,深度学习技术被应用到百用可扩展(scalable)的梯度下降的世界捕捉下来,图像和视频数度的

5、凤巢广告系统、网页搜索、算法求解大规模优化问题。据暴增,造就了图像大数据时代。32第 11 卷第4 期2015 年 4 月计算机视觉的主要内容就是图像在将基于深度学习的图像识别应户分析、商品推荐等互联网应用识别:一方面,这个技术使得计用于图像搜索、网页搜索、百度中大有用武之地。算机像人类视觉系统一样,具有魔图、涂书笔记、作业帮、百度传统图像分类算法中具有[3]“看懂”世界的能力,从而能自街景等互联网产品以及百度眼镜代表性的是杨(Yang)等人在主适应环境、改造环境;另一方(BaiduEye)、自动驾驶等创新性2009年提出的采用稀疏编

6、码面,依靠识别图像内容,可以帮研究项目方面,也积累了丰富经(sparsecoding)表征图像、通过助我们更好地了解人,比如,通验。下面与大家分享若干个技术大规模数据训练支持向量机(sup-过用户产生的拍照内容了解用户实践。portvectormachine)进行图像分的行为和喜好,或者通过识别用类的方法。这类方法在2010年[1]户手势理解用户的意图。借助图基于深度学习的图像和2011年的ImageNet图像分像识别让互联网服务更好地理解类竞赛中取得了最好成绩,其主分类和物体检测算法世界、洞察用户,也是百度深度要缺陷在于稀疏编码和分

7、类模学习研究院重点投入的技术研发图像分类(imageclassifica-型是在不同目标函数的监督下分方向之一。tion)和物体检测(objectdetec-开训练得到的,两者无法有效有意思的是,深度学习研tion)是图像识别的两个核心问地联合训练。变革发生于2012[4]究的初衷主要就是应用于图像识题。前者主要对图像整体的语义年,辛顿等人采用卷积神经网别。迄今为止,尽管深度学习已内容进行类别判定,后者则定位络(ConvolutionalNeuralNetwork,经被应用到语音、图像、文字等图像中特定物体出现的区域并判CNN)将Im

8、ageNet图像Top5分方面,但深度学习领域发表的论定其类别。与图像分类相比,物类识别错误率从之前的25%降低文中大约70%是关于图像识别[2]的。从2012年的ImageNet竞识别错误率赛开始,深度学习在图像识别领

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。