基于深度学习的图像识别进展:百度的若干实践

基于深度学习的图像识别进展:百度的若干实践

ID:40499766

大小:1.43 MB

页数:12页

时间:2019-08-03

基于深度学习的图像识别进展:百度的若干实践_第1页
基于深度学习的图像识别进展:百度的若干实践_第2页
基于深度学习的图像识别进展:百度的若干实践_第3页
基于深度学习的图像识别进展:百度的若干实践_第4页
基于深度学习的图像识别进展:百度的若干实践_第5页
资源描述:

《基于深度学习的图像识别进展:百度的若干实践》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、近年来在人工智能领域最受关注的,非深度学习莫属。自2006年吉奥夫雷·辛顿(GeofferyHinton)等在《科学》(Science)杂志发表那篇著名的论文[1]开始,深度学习的热潮从学术界席卷到了工业界。2012年6月,《纽约时报》披露“谷歌大脑(GoogleBrain)”项目,由著名的斯坦福大学机器学习教授吴恩达(AndrewNg)和大规模计算机系统世界顶级专家杰夫·迪恩(JeffDean)共同主导,用1.6万个CPU核的并行计算平台训练深度神经网络(DeepNeuralNetworks,DN

2、N)的机器学习模型,在语音和图像识别等领域获得巨大成功。国内方面,2013年1月,百度成立深度学习研究院,公司CEO李彦宏担任院长。短短两年时间,深度学习技术被应用到百度的凤巢广告系统、网页搜索、语音搜索、图像识别等领域,涵盖几十项产品。今天,用户在百度平台上的几乎每个服务请求,都被深度学习系统所处理。人工智能的特征之一是学习的能力,即系统的性能是否会随着经验数据的积累而不断提升。所以,大数据时代的到来给人工智能的发展提供前所未有的机遇。在这个时代背景下,深度学习在包括图像识别等方面所取得的突破性进

3、展并非偶然。在百度的实践中,我们认识到深度学习主要在以下三个方面具有巨大优势:1.从统计和计算的角度看,深度学习特别适合处理大数据。在很多问题上,深度学习是目前我们能找到的最好方法。它集中体现了当前机器学习算法的三个大趋势:用较为复杂的模型降低模型偏差(modelbias),用大数据提升统计估计的准确度,用可扩展(scalable)的梯度下降算法求解大规模优化问题。2.深度学习不是一个黑箱系统。它像概率模型一样,提供一套丰富的、基于联接主义的建模语言(建模框架)。利用这套语言系统,我们可以表达数据内

4、在的丰富关系和结构,比如用卷积处理图像中的二维空间结构,用递归神经网络(RecurrentNeuralNetwork,RNN)处理自然语言等数据中的时序结构。3.深度学习几乎是唯一的端到端机器学习系统。它直接作用于原始数据,自动逐层进行特征学习,整个过程直接优化某个目标函数。而传统机器学习往往被分解为几个不连贯的数据预处理步骤,比如人工抽取特征,这些步骤并非一致地优化某个整体的目标函数。让计算机识别和理解图像,是人工智能最重要的目标之一。尤其是在移动互联网时代,智能手机上的摄像头将人们日常看到的世界

5、捕捉下来,图像和视频数据暴增,造就了图像大数据时代。计算机视觉的主要内容就是图像识别:一方面,这个技术使得计算机像人类视觉系统一样,具有“看懂”世界的能力,从而能自主适应环境、改造环境;另一方面,依靠识别图像内容,可以帮助我们更好地了解人,比如,通过用户产生的拍照内容了解用户的行为和喜好,或者通过识别用户手势理解用户的意图。借助图像识别让互联网服务更好地理解世界、洞察用户,也是百度深度学习研究院重点投入的技术研发方向之一。有意思的是,深度学习研究的初衷主要就是应用于图像识别。迄今为止,尽管深度学习已

6、经被应用到语音、图像、文字等方面,但深度学习领域发表的论文中大约70%是关于图像识别的。从2012年的ImageNet[2]竞赛开始,深度学习在图像识别领域发挥出巨大威力,在通用图像分类、图像检测、光学字符识别(OpticalCharacterRecognition,OCR)、人脸识别等领域,最好的系统都是基于深度学习的。前面所述深度学习的三大优势,在最近图像识别的进展中体现得淋漓精致:模型结构越来越复杂,训练数据规模也不断增加;各种关于数据结构的先验知识被体现到新的模型结构中;端到端学习让我们越来

7、越摒弃基于人工规则的中间步骤。百度深度学习研究院在基于深度学习的图像识别课题上开展了大量工作,并取得丰硕成果。在将基于深度学习的图像识别应用于图像搜索、网页搜索、百度魔图、涂书笔记、作业帮、百度街景等互联网产品以及百度眼镜(BaiduEye)、自动驾驶等创新性研究项目方面,也积累了丰富经验。下面与大家分享若干个技术实践。基于深度学习的图像分类和物体检测算法图像分类(imageclassification)和物体检测(objectdetection)是图像识别的两个核心问题。前者主要对图像整体的语义内

8、容进行类别判定,后者则定位图像中特定物体出现的区域并判定其类别。与图像分类相比,物体检测更加关注图像的局部区域和特定的物体类别集合,被视为更加复杂的图像识别问题。两项技术在信息检索、广告投放、用户分析、商品推荐等互联网应用中大有用武之地。传统图像分类算法中具有代表性的是杨(Yang)等人[3]在2009年提出的采用稀疏编码(sparsecoding)表征图像、通过大规模数据训练支持向量机(supportvectormachine)进行图像分类的方法。这类方法在2010

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。