谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc

谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc

ID:28145382

大小:289.50 KB

页数:10页

时间:2018-12-08

谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc_第1页
谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc_第2页
谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc_第3页
谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc_第4页
谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc_第5页
资源描述:

《谷歌首席科学家李飞飞:“AI超越 ImageNet 的视觉智能”.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、谷歌首席科学家李飞飞:“AI超越ImageNet的视觉智能”  说起人工智能,孕育了卷积神经网络和深度学习算法的ImageNet挑战赛恐怕是世界上最著名的AI数据集。8年来,在ImageNet数据集的训练下,人工智能对于图像识别的准确度整整提高了10倍,甚至超越了人类视觉本身。  然而,AI领域的科学家们并没有停下前进的脚步。上个周末,人工智能领域最卓越的科学家之一:斯坦福大学终身教授、谷歌云首席科学家李飞飞在未来论坛年会上,为我们做了一场名为“超越ImageNet的视觉智能”的精彩演讲。她告诉我们,AI不仅仅能够精准辨认物体,还能够理解图片内容、甚至能根据一张图片写一小段文章

2、,还能“看懂”视频……    我们都知道,地球上有很多种动物,这其中的绝大多数都有眼睛,这告诉我们视觉是最为重要的一种感觉和认知方式。它对动物的生存和发展至关重要。  所以无论我们在讨论动物智能还是机器智能,视觉是非常重要的基石。世界上所存在的这些系统当中,我们目前了解最深入的是人类的视觉系统。从5亿多年前寒武纪大爆发开始,我们的视觉系统就不断地进化发展,这一重要的过程得以让我们理解这个世界。而且视觉系统是我们大脑当中最为复杂的系统,大脑中负责视觉加工的皮层占所有皮层的50%,这告诉我们,人类的视觉系统非常了不起。  寒武纪物种大爆发  一位认知心理学家做过一个非常著名的实验,

3、这个实验能告诉大家,人类的视觉体系有多么了不起。大家看一下这个视频,你的任务是如果看到一个人的话就举手。每张图呈现的时间是非常短的,也就是1/10秒。不仅这样,如果让大家去寻找一个人,你并不知道对方是什么样的人,或者TA站在哪里,用什么样的姿势,穿什么样的衣服,然而你仍然能快速准确地识别出这个人。  1996年的时候,法国著名的心理学家、神经科学家SimonJ.Thorpe的论文证明出视觉认知能力是人类大脑当中最为了不起的能力,因为它的速度非常快,大概是150毫秒。在150毫秒之内,我们的大脑能够把非常复杂的含动物和不含动物的图像区别出来。那个时候计算机与人类存在天壤之别,这激

4、励着计算机科学家,他们希望解决的最为基本的问题就是图像识别问题。  在ImageNet之外,在单纯的物体识别之外,我们还能做些什么?  过了20年到现在,计算机领域内的专家们也针对物体识别发明了几代技术,这个就是众所周知的ImageNet。我们在图像识别领域内取得了非常大的进步:8年的时间里,在ImageNet挑战赛中,计算机对图像分类的错误率降低了10倍。同时,这8年当中一项巨大的革命也出现了:2012年,卷积神经网络(convoluTIonaryneuralnetwork)和GPU(图形处理器,GraphicProcessingUnit)技术的出现,对于计算机视觉和人工智能

5、研究来说是个非常令人激动的进步。作为科学家,我也在思考,在ImageNet之外,在单纯的物体识别之外,我们还能做些什么?    8年的时间里,在ImageNet挑战赛中,计算机对图像分类的错误率降低了10倍。  通过一个例子告诉大家:两张图片,都包含一个动物和一个人,如果只是单纯的观察这两张图中出现的事物,这两张图是非常相似的,但是他们呈现出来的故事却是完全不同的。当然你肯定不想出现在右边这张图的场景当中。    这里体现出了一个非常重要的问题,也就是人类能够做到的、最为重要、最为基础的图像识别功能——理解图像中物体之间的关系。为了模拟人类,在计算机的图像识别任务中,输入的是图

6、像,计算机所输出的信息包括图像中的物体、它们所处的位置以及物体之间的关系。目前我们有一些前期工作,但是绝大多数由计算机所判断的物体之间的关系都是十分有限的。  最近我们开始了一项新的研究,我们使用深度学习算法和视觉语言模型,让计算机去了解图像中不同物体之间的关系。  计算机能够告诉我们不同物体之间的空间关系,能在物体之间进行比较,观察它们是否对称,然后了解他们之间的动作,以及他们之间的介词方位关系。所以这是一个更为丰富的方法,去了解我们的视觉世界,而不仅仅是简单识别一堆物体的名称。    VisualRelaTIonshipDetecTIonwithLanguagePriors

7、  更有趣的是,我们甚至可以让计算机实现Zeroshort(0样本学习)对象关系识别。举个例子,用一张某人坐在椅子上、消防栓在旁边的图片训练算法。然后再拿出另一张图片,一个人坐在消防栓上。虽然算法没见过这张图片,但能够表达出这是“一个人坐在消防栓上”。类似的,算法能识别出“一匹马戴着帽子”,虽然训练集里只有“人骑马”以及“人戴着帽子”的图片。让AI读懂图像  在物体识别问题已经很大程度上解决以后,我们的下一个目标是走出物体本身,关注更为广泛的对象之间的关系、语言等等。  ImageNet为我

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。