欢迎来到天天文库
浏览记录
ID:28149011
大小:1.27 MB
页数:29页
时间:2018-12-08
《迈向智能时代 人工智能催生新一代专用计算芯片.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、迈向智能时代人工智能催生新一代专用计算芯片 深度学习作为新一代计算模式,近年来,其所取得的前所未有的突破掀起了人工智能新一轮发展热潮。深度学习本质上是多层次的人工神经网络算法,即模仿人脑的神经网络,从最基本的单元上模拟了人类大脑的运行机制。由于人类大脑的运行机制与计算机有着鲜明的不同,深度学习与传统计算模式有非常大的差别。 深度学习的人工神经网络算法与传统计算模式不同,它能够从输入的大量数据中自发的总结出规律,从而举一反三,泛化至从未见过的案例中。因此,它不需要人为的提取所需解决问题的特征或者总结规律来进行编
2、程。人工神经网络算法实际上是通过大量样本数据训练建立了输入数据和输出数据之间的映射关系,其最直接的应用是在分类识别方面。例如训练样本的输入是语音数据,训练后的神经网络实现的功能就是语音识别,如果训练样本输入是人脸图像数据,训练后实现的功能就是人脸识别。 传统计算机软件是程序员根据所需要实现的功能原理编程,输入至计算机运行即可,其计算过程主要体现在执行指令这个环节。而深度学习的人工神经网络算法包含了两个计算过程: 1、用已有的样本数据去训练人工神经网络; 2、用训练好的人工神经网络去运行其它数据。
3、这种差别提升了对训练数据量和并行计算能力的需求,降低了对人工理解功能原理的要求。 传统计算架构无法支撑深度学习的海量数据并行运算 根据上文的分析我们可以看到,深度学习与传统计算模式最大的区别就是不需要编程,但需要海量数据并行运算。 传统处理器架构(包括x86和ARM等)往往需要数百甚至上千条指令才能完成一个神经元的处理,因此无法支撑深度学习的大规模并行计算需求。 为什么传统计算架构无法支撑深度学习的大规模并行计算需求?因为传统计算架构计算资源有限。 传统计算架构一般由中央运算器(执行指令计算)、
4、中央控制器(让指令有序执行)、内存(存储指令)、输入(输入编程指令)和输出(输出结果)五个部分构成,其中中央运算器和中央控制器集成一块芯片上构成了我们今天通常所讲的CPU。 我们从CPU的内部结构可以看到:实质上仅单独的ALU模块(逻辑运算单元)是用来完成指令数据计算的,其他各个模块的存在都是为了保证指令能够一条接一条的有序执行。这种通用性结构对于传统的编程计算模式非常适合,同时可以通过提升CPU主频(提升单位时间执行指令速度)来提升计算速度。 但对于并不需要太多的程序指令,却需要海量数据运算的深度学习的
5、计算需求,这种结构就显得非常笨拙。尤其是在目前功耗限制下无法通过提升CPU主频来加快指令执行速度,这种矛盾愈发不可调和。因此,深度学习需要更适应此类算法的新的底层硬件来加速计算过程,也就是说,新的硬件对我们加速深度学习发挥着非常重要的作用。目前主要的方式是使用已有的GPU、FPGA等通用芯片。 新计算平台生态正在建立 GPU因其并行计算优势最先被引入深度学习 GPU作为应对图像处理需求而出现的芯片,其海量数据并行运算的能力与深度学习需求不谋而合,因此,被最先引入深度学习。 2011年吴恩达率先将其应用
6、于谷歌大脑中便取得惊人效果,结果表明12颗NVIDIAD的GPU可以提供相当于2000颗CPU的深度学习性能,之后纽约大学、多伦多大学以及瑞士人工智能实验室的研究人员纷纷在GPU上加速其深度神经网络。 英伟达(Nvidia)是全球可编程图形处理技术的领军企业,公司的核心产品是GPU处理器。 英伟达通过GPU在深度学习中体现的出色性能迅速切入人工智能领域,又通过打造NVIDIACUDA平台大大提升其编程效率、开放性和丰富性,建立了包含CNN、DNN、深度感知网络、RNN、LSTM以及强化学习网络等算法的平台
7、。 根据英伟达公开宣布的消息来看,在短短两年里,与NVIDIA在深度学习方面展开合作的企业便激增了近35倍,增至3,400多家企业,涉及医疗、生命科学、能源、金融服务、汽车、制造业以及娱乐业等多个领域。 英伟达针对各类智能计算设备开发对应GPU,使得深度学习可以渗透各种类型的智能机器 IT巨头争相开源人工智能平台 深度学习系统一方面需要利用庞大的数据对其进行训练,另一方面系统中存在上万个参数需要调整。 IT巨头开源人工智能平台,旨在调动更多优秀的工程师共同参与发展其人工智能系统。开放的开发平台将带来
8、下游应用的蓬勃发展。最典型的例子就是谷歌开源安卓平台,直接促成下游移动互联网应用的空前繁荣。 开源人工智能平台可以增强云计算业务的吸引力和竞争力 以谷歌为例,用户使用开源的TensorFlow平台训练和导出自己所需要的人工智能模型,然后就可直接把模型导入TensorFlowServing对外提供预测类云服务,相当于TensorFlow系列把整个用深度学习模型对外提
此文档下载收益归作者所有