欢迎来到天天文库
浏览记录
ID:27871918
大小:235.00 KB
页数:9页
时间:2018-12-06
《天数智芯研发:技术创新永无止境_让AI变得更加简单.doc》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、天数智芯研发:技术创新永无止境_让AI变得更加简单 近年来,在大数据、云计算等技术升级的共同推动下,人工智能技术及应用取得了蓬勃发展。如今,继“互联网+”之后,“AI+”已蔚然成风。 人工智能技术的发展不会取代人类,但使用人工智能的企业一定会取代那些从未打算与人工智能结合的对手们。目前已经有一些公司凭借新技术迅速崛起,并对同行施加了降维打击。很多企业已经意识到寻求AI赋能的重要性,但面临的难题是,要让传统企业实现AI升级并不容易,从基础硬件的配置和部署,到数据采集和结构化,到模型搭建与训练,再到算法模型的部署,其复杂性不言而喻。 由于复杂度过高,很多
2、企业往往初步地了解了基础硬件的配置和软件部署后就对智能化望而却步。正如著名华人学者李飞飞曾说,AI技术让人兴奋,但使用起来仍有很高的门槛,以致于只有少数公司能发挥其作用,她认为发展AI的当务之急就是降低进入的门槛。 如今在中国有这么一家公司,就是致力于帮助企业快速且低门槛地使用人工智能工具,解决开发环境部署和高成本投入等问题。 “我们的目标是将企业AI开发和应用变的更快、更简单”,天数智芯研发副总倪岭表示。 ▌让AI计算更快更简单的秘诀 为了帮助企业更简单高效的使用大数据和人工智能技术为自身业务赋能,倪岭带领团队研发了SkyDiscovery智能数
3、据基础软件平台;同时,为了响应企业对于私有云和软硬件一体化部署的需求,天数智芯也推出了相应的超融合一体机产品——SkyAXE,为使用者提供高性能、高可用、低成本、低运维的数据计算服务。 让计算变得更快:为加速数据分析和AI计算,各类高性能硬件层出不穷,包括天数也在紧锣密鼓的研发通用、标准、高性能计算芯片。倪岭认为,所谓“硬件越快,软件越难”,在大规模的分布式异构环境下,计算、网络、存储如何协同高效运转对软件提出了巨大挑战。天数通过自研的“SoftSilicon”核心计算加速技术,使用高级指令集优化,并行与分布式加速,动态编译,RDMA网络传输,分级存
4、储等一系列基础软件优化手段充分挖掘硬件的能力,最小化计算任务各环节的性能瓶颈,从而帮助企业“少花钱,多办事”,更有效的进行数据科学和机器学习任务的开发和应用。 让开发变得更简单:在实际的数据分析任务中,机器学习往往只是其全生命周期中很小的一部分,数据的清洗与准备,特征选取,模型的反复调试与评估,模型的部署和管理往往会占去开发者更多的时间和精力,计算资源的管理与分配,繁杂运行环境与依赖,项目开发的协同与隔离,都是阻碍数据科学家和机器学习工程师进行快速原型开发的拦路虎。 倪岭认为,作为一个成熟好用的数据科学平台产品,在用户交互和平台功能上要尽可能的将用户从
5、繁杂和重复性的劳动中解放出来,因此,基于容器编排系统的云API,数据及模型的可视化探索,可交互的在线编程环境,拖拽的傻瓜式开发,工作流的支持,包括自动特征工程,自动模型选择,自动超参数和架构搜索的AutoML,完备的模型管理与导出,以及资源和计算任务的管理与监控,数据、代码、模型、可视化分析的托管与共享等功能都在天数智芯团队的努力下一一呈现给SkyDiscovery的使用者们。 “一个功能点就能体现天数在把计算变得更快,开发变得简单所做的努力”,倪岭举例道,使用多个节点的多块GPU对单机Tensorflow模型训练进行原生的分布式加速,需要修改大量代码和
6、进行手动集群管理,是个既困难又繁琐的任务,即便是富有经验的程序员也望而却步。SkyDiscovery提供了单机版Tensorflow训练程序自动分布式化的功能,用户不需要修改一行代码便可以轻松在分布式环境下达到接近线性的加速比。 ▌超融合一体机SkyAXE——打造通用的高性能软硬件平台 倪岭表示,借鉴芯片硬件开发中软硬件协同设计的理念,在保证SkyDiscovery软件平台标准通用的前提下,SkyAXE大数据机器学习一体机从规划之初,团队就将硬件与软件架构的相融与适配进行了综合的考量。 市场上常见的数据科学相关的一体机产品,因为使用场景的不同采用截然
7、不同的设计,搭配的软件平台也泾渭分明。大数据一体机通常是堆叠commodityserver节点,搭配如HBase,Spark等Hadoop生态系统的软件;而深度学习一体机都以单机多GPU卡的形式出现,配合诸如Tensorflow和Caffe等的深度学习框架。 倪岭认为,以Hadoop为代表的大数据技术和传统HPC技术,本质上,都是分布式计算环境下的作业系统,解决的都是将大的数据处理任务进行分解和协调的问题,如果以高性能计算为出发点,利用HPC技术,将存储,计算和应用以超融合的方式进行整合,配合大数据生态中的动态水平扩展、高容错和高可用的特性,一个在云端融
8、合大数据和高性能计算的统一软硬件平台不但是完全有可能的,并且是数据
此文档下载收益归作者所有