【7A版】助你玩转机器学习技术的十三套框架.doc

【7A版】助你玩转机器学习技术的十三套框架.doc

ID:34361462

大小:4.13 MB

页数:7页

时间:2019-03-05

【7A版】助你玩转机器学习技术的十三套框架.doc_第1页
【7A版】助你玩转机器学习技术的十三套框架.doc_第2页
【7A版】助你玩转机器学习技术的十三套框架.doc_第3页
【7A版】助你玩转机器学习技术的十三套框架.doc_第4页
【7A版】助你玩转机器学习技术的十三套框架.doc_第5页
资源描述:

《【7A版】助你玩转机器学习技术的十三套框架.doc》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、7A版优质实用文档助你玩转机器学习技术的十三套框架过去几年以来,机器学习已经开始以前所未有的方式步入主流层面。这种趋势并非单纯由低成本云环境乃至极为强大的GPU硬件所推动;除此之外,面向机器学习的可用框架也迎来了爆发式增长。此类框架全部为开源成果,但更重要的是它们在设计方面将最为复杂的部分从机器学习中抽象了出来,从而保证相关技术方案能够为更多开发人员服务。在今天的文章中,我们将共同了解十三款机器学习框架,一部分去年刚刚发布、另一部分则在不久前进行了全部升级。而这些框架中最值得关注的特性,在于它们正致力于

2、通过简单而新颖的方式应对与机器学习相关的种种挑战。ApacheSparkMLlibApacheSpark可能算得上当前Hadoop家族当中最为耀眼的成员,但这套内存内数据处理框架在诞生之初实际与Hadoop并无关系,且凭借着自身出色的特性在Hadoop生态系统之外闯出一片天地。Spark目前已经成为一款即时可用的机器学习工具,这主要归功于其能够以高速将算法库应用至内存内数据当中。Spark仍处于不断发展当中,而Spark当中的可用算法亦在持续增加及改进。去年的1.5版本添加了众多新算法,对现有算法做出改

3、进,同时进一步通过持续流程恢复了MLlib中的SparkML任务。ApacheSinga77A版优质实用文档7A版优质实用文档这套“深层学习”框架能够支持多种高强度机器学习功能,具体包括自然语言处理与图像识别。Singa最近被纳入Apache孵化器项目,这套开源框架致力于降低大规模数据的深层学习模型训练难度。Singa提供一套简单的编程模式,用于跨越一整套设备集群进行深层学习网络训练,同时支持多种常规训练任务类型;卷积神经网络、受限玻尔兹曼机与复发性神经网络。各模型能够进行同步(一一)或者异步(并行)训

4、练,具体取决于实际问题的具体需求。Singa还利用ApacheZookeeper对集群设置进行了简化。Caffe深层学习框架Caffe是一套“立足于表达、速度与模块化”的解决方案。其最初诞生于20GG年,主要用于机器视觉项目。Caffe自出现之后就一直将多种其它应用囊括入自身,包括语音与多媒体。由于优先考量速度需求,因此Caffe全部利用C++编写而成,同时支持CUDA加速机制。不过它也能够根据需要在CPU与GPU处理流程间往来切换。其发行版中包含一系列免费与开源参考模型,主要面向各类常规典型任务;目前

5、Caffe用户社区亦在积极开发其它模型。微软AzureMLStudio77A版优质实用文档7A版优质实用文档根据机器学习任务的实际数据规模与计算性能需求,云往往能够成为机器学习应用的一大理想运行环境。微软公司已经立足于Azure发布了其按需计费机器学习服务,即AzureMLStudio,其能够提供按月、按小时以及免费等分层版本。(微软公司的HowOldRobot项目亦利用这套系统创建而成。)AzureMLStudio允许用户创建并训练模型,而后将其转化为能够由其它服务消费的API。每个用户账户能够为模型

6、数据提供最高10GB存储容量,不过大家也可以将自己的Azure存储资源连接至服务当中以承载规模更大的模型。目前可用算法已经相当可观,其分别由微软自身以及其它第三方所提供。大家甚至不需要账户即可体验这项服务;用户可以匿名登录并最多使用八小时AzureMLStudio。AmazonMachineLearningAmazon的这套面向云服务的通用型方案遵循既定模式。其提供核心用户最为关注的运行基础,帮助他们立足于此寻求自身最需要的机器学习方案并加以交付。AmazonMachineLearning同时也是云巨头

7、首次尝试推出机器学习即服务方案。它能够接入被保存在AmazonS3、Redshift或者RDS当中的数据,并能够运行二进制分类、多类分类或者数据递归以创建模型。然而,该服务高度依赖于Amazon本身。除了要求数据必须被存储于Amazon之内之外,其结果模型也无法进行导入与导出,另外训练模型的数据库集亦不可超过100GB。当然,这只是AmazonMachineLearning的起步成效,其也足以证明机器学习完全具备可行性——而非技术巨头的奢侈玩物。微软分布式机器学习工具包77A版优质实用文档7A版优质实用

8、文档我们用于解决机器学习难题的设备数量越多,实际效果就越好——但将大量设备汇聚起来并开发出能够顺利跨越各设备运行的机器学习应用绝非易事。微软的DMTK(即分布式机器学习工具包)框架则能够轻松跨越一整套系统集群解决多种机器学习任务类型的分发难题。DMTK的计费机制归属于框架而非完整的开箱即用解决方案,因此其中实际涉及的算法数量相对较小。不过DMTK在设计上允许用户进行后续扩展,同时发挥现有集群之内的有限资源。举例来说,集群中的每个节点都拥有一

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。