盘点2017年15个最常用的数据处理python库

盘点2017年15个最常用的数据处理python库

ID:32406987

大小:433.80 KB

页数:4页

时间:2019-02-04

盘点2017年15个最常用的数据处理python库_第1页
盘点2017年15个最常用的数据处理python库_第2页
盘点2017年15个最常用的数据处理python库_第3页
盘点2017年15个最常用的数据处理python库_第4页
资源描述:

《盘点2017年15个最常用的数据处理python库》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、盘点2017年15个最常用的数据处理python库由于近年来Python在数据科学领域获得了很大的推动,我想根据最近的经验,为数据科学家和工程师列出一些最有用的库。而且,由于所有库都是开源的,我们增加了来自Github的提交,贡献者数量和其他指标,这可以作为库流行度的代理指标。核心库1.NumPy(提交:15980,贡献者:522)当开始处理Python中的科学任务时,不可避免地会对Python的SciPyStack有所帮助,SciPyStack是专门为Python中的科学计算而设计的软件的集合(不要与作为该堆栈的一部分的SciPy库混淆,围绕这个堆栈的社区)。这样我们就想先看看它。然而

2、,这个堆栈非常庞大,其中有十几个库,我们希望把重点放在核心包(特别是最重要的包)上。科学计算栈所建立的最基本的软件包是NumPy(代表NumericalPython)。它为Python中的n数组和矩阵操作提供了丰富的有用特性。该库提供了对NumPy数组类型的数学运算的矢量化,从而改善了性能,并相应地加快了执行速度。2.SciPy(提交:17213,贡献者:489)SciPy是一个工程和科学软件库。再次,您需要了解SciPyStack和SciPyLibrary之间的区别。SciPy包含用于线性代数,优化,集成和统计的模块。SciPy库的主要功能建立在NumPy之上,因此它的阵列大量使用了N

3、umPy。它通过其特定的子模块提供了有效的数值例程,如数值积分,优化等等。SciPy的所有子模块的功能都有很好的记录-另一个硬币在它的锅里。3.熊猫(承诺:15089,贡献者:762)Pandas是一个Python包,旨在简单直观地处理“标记”和“关系”数据。熊猫是数据争夺的最佳工具。它设计用于快速简便的数据处理,聚合和可视化。库中有两个主要的数据结构:“系列”-一维,“数据框架”是二维的。例如,当您想要从这两种类型的结构中接收到一个新的Dataframe时,您将通过传递一个Series来将一行添加到DataFrame中,从而得到这样的DF:这里只是一小部分你可以用熊猫做的事情:轻松从D

4、ataFrame中删除和添加列将数据结构转换为DataFrame对象处理缺失的数据,表示为NaN功能强大的分组可视化4.Matplotlib(提交:21754,贡献者:588)另一个SciPyStack核心软件包和另一个为轻松生成简单而强大的可视化生成的Python库是Matplotlib。这是一个顶尖的软件,使得Python(有NumPy,SciPy和Pandas的一些帮助)成为MatLab或Mathematica等科学工具的认知竞争者。但是,这个库是相当低级的,这意味着您需要编写更多的代码才能达到高级的可视化效果,而且如果使用更多的高级工具,您通常会付出更多的努力,但总体工作量是值得

5、的射击。通过一点努力,您可以制作任何可视化文件:线条图;散点图;条形图和直方图;饼状图;茎地块;等高线图;颤抖地块;频谱图。还有用Matplotlib创建标签,网格,图例和许多其他格式化实体的工具。基本上,一切都是可定制的。该库由不同的平台支持,并使用不同的GUI工具包来描述可视化结果。不同的IDE(如IPython)支持Matplotlib的功能。还有一些额外的库可以使可视化更容易。5.Seaborn(承诺:1699,贡献者:71)Seaborn主要关注统计模型的可视化;这样的可视化包括热图,那些总结数据但仍然描绘整体分布的热图。Seaborn基于Matplotlib并高度依赖于此。6

6、.散景(提交:15724,贡献者:223)另一个伟大的可视化库是Bokeh,它的目标是交互式可视化。与之前的库相比,这个库独立于Matplotlib。正如我们已经提到的,Bokeh的主要焦点是交互性,它通过现代浏览器以“数据驱动文档”(d3.js)的形式进行演示。7.Plotly(承诺:2486,贡献者:33)最后,关于Plotly的一句话。这是一个基于Web的工具箱,用于构建可视化,将API暴露给一些编程语言(其中的Python)。在plot.ly网站上有一些强大的,开箱即用的图形。为了使用Plotly,你需要设置你的API密钥。图形将被处理服务器端,并将张贴在互联网上,但有一种方法来

7、避免它。机器学习8.SciKit-Learn(提交:21793,贡献者:842)Scikits是SciPyStack的附加软件包,专门用于图像处理和机器学习等特定功能。就后者而言,这些套餐中最为突出的就是scikit-learn。该软件包构建在SciPy的顶部,并大量使用其数学运算。scikit-learn为常见的机器学习算法提供了一个简洁而一致的界面,使得将ML带入生产系统变得简单。该库结合了高质量的代码和良好的文档,易用性和高性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。