资源描述:
《05_06Python数据分析环境_数据入门》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、LOGO第五、六讲Python数据环境搭建数据处理入门•环境搭建•Numpy:数组运算•Numpy:随机数产生数据分析和数据挖掘中国大数据在线教育领导者安装Python数据分析环境数据分析和数据挖掘中国大数据在线教育领导者http://www.scipy.org/install.html数据分析和数据挖掘中国大数据在线教育领导者Python数据分析环境Spyder–交互式编程–界面Tab键数据分析和数据挖掘中国大数据在线教育领导者重要的Python库Numpy–多维数组–数学函数–读写数据集工具–线性代数、
2、傅里叶变化、随机数工具–C、C++、Fortran语言接口pandas–针对结构化数据的大量数据和函数matplotlib–绘制数据图表的工具Scipy–科学计算中各标准问题域的包的集合数据分析和数据挖掘中国大数据在线教育领导者Numpy载入–Importnumpyasnp–另:importpandasasps;importmatplotlib.pyplotasplt创建数组–array:np.array–zeros:np.zeros–ones:np.ones–arange–eye(I)查看数组–.d
3、im,.dtype,.shape数据分析和数据挖掘中国大数据在线教育领导者Numpy数组的读取–索引:从0开始–索引多个元素,“切片”•一维,高维,“:”–切片为视图而非复制–复制.copy()计算–矩阵转置.T:np.dot(arr.T,arr)–函数计算数据分析和数据挖掘中国大数据在线教育领导者Numpy常用计算函数–abs,fabs–sqrt,square,exp,log,log*,log1p–sign,ceiling,floor,modf–isnan(NotaNumber),isfinite,isi
4、nf–cos,sin,tan,arccos,arcsin,arctan–add,substract,multiply,divide,power–maximum,minimum,mod,copysign–greater,greater_equal,less,less_equal数据分析和数据挖掘中国大数据在线教育领导者Numpy产生数组–np.meshgrid–np.linspace(start,end,N)–np.arange(start,end,step)逻辑操作–np.where(逻辑表达式,a,b)数据
5、分析和数据挖掘中国大数据在线教育领导者Numpy统计–sum,mean,std,var,–min,max,argmin,argmax–cumsum,cumprod排序相关–sort(axis)–unique()随机数生成–fromnumpy.randomimport**数据分析和数据挖掘中国大数据在线教育领导者Numpynumpy.random简单的随机数据–rand(d0,d1,...,dn),–randn(d0,d1,...,dn)•sigma*np.random.randn(...)+mu–ran
6、dint(low[,high,size])–random_integers(low[,high,size])–choice(a[,size,replace,p])排列–shuffle(x)–permutation(x)数据分析和数据挖掘中国大数据在线教育领导者Numpynormal([loc,scale,size])正态(高斯)分布beta(a,b[,size])贝塔分布样本,在[0,1]内。binomial(n,p[,size])二项分布的样本。chisquare(df[,size])卡方分布样本。logno
7、rmal([mean,sigma,size])对数正态分布exponential([scale,size])指数分布f(dfnum,dfden[,size])F分布样本。multivariate_normal(mean,cov[,size])多元正态分布。数据分析和数据挖掘中国大数据在线教育领导者Numpy例子:一只股票每日预期收益为0.1%,每日波动率为0.5%求100日后的预期收益估计数据分析和数据挖掘中国大数据在线教育领导者LOGO联系我们:–新浪微博:ChinaHadoop–微信公号:ChinaHa
8、doop–网站:http://chinahadoop.cn数据分析和数据挖掘中国大数据在线教育领导者