R语言应用_数据挖掘.pdf

R语言应用_数据挖掘.pdf

ID:52913758

大小:3.23 MB

页数:56页

时间:2020-03-31

R语言应用_数据挖掘.pdf_第1页
R语言应用_数据挖掘.pdf_第2页
R语言应用_数据挖掘.pdf_第3页
R语言应用_数据挖掘.pdf_第4页
R语言应用_数据挖掘.pdf_第5页
资源描述:

《R语言应用_数据挖掘.pdf》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、Teradata数据挖掘之R语言应用交流Yinbinfeng2014.11Agenda一、R语言基础介绍二、如何使用R语言及思考三、R语言应用案例(1)基于熵值法指标权重设定因子分析评估(2)R自回归指标预测(3)基于二次规则的马科维茨资产组合2©2014Teradata什么是R语言?R语言是统计挖掘的绘图语言,也是实现该语言的软件。3©2014TeradataR语言的特点多领域的统计资源•目前在R网站上约有近6000个包,涵盖了基础统计学、社会学、经济学、生态学、空间分析、系统发育分析、生物信息学等诸多方面。跨平台•R可在多种操作系统上运行,如Windows、Ma

2、cOS、多种Linux和UNIX等。命令行驱动•R即时解释,输入命令,即可获得相应的结果。4©2014Teradata为什么选择R语言5©2014TeradataR和其它统计软件的比较EXCEL无需编程,所见即所得,重在数据的整理,能满意绝大部分常规统计分析SAS速度快,有大量统计分析模块,可扩展性稍差,且价格昂贵SPSSStatistics简单的图型操作界面,简单易学,但编程十分困难SPSSModelerS+运行S语言,具有复杂的界面,与R完全兼容,且价格昂贵6©2014TeradataR语言的缺点7©2014TeradataR开发常用开源工具--RStudio

3、RStudio是当前R开发最流量的开源工具之一,主要功能介绍如下:R代码区R运行对象R运行结果R图型展示区及帮助区8©2014TeradataR程序包(RPackages)9©2014TeradataR常用程序包介绍(1)RPackage名称R描述abindCombinemulti-dimensionalarrayscaret分类与回归预测ccgarch基于异分差条件回归预测模型datasetsR数据集包Features特征选择foreachForeachloopingconstructforRForecast时间序列与线性回归模型ggplostR绘图包iterat

4、orsIteratorconstructforRMatrixSparseandDenseMatrixClassesandmethods10©2014TeradataR常用程序包介绍(2)RPackage名称R描述bootB值检验cluster聚类分析mboosting模型为基础的提升(包含众多预测模,如最小二乘法)ForeachForeachloopingconstructforRforeignReadDataStoredbyS.SAS,SPSS,dBASEparallel支撑数据的并行计算penalizedSVMSVM向量机分类模型RODBCODBCDatabas

5、eAccessXLConnectExcelConnectorforRtimeData时间序列对象11©2014TeradataR常用程序包介绍(3)RPackage名称R描述nlme线性回归和非线性回归statsT值检验、B检验、F检验、线性回归、广义回归party决策树分析模型包strings字符串类……12©2014TeradataR语言基础对象—(1)数字向量•向量是有相同基本类型的元素序列,即一维数组,定义向量的最常用办法是使用函数c(),R中用符号“<-”、“=”来为变量赋值,如:>x=c(1:3,10:13)>x[1]12310111213•可以对向量进

6、行加(+)减(-)乘(*)除(/)、乘方(^)运算,其含意是对向量的每一个元素进行运算。如:>x<-c(1,4,6.25)>y=x*2+1>y[1]3.09.013.513©2014TeradataR语言基础对象—(2)逻辑向量•向量可以取逻辑值,如:>l=c(T,T,F)>l输出[1]TRUETRUEFALSE当然,逻辑向量往往是一个比较的结果,如:>x输出[1]1.004.006.25>l=x>3>l输出[1]FALSETRUETRUE•一个向量与常量比较大小,结果还是一个向量,元素为每一对比较的结果逻辑值。如:>log(10*x)[1]2.3025853.68

7、88794.135167>log(10*x)>x输出[1]TRUEFALSEFALSE比较运算符包括<,<=,>,>=,==,!=。14R语言基础对象—(2.1)取逻辑值的下标向量•如:v为和x等长的逻辑向量,x[v]表示取出所有v为真值的元素,如:•>x输出:[1]1.00125.006.25•>x<10输出:[1]TRUEFALSETRUE•>x[x<10]输出:[1]1.006.25•>x[x<0]输出:numeric(0)•可见x[x<10]取出所有小于10的元素组成的子集。•这种逻辑值下标是一种强有力的检索工具,例如x[sin(x)>0]可以取出x中所

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。