欢迎来到天天文库
浏览记录
ID:21036612
大小:5.37 MB
页数:329页
时间:2018-10-17
《《基于r的统计分析与数据挖掘》课件》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、第1章关于R《基于R的统计分析与数据挖掘》为什么选择R和如何学习RR语言是一种面向统计分析的计算机高级语言,属于数据分析软件范畴根据由浅入深的数据分析需求,依据数据分析过程分阶段、分步骤地学习R,是一种快速有效掌握R的基本方法R入门必备R是一个关于包的集合包是关于函数、数据集、编译器等的集合编写R程序的过程就是通过创建R对象组织数据,通过调用系统函数,或者创建并调用自定义函数,以逐步完成数据分析任务的过程包是R的核心,可划分为基础包(Base)和共享包(Contrib)两大类R的下载可从R的网站ww
2、w.r-project.org上免费下载并安装R软件启动R成功启动R之后显示的窗口R的书写是严格区分英文大小写的;利用键盘上的上下箭头键,可重复显示以往或后续的书写内容当前已经加载了哪些包成功启动R意味着基础base包中的默认加载包已成功加载到R的工作空间,用户可以直接调用其中的函数窗口菜单:MicsListsearchpath当前可以做的事情成功启动R意味着用户可在R工作空间中创建和管理R对象,调用已被加载包中的函数,实现对对象的管理和相关的数据分析等R对象是R程序处理的基本单元,用于待分析数据
3、的组织,以及分析结果的组织等。每个R对象均有一个对象名作为唯一的标识。一般可直接通过对象名访问对象中的数据或其他内容当前可以做的事情函数是实现某计算或分析的程序段,可视为一种特殊的对象。每个函数均有一个函数名。用户可通过两种形式调用函数:函数名()函数名(形式参数列表)如何获得的R帮助文档help.start()函数和包的拓展使用若要调用尚未加载的包中的函数,需按照“先加载,后浏览,再调用”的步骤实现先加载:首先,将未加载的包加载到R的工作空间,调用的函数为:library(“包名称”)后浏览:然后
4、,浏览包中提供的函数,调用的函数为:library(help=”包名称”)再调用:最后,以无形式参数或带形式参数的方式调用相应函数R的运行方式命令行方式是指在R控制台的提示符>后,输入一条命令并回车即可立即得到运行结果。适合于较为简单步骤较少的数据处理和分析R的运行方式程序运行方式也称脚本运行方式,是指首先编写R程序,然后一次性提交运行该程序。适合于较为复杂步骤较多的数据处理和分析退出R当结束R工作退出R的时候,可调用函数:q(),或鼠标单击R主窗口右上角的窗口关闭按钮工作空间(workspace)
5、是R的工作环境,或工作内存,其中临时保存了本次运行中生成的R对象和已输入的命令清单等退出R时,用户可指定将工作空间中的内容保存到当前工作目录下的环境文件中。环境文件名为.Rdata和.Rhistory第2章R的数据组织《基于R的统计分析与数据挖掘》从存储角度划分R对象数据对象是R组织数据的基本方式。由于不同类型的数据在计算机中所需的存储字节不同,所以可将R数据对象划分为数值型:123.5,1.235E2字符型:”ZhangSan”,”BeiJing”逻辑型:只有真(是)、假(否)两个取值从结构角度划
6、分R对象数据对象是R组织数据的基本方式。由于数据分析实践中有不同的数据组织结构,所以R数据对象可划分为向量、矩阵、数组、数据框、列表等多种结构类型创建和访问R的数据对象创建对象是通过赋值语句实现的。基本书写格式为:对象名<-R常量或R函数访问对象,即浏览对象的具体取值,也称对象值。基本书写格式为:对象名,或,print(对象名)查看对象的结构,即对象的存储类型以及与结构相关的信息。基本书写格式为:str(对象名)创建和访问R的数据对象管理对象,即浏览当前工作空间中包含哪些对象,删除不再有用的对象等。
7、基本书写格式为:ls()rm(对象名或对象名列表),或,remove(对象名)向量的创建和访问示例:访问向量中的元素示例:矩阵的创建和访问示例:矩阵的创建和访问示例:访问矩阵中的元素示例:访问矩阵中的元素示例:访问矩阵中的元素以编辑窗口形式访问:数据框的创建和访问示例:访问数据框示例:数据对象的相互转换可利用as函数将数据对象的存储类型转换为指定的类型,基本书写格式为:as.存储类型名(数据对象名)向量转换为因子:因子是一种特殊形式的向量。由于一个向量可视为一个变量,如果该变量的计量类型为分类型,则
8、将对应的向量转换为因子,这样更利于后续的数据分析。基本书写格式为:as.factor(向量名)从文本文件读数据可利用scan函数将文本数据读入到向量中,基本书写格式为:scan(file=”文件名”,skip=行数,what=存储类型转换函数())可利用read.table函数将文本数据读入到数据框中,基本书写格式为:read.table(file="文件名",header=TRUE/FALSE,sep="数据分隔符")第3章R的数据管理《基于R的统计分析与数据挖掘》
此文档下载收益归作者所有