R软件及编程应用第四讲报告.ppt

R软件及编程应用第四讲报告.ppt

ID:56446399

大小:979.00 KB

页数:91页

时间:2020-06-18

R软件及编程应用第四讲报告.ppt_第1页
R软件及编程应用第四讲报告.ppt_第2页
R软件及编程应用第四讲报告.ppt_第3页
R软件及编程应用第四讲报告.ppt_第4页
R软件及编程应用第四讲报告.ppt_第5页
资源描述:

《R软件及编程应用第四讲报告.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、R软件及编程应用中南财经政法大学信息与安全工程学院刘树栋第四讲:数据读写、预处理及字符串操作一、数据读写二、数据预处理三、字符串操作一、数据读写1、连接键盘与显示器2、读写文件3、连接数据库4、从Hadoop中获取数据1、连接键盘与显示器R语言中提供了多种多样的输入(I)/输出(O)功能。R提供了多个命令来连接键盘和显示器,包括scan()、readline()、print()和cat()。(1)使用scan()函数:使用scan()函数可从文件中读取或从键盘输入一个向量,可以是数值型或字符型向量,甚至可读取数据

2、来形成一个列表。函数功能描述:readdataintoavectororlistfromtheconsoleorfile函数定义形式:参数说明(1):file从文件中读取数据时,引号中输入文件路径。从键盘中输入时,此参数为空。what默认情况下声明读入为字符型数据。还可设置读入数据的精度/类型,例如what=integer(0),what=numeric(0),what=character(0)。如果读入数据有字符和数值,可用what=“”来声明,则会把读入的数值隐式的转换成字符。sep指定各个读入数据之间的分隔

3、符,默认情况下为空白字符,包括空格、回车、换行符/tab和水平制表符。参数说明(2):还可通过list指定读入变量的变量名,同时生成的对象为列表,此时可以同时读入字符和数值。skip从第几行开始读入数据。nlines指定最大读入行数。如果通过键盘输入时,不希望出现下标提示,则可以使用quiet=TRUE。encoding=“”指定编码格式,有时候读入中文可能出现乱码,可通过此参数指定:Latin-1或UTF-8注意事项:用于读入纯字符或数字,没有表头。如果输入单一类型的向量,例均为字符,用scan函数效率更高。默

4、认情况下用scan函数读入的数据生成向量类型。举例:键盘输入命令行在每行行首提示的数字是下一个输入项的索引。键入一个空行表示结束输入举例:读取文件(2)使用readline()函数:读取从键盘中输入的单行数据。函数功能描述:readsalinefromtheterminal使用说明:一般调用readline时可以指定一个提示语字符串作为参数,为用户提示要输入的内容。这个参数是可选的。readline()与readLines()是两个不同的函数。举例思考:从输出结果的角度,scan和readline的区别?(3)使

5、用print()在交互模式的顶层,只需要简单键入变量名或者表达式,就能输出变量或表达式的值。print()函数:在非交互模式下,例如在函数体内部打印变量或表达式的值,上述方法就行不通。此时print()函数就派上用场了。print()函数可带一个参数digits=参数指定每个数输出的有效数字位数,print.gap=参数,用来指定矩阵或数组输出时列之间的间距。(4)使用cat()函数。cat()函数:比print()函数稍微好用一点,因为后者只可输出一个表达式,而且输出内容自带编号,这可能会造成干扰。cat()函

6、数定义形式:使用说明:cat()函数可把多个参数连接起来在输出,具有paste()功能。使用cat()函数时需要一个行结束字符“”,如果没有,输入提示符“>”不会换行。默认情况下打印各个参数以空格分开。即sep=“”的设置。还可以设置各种字符,如“”,来分隔各个输出参数,或不设如何分隔:sep=“”。此外也可以把sep设置为字符串向量。举例2、读写文件一般把文本文件定义为由ASCII字符或其他人类语言的编码(如中文的GB编码)构成的文件。其中用换行符表示文本内部的行间隔。R提供了多个读写文件的函数,包括r

7、eadLines()、read.table()、read.fwf()、write.table()、writeLines()等。(1)使用read.table()函数:将文本文件(如表格类的数据)读入R,生成数据框对象。函数功能描述:readsafileintableformatandcreatesadataframefromit,withcasescorrespondingtolinesandvariablestofieldsinthefile.函数定义形式:参数说明(1):file:指定读入的文件或文件路径。h

8、eader:是否读入列名,默认是不读入。sep:用来指定分隔符,读入的数据要求有规则的分隔符,如空格、TAB、换行符、回车符等。as.is:读入的字符是否转换成因子,默认所有读入的字符都转换成因子。calClasses:指定类的数据类型的格式。stringAsFactors=是否字符转换成因子,默认是TRUE参数说明(2):row.names=c()指定各行的名称col.

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。