R语言,实现各种常用的数据输入与输出

将数据输入或加载到R工作空间中,是使用R进行数据分析的第一步。R语言支持读取众多格式的数据文件,excel文件,csv文件,txt文件和数据库(MYSQL数据库)等;其中,excel和csv是我们最常遇到的数据文件格式。

目录

0 设置工作目录【很重要】

1 read.table() #读取带分隔符的文本/数据文件

2 read.csv() #读取.csv格式的数据,read.table的一种特定应用

3 excel数据文件读取

4 scan #比read.table更加灵活

5 保存为.Rdata

6 write.table()

7 CSV格式导出


正文

0 设置工作目录【很重要】

R语言中数据的输入需要设置数据读取的路径,一般将数据文件放到工作目录下,这样直接就可以通过read.table等读取数据文档(不许要设置路径)。

方法一:setwd()

setwd("E:/") #设置当前工作目录为"E:/"

getwd() #读取当前工作空间的工作目录(文件读取保存路径)

> getwd() #读取当前工作空间的工作目录(文件读取保存路径) [1] "C:/Users/ysl/Documents" > setwd("E:/") #设置当前工作目录为"E:/" > getwd() #再次使用getwd()函数即可查看是否设置成功 [1] "E:/"

方法二:通过R-gui菜单栏设置(文件-改变工作目录)

1 read.table() #读取带分隔符的文本文件

read.table()函数是R最基本函数之一,读取带分隔符的文本/表格文件

#Usage read.table(file, header = FALSE, sep = "", quote = ""'", dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"), row.names, col.names, as.is = !stringsAsFactors,na.strings = "NA", colClasses = NA, nrows = -1, skip = 0, check.names = TRUE, fill = !blank.lines.skip, strip.white = FALSE, blank.lines.skip = TRUE, comment.char = "#",allowEscapes = FALSE, flush = FALSE, stringsAsFactors = default.stringsAsFactors(),fileEncoding = "", encoding = "unknown", text, skipNul = FALSE) read.csv(file, header = TRUE, sep = ",", quote = """, dec = ".", fill = TRUE, comment.char = "", ...)read.csv2(file, header = TRUE, sep = ";", quote = """,dec = ",", fill = TRUE, comment.char = "", ...)

read.delim(file, header = TRUE, sep = "t", quote = """,dec = ".", fill = TRUE, comment.char = "", ...)

read.delim2(file, header = TRUE, sep = "t", quote = """,dec = ",", fill = TRUE, comment.char = "", ...)

常用参数的说明如下:

(1)file:file是一个带分隔符的ASCII文本文件。

①绝对路径或者相对路径。一定要注意,在R语言中是转义符,所以路径分隔符需要写成""或者“/”。所以写成“C:myfilemyfile.txt”或者“C:/myfile/myfile.txt”即可。

②使用file.choose(),弹出对话框,自动选择文件位置。例如:read.table(file.choose(),...)。

(2)header:一个表示文件是否在第一行包含了变量的逻辑型变量。

如果header设置为TRUE,则要求第一行要比数据列的数量少一列。

(3)sep分开数据的分隔符。默认sep=""

read.table()函数可以将1个或多个空格、tab制表符、换行符或回车符作为分隔符。常见空白分隔符有:空格,制表符,换行符

sep=” ”;sep = “t”;sep = “n”

(4)stringsAsFactors 逻辑值,标记字符向量是否需要转化为因子,默认是TRUE。stringsAsFactors = F意味着,“在读入数据时,遇到字符串之后,不将其转换为factors,仍然保留为字符串格式”。

(5)encoding 设定输入字符串的编码方式。

#读取txt文档

>df<- read.table("data.txt")>dfV1V21x y21 233 445 6>df <- read.table("data.txt",header = T)>dfxy11 223 435 6

#样式1:直接读取数据

>df <- read.table("data.csv") #直接读取数据>head(df)V11ID,Sepal.Length,Sepal.Width,Petal.Length,Petal.Width,Species21,5.1,3.5,1.4,0.2,setosa32,4.9,3,1.4,0.2,setosa43,4.7,3.2,1.3,0.2,setosa54,4.6,3.1,1.5,0.2,setosa65,5,3.6,1.4,0.2,setosa#样式2:读数+首行表头

> df <- read.table("data.csv",header =T) #读数+首行表头> head(df)ID.Sepal.Length.Sepal.Width.Petal.Length.Petal.Width.Species11,5.1,3.5,1.4,0.2,setosa22,4.9,3,1.4,0.2,setosa33,4.7,3.2,1.3,0.2,setosa44,4.6,3.1,1.5,0.2,setosa55,5,3.6,1.4,0.2,setosa66,5.4,3.9,1.7,0.4,setosa

#样式3:读数+首行表头+","逗号分割

> df <- read.table("data.csv",header =T,sep=",") #读数+首行表头+","逗号分割>head(df)IDSepal.Length Sepal.Width Petal.Length Petal.Width Species11 5.1 3.5 1.4 0.2 setosa22 4.9 3.0 1.4 0.2 setosa33 4.7 3.2 1.3 0.2 setosa44 4.6 3.1 1.5 0.2 setosa55 5.0 3.6 1.4 0.2 setosa66 5.4 3.9 1.7 0.4 setosa>summary(df)IDSepal.Length Sepal.Width Petal.Length Min.: 1.00 Min. :4.300 Min. :2.000 Min. :1.000 1stQu.: 38.25 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 Median: 75.50 Median :5.800 Median :3.000 Median :4.350 Mean: 75.50 Mean :5.843 Mean :3.057 Mean :3.758 3rdQu.:112.75 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 Max.:150.00 Max. :7.900 Max. :4.400 Max. :6.900 Petal.WidthSpecies Min.:0.100 setosa :50 1stQu.:0.300 versicolor:50 Median:1.300 virginica :50 Mean:1.199 3rdQu.:1.800 Max.:2.500

#样式4:读数+首行表头+","逗号分割+字符转因子factor

>df <- read.table("data.csv",header = T,sep=",",stringsAsFactor = T)##读数+首行表头+","逗号分割+字符转因子factor>head(df)IDSepal.Length Sepal.Width Petal.Length Petal.Width Species11 5.1 3.5 1.4 0.2 setosa22 4.9 3.0 1.4 0.2 setosa33 4.7 3.2 1.3 0.2 setosa44 4.6 3.1 1.5 0.2 setosa55 5.0 3.6 1.4 0.2 setosa66 5.4 3.9 1.7 0.4 setosa#请注意species结果与样式3中结果的差异>summary(df) IDSepal.Length Sepal.Width Petal.Length Min.: 1.00 Min. :4.300 Min. :2.000 Min. :1.000 1stQu.: 38.25 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 Median: 75.50 Median :5.800 Median :3.000 Median :4.350 Mean: 75.50 Mean :5.843 Mean :3.057 Mean :3.758 3rdQu.:112.75 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 Max.:150.00 Max. :7.900 Max. :4.400 Max. :6.900 Petal.WidthSpecies Min.:0.100 setosa :50 1stQu.:0.300 versicolor:50 Median:1.300 virginica :50 Mean:1.199 3rdQu.:1.800 Max. :2.500

2 read.csv() #读取.csv格式数据,read.table的一种特定应用

read.csv() 读取逗号分割数据文件,read.table()的一种特定应用

默认逗号分割,header=T,stringsAsFactor = T

df <- read.csv("data.csv")

等同df <- read.table("data.csv",header = T,sep=",",stringsAsFactor = T)

read.csv(file, header = TRUE, sep = ",", quote = """,dec = ".", fill = TRUE, comment.char = "", ...)

#实例> df<-read.csv("data.csv") #相当于df<-read.table("data.csv",header= T,sep=",",stringsAsFactor= T)> head(df)IDSepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies1 1 5.13.51.40.2setosa2 2 4.93.01.40.2setosa3 3 4.73.21.30.2setosa4 4 4.63.11.50.2setosa5 5 5.03.61.40.2setosa6 6 5.43.91.70.4setosa

3 excel数据文件读取

这里只讲1种:readxl,其他excel数据读取方法可自行百度

install.packages("readxl")library(readxl)df <- read_excel("文件名",sheet=1)

4 scan #类似read.table(),但比read.table更加灵活

scan(file = "", what = double(), nmax = -1, n = -1, sep = "",quote = if(identical(sep, "n")) "" else "'"", dec = ".",skip = 0, nlines = 0, na.strings = "NA",flush = FALSE, fill = FALSE, strip.white = FALSE,quiet = FALSE, blank.lines.skip = TRUE, multi.line = TRUE,comment.char = "", allowEscapes = FALSE,fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

关于scan的相关参数介绍参照read.table

5 保存为.Rdata

通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中

save() #保存数据

load() #加载数据

> a <- 1:9 > save(a,file='E://dumData.Rdata') > rm(a) #将对象a从R中删除 > load('d://dumData.Rdata') > print(a) [1] 1 2 3 4 5 6 7 8 9

6 write.table() #常用导出数据函数

write.table(x, file = "", append = FALSE, quote = TRUE, sep = " ",eol = "n", na = "NA", dec = ".", row.names = TRUE,col.names = TRUE, qmethod = c("escape", "double"),fileEncoding = "")

参数解释:

x: 要写入的对象,最好是矩阵或数据框。如果不是,它是试图强迫x到一个数据框。

file: 一个字符串命名文件或编写而打开的一个连接。 " "表示输出到控制台。

append: 逻辑。只有当file是一个字符串才相关。 如果TRUE,输出追加到文件;如果FALSE,任何现有文件的名称被摧毁

quote: 一个逻辑值(TRUE或FALSE)或数字向量。如果TRUE,任何字符或因素列将用双引号包围。如果一个数值向量,其元素为引用的列的索引。在这两种情况下,行和列名报价,如果他们被写入。如果FALSE,并没有被引用。

sep: 字段分隔符字符串。每一行x中的值都被这个字符串分隔开。

row.names: 表示x的行名是否与x一起写的逻辑值,或者是写行名的字符向量

col.names: 类似row.names。

实例

>x <- c (22,23)>y <- c ("k", "j")>f <- data.frame (x = x, y = y)>f#x y#1 22 k#2 23 j#以空格分隔数据列(默认),含行号(默认),含列名(默认),字符串带引号>write.table (f, file ="f.csv")

#以逗号分隔数据列,含行号(默认),含列名(默认),字符串带引号>write.table (f,file ="f.csv", sep =",")

#以逗号分隔数据列,不含行号,含列名(默认),字符串带引号>write.table (f,file ="f.csv", sep =",", row.names = FALSE)

#以空格分隔数据列,不含行号,不含列名,字符串带引号>write.table (f,file ="f.csv", row.names = FALSE, col.names =FALSE) #以空格分隔数据列,不含行号,不含列名,字符串不带引号>write.table (f,file ="f.csv", row.names = FALSE, col.names =FALSE, quote =FALSE)

7 CSV格式导出 #write.table的一种特定应用

通过函数write.csv()保存为一个.csv文件

write.csv() #保存为一个.csv文件

> x <- c(1:3)> y <- c((1:3)/10)> z <- c("R and","Data Mining","Examples") > df <- data.frame(x= x,y= y,z = z) > df# x y z#1 1 0.1 R and#2 2 0.2 Data Mining#3 3 0.3 Examples> write.csv(df1,"E://dummmyData.csv",row.names = FALSE)

以上是一些常用的数据输入与输出方法

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343