数据分析R语言实战学习笔记(一)

第二章 数据的读取和保存

  • 查看和载入数据集

data() 查看数据集列表
data(CO2) 载入CO2数据集
library(MASS) 载入MASSpackage
data(package=”MASS”) 查看MASS中数据集
data(SP500, package=”MASS”) 载入MASS中的SP500数据集

  • 工作目录获取和设置

getwd() 获取各种目录
setwd(“d:/data”) 设置工作目录

  • 读取数据

read.table() 读取文本文件,常用参数如下:
file 要读取的数据文件名称
header 逻辑值,TRUE表示文件的第一行包含变量名,默认为FALSE
sep 文件中字段的分隔符,默认为sep=””,表示分隔符是空格
quote 设置如何引用字符型变量,默认字符串被引号,如果没有设定分隔符,引号前面加\,即quote=”\”
dec 设置用来表示小数点的字符
row.names 向量的行名,默认为1,2,3。。。
col.names 向量的列名,默认为V1,V2,V3。。。
na.strings 赋给缺失数据的值(NA)
skip 开始读取数据前跳过的数据文件的行数
strip.white 是否清除空白字符
blank.lines.skip 是否跳过空白行

  • 举例

data <- read.table(“d:/data/salary.txt”,header=TRUE)
直接读入完整的路径名称

read.csv() 读取逗号分隔文件,header默认值为TRUE
read.delim() 针对使用其他分隔符的数据(并且不使用行号),sep默认值为”\t”

scan() 如果不加参数,则手动输入数据,大部分参数与read.table相同,没有header参数,其他需要注意的参数如下:
what 指定要读取的数据类型,默认为数值型向量
nmax 指定要读入数据的最大数量,如果what=list,则为最大的行数,默认将读到文件末端
n 要读取数据的最大数量,默认值为没有限制

  • 举例

data2 <- scan(“salary.txt”,skip=1,what=list(City=””,Work=0,Price=0,Salary=0))
由于不存在header参数,skip=1说明跳过表示名称的第一行;what=list(City=””,Work=0,Price=0,Salary=0)指明要创建列表,指明列表中对象的名称,这是一个名义列表结果,用来指定第一个变量City是字符型,后面三个是数值型

mode() 显示对象的类型
names() 显示对象中的标签
dim() 显示对象的维度
attach() 固定搜索路径,常用于固定一个数据框,则可以直接引用数据框的列名,起相同作用的还有with()函数
detach()attach()作用相反

read.fwf() 读取固定宽度格式的文件,以行的方式读入数据,通过widths参数指定一个向量来设置各个字段的宽度,注意小数点也占一个字符

举例

data.fwf <- read.fwf(“d:/data/fwf.txt”,widths=c(2,4,4,3),col.names=c(“w”,”x”,”y”,”z”))

data.excel <- read.delim(“clipboard”) 先复制,然后从剪贴板读取,读取excel的便捷方式,或者使用RODBC包或者xlsx包

readHTMLTable() XML包读取网页的函数,主要参数如下:
doc HTML文件或URL(网页网址)
header 若为逻辑值,表示是否包含列标签,若为字符向量,则为列名赋值
colClasses 一个列表或向量,制定表中各列数据的类型
skip.rows 指定要忽略的行
trim 逻辑值,表示是否要删除开头和结尾的空白单元格
which 整数向量,表示返回网页中的哪几个表

load() 载入R格式的文件,.Rdata结尾的文件

  • foreign包

read.spss()
read.mtp()
read.ssd()
read.dta()
spss数据集,使用Hmisc包中的spss.get()函数

  • 输出对象

cat() 在屏幕上输出对象,或输出文件,append参数为TRUE表示追加
readLines() 直接从链接中以行的形式读入文本
write.table() 写入文本
write.csv() 写入csv文件
save() 保存R对象

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容