?read.table
:调出帮助文档
今天主要学习两大重要数据类型:
- 向量
- 数据框(表格)
附:R语言数据类型
- 向量(vector)
- 矩阵(Matrix)
- 数组(Array)
- 数据框(Data frame)
- List
向量
- 变量分为标量与向量:
- 标量:单个元素组成的变量:1;"a"
- 向量:多个元素组成的变量:c(1,2,3);c("a","b","c")
元素可以是数字也可以是字符串
- 提取向量元素方法
- 根据元素位置:
(1)x[4]
(2)x[-4]
(3)x[2:4]
(4)x[-(2:4)]
(5)x[c(1,5)]
- 根据值大小
(1)x[x==10]
(2)x[x<0]
(3)x[x%in%c(1,2,5)]
数据框
读取表格数据,文件最好存入工作目录下,方便读取。
常用read.csv()
或read.table()
读取数据
- 读取本地数据:
a=read.csv(file="double.txt",seq="\t",header=T)
:将数据框赋值给变量a - 查看与设置行列名
-
header=T
表示默认第一行为列名,若header=F
,表示第一行不设置为列名 -
row.names=1
:表示默认第一列为行名,不输入则第一列 -
colnames(变量名)
:查看列名 -
rownames(变量名)
:查看行名 -
colnames(x)[1]="bioplanet"
:将数据框x的第一列名称改为bioplanet -
rownames(x)[1]="bioinfo"
:将数据框x的第一行名称改为bioinfo
- 导出数据框
write.table(file="new.txt",sep=",",quote=F)
quote:quote 制定包围字符型数据的字符。默认情况下,字符串可以被 " 或 ’ 括起,并且两种情况下,引号内部的字符都作为字符串的一部分。有效的引用字符(可能没有)的设置由参数 quote 控制。默认值改为 quote = “”
4.变量的保存于重新加载
- 保存
所有变量save.image(file="文件名.RData")
某个变量save(frame1,file="frame1.RData")
- 重新加载
load("frame1.RData")
- 提取元素
A[x,y]
:向量A的第x行第y列
A[x,]
:向量A的第x行
A[,y]
:向量A的第y列
A[y]
:向量A的第y列
A[a:b]
:向量A的第a列到第b列
A[c(a,b)]
:向量A的第a列和第b列
A$列名
:提取列