好习惯
- 以R.project的形式管理项目,每次以Rproject的方式打开Rstudio
- 在脚本编辑器里面打代码运行和调试,运行的方式:光标放在某一行,点绿色箭头Run 或者是ctrl+enter
- 赋值符号 <- 用 Alter- 打出,赋值符号前后会有空格,好看。
生成向量
c()
字符要每一个都标引号' '或者" "
连续的数字 用冒号:
1:5
重复的 用rep()
rep(1,time=3) , rep("a",time=3)
1重复3次,a重复3次
有规律的序列用seq( )
seq(from=3,to=15,by=3)
从3到15,间隔为3取值
随机数用rnorm()
rnorm(4)
取4个随机数
向量中元素的等级转换
字符型元素是最高级的,向量中只能有一种元素,在数据框中,一列相当于一个向量,那么一列里面的内容是同一类。
通过组合生成复杂的向量
paste0()
把两个向量分别捏在一起
区别于paste()
中间有一个空格连接
连接的向量可以是两个,三个,甚至更多,还可以在中间加字,
简单计算
比如给向量赋值
x <- c(1,1,1,2,2,2,3,3,4)
x+1
sqrt(x)
开平方
log(x)
求log
根据给出的条件进行判断,生成逻辑型向量
初级统计
赋值为x,然后
max(x)
最大值
min(x)
#最小值
mean(x)
#均值
median(x)
#中位数
var(x)
方差
sd(x)
标准差
sum(x)
总和
length(x)
看向量的长度
unique(x)
去重复,返回的是向量中没有重复的元素
duplicated(x)
返回的是逻辑判断 TRUE 或 FALSE,重复的返回TRUE.
table(x)
对unique(x)得到的元素进行统计,即统计同一个元素出现的次数。
排序用
sort()
sort(x,decreasing=T)
降序sort(x,decreasing=F)
升序
对两个向量进行操作
连接
paste0()
和paste()
交集、并集、差集
有两个向量x
和 y
intersect(x,y)
交集
union(x,y)
并集
setdiff(x,y)
差集 注意向量的顺序不同,结果不同
%in%
x%in%y
向量x中的元素在y中存在吗
y%in%x
向量y中的元素在x中存在吗
返回逻辑判断
向量取值
用 []
首先是要有一个向量 生成向量
按逻辑值取值
按位置取值
修改向量中元素
取子集+赋值
习题中发现的问题