关于如何设置下载R包的镜像
R的配置文件是 .Rprofile。在刚开始运行Rstudio的时候,程序会查看许多配置内容,其中一个就是.Renviron,它是为了设置R的环境变量(这里先不说它);而.Rprofile就是一个代码文件,如果启动时找到这个文件,那么就替我们先运行一遍(这个过程就是在启动Rstudio时完成的)
(相当于Linux里的.bashrc文件)
file.edit('~/.Rprofile')
# options函数就是设置R运行过程中的一些选项设置
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/")) #对应清华源
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") #对应中科大源
# 当然可以换成其他地区的镜像
不过我试了一下我的RStudio好像不需要
然后来用iris这个数据试一下
iris
1.mutate(),新增列
mutate(test, new = Sepal.Length * Sepal.Width)
2.select(),按列筛选
(1)按列号筛选
select(test,1)
select(test,c(1,5))
select(test,Sepal.Length)
(2)按列名筛选
select(test, Petal.Length, Petal.Width)
3.filter()筛选行
4.arrange(),按某1列或某几列对整个表格进行排序
5.summarise():汇总
管道操作 %>% (cmd/ctr + shift + M)
count统计某列的unique值
test %>%
group_by(Species) %>%
summarise(mean(Sepal.Length), sd(Sepal.Length))
count(test,Species)
处理
连接两个表
options(stringsAsFactors = F)
test1 <- data.frame(x = c('b','e','f','x'),
z = c("A","B","C",'D'),
stringsAsFactors = F)
test2 <- data.frame(x = c('a','b','c','d','e','f'),
y = c(1,2,3,4,5,6),
stringsAsFactors = F)
inner_join,取交集
左连left_join
全连full_join
半连接:返回能够与y表匹配的x表所有记录semi_join
反连接:返回无法与y表匹配的x表的所记录anti_join
简单合并 bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数