Day6-学习R包
image.png
1、安装和加载R包
1.1镜像设置
1.1.1初级模式:用options()$repos
检验
image.png
1.1.2升级模式:用
options()$BioC_mirror
检验image.png
1.1.3高级模式:R的配置文件 .Rprofile
Rstudio最重要的两个配置文件:
(1)在刚开始运行Rstudio的时候,程序会查看许多配置内容,其中一个就是
.Renviron
,它是为了设置R的环境变量;(2)
.Rprofile
就是一个代码文件,如果启动时找到这个文件,那么就替我们先运行一遍(这个过程就是在启动Rstudio时完成的)file.edit()编辑文件
1.2安装R包
R包安装命令是install.packages(“包名”)#BiocManager::install(“包名”)
image.png
image.png
1.3加载包
library(包)
image.png
2、dplyr五个基础函数
2.1.mutate(),新增列
image.png
image.png
2.2.select(),按列筛选
(1)按列号筛选
image.png
image.png
2.3.filter()筛选行
image.png
2.4.arrange(),按某1列或某几列对整个表格进行排序
image.png
image.png
2.5.summarise():汇总
image.png
image.png
image.png
3、dplyr两个实用技能
3.1、管道操作 %>% (cmd/ctr + shift + M)
image.png
3.2、count统计某列的unique值
image.png
image.png
4、dplyr处理关系数据
即将2个表进行连接,注意:不要引入factor
stringsAsFactors=FALSE
就是不变成属性数据,按字符串读入
data.frame()
函数创建数据框,紧密耦合的变量集合,这些变量共享了矩阵和列表的许多属性,它们被大多数R的建模软件用作基本的数据结构。
image.png
4.1.內连inner_join,取交集
取x的交集数据image.png
image.png
4.2、左连left_join
image.png
image.png
4.3、全连full_join
image.png
image.png
4.4.半连接:返回能够与y表匹配的x表所有记录semi_join
image.png
image.png
4.5.反连接:返回无法与y表匹配的x表的所记录anti_join
image.png
image.png
4.6、简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数image.png