上下简单合并
merge(df1, df2, all = T)
dplyr的join系列合并数据框
library(tidyverse)
—— 加载tidyverse包
full_join(df1, df2, by = '?')
—— 两表格并集
inner_join(df1, df2, by = '?')
—— 两表格交集
left_join(df1, df2, by = '?')
—— 左连接
right_join(df1, df2, by = '?')
—— 右连接
数据拆分
- separate_rows(df_x, col_y, sep = ",")
将数据按分隔符拆分为多行。
PS:分隔符为“|”时应该输入sep = '\\|'
去重
去除重复行,保留一行
- unique()
- duplicated()
去除空行
- 一行中只要有NA就整行删除;
# 创建一个数据框
df <- data.frame(Name = c("Tom", "Nick", "John", "Tom"),
Age = c(23, NA, 21, 25),
Score = c(85, 90, NA, 88))
# 使用na.omit()函数删除含有NA值的行
df <- na.omit(df)