R语言之数据合并、拆分、去重

上下简单合并

merge(df1, df2, all = T)

dplyr的join系列合并数据框

library(tidyverse) —— 加载tidyverse包
full_join(df1, df2, by = '?') —— 两表格并集
inner_join(df1, df2, by = '?') —— 两表格交集
left_join(df1, df2, by = '?') —— 左连接
right_join(df1, df2, by = '?') —— 右连接

数据拆分

  • separate_rows(df_x, col_y, sep = ",")
    将数据按分隔符拆分为多行。
    PS:分隔符为“|”时应该输入sep = '\\|'

去重

去除重复行,保留一行

  • unique()
  • duplicated()

去除空行

  • 一行中只要有NA就整行删除;
# 创建一个数据框
df <- data.frame(Name = c("Tom", "Nick", "John", "Tom"), 
                 Age = c(23, NA, 21, 25), 
                 Score = c(85, 90, NA, 88))
 
# 使用na.omit()函数删除含有NA值的行
df <- na.omit(df)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Day1 R语言基础 数据类型 数值型(右对齐)、字符型(左对齐)、逻辑性(NA:存在但未知的东西*NA作为向量...
    要开心_c34d阅读 311评论 0 0
  • https://github.com/hbctraining/Intro-to-R Tidyverse套件旨在共同...
    小洁忘了怎么分身阅读 6,385评论 -1 34
  • 第一课:安装与基本操作 R的扩展包在R官网CRAN;另外,R官网还包含很多扩展资料,包括源代码,手册,FAQ,推荐...
    lizi_sjtu阅读 674评论 0 0
  • R数据科学### 20200919 8:30 raining#### shif+enter 换行 planes ...
    miki1823阅读 1,005评论 0 2
  • #使用dplyr处理关系数据 #要想处理关系数据,你需要能够在两张表之间进行的操作。我们设计了三类操作来处理关系数...
    枸杞子岛年阅读 753评论 0 1