R语言学习
1 获得学习小抄
tidyr包的小抄
2 tidyr包功能
(1)数据框的变形
(2)处理数据框中的空值
(3)根据一个表格衍生出其他表格
(4)实现行或列的分割和合并
用的数据处理成标准而统一的数据框(Tidy Data),才能进行进一步的数据处理和作图
3 安装tidyr包
3.1 下载和安装tydir:
install.packages("tidyr")
3.2 加载tydir包:
library()
4 数据框
新建数据框(这里直接把新建的数据框赋值给了a)
a<data.frame(GeneId=rep("gene5",times=3),SampleName=paste("Sample",1:3,sep=""),Expression=c(14,19,18))
rep
,重复,括号中填要重复的字符和重复次数。
paste
,连接两个字符串,括号要填两个代连接字符并指定分隔符(sep),没有分隔符就填sep=“”。
5 认识Tidy Data
是一种组织表格数据的方式,提供了一种能够跨包使用的“统一”的数据格式。
5 .1 Reshape Data
准备数据
变形1
gather(a,X1999,X2000,key = "year",value = "cases")
gather括号里的分别是:
数据框名,需合并的列名(两个),合并后的key列名,value列名。
gather(a,year,cases,-country)
#-country的意思就是合并除country外剩下的列。
5.2 Handle Missing Values
处理丢失的数据。就是某些单元格有空值的情况。
三种处理方式:
(1).删除整行
(2).根据上下文(瞎)蒙一个
(3).同一列的空值填上同一个数。
5.2.1 获取数据框X
导入:X<-read.csv('doudou.csv')
导出:write.csv(X,'doudou.csv')
drop_na()
:有空值的,整行删除掉
括号里填数据框名,依据的列名(有空值那一列的列名)
fill()
,根据上一行的数值填充上
replace_na()
,空值填进去特定的一个数值
括号里填数据框名,要填的列名=要填的值
5.3 Expand Tables
complete
(把空值的位置补全)
expand
列出每列值所有可能的组合