今天学习了R包--dplyr的使用,感觉比昨天理解的更好一点,R包的使用也有了一个比较好的认知
大部分的代码我列在了思维图里,下面说几个需要注意的点
1、注意写代码时候的大小写以及空格,符号,中英文
自己写的时候经常因为手快而导致的错误,搞得一段代码敲了好几遍才好
2、管道操作
其实管道操作我的理解就相当于,一句话的代码拆成好几句,但是为了回车的时候不让机器运行这段没写完的代码而增加的一个命令,只要有这个命令,代表代码没写完要继续
3、stringsAsFactors = F
这段代码的意思是不要引入factor,在读入数据时,遇到字符串之后,不将其转换为factors,仍然保留为字符串格式,这样这个字符串不会当作一个因素去分类
4、表格内连和半连接的区别
两个表格根据x取交集,内连是两个表格x有交集的都会列出,半连接是两个表格x有交集时,只列出一个表格