1.数据管理
aggergate整合数据 时往往是将多组观测替换为根据这些观测计算的描述性统计量。个人认为可以简单的理解为合并不同数据集啦。
reshape重塑数据时,则会通过修改数据结构(行和列)来决定数据的组织方式。回笼重造,数据还是那个数据,就是表现形式不同了,就像是冶金的过程,哈哈哈。
想要具体还是要去看书呀chapter5.6 <R in Action,2E>
用于连接每对数据表的变量称为键,键是唯一标识观测的变量(或者变量集合),单个变量就可以识别一个观测,可以理解为数据集中的特性,是能够唯一标识每个观测的,通过键特异性的查找数据,因此验证键就进行计数键,返回所有n==1
一定要看chapter 9 <R for Data Science>
Tips for R
1.处理缺失值NA,NaN,Inf,方法可以有:推理,删除(比如单个,整行,成对),或者简单(非随机,如均值,中位数,众数)插补;
2.优先用read.csv,哈哈哈哈;
3.可以学下正则表达式,填坑.jpg;
4.命名必须以字母开头,所以我推测,如果是花花直接输入列名1999,花花会返回为X1999;
5.cheatsheet很好用,但是一定要有基础知识储备哟;
6.全国各地好多地方都初雪了,西湖真的冷哭了,啊哈哈哈哈,保重圣体啊。