2、data.table包
这个包让你可以更快地完成数据集的数据处理工作。放弃选取行或列子集的传统方法,用这个包进行数据处理。用最少的代码,你可以做最多的事。相比使用data.frame,data.table可以帮助你减少运算时间。你一定会对这个包的简洁性感到震惊。
一个数据表格包含三部分,即DT[i, j, by]。你可以理解为我们告诉R用i来选出行的子集,并计算通过by来分组的j。大多数时候,by是用于类别变量的。在下面的代码中,我用了两个数据集(airquality和iris)。
**第一步、加载数据,加载data.table包**
**第二步、把数据转换成data.table格式**
**第三步、按照你想要的查询**
还可以多条件查询。如上所示。
有问题,欢迎留言。
感谢关注!!!
CSDN同步更加精彩---ID:weixin_45098535