今天学习的是第二章Pandas基础。
有几个函数我觉得挺有用的,记录一下:
-
唯一值函数unique和nunique
、以及value_counts
-
要观察多个列组合的唯一值,可使用 drop_duplicates 。其中的关键参数是 keep ,默认值 first 表示每个组合保留第一次出现的所在行, last 表示保留最后一次出现的所在行, False 表示把所有重复组合所在的行剔除。
-
替换函数。替换操作是针对某一个列进行的。在 replace 中,可以通过字典构造,或者传入两个列表来进行替换:
-
逻辑替换。逻辑替换包括了 where 和 mask ,这两个函数是完全对称的: where 函数在传入条件为 False 的对应行进行替换,而 mask 在传入条件为 True 的对应行进行替换,当不指定替换值时,替换为缺失值。
-
排序函数。排序共有两种方式,其一为值排序,其二为索引排序,对应的函数是 sort_values 和 sort_index 。
-
对 HP, Attack, Defense, Sp. Atk, Sp. Def, Speed 进行加总,验证是否为 Total 值。
-
对于 # 重复的妖怪只保留第一条记录,解决以下问题:
a. 求第一属性的种类数量和前三多数量对应的种类
b. 求第一属性和第二属性的组合种类
c. 求尚未出现过的属性组合
3.按照下述要求,构造 Series :
a. 取出物攻,超过120的替换为 high ,不足50的替换为 low ,否则设为 mid
b. 取出第一属性,分别用 replace 和 apply 替换所有字母为大写
c. 求每个妖怪六项能力的离差,即所有能力中偏离中位数最大的值,添加到 df 并从大到小排序
这道题真的是一点不会,只能照着答案抄了,太菜了。