numpy,pandas常用函数
numpy 和 pandas 是 python 中俩个常用于科学计算以及数据清洗的强力模块。numpy 的 ndarray 在处理(矩阵)计算,尤其是在神经网络处理输入的图片时,特别有效;pandas 则在数据清洗时特别好用。
一.numpy常见函数
首先要说的是,numpy不同于pandas,若是想要查看numpy数组的内容,只能用print!!!pandas 可以用 head() 函数查看前5行,而且格式还比较工整)若是该 numpy 数组特别大,看起来就比较难受🙃,只能用 shape() 函数查看一下数组形状(m行n列)。
然而 numpy 数组很方便,它的 zero( ‘shape’ ) ,ones( ‘shape’ ) 函数,可以创建全 0 和 全 1 的,指定维度的数组。目测应该是内存连片附值。
dtype 函数 既可以查看数组的类型(np.dtype),又可以用来类型转换。size函数可以查看数组大小。
二.pandas常见函数
pandas 常见函数有 read_csv()用来读取文件.
pandas 有俩类数据结构:DataFrame 和 Series 。
DataFrame 类似于数据库表 ,行索引与列索引相同;
Series类似于字典,有index 和 values俩个属性。
上文提到 DataFrame 类似于数据库表,所以他的常用函数也和数据库表类似,比如说:rename() 函数用来重命名列,
drop 函数用来删除不必要的行和列 drop ( columns = [] ),
drop( index = [] )
apply() 函数自由度高,常用来对整列的数据进行操作,df['name'].apply(str.upper),将整个 ‘name’ 列转换成大写。
describe()函数对数据进行统计并输出。
merge() 和 concat() 用于数据合并。
merge 可以通过设置参数 ‘on == ’ 指定合并对象。
astype() 函数进行数据类型转换
hist() 函数可以绘图
groupby
log1p
exp1m
pandas 的 loc(columns),iloc(index) 函数
df.iloc[1:3,2:4] (df.iloc[index,columns])
df.loc[1:2,'A':'B] (df.loc[行索引,列索引])