网上找资料学习pandas, 小结下学习心得。
从数据类型来说,pandas主要数据结构有四种,Series,DataFrame, Arrays, Panel. 目前主要用的是前面两种数据框DataFrame 和序列Series。DataFrame是二维数据,有行有列,DataFrame默认会自动创建行索引。 Series是一维数据,默认有索引。
1. Series定义访问如下:
2. DataFrame定义访问如下,可以从文件读也可以自己定义
数据类型主要支持下面几种:
字符串类型:object
整数类型:Int64,Int32,Int16, Int8
无符号整数:UInt64,UInt32,UInt16, UInt8
浮点数类型:float64,float32
日期和时间类型:datetime64[ns]、datetime64[ns, tz]、timedelta[ns]
布尔类型:bool