今天学习的是时序数据,
1. 时序中的基本对象
概念 单元素类型 数组类型
Datatimes Timestamp DatetimeIndex
Timedeltas Tiimedelta TimedeltaIndex
Timespans Period PeriodIndex
Dateoffsets DateOffset None
2. 时间戳
(1)单个时间戳生成:pdTimestampe(), 使用year, month、day、hour、min、second获取各时间戳分量。
(2) 时间戳对象转换:pd.to_datatime()
(3) 时间序列生成:pd.data_range(),
(4)dt对象与三类操作:取出时间相关属性;判断时间戳是否满足条件;取整操作。
3. 时间差
时间差的生成:pd.Timedelta()
时间差序列转换:pd.to_timedelta()
时间差序列生成:pd.timedelta_range()
1.4 日期偏置
offset对象
偏置字符串:
标志 描述
MS 月初
M 月末
B 工作日
W-MON 周一
WOM-1MON 每月第一个周一
1.5 时序中的滑窗与分组
滑动窗口:series.rolling
重采样:series.resample
练习
EX1
-
将 Datetime, Time 合并为一个时间列 Datetime ,同时把它作为索引后排序。
-
a. 找出间隔时间的前三个最大值所对应的三组时间戳。
b. 是否存在一个大致的范围,使得绝大多数的间隔时间都落在这个区间中?如果存在,请对此范围内的样本间隔秒数画出柱状图,设置 bins=50 。
Ex2
-
按月计算周一至周日各品种水果的平均记录条数,行索引外层为水果名称,内层为月份,列索引为星期。
-
按天计算向前10个工作日窗口的苹果销量均值序列,非工作日的值用上一个工作日的结果填充。