时序数据的特点:
1.时间序列数据依赖于时间,但不一定是时间的严格函数。
2.时间序列数据每时刻上的值具有一定的随机性,不可能完全准确地用历史值去预测。
3.时间序列数据前后时刻(但不一定是相邻时刻)的数值往往具有相关性。
4.从整体上看,时间序列往往会呈现出某种趋势性或出现周期性变化的现象。
分类:
按研究对象分类:一元时间序列和多元时间序列。
按时间参数分类:离散时间序列和连续时间序列。
按统计特性分类:平稳时间序列和非平稳时间序列。
按分布规律分类:高斯型时间序列和非高斯型时间序列
1.统计时序分析
1. 频域分析
2. 时域分析
2.平稳时间序列检验
什么是平稳时间序列?这就需要我们从概率统计的角度来定义。一般来讲,平稳时间序列有两种定义,分别是:严平稳时间序列和宽平稳时间序列。其中,严平稳要求序列所有的统计性质都不会随着时间的推移而发生变化。宽平稳则认为只要保证序列 [二阶矩](https://en.wikipedia.org/wiki/Moment_(mathematics) 平稳,就代表序列稳定。显然,严平稳比宽平稳的条件严格。严平稳是对序列联合分布的要求,以保证序列所有的统计特征都相同。
关于序列平稳性的检验,一般有两种方法,分别是:图检验和假设检验。图检验是根据时序图和自相关图显示的特征作出判断,因其操作简便而运用广泛。简单来讲,如果一张时序图呈现出明显的增长和下降趋势,那么就一定不平稳。
3.自相关图
4.纯随机性检验
怎样判断一个平稳序列是否随机呢?这就会用到纯随机性检验。纯随机性检验的过程中,一般会涉及到两个统计量,分别是:Q 统计量和 LB 统计量(Ljung-Box)。但由于 LB 统计量是 Q 统计量的修正,所以业界通常所称的 Q 统计量也就是 LB 统计量。
Python 中,我们可以利用 statsmodels 统计计算库中的 acorr_ljungbox() 函数计算 LB 统计量,该函数默认会返回 LB 统计量和 LB 统计量的 P 值。如果 LB 统计量的 P 值小于 0.05,我们则认为该序列为非随机序列,否则就为随机序列。
5.ARMA介绍及建模
ARMA 模型的全称是自回归移动平均模型,它是目前最常用的拟合平稳序列的模型。ARMA 模型一般又可以被细分为 AR 自回归模型,MA 移动平均模型和 ARMA 三类。