時系列データの定常性と定常過程、単位根過程

statisticsmachinelearning

時系列データを各時間\(t\)ごとの分布から抽出された確率変数\(R_t\)の列とみなすと、次の性質が定義される。

  • 弱定常性(weak stationarity): 各分布の平均\(E(R_t) = \mu\)が\(t\)に依らず一定で、\(lag=k\) のデータとの共分散である自己共分散 \(Cov(R_t, R_{t-k}) = E[(R_t - E(R_t))(R_{t-k} - E(R_{t-k}))] = \gamma_k\) がlagのみに依存する(つまり分散 \(\gamma_0\) も一定)
  • 強定常性(strict stationarity): 任意の\(t,k\)に対する \((R_t, R_{t+1}, …, R_{t+k})\) の同時分布が同一

つまり弱定常性を持つデータは、一定の平均のまわりの一定の振れ幅の中で、それ以前の値にlagに応じた影響を受けながら推移することになる。単に定常性と言う場合この弱定常性のことを指す。

同一の分布でなくても平均と分散、自己共分散が一定ならば弱定常性の条件は満たされるため、弱定常性のみを持ち強定常性を持たないことはある。 逆に強定常性を持つ場合は弱定常性も持ちそうだが、強定常性の条件は平均や分散(1次と2次のモーメント)を必須としないので必ずしも正しくなく、 平均と分散が定義されないコーシー分布では弱定常性を持たないことになる。

確率変数の列を確率過程(stochastic process)と呼び、定常性を持つものを定常過程(stationary process)と呼ぶ。 また、それ自体は定常過程でなく、差分系列 \(\Delta R_t = R_t - R_{t-1}\) が定常過程であるものを単位根過程(unit root process)と呼ぶ。 単位根という用語はAR特性方程式の根に1が含まれることに由来しているらしい。

時系列データのMAモデルとARモデル、その定常性と反転可能性 - sambaiz-net

参考

現場ですぐ使える時系列データ分析~データサイエンティストのための基礎知識〜

CHAPTER 4. STATIONARY TS MODELS

定常性についてのまとめ | Developers.IO

第1章「離散時間確率過程」