時系列データの定常性と定常過程、単位根過程

(2020-07-05)

時系列の各時間tでのデータをそれぞれの分布から抽出された確率変数R_tとして扱い、次の性質が定義される。

  • 弱定常性(weak stationarity): 各分布の平均E(R_t) = μがtに依らず一定で、lagkのデータとの共分散である自己共分散Cov(R_t, R_{t-k}) = E[(R_t - E(R_t))(R_{t-k} - E(R_{t-k}))] = γ_kがlagのみに依存する(つまり分散γ_0も一定)
  • 強定常性(strict stationarity): 任意のt,kに対する(R_t, R_{t+1}, ..., R_{t+k})の同時分布が同一

つまり弱定常性を持つデータは、一定の平均のまわりの一定の振れ幅の中で、それ以前の値にlagに応じた影響を受けながら推移することになる。単に定常性と言う場合この弱定常性のことを指す。

弱定常性の条件は同一の分布でなくても平均と分散、自己共分散が一定ならば満たされるため、強定常性の条件は満たさないことがある。 逆に強定常性を持つ場合は弱定常性も持ちそうだが、強定常性の条件は平均や分散(1次と2次のモーメント)を必須としないので必ずしも正しくない。 同一の分布からそれぞれ独立に抽出した列であるiid(independently and identically distributed, 独立同一分布)系列は強定常性を持つが、 その分布が平均と分散が定義されないコーシー分布のような場合は弱定常性を持たないことになる。

確率変数の列を確率過程(stochastic process)と呼び、定常性を持つものを定常過程(stationary process)と呼ぶ。 また、それ自体は定常過程でなく、差分系列 ΔR_t = R_t - R_{t-1} が定常過程であるものを単位根過程(unit root process)と呼ぶ。 単位根という用語はAR特性方程式の根に1が含まれることに由来する。

ARモデルとDickey-Fuller testによる単位根の検定、OLSとAICによるパラメータと次数の決定 - sambaiz-net

参考

現場ですぐ使える時系列データ分析~データサイエンティストのための基礎知識〜

CHAPTER 4. STATIONARY TS MODELS

定常性についてのまとめ | Developers.IO

第1章「離散時間確率過程」