在正常的機器學習問題中,我們通過觀察值來進行預測,預測與時間因素無關。在某些情況下,機器學習也可以預測未來的結果,但這将同等對待所有過去的觀察結果。
然而,時間序列數據集是完全不同的。時間序列任務增加了一個“時間維度”,并且在觀察之間也有一個明确的依賴順序。簡單地說:時間序列是按時間順序進行的一系列觀察。
時間序列數據的組成部分
可以将這些組成部分組合起來,以提供所觀察到的時間序列。例如,可以将它們加在一起形成如下模型(盡管并非總是如此):
時間序列數據可以有兩種不同的類型:
下面提供了用于預測時間序列數據的各種經典方法的完整概述。
自回歸(AR)
自回歸模型是将時間序列中的值回歸到相同時間序列中的先前值的模型。在此模型中,下一個值表示為所有先前時間戳值(也稱為滞後值)的線性組合。
自回歸模型用AR(p)表示,其中p稱為模型的階數。例如,AR(1)将是“一階自回歸過程”。一階AR過程中某個時刻(t)的結果變量僅與間隔一個周期的時間段(即(t-1)的值)相關。
移動平均線(MA)
與在回歸中使用預測變量的過去值的線性組合不同,移動平均模型通過取該模型中任何觀測子集的平均值來使用過去的預測誤差項(εt)。在此模型中,當前與平均值的偏差取決于過去與平均值的偏差。移動平均線對于預測長期趨勢非常有用。
移動平均線用MA(q)表示,其中q為移動平均線窗口的大小,也稱為移動平均線的階數。
自回歸移動平均線(ARMA)
ARMA模型就是上述AR(p)和MA(q)模型的結合。它用兩個多項式來描述弱平穩随機時間序列,即一個是自回歸,另一個是移動平均。它利用了AR(p)和MA(q)的優勢, AR(p)利用因變量的前一個值進行預測,MA(q)利用序列均值和先前誤差進行預測。
自回歸綜合移動平均線(ARIMA)
ARIMA是上述簡單的自動回歸移動平均線的推廣,唯一的區别是積分的概念。
簡而言之,此模型的關鍵方面是:
ARIMA(p,d,q)模型中:p是自回歸(AR)的項數,用來獲取自變量;d是差分(I)的系數,為了使時間序列平穩;q是移動平均(MA)的項數,為了使其光滑.
平穩序列如果Y在時間t的分布與任何其他時間點相同,則稱該序列為“嚴格平穩”。這意味着序列Yt的均值、方差和協方差是時間不變的。
可以通過差分使非平穩序列平穩。一般說來,如果微分d次是平穩的序列,則稱其為d階積分。
ARIMA模型中的“ I”代表integrated。它是衡量實現平穩性需要多少非季節的度量,也是ARMA和ARIMA之間區别的基礎。
為什麼我們需要假設序列平穩呢?,
- 如果該系列是非平穩的,則标準技術無效。
- 如果序列是非平穩的,則可能導緻自相關。
- 可能會導緻虛假的回歸,表明與過去的值存在關系,而實際上不存在這種關系。
更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!