tft每日頭條

 > 生活

 > 機器學習預測的目标

機器學習預測的目标

生活 更新时间:2025-02-11 22:33:02

機器學習預測的目标(機器學習中的時間序列預測概述)1

在正常的機器學習問題中,我們通過觀察值來進行預測,預測與時間因素無關。在某些情況下,機器學習也可以預測未來的結果,但這将同等對待所有過去的觀察結果。

然而,時間序列數據集是完全不同的。時間序列任務增加了一個“時間維度”,并且在觀察之間也有一個明确的依賴順序。簡單地說:時間序列是按時間順序進行的一系列觀察。

時間序列數據的組成部分
  1. 平均水平(level):序列的基線值。
  2. 趨勢(Trend):該序列遵循的行為,即根據情況和條件增加或減少。
  3. 季節性(Seasonality):一段時間内行為的重複模式或周期。
  4. 噪聲(Noise):模型無法解釋的數據的可選變化。

機器學習預測的目标(機器學習中的時間序列預測概述)2

可以将這些組成部分組合起來,以提供所觀察到的時間序列。例如,可以将它們加在一起形成如下模型(盡管并非總是如此):

機器學習預測的目标(機器學習中的時間序列預測概述)3

時間序列數據可以有兩種不同的類型:

  1. 單變量時間序列:指由在一定時間間隔内記錄的單個(标量)觀測值組成的時間序列數據。例如,從傳感器收集的數據(傳感器每秒測量一次房間的溫度)。
  2. 多元時間序列:按一定時間間隔記錄的随時間變化的多個變量。例如,在一個三軸加速度計中,有三個加速度,每個軸(x,y,z)一個,它們随着時間同時變化。
時間序列預測方法

下面提供了用于預測時間序列數據的各種經典方法的完整概述。

機器學習預測的目标(機器學習中的時間序列預測概述)4

自回歸(AR)

自回歸模型是将時間序列中的值回歸到相同時間序列中的先前值的模型。在此模型中,下一個值表示為所有先前時間戳值(也稱為滞後值)的線性組合。

機器學習預測的目标(機器學習中的時間序列預測概述)5

自回歸模型用AR(p)表示,其中p稱為模型的階數。例如,AR(1)将是“一階自回歸過程”。一階AR過程中某個時刻(t)的結果變量僅與間隔一個周期的時間段(即(t-1)的值)相關。

移動平均線(MA)

與在回歸中使用預測變量的過去值的線性組合不同,移動平均模型通過取該模型中任何觀測子集的平均值來使用過去的預測誤差項(εt)。在此模型中,當前與平均值的偏差取決于過去與平均值的偏差。移動平均線對于預測長期趨勢非常有用。

機器學習預測的目标(機器學習中的時間序列預測概述)6

移動平均線用MA(q)表示,其中q為移動平均線窗口的大小,也稱為移動平均線的階數。

自回歸移動平均線(ARMA)

ARMA模型就是上述AR(p)和MA(q)模型的結合。它用兩個多項式來描述弱平穩随機時間序列,即一個是自回歸,另一個是移動平均。它利用了AR(p)和MA(q)的優勢, AR(p)利用因變量的前一個值進行預測,MA(q)利用序列均值和先前誤差進行預測。

機器學習預測的目标(機器學習中的時間序列預測概述)7

自回歸綜合移動平均線(ARIMA)

ARIMA是上述簡單的自動回歸移動平均線的推廣,唯一的區别是積分的概念。

簡而言之,此模型的關鍵方面是:

  1. 自回歸:利用觀測值和過去的滞後觀測值之間的依賴關系建立的模型。
  2. 綜合:取原始觀測值之間的差值(例如,在前一個時間步中将一個觀測值減去另一個觀測值),以使時間序列保持平穩。
  3. 移動平均線:一種利用觀測值和移動平均模型殘差之間的相關性來進行滞後觀測的模型。

ARIMA(p,d,q)模型中:p是自回歸(AR)的項數,用來獲取自變量;d是差分(I)的系數,為了使時間序列平穩;q是移動平均(MA)的項數,為了使其光滑.

平穩序列

如果Y在時間t的分布與任何其他時間點相同,則稱該序列為“嚴格平穩”。這意味着序列Yt的均值、方差和協方差是時間不變的。

可以通過差分使非平穩序列平穩。一般說來,如果微分d次是平穩的序列,則稱其為d階積分。

ARIMA模型中的“ I”代表integrated。它是衡量實現平穩性需要多少非季節的度量,也是ARMA和ARIMA之間區别的基礎。

為什麼我們需要假設序列平穩呢?
  1. 如果該系列是非平穩的,則标準技術無效。
  2. 如果序列是非平穩的,則可能導緻自相關。
  3. 可能會導緻虛假的回歸,表明與過去的值存在關系,而實際上不存在這種關系。
,

更多精彩资讯请关注tft每日頭條,我们将持续为您更新最新资讯!

查看全部

相关生活资讯推荐

热门生活资讯推荐

网友关注

Copyright 2023-2025 - www.tftnews.com All Rights Reserved