平均絶対スケール誤差


Mean_absolute_scaled_error
統計では、平均絶対尺度誤差( MASE ) は予測の精度の尺度です。これは、予測値の平均絶対誤差を、サンプル内の 1 ステップのナイーブ予測の平均絶対誤差で割ったものです。これは、2005 年に統計学者のロブ J. ハインドマンと意思決定科学のアン B. コーラー教授によって提案され、「他の測定に見られる問題のない予測精度の一般的に適用可能な測定」であると説明しました。平均絶対スケーリング誤差は、二乗平均平方根偏差などの予測誤差を計算する他の方法と比較すると、有利な特性を持っています。、したがって、予測の比較精度を決定するために推奨されます。
コンテンツ
1 根拠
2 非季節時系列
3 季節時系列
4 非時系列データ
5 こちらもご覧ください
6 参考文献

根拠
平均絶対スケール誤差には、次の望ましい特性があります:
スケールの不変性: 平均絶対スケール誤差はデータのスケールに依存しないため、異なるスケールのデータ セット間で予測を比較するために使用できます。
としての予測可能な動作 y 0 { y_{t}rightarrow 0}

 :平均絶対パーセント誤差(MAPE)などのパーセンテージ予測精度の尺度は、y t
{ y_{t}}

、値のMAPEの分布を歪めますy t
{ y_{t}}

これは、摂氏または華氏の温度など、スケールが意味のある 0 を持たないデータ セット、および断続的な需要データ セットの場合に特に問題になります。y t = 0
{ y_{t}=0}

頻繁に発生します。
対称性:平均絶対スケール誤差は、正と負の予測誤差に等しくペナルティを課し、大きな予測と小さな予測の誤差に等しくペナルティを課します。対照的に、MAPE と中央絶対パーセント誤差 (MdAPE) はこれらの基準の両方に失敗しますが、「対称」sMAPE と sMdAPE は 2 番目の基準に失敗します。
解釈可能性:平均絶対スケール誤差は簡単に解釈できます。値が 1 より大きい場合は、単純な方法によるサンプル内の 1 ステップ予測が、検討中の予測値よりも優れていることを示しています。
MASE の漸近正規性: 1 ステップ予測の Diebold-Mariano 検定は、2 つの予測セット間の差の統計的有意性を検定するために使用されます。 Diebold-Mariano 検定統計量で仮説検定を実行するには、D M ~ N( 0 1 ) { DMsim N(0,1)}

、 どこD M
{ DM}

検定統計量の値です。MASE の DM 統計は、この分布を近似することが経験的に示されていますが、平均相対絶対誤差 (MRAE)、MAPE、および sMAPE は近似し

非季節時系列
非季節時系列の場合、平均絶対スケール誤差は次のように推定されます。M あ S え = メートルe a n( | |e j
| |
1T − 1 ∑ t =2 | |よ t − よ t − 1
| |
) 1J ∑ j
| |e j
| |
1T − 1 ∑ t = 2 T
| |よ t
−よ t − 1
| |
{ mathrm {MASE} =mathrm {mean} left({frac {left|e_{j}right|}{{frac {1}{T-1}}sum _{t =2}^{T}left|Y_{t}-Y_{t-1}right|}}right)={frac {{frac {1}{J}}sum _{j} left|e_{j}right|}{{frac {1}{T-1}}sum _{t=2}^{T}left|Y_{t}-Y_{t-1} 右|}}}

ここで、分子e jは、特定の期間 ( Jは予測の数) の予測誤差であり、その期間の実際の値 ( Y j ) から予測値 ( F j ) を引いた値として定義されます: e j  =  Y j  −  F jであり、分母は、トレーニング セット (ここではt = 1..Tと定義)に対する 1 ステップの「ナイーブ予測法」の平均絶対誤差です。これは、前期の実際の値を次のように使用します。予測: F t  =  Y t −1

季節時系列
季節時系列の場合、平均絶対スケーリング誤差は、非季節時系列の方法と同様の方法で推定されます。M あ S え =
メートルe a n( | |e j
| |1 T −
メートル∑ t =
メートル+ 1 T
| |よ t
−よ t −
メートル
| |)= 1 J ∑ j
| |e j
| |1 T −
メートル
∑t =
メートル+ 1 T
| |よ t − よ t −
メートル
| |
{ mathrm {MASE} =mathrm {mean} left({frac {left|e_{j}right|}{{frac {1}{Tm}}sum _{t=m +1}^{T}left|Y_{t}-Y_{tm}right|}}right)={frac {{frac {1}{J}}sum _{j}left |e_{j}right|}{{frac {1}{Tm}}sum _{t=m+1}^{T}left|Y_{t}-Y_{tm}right|} }}

非季節時系列の方法との主な違いは、分母が、前の季節の実際の値を使用する、トレーニング セットのワンステップ「季節単純予測方法」の平均絶対誤差であることです 。 F t  =  Y t −m , ここで、 mは季節期間です。
このスケールフリーエラー メトリックは、「単一のシリーズの予測方法を比較したり、シリーズ間の予測精度を比較したりするために使用できます。このメトリックは、無限または未定義の値を決して与えないため、断続的な需要シリーズに適していますすべての履歴データが等しい無関係な場合を除きます 。
予測方法を比較する場合、MASE が最も低い方法が優先されます。

非時系列データ
非時系列データの場合、データの平均 ( よ ¯ { {bar {Y}}}

) を「ベース」予測として使用できます。M あ S え = メートルe a n( | |e j
| |
1J ∑ j =1 | |よ j − よ ¯
| |
) 1J ∑ j
| |e j
| |
1J ∑ j
| |よ j−よ ¯ | |
{ mathrm {MASE} =mathrm {mean} left({frac {left|e_{j}right|}{{frac {1}{J}}sum _{j=1 }^{J}left|Y_{j}-{bar {Y}}right|}}right)={frac {{frac {1}{J}}sum _{j} left|e_{j}right|}{{frac {1}{J}}sum _{j}left|Y_{j}-{bar {Y}}right|}}}

この場合、MASE は平均絶対誤差を平均絶対偏差で割ったものです。

こちらもご覧ください
平均二乗誤差
平均絶対誤差
平均絶対パーセント誤差
二乗平均平方根偏差
テストセット
説明されていない分散の割合

参考文献
^ハインドマン、 RJ (2006). 「予測精度の測定の別の見方」、FORESIGHT Issue 4 June 2006、pg46
^ Franses、Philip Hans (2016-01-01). 「平均絶対スケール誤差に関する注意」 . 予測の国際ジャーナル。32 (1): 20–22. ドイ: 10.1016/j.ijforecast.2015.03.008 . hdl : 1765/78815。
^ Hyndman、RJ、および Koehler AB (2006)。「予測精度の尺度をもう一度見てみましょう。」International Journal of Forecasting の第 22 巻第 4 号、679 ~ 688 ページ。
doi : 10.1016/j.ijforecast.2006.03.001
^ マクリダキス、スパイロス (1993-12-01)。「精度測定: 理論的および実際的な懸念」. 予測の国際ジャーナル。9 (4): 527–529. ドイ:10.1016/0169-2070(93)90079-3 .
^ Diebold、Francis X.; マリアーノ、ロベルト S. (1995)。「予測精度の比較」。ビジネスと経済統計のジャーナル。13 (3): 253–263. ドイ: 10.1080/07350015.1995.10524599 .
^ Diebold、Francis X.; マリアーノ、ロベルト S. (2002)。「予測精度の比較」。ビジネスと経済統計のジャーナル。20 (1): 134–144. ドイ:10.1198/073500102753410444。
^ Diebold、Francis X. (2015)。「20 年後の予測精度の比較: ディーボルト・マリアーノ テストの使用と乱用に関する個人的な見解」 (PDF) . ビジネスと経済統計のジャーナル。33 (1): 1.ドイ: 10.1080/07350015.2014.983236 . ^
「2.5 予測精度の評価 | OTexts」 . www.otexts.org 。2016 年5 月 15 日閲覧。
^ Hyndman、Rob 他、指数平滑法による予測: 状態空間アプローチ、ベルリン: Springer-Verlag、2008 年。
ISBN  978-3-540-71916-8 .
^ ハインドマン、ロブ。「データが時系列でない場合のMAPEの代替」 . クロス検証済み。2022 年10 月 11 日閲覧。”