Powered by OpenAIRE graph
Found an issue? Give us feedback
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/ Bionics of Intellige...arrow_drop_down
image/svg+xml art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos Open Access logo, converted into svg, designed by PLoS. This version with transparent background. http://commons.wikimedia.org/wiki/File:Open_Access_logo_PLoS_white.svg art designer at PLoS, modified by Wikipedia users Nina, Beao, JakobVoss, and AnonMoos http://www.plos.org/
addClaim

This Research product is the result of merged Research products in OpenAIRE.

You have already added 0 works in your ORCID record related to the merged Research product.

Maximum-versus-mean absolute error in selecting criteria of time series forecasting quality

Maximum-versus-mean absolute error in selecting criteria of time series forecasting quality

Abstract

In time series forecasting, a commonly accepted criterion of the forecasting quality is the root-mean-square error (RMSE). Sometimes only RMSE is used. In other cases, another measure of forecasting accuracy is used along with RMSE. It is the mean absolute error (MAE). Although RMSE and MAE are the common criteria of time series forecasting quality, they both register information about averaged errors. However, averaging may remove information about volatility, which is typical for time series, in a few points (outliers) or narrow intervals. Information about outliers in time series forecasts (with respect to test data) can be registered by the maximum absolute error (MaxAE). The MaxAE criterion does not have any relation to averaging. It registers information about the worst outlier instead. Therefore, the goal is to ascertain the best criteria of time series forecasting quality, wherein the RMSE criterion is always present. First, 12 types of benchmark time series are defined to test and select criteria. The time series is of 168 points, whereas the last third of the series is forecasted. After having generated 200 times series for each of those 12 types, ARIMA forecasts are made at 56 points of every series. All the 2400 RMSEs are sorted in ascending order, whereupon the respective MAEs and MaxAEs are re-arranged as well. The interrelation between the RMSE and MAE/MaxAE is studied by their intercorrelation function. RMSEs and MaxAEs are “more different” than RMSEs and MAEs, because the correlation between the RMSE and MAE is stronger. Consequently, the MAE criterion is useless as it just nearly replicates information about the forecasting quality from the RMSE criterion. Inasmuch as the MaxAE criterion can import additional information about the forecasting quality, the best criteria are RMSE and MaxAE.

При прогнозуванні часових рядів якість прогнозів загальноприйнято оцінювати за критерієм середньоквадратичної помилки (RMSE). Іноді тільки RMSE й використовують. В інших випадках, разом з RMSE використовується ще одна міра точності прогнозування. Такою мірою є середня абсолютна помилка (MAE). Хоча RMSE й MAE є загальноприйнятими критеріями якості прогнозування часового ряду, вони обидва фіксують інформацію про усереднені помилки. Однак усереднення може стирати інформацію про волатильність, яка є типовою для часових рядів у точках викидів або на вузьких інтервалах. Інформація про викиди у прогнозах часового ряду (відносно тестових даних) може бути зафіксована за допомогою максимуму абсолютної помилки (MaxAE). MaxAE-критерій не має жодного стосунку до усереднення. Натомість він фіксує інформацію про най-гірший викид. Тому мета полягає у встановленні найкращих критеріїв якості прогнозування часових рядів, де, щоправда, RMSE-критерій завжди присутній. Спочатку визначаються 12 типів контрольних часових рядів для тестування і вибору критеріїв. Часовий ряд складається зі 168 точок, причому прогнозується остання третина цього ряду. Згенерувавши 200 часових рядів для кожного з 12 типів, виконуються ARIMA-прогнози у 56 точках кожного ряду. Всі 2400 значень RMSE сортуються у порядку зростання, після чого відповідні значення MAE й MaxAE також упорядковуються наново. Взаємоспіввідношення між RMSE й MAE/MaxAE вивчається за їх взаємокореляційною функцією. Значення RMSE й MaxAE є “більш різними”, ніж значення RMSE й MAE, оскільки кореляція між RMSE й MAE є сильнішою. Отже, MAE-критерій не має сенсу, тому що він практично повторює інформацію про якість прогнозування з RMSE-критерію. Оскільки MaxAE-критерій може вносити додаткову інформацію про якість прогнозування, найкращими критеріями є RMSE й MaxAE.

Keywords

arima forecasting, взаємокореляційна функція, maximum absolute error, максимум абсолютної помилки, середньоквадратична помилка, outliers, ARIMA-прогнозування, root-mean-square error, прогнозування часових рядів, викиди, mean absolute error, intercor-relation function, forecasting quality, time series forecasting, середня абсолютна помилка, якість прогнозування

  • BIP!
    Impact byBIP!
    selected citations
    These citations are derived from selected sources.
    This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    0
    popularity
    This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
    Average
    influence
    This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
    Average
    impulse
    This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
    Average
Powered by OpenAIRE graph
Found an issue? Give us feedback
selected citations
These citations are derived from selected sources.
This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Citations provided by BIP!
popularity
This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.
BIP!Popularity provided by BIP!
influence
This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).
BIP!Influence provided by BIP!
impulse
This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.
BIP!Impulse provided by BIP!
0
Average
Average
Average
gold