прогнозирование продаж
   Главная / Обучение / Статьи/ Сравнение методов ARIMA и Винтерса в задаче прогнозирования продаж
прогнозирование продаж
прогнозирование продаж
 
прогнозирование продаж
О компании
Програмные продукты
Услуги
Обучение
Материалы
Форум
     Учебник       Книги       Java-апплеты       Статьи       Ссылки       Загрузить материалы       Семинары       КПК   
Наши публикации
Статьи в популярных и научных изданиях




К списку статей

Сравнение методов ARIMA и Винтерса в задаче прогнозирования продаж

© НейроПроект, 2005
 

В данной статье рассмотрим вариант использования методов Винтерса и ARIMA в задаче прогнозирования продаж. С описанием методов можно ознакомиться либо в нашем учебнике, либо где-то еще в интернете, либо практически в любой книге по прогнозированию - оба алгоритма распространены и хорошо известны.

В данном тесте сравниваются два статистических метода прогнозирования, позволяющих учитывать сезонность. Один из них принадлежит к классу алгоритмов, основанных на экспоненциальном сглаживании (Winters), второй к классу регресионных алгоритмов (ARIMA). Цель теста состояла в том чтобы проверить как обе методики работают в практической задаче.

В данном случае тестовым материалом для методов прогнозирования был выбран перенормированный в другой масштаб исторический ряд продаж одного из продуктов крупной компании.

ряд продаж для прогнозирования

На рисунке представлены еженедельные исторические данные за неполных четыре года (204 недели). Даже без использования статистического анализа заметна сезонность - глубокие провалы соответствуют падениям продаж в новогодние праздники. Можно также отследить уменьшение продаж в майские праздники и в летний сезон.

Цель состояла в том, чтобы проверить точность краткосрочного (на 4 недели вперед) и среднесрочного прогнозирования (на 10 недель вперед) методами Винтерса и ARIMA в абсолютно равных условиях.

Оба метода не используют независимые переменные и опираются исключительно на предисторию прогнозируемого ряда, поэтому никакие дополнительные данные в данной задаче не использовались.

Все вычисления проводились в программе Minitab 14.

В каждую неделю начиная со 150-ой по 195-ую включительно строились два прогноза на 10 недель вперед методом ARIMA и методом Винтерса, соответственно. Причем в обоих случаях все исторические данные вплоть до первой точки прогноза использовались для настройки внутренних параметров моделей. Для каждого прогноза отдльно рассматривалось два варианта:

  1. Сам прогноз целиком оценивался как среднесрочный.
  2. Первые 4 точки этого прогноза оценивались как краткосрочный прогноз на месяц вперед.
Для метода Винтерса использовалсь следующие настройки
  • Коэффициент сезонности = 53
  • Вес уровня = 0.2
  • Вес тренда = 0.2
  • Вес сезонной составляющей = 0.2

Для ARIMA выбрана модель ARIMA(2,1,2)(1,0,1)53 Таким образом, были получены 45 прогнозов, построенных методом Винтерса и 45 прогнозов, построенные алгоритмом ARIMA. Посмотрим на эти прогнозы.

прогнозирование продаж

На каждом из двух рисунков черной толстой линией показан график реальных продаж, а семейство тонких цветных линий - прогнозы, сделанные на 10 недель вперед из разных точек. Видно, что прогнозы, сделанные по алгоритму ARIMA точнее чем прогнозы, сделанные по методу Винтерса.

Оценим точность краткосрочного и среднестрочного прогнозирования продаж для каждого из двух методов. Предположим, что мы строим прогноз длиной N из точки i (т.е. из i-ой точки строим прогноз на N недель вперед). Тогда точность проноза можно посчитать по следующей формуле:
прогнозирование продаж

Здесь прогнозирование продаж - реальное значение точки ряда продаж, а прогнозирование продаж - прогноз этой же точки.

Посмотрим на графики точности, которую показывали оба алгоритма в течение 45 недель (начиная со 150-ой по 195-ую) при среднесрочном и краткосрочном прогнозирование продаж.
точности методов в задаче прогнозирования продаж

Средняя точность прогнозирования

  4 нед. 10 нед.
ARIMA 90.38% 89.67%
Winters 83.67% 80.72%


точности методов в задаче прогнозирования продаж

Анализ результатов

    Описанное тестирование не претендует на научную строгость и полноту изложения. Было бы правильнее во-первых тестировать методы на разных задачах и данных, а во-вторых, при каждом таком тестировании тщательно подбирать числовые коэффициенты методов для более правильной настройки. И тем не менее, вполне можно указать на следующие особенности.
  • Хорошо видно, что в подавляющем большинстве случаев прогнозы, сделанные по методике ARIMA, точнее чем прогнозы, сделанные по методу Винтерса. Это неудивительно - ARIMA более сложный алгоритм, опирающийся на автокорреляцию, очевидно, что он, в целом, не может работать хуже, чем алгоритм, основанный на сглаживании. Кроме того, если анализировать научные публикации последнего десятилетия можно видеть, что в подавляющем количестве работ по прогнозированию классическими методами используется именно ARIMA, как наиболее обоснованный и надежный алгоритм (из статистических). Результаты нашего теста в очередной раз подтверждают это.
  • Заметно, что прогнозирование продаж на период новогодних праздников имеют плохое, а иногда очень плохое качество. Особенно это заметно для краткосрочного прогнозирования. Понять почему так происходит довольно просто - в это время продажи резко падают из-за большого количества нерабочих дней. Алгоритм опирается на прошлогоднюю ситуацию и пытается "спроецировать" динамику прошлого сезона на текущее время. В данном случае такой подход привел к несостоятельным прогнозам, поскольку изменился формат новогодних праздников и их количество. Этого можно было избежать, например, используя нейронную сеть, которая кроме прочего, получала бы на вход дополнительный временной ряд - количество рабочих дней.

Выводы

Описанное тестирование можно считать еще одним подтверждением в пользу того, что при решении задач прогнозирования методы Бокса-Дженкинса чаще всего работают лучше, чем метод Винтерса. Вместе с тем, хотелось бы отметить, что использование нейронных сетей позволило бы очень легко учесть дополнительную информацию о продажах, которую невозможно использовать описанными методами, но которая совершенно точно повысила бы точность прогнозирования и которая почти всегда есть в базах данных компаний. Речь идет о таких данных как индексы рекламных активностей, деятельность конкурентов, цена товара, исторические данные о ситуациях out-of-stock, история продаж продуктов, влияющих на прогнозируемый и т.д. В следующих статьях мы рассмотрим пример решения задачи прогнозирования продаж с помощью нейронных сетей и сравним результаты со результатами статистических методов.


     Учебник       Книги       Java-апплеты       Статьи       Ссылки       Загрузить материалы       Семинары       КПК   


Rambler's Top100 Rambler's Top100