2. МоделиВыбор модели зависит от типа задачи, объёма данных и требований
к точности. На практике используется несколько классов алгоритмов.
- Градиентный бустинг (XGBoost, LightGBM, CatBoost)
Самый распространённый подход в задачах прогнозирования на табличных данных. Алгоритм последовательно строит серию простых моделей, где каждая следующая исправляет ошибки предыдущей. Результат — высокая точность даже на небольших объёмах данных. Именно этот подход использует Ozon для прогнозирования спроса.
- Рекуррентные нейронные сети (RNN / LSTM)
Применяются там, где важна временная последовательность событий — например, динамика продаж по неделям или сезонные колебания спроса. Обычные RNN плохо запоминают долгосрочные зависимости, поэтому на практике чаще используют их улучшенную версию — LSTM (Long Short-Term Memory), которая устойчивее работает на длинных временных рядах.
Архитектура, которая изначально создавалась для обработки текста,
но хорошо зарекомендовала себя и в прогнозировании временных рядов. Эффективна при работе с большими объёмами разнородных данных — когда нужно одновременно учитывать продажи, погоду, маркетинговые акции
и поведение пользователей.
Комбинация нескольких моделей разных классов — нейросетей, деревьев решений, линейных моделей. Каждая модель "видит" данные по-своему,
а итоговый прогноз усредняется или взвешивается. Такой подход снижает риск ошибки одной модели и повышает общую устойчивость системы.
На практике для большинства бизнес-задач начинают с градиентного бустинга — он быстрее обучается, легче интерпретируется и часто не уступает по точности более сложным архитектурам. Нейросети и Transformer подключают там, где данных много и важна способность модели улавливать сложные нелинейные зависимости.