Прогнозирование временных рядов (Time Series Forecasting)
Задача анализа данных, изменяющихся во времени, с целью предсказания их будущих значений на основе исторических наблюдений
Прогнозирование временных рядов — это задача анализа данных, изменяющихся во времени, с целью предсказания их будущих значений на основе исторических наблюдений. Если у нас есть данные, записанные по времени, мы можем использовать их прошлое поведение, чтобы предсказать будущее.
Что такое временной ряд
Временной ряд — это последовательность значений, измеренных через равные промежутки времени.
Примеры:
- ежедневные продажи магазина
- курс валют по дням
- количество пользователей сайта по часам
- температура воздуха по дням
- пульс человека в течение тренировки
Главная особенность — порядок наблюдений важен. Если перемешать значения, данные потеряют смысл.
Где применяется прогнозирование временных рядов
В бизнесе и экономике:
- прогноз продаж
- прогноз спроса
В промышленности:
- предиктивное обслуживание оборудования
- анализ показаний датчиков
В медицине:
- анализ сердечного ритма
- мониторинг состояния пациента
Особенности временных рядов
Временные ряды отличаются от обычных табличных данных:
— Зависимость от прошлого: будущие значения зависят от предыдущих наблюдений
— Тренд: долгосрочное устойчивое направление движения данных.
— Сезонность: повторяющиеся закономерности через равные интервалы времени.
— Шум: cлучайные колебания, которые трудно объяснить.
Основные задачи прогнозирования
Краткосрочный прогноз
Предсказание на небольшой горизонт:
- продажи на завтра
- курс валют на следующей неделе
- нагрузка на сервер через час
Долгосрочный прогноз
Предсказание на большой горизонт:
- выручка на год
- экономические показатели
- демография
Подходы к прогнозированию
Классические статистические методы
Используют математические модели временной зависимости:
- ARIMA
- Exponential Smoothing
- SARIMA
Хорошо работают, когда данных немного и структура ряда стабильна.
Машинное обучение: временной ряд преобразуется в обычную таблицу признаков:
- значения в прошлые моменты времени
- скользящие средние
- сезонные признаки
- календарные признаки
Популярные модели:
- линейная регрессия
- Random Forest
- Gradient Boosting
- CatBoost / LightGBM
Подход хорошо работает при наличии дополнительных факторов.
Глубинное обучение: используется при сложных и больших данных.
Популярные архитектуры:
- RNN
- LSTM
- GRU
- Temporal Convolutional Networks
- Transformers
Подходит для:
- длинных зависимостей
- сложной сезонности
- многомерных временных рядов