Skip to content

GitLab

  • Menu
Projects Groups Snippets
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
  • Sign in / Register
  • F FEDOT
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 87
    • Issues 87
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 1
    • Merge requests 1
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Monitor
    • Monitor
    • Incidents
  • Packages & Registries
    • Packages & Registries
    • Package Registry
    • Container Registry
    • Infrastructure Registry
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar
  • ITMO-NSS-team
  • FEDOT
  • Merge requests
  • !138

Merged
Created Aug 12, 2020 by Rosneft rosneft@rosneft_userDeveloper

Time series forecasting improved

  • Overview 56
  • Commits 13
  • Changes 79

Внес несколько доработок в логику прогнозирования временных рядов.

Сейчас основной вариант применения такой: временной ряд преобразуется в lagged-представление и затем выполняется fit/predict на его train и test-частях. Пример:

image

Что изменено:

  1. Длина предсказанного временного ряда равна длине test-данных. Те части, которые предсказать невозможно (первые window_size шагов, для которые нет предшествующих признаков), заполняются nan-ами. Это позволяет более удобно сравнивать obs с predicted.

  2. Добавлен унаследованный от Chain класс TSChain, который добавляет новый метод forecast - пошаговое прогнозирование временного ряда "в будущее". Принцип тут такой:

image

  1. Модифицировал логику для композитных моделей для временных рядов.

Т.к. нет смысла предсказывать ряд повторно с помощью secondary-модели, то реализована логика ансамблирования: временные ряды преобразуются в табличные признаки и воспринимаются уже как features для обычной регресионной задачи.

Пример (здесь показан простейший случай взвешенной суммы двух рядов): image

  1. Всякое разное

Что хорошо бы доделать:

  1. Задать idx как даты и сохранять их в ходе все преобразований.
  2. Довести до ума LSTM - сейчас его качество довольно низкое и для корректной работы нужно, чтобы windows_size был равен forecast_length.
  3. Проверить на реальных датасетах.
  4. Доделать ансамблирование для многомерных рядов
  5. Улучшить разбиение на масштабы, выявление периодичности и т.п (мб какие-то библиотеки для этого есть).

Но в целом на тестах и разных примерах (см ts_forecasting_examples) работает как будто бы корректно, например:

image

UPD: скетч по логике forecast

image

Assignee
Assign to
Reviewer
Request review from
Time tracking
Source branch: ts-forecasting-new