Regression / autoregression / clustering
Решил прикинуть, насколько на текущую реализацию натягиваются авторегрессионные задачи (ну и заодно обычная регрессия).
В качестве примеров можно позапускать metocean_foreacting_problem.py и simple_regression_problem.py.
Что сейчас на мой взгляд не оч:
-
Для хранения типа решаемой задачи используется де-факто глобальная переменная task_types.current_task_typeUPD: Вроде придумал, как непротиворечиво это запилить. -
Для моделей из statsmodels интерфейс не так единообразен, как у sklearn.
Надо подумать, можно ли обойтись без кучи if в _convert_to_stats_model и т.д. -
UPD: добавил ещё модель на основе кластеризации и соответствующий тип задач как вспомогательную для включения в цепочки.
Интересные факты: Вот пример прогноза SSH с помощью модели из ARи ARIMA, обьединенных XGBoost-ом: