Stage 2
Что надо иметь к этому моменту:
Ядро фреймворка автоматического МО для задач моделирования:
- релиз ядра фреймворка, позволяющего хранить, обучать и строить «цепочки» моделей МО (в виде ориентированного ациклического графа), который будет включать в себя:
-
Возможность создания композитных моделей для задач классификации, регрессии и авторегрессии.
-
Реализацию базовой функциональности настройки параметров моделей с помощью случайного поиска в заданном диапазоне.
-
Поддержку включения в цепочки моделей для классификации и регрессии вспомогательных блоков кластеризации.
-
Функциональность меж-цепочного кеширования обученных моделей для ускорения обучения новых цепочек в процессе идентификации структуры с помощью нахождения структурно идентичных подграфов и импорта кэша обученных моделей из одной цепочки в другую.
-
Поддержку встраивания существующих AutoML-фреймворков в виде атомарных моделей, которые могут входить в состав композитных моделей наравне с прочими ML-моделями.
- Алгоритм, идентифицирующий структуру композитных моделей в форме направленного ациклического графа с узлами в виде моделей МО (v.2.0), включающий следующие новые возможности:
-
Функциональность автоматического упрощения полученных цепочек без дополнительных затрат на обучение моделей.
-
Возможность задавать явное временное ограничение на максимальное время решения задачи идентификации.
-
Дополнительные схемы мутации и скрещивания для цепочек, обеспечивающие более устойчивые и структурно простые решения.
-
Базовая реализация самонастройки гиперпараметров генетического алгоритма, упрощающая конфигурирование фреймворка.
-
Генератор синтетических тестов для оценки качества и устойчивости алгоритма идентификации структуры композитных моделей.
Туториалы:
-
Руководство программиста (продвинутого) для ядра фреймворка – 1 шт.
-
Туториалы для начинающих по применению алгоритмов из этапов 1 и 2:
-
туториал по использованию алгоритма построения цепочек из моделей МО v.2.0;
-
туториал по использованию алгоритма выращивания моделей из функциональных блоков.
Утилиты:
Утилита для создания синтетических цепочек с заданными характеристиками и порождения с их помощью наборов входных и выходных данных, на основе которых возможно выполнение оценки качества и устойчивости алгоритмов идентификации структуры композитных моделей.