Add basic synthetic data and chain generation API
Created by: J3FALL
Сделал базовое API для генерации синтетических данных и цепочек. Основные скрипты находятся в utilities/synthetic, тесты - test_synthetic_data и test_synthetic_chain. Пример с использованием в utilities/synthetic/examples.py.
Что можно генерить:
- Данные для задач классификации, по аналогии с sklearn.make_classification и и sklearn.make_gaussian_quantiles.
- Цепочки с фиксированной структурой узлов и случайными связями.
- Случайные цепочки.
- Цепочки со структурой сбалансированного дерева.
- Цепочки с заранее предобученными (на случайных датасетах) моделями.
- Датасет для бенчмаркинга (по схеме из статьи на YSC).
В ходе обучения цепочек "через раз" можно ловить подобную ошибку. Возможно, проблема в препроцессинге данных, но однозначно понять, в чем корень проблемы, мне пока не удалось.