... | ... | @@ -3,10 +3,10 @@ |
|
|
|
|
|
**BN-based synthetic data** - это подход для генерации синтетических персональных данных на основе построения иерархической блочной структуры байесовской сети.
|
|
|
|
|
|
Моделирование различных аспектов человеческого поведения на уровне личности и общества является трудной задачей из-за значительного многомасштабного воздействия процессов, лежащих в основе человеческой натуры. Учет такой разнородной информации о человеке приводит к необходимости сбора данных из разных источников. Некоторые из них могут быть недоступны, доступность других отличается во времени. Поэтому, возвращаясь к задаче создания **генеративной модели для производства синтетических данных**, мы сталкиваемся с проблемой, касающейся необходимости изучения всей модели каждый раз, когда мы получаем новые данные. С ростом объема данных и новых источников данных легко увидеть, что обновление всей модели стало чрезмерно дорогим.
|
|
|
Моделирование различных аспектов человеческого поведения на уровне личности и общества является трудной задачей из-за значительного многомасштабного воздействия процессов, лежащих в основе человеческой натуры. Учет разнородной информации о человеке приводит к необходимости сбора данных из разных источников. Некоторые из них могут быть недоступны, доступность других отличается во времени или ограничена законами о конфиденциальности персональных данных. Поэтому, возвращаясь к задаче создания **генеративной модели для производства синтетических данных**, мы сталкиваемся с проблемой, касающейся необходимости изучения всей модели каждый раз, когда мы получаем новые данные. С ростом объема данных и новых источников данных легко увидеть, что обновление всей модели стало чрезмерно дорогим.
|
|
|
|
|
|
На рисунке вы можете увидеть пример многомасштабной модульной структуры модели человека. Примеры данных на каждом уровне написаны курсивом. Возможные источники данных показаны слева. Названия уровней показаны справа.
|
|
|
|
|
|
![](https://github.com/Anaxagor/BN-based-synthetic-data-/blob/master/img/modules_scheme.png)
|
|
|
|
|
|
|
|
|
Чтобы избежать дополнительных затрат на переобучение байесовской сети, желательно иметь подход для учета новых данных для уже предварительно обученной сети. В то же время мы хотели бы улучшить интерпретируемость структуры сети. Эти факторы приводят нас к созданию байесовской сети с блочной или частичной структурой, где каждый блок может быть связан с масштабом (или уровнем) человеческой личности. |