В данном проекте могут быть использованы персональные данные, собранные из разных источников (социальные сети, психологические опросники, данные компаний о своих сотрудниках, государственные реестры и т. д.). В качестве примеры мы рассмотрим подготовку данных, собранных из профилей пользователей социальной сети ВКонтакте с помощью открытого API.
Все данные были разделены на три модуля, каждый из которых описывает какое-то личностное представление человека. Так как байесовская сеть работает с дискретными величинами, все непрерывные величины необходимо дискретизировать.
Социодемографические данные
- Возраст
Дискретизирован на 12 интервалов с шагом в 5 лет
- Пол
- Код города
1 - Москва 2 - Санкт-Петербург 3 - остальные города