|
|
|
В данном проекте могут быть использованы персональные данные, собранные из разных источников (социальные сети, психологические опросники, данные компаний о своих сотрудниках, государственные реестры и т. д.).
|
|
|
|
В качестве примеры мы рассмотрим подготовку данных, собранных из профилей пользователей социальной сети ВКонтакте с помощью открытого API.
|
|
|
|
|
|
|
|
Все данные были разделены на три модуля, каждый из которых описывает какое-то личностное представление человека. Так как байесовская сеть работает с дискретными величинами, все непрерывные величины необходимо дискретизировать.
|
|
|
|
|
|
|
|
### Социодемографические данные
|
|
|
|
|
|
|
|
* Возраст
|
|
|
|
`Дискретизирован на 12 интервалов с шагом в 5 лет`
|
|
|
|
* Пол
|
|
|
|
* Код города
|
|
|
|
> 1 - Москва
|
|
|
|
> 2 - Санкт-Петербург
|
|
|
|
> 3 - остальные города |
|
|
|
\ No newline at end of file |