... | ... | @@ -5,10 +5,41 @@ |
|
|
|
|
|
### Социодемографические данные
|
|
|
|
|
|
* Возраст
|
|
|
* Возраст
|
|
|
`Дискретизирован на 12 интервалов с шагом в 5 лет`
|
|
|
* Пол
|
|
|
* Код города
|
|
|
> 1 - Москва
|
|
|
> 2 - Санкт-Петербург
|
|
|
> 3 - остальные города |
|
|
\ No newline at end of file |
|
|
* Пол
|
|
|
`1 - мужчина, 2 - женщина`
|
|
|
* Код города
|
|
|
`1 - Москва,
|
|
|
2 - Санкт-Петербург,
|
|
|
3 - остальные города`
|
|
|
* Уровень образование
|
|
|
`0 - школьник/абитуриент,
|
|
|
1 - бакалавр,
|
|
|
2 - магистр,
|
|
|
3 - специалист,
|
|
|
4 - научная деятельность`
|
|
|
* Семейный статус
|
|
|
`0 - не указан, 1 - не женат/не замужем, 2 - имеет друга/подругу, 3 - помолвлен(а), 4 - женат/замужем`
|
|
|
* Количество родственников
|
|
|
`Дискретизировано на 8 интервалов с шагом 3`
|
|
|
|
|
|
### Информация об интересах пользователя
|
|
|
|
|
|
На основе групп, на которые подписаны пользователи, было выявлено пять самых часто встречающихся интересов. Для каждого пользователя оценивалась доля его заинтересованности в теме, которая зависела от количества его подписок, соответствующих этой теме.
|
|
|
* Тема "Любовь, отношения, материнство"
|
|
|
* Тема "Спорт, фитнес"
|
|
|
* Тема "Деньги, поиск работы"
|
|
|
* Тема "История, политика"
|
|
|
* Тема "Новости"
|
|
|
Все значения были дискретизированы на 11 интервалов с шагом 10%.
|
|
|
|
|
|
### Метрики активности человека в социальной сети
|
|
|
|
|
|
* Количество друзей
|
|
|
* Количество фолловеров
|
|
|
* Среднее количество лайков за один пост
|
|
|
* Общее количество постов
|
|
|
* Среднее количество просмотров одного поста
|
|
|
* Доля репостов
|
|
|
Все величины были дискретизированы на 6 - 10 интервалов в зависимости от исходного распределения характеристики. |
|
|
\ No newline at end of file |