Skip to content

GitLab

  • Menu
Projects Groups Snippets
    • Loading...
  • Help
    • Help
    • Support
    • Community forum
    • Submit feedback
  • Sign in / Register
  • B BAMT
  • Project information
    • Project information
    • Activity
    • Labels
    • Members
  • Repository
    • Repository
    • Files
    • Commits
    • Branches
    • Tags
    • Contributors
    • Graph
    • Compare
  • Issues 1
    • Issues 1
    • List
    • Boards
    • Service Desk
    • Milestones
  • Merge requests 0
    • Merge requests 0
  • CI/CD
    • CI/CD
    • Pipelines
    • Jobs
    • Schedules
  • Deployments
    • Deployments
    • Environments
    • Releases
  • Monitor
    • Monitor
    • Incidents
  • Packages & Registries
    • Packages & Registries
    • Package Registry
    • Container Registry
    • Infrastructure Registry
  • Analytics
    • Analytics
    • Value stream
    • CI/CD
    • Repository
  • Wiki
    • Wiki
  • Snippets
    • Snippets
  • Activity
  • Graph
  • Create a new issue
  • Jobs
  • Commits
  • Issue Boards
Collapse sidebar
  • ITMO-NSS-team
  • BAMT
  • Wiki
  • 4. Подготовка данных

4. Подготовка данных · Changes

Page history
Updated 4. Подготовка данных (markdown) authored Jun 09, 2020 by Irina Deeva's avatar Irina Deeva
Hide whitespace changes
Inline Side-by-side
4.-Подготовка-данных.md
View page @ 3f10634a
...@@ -5,10 +5,41 @@ ...@@ -5,10 +5,41 @@
### Социодемографические данные ### Социодемографические данные
* Возраст * Возраст
`Дискретизирован на 12 интервалов с шагом в 5 лет` `Дискретизирован на 12 интервалов с шагом в 5 лет`
* Пол * Пол
* Код города `1 - мужчина, 2 - женщина`
> 1 - Москва * Код города
> 2 - Санкт-Петербург `1 - Москва,
> 3 - остальные города 2 - Санкт-Петербург,
\ No newline at end of file 3 - остальные города`
* Уровень образование
`0 - школьник/абитуриент,
1 - бакалавр,
2 - магистр,
3 - специалист,
4 - научная деятельность`
* Семейный статус
`0 - не указан, 1 - не женат/не замужем, 2 - имеет друга/подругу, 3 - помолвлен(а), 4 - женат/замужем`
* Количество родственников
`Дискретизировано на 8 интервалов с шагом 3`
### Информация об интересах пользователя
На основе групп, на которые подписаны пользователи, было выявлено пять самых часто встречающихся интересов. Для каждого пользователя оценивалась доля его заинтересованности в теме, которая зависела от количества его подписок, соответствующих этой теме.
* Тема "Любовь, отношения, материнство"
* Тема "Спорт, фитнес"
* Тема "Деньги, поиск работы"
* Тема "История, политика"
* Тема "Новости"
Все значения были дискретизированы на 11 интервалов с шагом 10%.
### Метрики активности человека в социальной сети
* Количество друзей
* Количество фолловеров
* Среднее количество лайков за один пост
* Общее количество постов
* Среднее количество просмотров одного поста
* Доля репостов
Все величины были дискретизированы на 6 - 10 интервалов в зависимости от исходного распределения характеристики.
\ No newline at end of file
Clone repository
  • 1. Байесовская сеть
  • 2. Алгоритм идентификации байесовской сети
  • 3. Сэмплирование синтетических данных
  • 4. Подготовка данных
  • 5. Руководство пользователя
  • Home