Top Banner
Выделение групп пользователей в данных мобильного мониторинга Намиот Д.Е. МГУ им. М.В. Ломоносова Ломоносовские чтения 2014
13

Выделение групп пользователей в данных мобильного мониторинга

Nov 27, 2014

Download

Software

Презентация - Ломонсовские чтения 2014
Выделение групп пользователей в данных мобильного мониторинга
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Выделение групп пользователей в данных мобильного мониторинга

Выделение групп пользователей в данных мобильного мониторинга

Намиот Д.Е.

МГУ им. М.В. Ломоносова

Ломоносовские чтения 2014

Page 2: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

• Пассивный мониторинг мобильных абонентов позволяет собирать анонимную информацию о присутствии• Эти данные, очевидно, связаны с некоторым местоположением• Для данной площадки мы можем говорить о модели посещаемости• Как можно найти эти модели посещаемости?

Направление исследований

Page 3: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Содержание

• Пассивный мониторинг для мобильных пользователей• Параллели с Web Log• Пропущенные записи и специфика мобильной статистики• Другие работы в этой области• Группы посетителей

Page 4: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Пассивный мониторинг • исходный адрес (MAC-address)• SSID• скорости передачи• дополнительная информация• информация от производителя

Page 5: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Пассивный мониторинг

• Wi-Fi маршрутизатор• Определение Wi-Fi

(Bluetooth) устройств• Внешняя база

данных (MySQL)• 70% определенных

устройств

Page 6: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Web Log

• Remote IP адрес – MAC адрес• User-Agent заголовок – выделяется из MAC• Отсутствует URI • Отсутствует Referrer• Новое поле: SSID. PNL – preferred networks list

Page 7: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Особенности статистики

• Процент определенных устройств: 70%-80%• Он не может быть предсказан. Зависит от

мобильной ОС, работающих приложений и т.д.• Разумное предположение: процент определенных

устройств постоянен• Использовать относительные значения вместо

абсолютных значений. Например, тренд в посещаемости вместо счетчика посетителей.

• Основное назначение: проверка гипотез о влиянии внешних событий на посещаемость. Например, влияние рекламы, маркетинговых акций и т.д.

Page 8: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Обзор работ

Page 9: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Обзор работ

Page 10: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Группы• Группа мобильных

абонентов периодически собирается в определенное время

• Не все участники присутствуют на каждой встрече

• Не все приходят одновременно

• Как найти такие группы?

Page 11: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Подходы к кластеризации

Увеличенный интервал Увеличенная частота

Page 12: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Поиск групп

• Ищем кластеры для каждого дня

• Определяем последовательность кластеров с некоторым минимальным процентом общих членов

Page 13: Выделение групп пользователей в данных мобильного мониторинга

Dmitry Namiot http://servletsuite.blogspot.com

Заключение

• Новая модель для извлечения данных из логов мобильного мониторинга• Новый класс отчетов, ориентированный на бизнес-приложения• Тестирование на реальных данных: 8 групп из 11• Области применения: приложения для Smart Cities, торговля и сфера обслуживания