Целью данного исследования является выделить группы пользователей приложения "Ненужные вещи" на основе их поведения и посмотреть, как группы отличаются по:
-
Удержанию
-
Конверсии в целевое действие (просмотр контактов)
-
Времени, проводимом в приложении
План:
Предобработка данных:
Данные с 7 октября по 3 ноября 2019 года. Явных и неявных пропусков нет. Неявные дубликаты contacts_show
и show_contacts
были преобразованы к одному значению contacts_show
. Было удалено 1.5% дублирующих друг друга
событий.
Исследовательский анализ данных:
Всего ~15% пользователей зашли в наше приложение на второй день. Остальные могли просто скачать приложение, найти, что им нужно, и больше не заходить туда. Или наоборот, не найти и потерять интерес к приложению. Через неделю в приложение заходит 5% пользователей, а через 2 недели – 2%.
От источника удержание не зависит.
При разбиении пользователей на недельные когорты, образовалось 4 когорты: с 41 недели по 44. Удержание у пользователей, пришедших в 44 неделю, гораздо ниже, чем у остальных когорт. У когорт первых 3 недель примерно одинаковые удержания, хотя у когорты 43 недели удержание на 14 день сильно ниже, чем у когорт 41 и 42 недель.
Когорты не отличаются в распределениях событий на сессию. Распределение просмотренных фотографий и контактов не изменилось, что говорит о том, что удержание упало не из-за того, что приложение как-то изменилось.
Когорты не отличаются по промежутку времени между событиями в сессиях. Это значит, что приложение не стало зависать или слишком медленно работать. Значит, падение удержания не связано с техническими проблемами.
Остается возможным то, что удержание уменьшилось из-за снижения популярности приложения.
В среднем, 20-25% пользователей посмотрело контакты. За 44 неделю самая низкая конверсия в просмотре контактов – 21%, на 3-4% меньше, чем у 41 и 43 недель.
У пользователей источников Google и Яндекс конверсия равна 24-25%, а у пользователей с других источников всего 19%.
Сегментация пользователей:
Кластеризация проводилась с помощью метода k-средних.
В образовавшихся кластерах (0, 1, 2) присутствует большой дисбаланс количества пользователей. На кластер 0 приходится 74% всех пользователей, на 1-ый кластер 16%, а на 2-й только 11%.
У кластера 1 гораздо выше удержание — вероятно, это кластер с самыми лояльными пользователями. Кластеры 0 и 2 практически не отличаются по конверсии. Через неделю у 0-го кластера удержание равно 23%, а у кластеров 0 и 2 удержание равно ~1.5%.
У кластера 1 самая высокая конверсия в просмотр контактов – 37%. У кластера 2 конверсия равна 26%, а кластера 0 – 19%.
У 2-го кластера распределение средней продолжительности сессии отличается от первых двух кластеров. У кластеров 0 и 1 распределения экспоненциальные и совпадают, а вот у 2-го кластера распределение больше похоже на нормальное и сильно правее. Пользователи 2-го кластера проводят в приложении в среднем по 40 минут, в то время как пользователи первых двух кластеров – по 8-9.
Кластер 0 представляет большинство пользователей – 74% всех пользователей. В этом кластере ниже всего удержание и конверсия по сравнению с остальными кластерами.
Кластер 1 представляет самых лояльных пользователей – 16% всех пользователей. Здесь самые высокие удержание и конверсия в просмотр контактов.
Кластер 2 представляет пользователей, которые больше всего проводят времени в приложении – 10%. Здесь такое же удержание, как и у большинства пользователей, однако выше конверсия в просмотр контактов.
Проверка гипотез:
Было проверено 5 гипотез с помощью t-теста. Чтобы получить групповую вероятность ошибки первого рода меньше 0.05, к уровню значимости была применена поправка Шидака, что дало уровень значимости 0.01 для каждой гипотезы.
В результате проверки гипотез, можно сказать, что конверсии в просмотр контактов различаются между остальными источниками и источником Google/Яндекс. Между источниками Google и Яндекс статистически значимой разницы в конверсии нет.
Между всеми кластерами есть статистически значимая разница в конверсии в просмотр контактов.
Рекомендации:
Если популярность приложения падает, то можно увеличить количество рекламы и источников пользователей. На рынке присутствуют другие торговые площадки – возможно, пользователи уходят к ним. Стоит посмотреть, что предлагают конкуренты.
По возможности увеличить рекламу на источниках Google и Яндекс, так как у пользователей с этих источников конверсия выше на 6-7%.
Можно провести UX-интервью с пользователями кластеров 1 и 2 с целью понять, что мотивирует заходить их в приложение чаще и проводить в нем больше времени. Почему они выбирают именно наш продукт.
С пользователями кластера 0 тоже можно провести UX-интервью, чтобы понять, почему они перестали пользоваться нашим приложением, или что заставило их перейти на другую торговую площадку.
Структура данных:
Данные об источниках установки приложения находятся в файле mobile_sources.csv
:
-
UserId
– идентификатор пользователя -
source
– источник, с которого пользователь установил приложение
Информация о действиях клиентов в приложении содержится в файле mobile_dataset.csv
:
-
event.time
– время совершения события -
event.name
– название события -
user.id
– идентификатор пользователя
Обозначения событий:
-
advert_open
— открытие карточки объявления -
photos_show
— просмотр фотографий в объявлении -
tips_show
— пользователь увидел рекомендованные объявления -
tips_click
— пользователь перешел по рекомендованному объявлению -
contacts_show
иshow_contacts
— пользователь нажал на кнопку "посмотреть номер телефона" на карточке объявления -
contacts_call
— пользователь позвонил по номеру на карточке объявления -
map
— пользователь открыл карту размещенных объявлений -
search_[1-7]
— разные действия, связанные с поиском по сайту -
favorites_add
— добавление объявления в избранное