Данные для первой части
Файл orders.csv
•transactionId — идентификатор заказа;
•visitorId — идентификатор пользователя, совершившего заказ;
•date — дата, когда был совершён заказ;
•revenue — выручка заказа;
•group — группа A/B-теста, в которую попал заказ.
Файл visitors.csv
•date — дата;
•group — группа A/B-теста;
•visitors — количество пользователей в указанную дату в указанной группе A/B-теста
Данные для второй части
Файл logs_exp.csv
Каждая запись в логе — это действие пользователя, или событие.
•EventName — название события;
•DeviceIDHash — уникальный идентификатор пользователя;
•EventTimestamp — время события;
•ExpId — номер эксперимента: 246 и 247 — контрольные группы, а 248
— экспериментальная.
Доп теория
Что такое событийная аналитика
Событийная аналитика (англ. event-based analytics) — это отслеживание и анализ событий — действий пользователя в приложениях, сервисах и других цифровых системах.
Событийную аналитику применяют при расшифровке записей бортовых самописцев, или «чёрных ящиков». Они фиксируют элементарные единицы данных: показания датчиков, переговоры пилотов, звуки в кабине самолёта. При расследовании причин катастроф или серьёзных технических ошибок собираемые самописцами сведения позволяют анализировать действия
экипажа и работоспособность техники и принимать решения на основе данных.
Например, возьмём интернет-магазин зоотоваров. Пользователи изучают сайт, ищут нужный продукт, а система веб-аналитики сохраняет данные о просмотрах страниц и объединяет их в сессии. При этом основная единица — просмотр страницы. Например, система веб-аналитики может сохранить такие данные о пользователе:
1.Просмотрел главную страницу;
2.Перешёл на страницу поиска: что-то искал
3.Перешёл на страницу товара;
4.Перешёл на страницу другого товара;
5.Перешёл на страницу «Корзина»;
6.Перешёл на страницу «Оформление заказа»;
7.Перешёл на страницу «Оплата»;
8.Перешёл на страницу «Успешный заказ».
От поставленной задачи зависит достаточность этих данных. Скажем, если нужно рассчитать коэффициент конверсии, веб-аналитики хватит. Просто найдём число пользователей, совершивших сессии с переходом на страницу оплаты, и поделим на всех. Но что если ответа требуют более сложные вопросы, например:
•Влияет ли выбор цвета товара на вероятность совершения
покупки?
•Сколько пользователей перестают пользоваться сайтом, после того как не нашли в поиске нужный товар?
Изучим, как бы выглядел путь этого же пользователя в терминологии событийной аналитики:
1.Увидел главную страницу;
2.Кликнул на поисковую строку на главной странице;
3.Осуществил поиск по запросу «кошачий корм»;
4.Увидел страницу товара «Кошачий корм "Сытый кот"»;
5.Посмотрел увеличенные изображения товара «Кошачий корм "Сытый кот"»;
6.Кликнул в блоке рекомендованных товаров на товар «Кошачий корм "Очень сытый кот"»;
7.Увидел страницу товара «Кошачий корм "Очень сытый кот"»;
8.Посмотрел увеличенные изображения товара «Кошачий корм "Очень сытый кот"»;
9.Изменил объём товара «Кошачий корм "Очень сытый кот"» с 9 л
на 12 л;
10.Добавил товар в корзину;
11.Нажал на кнопку «Перейти в корзину»;
12.Увидел страницу «Корзина»;
13.Нажал на ссылку «Условия доставки» и увидел всплывающее окно
сописанием условий;
14.Нажал на кнопку «Оформить заказ»;
15.Увидел страницу «Оформление заказа»;
16.Заполнил несколько полей (их бывает много, и заполнение каждого поля можно отслеживать как отдельное событие);
17.Нажал на кнопку «Оплатить»;
18.Оплатил товар на странице «Оплата заказа»;
19.Увидел страницу «Успешный заказ».
Если сосредоточиться на поведении пользователя, а не на просмотренных страницах, можно сделать гораздо больше выводов. А ещё выдвинуть или подтвердить гипотезы, связанные как с просмотрами целых страниц, так и отдельных их блоков — например, рекомендованных товаров или выбора цвета.
В системах веб-аналитики можно отслеживать популярные виды событий — поиска или добавления в корзину — специальными встроенными методами. Настраивают и дополнительные события, условия которых задают вручную. И всё же анализ в таких системах прежде всего основан на сессиях. Это не значит, что системы веб-аналитики хуже систем событийной. У них разное назначение: веб-аналитика сосредоточена на источниках трафика, а событийная аналитика — на поведении пользователей. При большом объёме накопленной статистики результаты анализа даже самых незначительных действий массы пользователей могут быть неожиданными.
Событийную аналитику активно применяют в мобильных приложениях. Дело в том, что в рамках одного экрана пользователь совершает много небольших действий.
События отслеживают в любых цифровых продуктах со сложным путём взаимодействия пользователей. Например, в веб-сервисах или даже интерактивных дисплеях в музеях. Когда клиенты «общаются» с продуктом через интерфейс, событийная аналитика — способ собрать сведения о том, как устроено это взаимодействие. И на основе данных о поведении пользователей сделать продукт более персонализированным.
Приёмы событийной аналитики
Собранные события можно и нужно анализировать.
Часто анализируют воронки событий. В событийной аналитике воронка
— это несколько заранее обозначенных последовательных действий на сайте, в игре или приложении, которые пользователи должны выполнить для достижения результата.
Винтернет-магазине воронка устроена просто: не добавив товар в корзину, нельзя перейти к оформлению заказа, а не оформив заказ, нельзя приобрести товар.
Вмобильных приложениях тоже есть воронки. Возьмём к примеру приложение «Котограм». В нём пользователи могут выкладывать фотографии своих котов или не публиковать своих, а смотреть только чужих. Сформулируем воронку:
• Пользователь скачал приложение;
• Зарегистрировался;
•Заполнил анкету;
•Совершил первое значимое действие: o Выложил первую фотографию
или
o Подписался на аккаунт другого пользователя. «Котограму» важны несколько показателей:
•Процент регистраций — отношение числа зарегистрировавшихся пользователей к количеству скачавших приложение;
•Процент заполнения анкет — отношение числа зарегистировавшихся и заполнивших анкету пользователей к общему количеству зарегистрировавшихся;
•Процент пользователей, совершивших первое значимое действие
—отношение тех, кто выложил первую фотографию или подписался на аккаунт, к числу заполнивших анкетные данные.
Последний шаг воронки имеет две опции: интересно узнать, сколько пользователей первым делом подписывается на других, а сколько — публикуют фотографию своего кота. Это может говорить о разных профилях поведения внутри приложения: будут те, кто создаёт котоконтент, и те, кто — потребляет.
Важно и то, сколько времени проходит между событиями. Например, известно, что медианное время до публикации первой фотографии составляет 7 дней. Стоит push-уведомлением напомнить пользователю без фото в аккаунте, что в «Котограме» можно поделиться изображением своего любимца.
Важно отслеживать не только показатели прохождения воронки — коэффициенты конверсии с одного этапа на другой, но и отмечать тех пользователей, которые не дошли до определённого шага. Например, может быть целый класс пользователей, которые не подписываются на другие аккаунты и сами ничего не выкладывают.