Анализ потребительской корзины: как исследовать и интерпретировать покупательский спрос
Яна Саулова, веб-аналитик «Риалвеб», рассказывает про алгоритм поиска ассоциативных правил
Данный алгоритм применяется на основе данных, найденных в процессе применения алгоритма Apriori – анализе информации об ассортименте товаров в «чеке». Для интернет-сферы данный подход является нетривиальным и, главное, доступным. В первую очередь он необходим маркетологам интернет-магазинов для принятия взвешенных решений, направленных на проработку сценариев взаимодействия с пользователями. Стоит также отметить, что такой анализ будет полезен интернет-магазинам, где в «чеке», как правило, не один товар, а набор различных товаров – например, любой продуктовый ритейл. Не рекомендуем проводить такой анализ для интернет-магазинов, связанных с продажей крупной бытовой техники, мебели, – магазинов, где пользователи приобретают один товар и на долгий срок.
Впервые задача поиска ассоциативных правил была предложена для нахождения типичных шаблонов покупок, совершаемых в супермаркетах. Современные кассовые аппараты в супермаркетах позволяют собирать информацию о покупках, которая может храниться в базе данных. На сегодняшний день специалисты в области веб-аналитики научились извлекать и грамотно владеть всеми необходимыми данными, что позволяет делать точно такой же анализ, но уже в онлайн-сфере, только вместо кассового аппарата – данные по электронной торговле.
Учитывая динамику рыночных отношений, скорость развития бизнеса и конкурентную составляющую в сети, уже сейчас становится понятно, что крайне важно не просто владеть имеющейся информацией о пользователях, но и научиться распознавать потребности покупателя до того, как он уйдет к конкуренту. Важным конкурентным преимуществом во все времена была и остается выгода для покупателя. С помощью такого анализа мы помогаем маркетологам сделать выгодные предложения для клиента интернет-магазина без ущерба для бизнеса в целом.
Суть анализа
Потребительская корзина — это набор товаров, которые
пользователь приобретает в рамках одной отдельно взятой транзакции. Базовым
понятием в теории ассоциативных правил является транзакция. Транзакция в
интернет-магазине – это сильный показатель, однако, привычнее всего
анализировать путь, который к ней привел, но не выбор пользователя.
Мы же предлагаем более внимательно взглянуть и на содержимое «корзины» в том
числе, чтобы иметь полный спектр данных о пользователе и его предпочтениях. Чем
раньше мы выявим поведенческие закономерности и продуктовые потребности
пользователя, тем скорее мы сможем «закрыть» эти потребности.
В жизни, если мы идем в магазин, то, как правило, приобретаем не один товар, а целый набор товаров. Так же происходит и при покупках в интернет-магазине. При анализе онлайн-данных, связанных с товарным ассортиментом, возникает ряд логичных вопросов: почему покупатель приобрел именно такой набор продуктов? является ли покупка одного товара в корзине следствием или причиной покупки другого товара? Эту связь и устанавливают ассоциативные правила.
Глядя на данные со скриншота, вряд ли можно сделать какие-то выводы о потребностях и предпочтении покупателей. Для выводов, очевидно, нужна более широкая выборка и больший набор данных. К тому же, данные со скриншота не вызывают никаких дополнительных вопросов, потому что все кажется довольно логичным: пользователь купил бананы, и тут же купил яблоки – все товары из одной категории. Почему бы и нет. А в другой транзакции пользователь просто приобрел два разных сорта пива: итальянское и чешское. Казалось бы – что тут такого?
Но если у вас есть целая база данных, скажем, за три месяца, с наличием таких данных – становится понятно, что упускается львиная доля закономерностей, которая по какой-то причине осталась не охвачена, хотя на ее основе можно сделать действительно полезные выводы.
Например, предположим, что в данном интернет-магазине представлено на выбор 10 сортов пива, а 70 транзакций из 100 содержат в одном «чеке» именно итальянское и чешское. Конечно, вы зададитесь вопросами:
– почему так?
– почему покупают именно эти сорта вместе, а другие не приобретаются вообще?
– может быть, дело в цене?
– или в расположении карточек товара в общем каталоге?
В результате поиска ассоциативных правил может быть обнаружено правило, утверждающее, что пользователь, купивший итальянский сорт пива, с вероятностью 75% купит и чешский сорт. Иными словами, производится поиск товаров, присутствие которых в транзакции влияет на вероятность наличия других товаров или комбинаций товаров. А как уже применить эти знания на практике – рассмотрим ниже.
Конечно, искать вручную такие закономерности нет никакого смысла, поэтому, забегая вперед, отметим, что для поиска шаблонов покупок и различных закономерностей мы, как правило, используем аналитическую платформу Deductor Studio. Весь анализ производится в несколько этапов.
1. Получаем и преобразовываем данные.
Чаще всего, осуществляя поиск ассоциативных правил, мы используем данные электронной торговли в Google Analytics, но это может быть и информация из другой системы веб-аналитики или же просто выгрузка из CRM.
Для поиска правил мы рекомендуем брать сравнительно небольшие временные отрезки – от одного до трех месяцев. Обычно нам требуется выгрузить целый массив данных. В наборе данных нас интересует всего лишь два столбца – это продукт (может быть название продукта, его идентификатор или же просто категория товара) и идентификатор транзакции, который присваивается в результате совершенной покупки в рамках электронной торговли.
По умолчанию сделать это сложно, потому что GA не отдает к выгрузке более 5000 строк за раз. Учитывая, что в дополнительном параметре у нас всегда указан идентификатор транзакций – строк получается от 15000 и более.
Поэтому мы всегда используем R [язык программирования и в тоже время полноценная программная среда для выполнения статистических вычислений] для выгрузки большого массива данных – процесс выгрузки и обработки данных сокращается до считанных минут, что для веб-аналитика особо ценно.
2. Загружаем «чистые» данные в аналитическую платформу DeductorStudio.
В данной платформе широко представлены самообучающиеся алгоритмы, полностью отвечающие нашей задаче. Система проста в использовании. Для тех, кто захочет научиться делать подобный анализ самостоятельно, имеется базовый доступ в статусе free. Базовых приемов для подобного анализа вполне достаточно. Единственное, что является ощутимым минусом – вы не сможете выгрузить полученные результаты, поскольку выгрузка доступна только в платной версии.
3. Обрабатываем имеющиеся данные.
После того как файл был успешно загружен в платформу, мы обращаемся к мастеру обработки и выбираем интересующий нас алгоритм в методе DataMining. На шаге настройки параметра построения ассоциативных правил остановимся немного подробнее, потому что именно на этом шаге необходимо понимать теоретическую суть всего анализа.
Ассоциативные правила
Ассоциативное правило состоит из двух наборов предметов, называемых условие и следствие и записываемых в виде X → Y, что читается следующим образом: «Из X следует Y». Таким образом, ассоциативное правило формулируется в виде: «Если условие, то следствие».
Поддержка ассоциативного правила — это число транзакций, которые содержат как условие, так и следствие. Например, для ассоциации A → B можно записать:
Достоверность ассоциативного правила A → B представляет собой меру точности правила и определяется как отношение количества транзакций, содержащих и условие, и следствие, к количеству транзакций, содержащих только условие:
Ниже на скриншоте приведен типичный пример полученного результата после обработки данных. Справа как раз и присутствуют описанные выше обозначения – условие, следствие, поддержка и достоверность.
Но на скриншоте также присутствует и обозначение «лифт». Если поддержка и достоверность достаточно высоки, то можно с большой вероятностью утверждать, что любая будущая транзакция, которая включает условие, будет также содержать и следствие. Если рассматривать на примере выше, то нами найдено правило, которое показывает, что если пользователь «кладет в корзину» йогурт питьевой, творог и чиабатту (что является условием), то с вероятностью в 80% он приобретет и чиабатту итальянскую (выступает в роли следствия). Методики поиска ассоциативных правил обнаруживают все ассоциации, которые удовлетворяют ограничениям на поддержку и достоверность, наложенным пользователем. Это приводит к необходимости рассматривать десятки и сотни тысяч ассоциаций, что делает невозможным обработку такого количества данных вручную. Число правил желательно уменьшить таким образом, чтобы проанализировать только наиболее значимые из них. Именно поэтому в данной методике незаменимым является термин «лифт» (оригинальное название – интерес, также встречается термин «улучшение») вычисляется следующим образом:
То есть по сути, лифт — это отношение частоты появления условия в транзакциях, которые также содержат и следствие, к частоте появления следствия в целом. Значения лифта большие, чем единица, показывают, что условие чаще появляется в транзакциях, содержащих следствие, чем в остальных. Можно сказать, что лифт является обобщенной мерой связи двух предметных наборов: при значениях лифта > 1 связь положительная, при 1 она отсутствует, а при значениях < 1 — отрицательная. В нашем же примере мы видим, что лифт равен 60, и указывает нам на положительную связь предметных наборов.
Популярные шаблоны покупок.
Так, в процессе генерации ассоциативных правил широко используются методики, позволяющие уменьшить количество ассоциаций, которое требуется проанализировать. Одной из наиболее распространенных является методика, основанная на обнаружении так называемых частых наборов, когда анализируются только те ассоциации, которые встречаются достаточно часто.
Наибольшей популярностью пользуются такие пары товаров как молоко и хлеб, молоко и огурцы.
Дерево правил
В рамках данного анализа мы всегда уделяем внимание такому методу как дерево правил. Данный визуализатор отображает те же самые правила, что и предыдущий, но в более удобной для анализа форме.
Если пользователь кладет в корзину бананы, то с вероятностью в 42% он купит и арбуз; с вероятность в 47% - виноград и голень цыпленка.
«Что-если»
Анализ "Что-если" в ассоциативных правилах позволяет ответить нам на вопрос, что мы получим в качестве следствия, если выберем данные условия? Например, какие товары приобретаются совместно с выбранными товарами?
С вероятностью 80% с творогом Valio пользователь приобретет чиабатту крестьянскую, а не итальянскую, и питьевой йогурт. Так же выявлены шаблоны наборов, приобретаемых с творогом.
Заключение
Как показал данный пример, глядя просто в интерфейс системы аналитики и в уже привычный нам всем набор данных, можно упустить ряд интересных закономерностей.
Такой анализ чаще всего помогает нам в решении следующих
задач:
1. предсказать то, какие товары покупатели могут выбрать в зависимости от того,
что уже есть в их корзинах;
2. выявить наиболее популярные товарные наборы, состоящие из более чем 1
предмета;
3. предложить рекламные акции типа «каждому купившему A и B товар C в
подарок»;
4. настроить персонализированную email-рассылку на основе часто встречающихся
наборов товаров для определенных пользователей.