10 Октября 2017 | 15:42

Хороший, плохой, злой – как начать оценивать комментарии и использовать это в рекламе

Веб-аналитик «Риалвеб» Павел Логинов о том, как работать с комментариями пользователей

image

Если вы занимаетесь e-commerce, то, скорее всего, на вашем сайте есть раздел с отзывами о товарах. Как можно использовать эти данные с пользой? Лучше всего работает максимально персонализированный подход, когда вы в курсе мнения каждого недовольного и счастливого клиента. Но что делать, если у вас на сайте ежедневно оставляют сотни и тысячи комментариев? Чисто физически качественно обработать каждое обращение невозможно.

Работать с большим количеством разрозненных данных можно с помощью машинного обучения, а именно – Natural Language Processing (NLP). NLP представляет собой машинную обработку естественного языка. Это направление науки о данных позволяет получить оценку эмоциональной окраски фрагмента текста. Определение тональности фрагмента текста происходит, как правило, на основе обучающей выборки, состоящей из фрагментов текста с присвоенным значением тональности. Такой способ не учитывает комментарии «троллей», так как сарказм и ирония могут быть распознаны только в рамках отдельной задачи. Тем не менее, процент подобных комментариев среди отзывов минимален и не будет мной рассмотрен, так как основная цель потребителя – донести свое впечатление о товаре, а не высмеять ваш бренд тем или иным способом.

В качестве путей получения оценки можно воспользоваться тремя способами:

1. Самостоятельно отобрать и проранжировать комментарии, написать алгоритм классификации текста и использовать его для оценки комментариев на вашем сайте. Это путь тех, кто хочет понять, как все работает, – путь первопроходцев, мечтателей и гениев. Для того, чтобы создать хороший классификатор, необходимо иметь хорошее представление о математической статистике, линейной алгебре, методах оптимизации и программировании. Помимо этого, нужно набить шишки в решении задач анализа текста. Эти требования ставят достаточно высокую планку для того, чтобы довести задуманное до завершения.

2. Воспользоваться готовым онлайн-сервисом, предоставляющим услуги по оценке ваших фрагментов текста. Как правило, такие услуги оцениваются в зависимости от количества запросов к сервису. Основной трудностью тут станет, скорее всего, отсутствие экспертизы по интеграции сервиса с вашими данными. Также могут возникнуть сложности с правильной интерпретацией полученных результатов, потому что различные вендоры используют разные алгоритмы при решении задач семантического анализа.

3. Обратиться в агентство интернет-рекламы, которое пойдет по первому или по второму пути, в этом случае вы быстро получите готовый результат, который можно применять в ваших рекламных кампаниях. Как правило, для решения подобных задач клиентам предоставляется несколько вариантов на выбор:

– Разработка алгоритма под ваш вид бизнеса – этот путь предполагает детальное изучение вашей целевой аудитории и ее отзывов, далее команда разработчиков и аналитиков предоставит готовый продукт, обученный на ваших данных и данных, близких к ним по тематике.

– Несколько стандартных решений от лидеров рынка. Плюсы использования таких решений в том, что они написаны лучшими разработчиками на основе state-of-the-art-алгоритмов. Но, как правило, стоимость использования таких сервисов растет с ростом количества данных, которые нужно обрабатывать.

Рассмотрим некоторые из продуктов для работы с текстом:

- Google Cloud Platform (Cloud Natural Language API). Решение от технологического лидера рынка, которое предлагает широкий выбор алгоритмов под различные задачи интеллектуального анализа данных. В качестве результата анализа фрагмента текста пользователь получает два числа – полярность и мера. Полярность – число между -1 (негативная окраска) и 1 (положительная окраска текста). Мера – число от 0 (нейтральная) до бесконечности. Мера характеризует силу полярности. В качестве примера можно привести иллюстрацию из статьи Гийома Лафоржа об анализе твитов:


Стоимость сервиса следующая:

Для начала работы с сервисом необходим ряд действий по регистрации, созданию приложения и т.д. По сравнению с продуктами конкурентов это занимает достаточно много времени. Также для работы с сервисом нужно продумать алгоритм взаимодействия – как отправлять к нему запросы и получать ответы, как их интерпретировать и как использовать в рекламных кампаниях. В качестве основного положительного момента является точность алгоритмов и возможность масштабирования вычислений для бизнеса практически любого размера.

indico.io – сервис, большая часть услуг которого построена вокруг анализа текстов. Помимо оценки тональности фрагмента текста предлагается вычленение ключевых слов из текста, определение темы фрагмента текста и т.д. Помимо анализа текста сервис предлагает услуги по распознаванию образов. В качестве ответа от сервиса пользователь получает число в интервале от 0 до 1. Это число является вероятностью того, что тональность проанализированного текста положительная (что это позитивный отклик). Значения меньше 0,5 характеризуют негативный комментарий. Значения от 0,5 до 1 являются характеристикой положительных комментариев. Например, если сервис присвоил комментарию оценку 0.11, это означает, что тональность текста выраженно отрицательная, если же присвоенная оценка равна, например, 0,91, значит, текст имеет выраженно положительную тональность. Стоимость использования сервиса зависит от числа запросов к нему:

- Algorithmia – сервис, который предлагает алгоритмы из различных разделов машинного обучения: анализ текста, распознавание образов, глубинное обучение и т.д. Основным плюсом сервиса является возможность выбора алгоритма, который лучше всего отрабатывает на вашем массиве с данными (как это проверить – тема отдельного разговора). Еще одним плюсом является возможность выбора из широкого списка языков для интеграции сервиса с вашими данными. Стоимость использования сервиса не указана в явном виде. 5000 кредитов в месяц бесплатны. Кредитом является один запрос к сервису. Также в качестве кредита учитывается одна секунда времени расчета. Сервис предлагает пакетную оплату в размере от $20 за пакет.

В качестве вендора нами был выбран indico.io, так как, во-первых, сервис предлагает большой объем бесплатных запросов, во-вторых, достаточно просто интегрируется, в-третьих, результат просто интерпретировать. У нашего клиента для управления тегами используется GTM, поэтому основная часть внедрения будет описана на основе принципов работы с этим инструментом. Схема обработки комментариев выглядит следующим образом:

Воспользуемся инструкцией по работе с сервисом и создадим в GTM пустой тег (произвольно назовем его), выберем тип Custom HTML:

Для работы с indico.io добавим в Tag Configuration следующий код:

 

<script>
varformSelector='form'; // ЗаменитенаCSS-селектор выбора нужной формы
formSelector.submit(function(event){// Методы трекинга отправки формы комментария также могут отличаться, в данном случае использован .submit()
varmy_comment='comment'; // ЗаменитенаCSS-селектор выбора текста комментария
$.post('https://apiv2.indico.io/sentiment',JSON.stringify({
'api_key':"ваш_токен",// Замените значение на токен, который после регистрации вам предоставит indico.io
'data':my_comment,
'language':"russian"})).then(function(res){
dataLayer.push({"event":"comment","eventСategory":"assessment","eventAction":"send","eventLabel":parseFloat(res.match(/[\d\.]+/))});});});
</script>

 

В ярлыке события (eventLabel) передается выражение parseFloat(res.match(/[\d\.]+/)) – это позволяет получить только числовое значение тональности комментария из ответа от indico.io. В качестве триггера к тегу добавьте DOM Ready:


Как упоминалось выше, такой способ работы с сервисом предполагает получение ответа в виде числа от 0 до 1. Чтобы увидеть статистику по тональности комментариев в Google Analytics, в нем необходимо предварительно настроить пользовательскую метрику:

 

После перехода в меню создания метрик создайте новую метрику со следующими параметрами:



Агрегация похитовая, так как за одну сессию пользователь может оставить несколько комментариев к разным продуктам, поэтому их следует разделять. Также тип – валюта, для того, чтобы отображать значение параметра до сотых. В итоге будет получен следующий пользовательский отчет в Google Analytics:



Так как значение оценки мы передаем в ярлыке события, то мы можем успешно разделить отдельные комментарии, благодаря числу знаков после запятой.

Нужно отдельно отметить, что использовать информацию о тональности отзыва можно не только в Google Analytics. Тональность комментариев можно передавать и в Яндекс.Метрику – для этого нужно воспользоваться Параметрами визитов.

Также с помощью Facebook pixel тональность можно отправлять в Facebook в виде пользовательского события. Тогда ваши кампании в этой социальной сети смогут обогатиться целым пластом новой аудитории и ее look-alike-аналогами.

Для работы с ремаркетингом во «ВКонтакте» необходимо немного изменить алгоритм и разделять пользователей на достаточно крупные группы до отправки данных из GTM, детали тут: https://vkcom.github.io/vk-ads-retargeting-demo/.

Как использовать полученные данные в своих рекламных кампаниях? Прежде всего нужно ориентироваться на образ компании в сети. Если комментарии негативные, то следует начать работать над исправлением ситуации – выбирать сегмент негативно настроенной аудитории и делать ей отдельные предложения, которые используют наиболее сильные стороны вашего продукта. Отдельное направление – предложение скидок для недовольных посетителей, но это неоднозначная стратегия, так как в некоторых случаях она может лишь усугубить ситуацию. Если ваш образ скорее положительный и не нуждается в существенном улучшении, то следует попробовать изучить различные сегменты аудитории по значению тональности. В некоторых случаях можно наблюдать закономерности, которые позволят выявить недоработки в бизнес-процессах взаимодействия с клиентом – дорогая доставка, неэффективный коллцентр, некачественная партия определенного товара и т.д. В зависимости от результата такого анализа стоит продумать сценарий исправления недочетов. Высокая стоимость доставки может быть снижена за счет дополнительного продуктового предложения – его анонс возможно доносить через отдельную ремаркетинговую кампанию.

Предложенный подход анализа комментариев сможет обогатить ваши данные и, следовательно, ваше знание о своей аудитории. Возможность интеграции подхода с основными рекламными платформами позволяет создать отдельный пул рекламных кампаний в зависимости от стратегии работы с имиджем компании и/или потребностью усилить некоторые продукты за счет предоставления уникальных предложений определенному сегменту аудитории.

 

Тенденции российского телеэфира Нейросети нам помогут: как внедрение обучаемых технологий скажется на онлайн-маркетинге
Рейтинги
Лидеры рейтингов AdIndex
# Компания Рейтинг
1 MGCom №1 Digital Index 2023
2 Росст №1 Digital Index в Фармкатегории 2023
3 Arrow Media №1 Performance в недвижимости 2023
–ейтинг@Mail.ru