«ВКонтакте» работает над нейросетью для борьбы с языком ненависти
Технология поможет быстрее находить посты, провоцирующие аудиторию на агрессию
Социальная сеть «ВКонтакте» работает над искусственным интеллектом, чтобы автоматически находить публикации с враждебными высказываниями. Как указано в блоге социальной сети, технология должна ускорить время обработки жалоб и значительно очистить платформу от хейтспича.
Чтобы обучить искусственный интеллект, соцсеть добавила новую категорию жалоб — «Враждебные высказывания». Пользователь может выбрать ее, нажав на кнопку «Пожаловаться», после этого публикация попадет на рассмотрение к модераторам. Предполагается, что такое решение поможет собрать датасет для новых разработок на основе нейросетей.
Таким образом, технология поможет быстрее находить посты, провоцирующие пользователей на агрессию. Сейчас нейросеть учится определять разные категории оскорблений, включая ксенофобию, сексизм, расизм, а также хейтспича с дискриминацией по возрасту, религии, внешности и другим параметрам.
«Мы разделяем позицию наших пользователей и партнеров касательно языка вражды и прославления насилия. Модераторы "ВКонтакте" ежедневно обрабатывают огромный объем контента, в том числе с использованием искусственного интеллекта, — большинство опасных материалов удаляются еще до того, как их кто-то увидит. Если же вы заметили оскорбительную публикацию, пожалуйтесь на нее», — отметил Иван Корнеев, руководитель команды модерации «ВКонтакте».
Уточняется, что за первую половину 2020 г. на платформе было удалено 520
тыс. единиц контента по теме разжигания вражды и ненависти, а также
заблокировано 1340 профилей и 2470 сообществ, распространяющих
хейтспич.