«Коммерсантъ»: «Яндекс» поделился кодом системы управления базами данных ClickHouse
«Яндекс» раскрывает исходный код ClickHouse — системы, позволяющей хранить и анализировать большие объемы информации. Технология может использоваться в телекоммуникациях, рекламе, интернет-торговле и информационной безопасности
ClickHouse уже заинтересовались в "Почте России", где ее будут применять в разработке и формировании онлайн-отчетности.
"Яндекс" решил опубликовать исходный код ClickHouse — распределенной системы управления базами данных, разработанной для сервиса веб-аналитики "Яндекс.Метрика", сообщили "Ъ" в компании. Технология не ограничивается аналитикой сайтов и приложений и может быть использована в телекоммуникациях, рекламе, онлайн-торговле, для обработки данных мониторинга и телеметрии, а также для решения задач информационной безопасности (ИБ), рассчитывают в "Яндексе".
ClickHouse хранит и быстро обрабатывает большие объемы
информации для создания аналитических отчетов. Система масштабируется и
позволяет хранить записи о триллионах событий — например, о действиях
пользователей на сайте, о запросах к сервису или о показах рекламы. Система
опробована на задачах "высоконагруженных сервисов" "Яндекса", объясняют в
компании: ClickHouse применяется не только в "Метрике", где используется для
хранения всех данных для отчетов, но и в "Маркете", "Почте", "Директе",
"Вебмастере", для бизнес-аналитики и в мониторинге инфраструктуры.
По словам руководителя группы разработки ClickHouse Алексея Миловидова,
публикация исходного кода — "один из самых значимых вкладов в open-source в
истории компании". Так, "Яндекс" уже выкладывал в открытый доступ исходные коды
предназначенного для нагрузочного тестирования "Яндекс.Танка", технологии
разработки сайтов БЭМ и инструмента для извлечения структурированных данных из
текста "Томита-парсер". Сделано это было в том числе и по прагматическим
соображениям. "Применение технологии в областях, которыми "Яндекс" не
занимается, помогает шире взглянуть на ее возможности",— говорит господин
Миловидов, приводя в пример положительный опыт использования ClickHouse в
совместном проекте с Европейским центром ядерных исследований.
Интерес к ClickHouse уже проявила "Почта России", использующая для разных типов задач инструменты на основе открытых технологий — так, для хранения данных применяются Hadoop, Cassandra и PostgreSQL, сообщила "Ъ" представитель предприятия Елена Алексеева. По ее словам, "Почта России" планирует использовать ClickHouse как один из компонентов разработки и формирования онлайн-отчетности.
Технический директор и сооснователь разработчика рекламной платформы Segmento (контрольный пакет — у Сбербанка) Кирилл Сафонов называет ClickHouse "мощным компонентом современных систем работы с данными". Система может как решать проблему анализа онлайн-поведения целевой аудитории или результатов рекламных кампаний, так и исследовать различные процессы внутри предприятия: изучение активности пользователей или сотрудников, работа с "техническими данными" о функционировании информационной системы, перечисляет он.
С точки зрения ИБ, сегодня в России разрабатывается немало SIEM-решений (Security information and event managemen), ClickHouse будет одним из них, рассуждает консультант по безопасности Cisco Алексей Лукацкий. Впрочем, если "Яндекс" готов будет делиться своей аналитикой и помогать во внедрении и настройке системы своим заказчикам, то он превратится в "очень серьезного" участника рынка средств мониторинга ИБ, считает он.
Компания приняла смелое решение опубликовать исходный код, а не сделать этот продукт коммерческим — как минимум, "это большой эксперимент", полагает глава российского представительства Eset Денис Матеев: "Если у него будут позитивные результаты, то "Яндекс" улучшит жизнь специалистам по электронной торговле, аналитикам, медиа и разработчикам софта". По его мнению, у ClickHouse есть потенциал применения в Security Operation Center — центрах мониторинга, куда стекается информация о событиях, имеющих отношение к ИБ.
Источник: Коммерсант.ru