В Рунете запустили новый рейтинг интернет-СМИ
Новый рейтинг интернет-СМИ позволяет оценивать качество их контента и аудитории одним интегральным показателем. Пока система работает неважно, но есть пути исправления ситуации
«Инфоротор» запустил рейтинг электронных СМИ, основанный на информационном индексе. Индекс - комплексный показатель, рассчитываемый исходя из данных о посещаемости СМИ, поведении его аудитории и качества контента. На сайте «Инфоротора» подробно описана методика его расчета.
Как пояснил представитель «Инфоротора», данные о содержании сайта собираются из полнотекстовых RSS, которые издания самостоятельно предоставляют. Каждая новость, которая приходит в RSS, анализируется «Инфоротором». Для расчета информационного индекса особенно важно определение перепечаток и эксклюзива. Каждую свежую новость «Инфоротор» автоматически сравнивает с новостями, ранее загруженными системой, и определяет, на какие новости похожа эта новость по основным семантическим конструкциям. Если новость попала в уже существующий сюжет и степень похожести семантических конструкций оригинальной (ранее загруженной и уже проанализированной) и загруженной новости - более 95%, последняя считается перепечаткой оригинального сообщения. Если новость становится первой в сюжете, она считается эксклюзивной.
Понятно, что эта методика не слишком точна, поскольку самые важные новости появляются на сайтах всех СМИ с небольшим интервалом и в оценку эксклюзивности внесет существенный вклад скорость работы RSS.
Также на позицию в рейтинге влияет цитируемость СМИ в других СМИ - чем больше издание цитируют и перепечатывают, тем выше будет его информационный индекс.
Данные о посетителях собираются с помощью счетчиков, которые СМИ-участники «Инфоротора» устанавливают на своих сайтах. Поскольку установка счетчика не является обязательным условием участия в «Инфороторе», некоторые издания обходятся без него, и это влияет на их позицию в рейтинге, так как в этом случае посещаемость сайта по данным «Инфоротора» равна нулю.
В результате получается рейтинг, соответствие которого реальности вызывает вопросы. «Руформатор» там занимает четвертое место среди всех СМИ: нам это льстит, однако мы оцениваем свои достижения скромнее - и скромность эта не ложная. Просто на сайте «Руформатора» есть счетчик «Инфоротора». Для того, чтобы рейтинг «Инфоротора» стал интересен, необходимо, чтобы он был, во-первых, точнее, во-вторых, представительнее.
Для решения второй задачи следует отказаться от требования полнотекстовых RSS, а вместо этого самостоятельно анализировать контент всех сайтов-СМИ. Это потребует определенных технических решений, однако это не невозможно: технологии извлечения новостей из веб-страниц существуют.
Для решения первой задачи необходимо либо отказаться от посещаемости как критерия (что резко уменьшит полезность этого рейтинга, например, для рекламодателей), либо перейти к использованию внешних метрик (например, Alexa). Они не так точны, как данные счетчиков, однако следует понимать, что ситуации, когда все значимые СМИ поставят себе чей-то счетчик, не достичь, а даже сравнительно невысокая точность Alexa лучше, чем то, что есть сейчас.
Источник: Руформатор