
Большинство систем мониторинга упоминаний в социальных медиа, онлайн-СМИ, блогах и форумах работают по общим принципам и правилам. Знание о том, как устроены системы мониторинга, на базе каких технологий они работают и как позволяет Шмаков.Медиа эффективно подбирать инструменты для решения задач в области мониторинга и анализа упоминаний. Мы решили поделиться со всеми своим опытом, чтобы вы могли использовать дорогостоящие инструменты так же эффективно, как это делаем мы.
В первой части мы расскажем про
- сообщение
Давайте для начала рассмотрим стандартный процесс обслуживания клиента в системе мониторинга упоминаний:
- У пользователя есть возможность создать «тему» \ «канал» \ «ленту»
- Пользователь системы создает «тему» \ «канал» \ «ленту», в которую по какой-то логике должны будут поступать сообщения
- Пользователь или «поддержка сервиса» с помощью поисковых операторов формирует логику поискового запроса, по которому будут отбираться сообщения в тему
- После сохранения темы система мониторинга упоминаний начинает поставлять в тему нужные сообщения, которые удовлетворяют п.2
Теперь обозначим ключевые термины:
- Тема
- Сообщение
- Поисковая фраза
- Поисковые операторы
- Источник данных
Что такое сообщение в системе мониторинга упоминаний

Сообщение — цифровой объект, содержащий определенный набор данных: текст, время публикации, автор публикации и т.д.
Сообщения можно разбить на несколько основных категорий:
- Статья в СМИ \ блоге
- Пост \ Репост \ комментарий в социальных медиа
- Видео на Youtube
- Сообщение в канале\чате Telegram
- Радио\Теле-эфир
- любое! сообщение, которое передано в систему мониторинга упоминания
Параметры данных сообщения по способу их получения

Источник нам передает сообщение, которое изначально содержит основную информацию
- дату
- текст
- автора
- рейтинг (для площадок отзывов)
- изображения
- гео-координаты
- медиа-объекты
Часть параметров сообщения система мониторинга добывает или обогащает, то есть добавляет к параметрам такие параметры, которых не было в сообщении источника. К таким параметрам можно отнести:
- пол автора
- возраст автора
- географию автора
- количество подписчиков автора
- рейтинг цитируемости автора или источника
- тональность
- тематика сообщения
- прямая речь
- роль объекта
- именованные сущности (Named-entity recognition, NER.): персоны, организации, локации
- любая извлекаемая информация, которая не содержалась в основных параметрах сообщения
Подведем итог
Сообщение – это объект, который по определенным правилам был собран системой мониторинга упоминаний в тему. Сообщение обладает основной и извлекаемой информацией. На базе этих данных после строятся все графики и фильтры.
В следующей статье мы поговорим о создании тем, поисковых операторах и параметрах запроса, которые могут очень сильно упростить работу или наоборот.