Библия G-модератора (Гламаздин Виктор)

И вот таким банальным способом мы, дорогие мои братцы и сестрицы, и вылавливаем еще не окученный конкурентами сегмент на рынке пивных услуг.

Качественный же контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания.

№2. Что такое простые частоты?

Это подсчет частот появления в текстах различных слов или тем.

Например, если мы видим в статье "наш любимый Василь Василич Пупкин", значит, это статья на его бабки.

Если - просто "уважаемый всем народом лидер", значит - на бабки его спонсоров.

Если же без пиетета - "Пупкин" или "политический деятель", значит - на бабки органов местного самоуправления.

Если "душитель свободы" и "кровавый бандит" значит, на членские взносы радикально-оппозиционной антипупкинской партии.

№3. А что есть относительные частоты?

Однако просто частота появления того или иного слова или темы мало что говорят. Гораздо более информативны не абсолютные, а относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста.

В зависимости от того, что является переменной содержания, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и пр.

№4. Надо ли применять базовые частоты?

Естественно!

Например, депутаты Госдумы ругают Правительство.

Это мода такая.

И если нам поступил заказ, проверить, насколько удачны пиар-действия лоббистов по свержению нынешнего кабинета министров, то глупо браться за тексты выступлений депутатов и оценивать по их агрессивности скорость роспуска команды премьера.

Надо взять в качестве образца тексты (изготовить, так сказать, "частотные словарики") прежних депутатских выступлений. И сделать на их основе таблицу с базовыми частотами употребления приготовленных нами для исследований единиц анализа (например, криков: "Долой!" или "В отставку раздолбаев!").

И тогда – сравнивая результаты теперешних выступлений с базовыми, мы поймем насколько они действительны агрессивны.

Отклонение частот вычисляют по формуле: h-j/i.

Тут у нас: h - количество слов данной категории, реально встретившихся в тексте, j - ожидаемое число вхождений слов данной категории в текст, а i - стандартное отклонение.

Величина j вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте.

Представим, что мы хотим оценить степень агрессивности выступления не депутата, а профессионального военного.

Очевидно, что норма для него будет отличаться от нормы для среднего человека.

— 152 —