И вот таким банальным способом мы, дорогие мои братцы и сестрицы, и вылавливаем еще не окученный конкурентами сегмент на рынке пивных услуг. Качественный же контент-анализ позволяет делать выводы даже на основе единственного присутствия или отсутствия определенной характеристики содержания. №2. Что такое простые частоты? Это подсчет частот появления в текстах различных слов или тем. Например, если мы видим в статье "наш любимый Василь Василич Пупкин", значит, это статья на его бабки. Если - просто "уважаемый всем народом лидер", значит - на бабки его спонсоров. Если же без пиетета - "Пупкин" или "политический деятель", значит - на бабки органов местного самоуправления. Если "душитель свободы" и "кровавый бандит" значит, на членские взносы радикально-оппозиционной антипупкинской партии. №3. А что есть относительные частоты? Однако просто частота появления того или иного слова или темы мало что говорят. Гораздо более информативны не абсолютные, а относительные частоты, которые вычисляются как отношение абсолютной частоты к длине анализируемого текста. В зависимости от того, что является переменной содержания, под длиной текста может пониматься количество слов в нем, количество предложений, абзацев и пр. №4. Надо ли применять базовые частоты? Естественно! Например, депутаты Госдумы ругают Правительство. Это мода такая. И если нам поступил заказ, проверить, насколько удачны пиар-действия лоббистов по свержению нынешнего кабинета министров, то глупо браться за тексты выступлений депутатов и оценивать по их агрессивности скорость роспуска команды премьера. Надо взять в качестве образца тексты (изготовить, так сказать, "частотные словарики") прежних депутатских выступлений. И сделать на их основе таблицу с базовыми частотами употребления приготовленных нами для исследований единиц анализа (например, криков: "Долой!" или "В отставку раздолбаев!"). И тогда – сравнивая результаты теперешних выступлений с базовыми, мы поймем насколько они действительны агрессивны. Отклонение частот вычисляют по формуле: h-j/i. Тут у нас: h - количество слов данной категории, реально встретившихся в тексте, j - ожидаемое число вхождений слов данной категории в текст, а i - стандартное отклонение. Величина j вычисляется путем умножения нормальной частоты категории на число слов в анализируемом тексте. Представим, что мы хотим оценить степень агрессивности выступления не депутата, а профессионального военного. Очевидно, что норма для него будет отличаться от нормы для среднего человека. — 152 —
|