Перед нами закон Ципфа[65], отражающий числовую регулярность не только письменных текстов, но и текстов биотаксономии: здесь n — ранг слов, упорядоченных по частоте их появления, P n – частота появления слова n- го ранга, d – константа. (Закон Ципфа может быть записан в разных модификациях и часто называется законом Эсту – Кондона – Ципфа – Мандельброта.) Вначале считалось, что закон Ципфа отражает числовую упорядоченность самого языка. Но вскоре стали выясняться различные неприятности, заставившие интерпретировать его иначе. Прежде всего, оказалось, что этот закон хорошо выполняется только для выборок, содержащих около 22000 различных слов. Такие выборки, по оценкам Ципфа, должны были содержать около двухсот тысяч словоупотреблений, что, конечно, никак не охватывает все богатство языка. Далее выяснилось, что с формулами, описывающими числовую упорядоченность, все обстояло хорошо, когда их сравнивали с частотами отдельных художественных произведений. Они никогда не описывали произвольные лексические выборки – отрывки из отдельных произведений или их объединения, представляемые в виде одной выборки. Возникли сомнения в правомерности самого существования числовой упорядоченности языка. Математик Ю.К. Орлов, один из лучших в нашей стране знатоков проблемы, посвятивший ее изучению более 20-ти лет, дает разъяснение, снимающее все нарекания [Орлов, 1980]: …закон Эсту – Кондона – Ципфа – Мандельброта оказался законом не языка, а текста. Законом отдельного чрезвычайного высокоорганизованного сообщения, рассчитанного на привлечение внимания максимально широкой аудитории. Нехудожественные тексты (научные, технические, философские) выполняли этот закон, если можно так выразиться, с большой натяжкой. Огромные выборки, претендующие представлять «язык в целом», не выполняли его вовсе (с. 82). Таким образом, для текстов мы получаем [там же]: …ту самую гармоническую последовательность чисел, которую с незапамятных времен получил Пифагор для колебания струны и которая лежит в основе так называемого натурального звукоряда (а так как все прочие музыкальные звукоряды можно рассматривать в качестве приближения к натуральному, то и всех музыкальных шкал вообще). По-видимому, эта аналогия имеет глубокий смысл… (с. 74). И в то же время Ю.К. Орлов обращает внимание на то, что выполнимость закона Ципфа для текста (выборки в 22000 слов) следует, как это легко показать, из числового значения константы d , которая, по оценкам лингвистов, оказывалась приблизительно равной одной десятой. Иными словами, порядок в высокоорганизованных текстах нашего языка оказался заданным числом . — 66 —
|