Отличия стиха и прозы на уровне алфавита

ОТЛИЧИЯ  РУССКОЯЗЫЧНЫХ СТИХОТВОРНЫХ  И  ПРОЗАИЧЕСКИХ  ТЕКСТОВ НА  УРОВНЕ  АЛФАВИТА

Поскольку текст — структура многоуровневая, каждый пласт предоставляет исследователю любопытный материал. Мною предпринят анализ стихотворных и прозаических художественных текстов русской литературы XIX–XX веков на уровне алфавита. Учтены практически все классики указанного периода, использовались, как правило, полные собрания стихов (за исключением переводов) и прозаические произведения целиком, что выгодно отличает данную статистику от всех предыдущих. Как мы увидим, это единственный способ добиться верного результата. Цель работы — дать филологам, поверяющим алгеброй гармонию, достойный инструмент для сравнения авторских стилей.
Методологическими основаниями послужили следующие предпосылки.
1. «Создание научной поэтики должно быть начато с фактического, на массовых фактах построенного признания, что существуют „прозаические“ и „поэтические“ языки, законы которых различны, и с анализа этих различий» [37, 6].
2. Мы имеем дело с текстами, т. е. «письменной речью с её буквенным кодом» [26, 9]. «Текст есть основа лингвистического исследования для извлечения языковой системы» [22, 107]. «При описании структурных характеристик языка для письменной речи прежде всего нужно говорить об алфавите» [23, 65]. Буквы рассматриваем как акт речевого поведения и анализируем именно как элементы текста, т. е. речи в её модальности [34, 77].
3. Буквы и фонемы суть та или иная степень абстракции. Идеальная транскрипция далеко не тождественна звучащей речи [10, 61, 258; 33, 208]. Но не раз отмечалось, что подсчёты по фонемам, звукам, буквам не противоречат друг другу [2, 64; 16, 177; 19, 120]. Удачно подметил Вейдле: анаграммы и аллитерации — это, строго говоря, повторение букв [8, 104].
4. При фонологически-статистическом исследовании реальную значимость имеет отношение фактической частотности к числам, выражающим теоретически рассчитанную, с учётом специфики стиля речи [31, 275, 280].
Чтобы выяснить особенности, необходимо иметь представление о нейтральном фоне. В науке ХХ века здесь царил недифференцированный подход. Дело не в том, что считать (см. п. 3), а в строгом отборе материала (как по виду, так и по объёму). Увы, ряд исследователей для характеристики фоники отдельных стихотворений продолжают пользоваться данными Пешковского [25, 182]. Это в корне неверно — нельзя смешивать письменные художественные тексты и спонтанную звучащую речь. Доказано, что она существенно отличается даже от стилизованной речи литературных персонажей (и сценической и, в ещё большей мере, героев прозаических произведений) по количеству употреблений единиц разных уровней, в т. ч. букв [16]. То же показало сравнение разговорного с языком художественной литературы [10, 249; 28; 33, 209–211]. И сам Пешковский отмечал, что «речь "Евгения Онегина" резко отличается от русской разговорной речи» (последняя шумнее) [25, 181]. К сожалению, принцип однородности материала нарушен и в статистике Полиграфического Директората [35; 17], и Института математики СО АН СССР (1964), и Лаборатории экспериментальной фонетики им. Щербы ЛГУ (научная, художественная, публицистическая проза) [6], и у Кучеры (состав выборки: 60% — беллетристика; 20% — газетные тексты; 10% — научно-популярные; 10% — поэзия [39, 199]). Из-за этого теряют всякую ценность и так грешащие натяжками выкладки Баевского [2, 64–98]. Нельзя использовать в данном контексте и сводные таблицы Андреева [1, 226–228] — они характеризуют только тексты технические, деловые и публицистику.
Мною подсчёты велись отдельно по более 50 авторам для поэзии (17,5 млн букв) и более 30 произведениям для прозы (21 млн), в основном перечисленным в таблице 2. Из прозы исключались стихотворные фрагменты, и наоборот. Таким образом, соблюдено требование вышеуказанного п. 4 и нивелировано влияние на результат различных объёмов текста. Затем показатели каждого автора или произведения складывались и определялось среднее. Поскольку для сравнения полезны и крайние значения, они приводятся в соответствующих графах.
Таблица 1 констатирует принципиальные отличия на уровне алфавита стихотворных и прозаических текстов. Знаки гласных в поэзии встречаются куда реже, чем в художественной прозе, — соответствующие диапазоны даже не пересекаются! Ни один рассмотренный прозаик не употребляет гласные так редко, как любой поэт, т. е. консонантный коэффициент в поэзии выше (раздел на отметке 1,34). Это фундаментальное отличие стиха от прозы в русском языке. Почти та же картина в отношении «о», «й», «ы»; значимы расхождения для «а», «и», «з», «р» (в таблице отмечены звёздочками). Основной вывод: поскольку слог является единицей информации текста [21, 15], строго ритмический способ организации речи оказывается более экономным. Подтверждаются и наблюдения фонологов: «повышение звучности идет не за счёт гласных, а за счёт согласных… Это главным образом звуки /м/, /н/ и /р/, а из шумных — звонкий /й/» [32]. Чему соответствуют и ранговые различия: в частности, «н» употребляется в поэзии чаще «и», а «м» — чаще «к»; в прозе же, в среднем, картина противоположная. Итак, мы видим: отличие стиха от прозы действительно носит материальный характер — состав языков не совпадает [36, 7]. Детальное осмысление феномена — предмет особой работы, здесь же подчёркиваю: ввиду объёма привлечённого материала данные из таблицы 1 вправе считаться окончательными для указанных типов русской художественной литературы.
Правомерно ли использовать критерии ;2 и Стьюдента, столь полюбившиеся филологам с лёгкой руки Головина [13]? Далеко не всегда, ведь и сам он указывал: «эти инструменты действуют хорошо тогда, когда наблюдаемые частоты подчинены т. н. нормальному распределению» [12, 138]. Возьмём для примера букву «л». Таблица 2 иллюстрирует интересную особенность: «провал» в области арифметического среднего всех значений (для поэзии и прозы это разные величины: буква «л» в прозе встречается чаще за счёт суффикса глаголов прошедшего времени, в художественной прозе XIX в. их удельный вес — 98,6% [20, 117], в ХХ в. — 91,7% [30, 99]; по ГПВ несовершенного вида она вдвое превосходит поэзию [29, 118]. И разница по авторам вызвана, прежде всего, количеством ГПВ). Если разбить всё творчество указанных поэтов на годовые отрезки, получим 630 выборок (при объёме менее 8000 букв или отсутствии точных дат период увеличивался; поэмы и драмы выделялись особо), и лишь в 20 частотность «л» попадёт в интервал 4,65–4,75% (диагр. 1). Сходная картина и в прозе (диагр. 2). Очевидно, мы имеем дело не с нормальным распределением, а с т. н. двугорбым. Создаётся впечатление, что и поэты, и прозаики избегают неких норм, присущих соответствующей форме. Здесь уместно вспомнить эксперименты Эттнива [38] и его неоднократно подтверждённый [7; 34] главный вывод: человек владеет вероятностными закономерностями речи и использует имеющиеся у него сведения для оптимизации стратегии речевого поведения [9, 4]. А поскольку следование норме, заданной в лингвистическом сознании членов коллектива, пользующихся данным языком (его разновидностью или функциональным стилем) [27, 46], наименее информативно, писатели бессознательно стараются от неё отклониться.
Все полученные данные позволяют утверждать: приёмы звукописи используются писателем только для решения локальных задач, а на больших объёмах текстов неизбежно проявляется его «родной» язык (ср.: «художественное задание фонетика стиха может выполнять лишь на малых отрезках речи, а не в масштабе всего произведения в целом» [32]). Подобно национальным языкам, разные стили отличаются и буквенным составом («Языки различны… не только списочным составом звуков, слов, форм и не только отношениями между ними, а и определённой частотой употребления» [24, 286]). Это хорошо видно на примере «л» (табл. 2). Причём у большинства поэтов её частотность стабильна на протяжении всей жизни. Отклонения, вызванные тематическими требованиями, в т. ч. крупных произведений, компенсируются написанным в тот же период.
1 Пример «литерной компенсации» в прозе. Логично предположить, что в романе «Обломов» из-за обильного употребления фамилии главного героя и её производных (1300 раз) будет повышена частотность «о». Ничего подобного! Она почти не отличается от средней (11,41%) и ощутимо ниже, чем, допустим, у Лескова (11,72%).
Тогда как почти у трети изученных поэтов наблюдаются резкие изменения частотности «л», удивительно совпадающие с избранием иной поэтической системы. Напрашиваются аналогии: а) литерный почерк сродни письменному и незначительно меняется со временем; б) фазы преобладания конкретного знака схожи с цветовыми периодами в творчестве живописцев. Обе гипотезы подтверждаются статистикой. Сплетение требований естества и частных предпочтений (как необходимости и случайности) образует текстовую ткань с причудливым рисунком.
По этим причинам рискованно оперировать при подсчётах порциями в 10 тысяч знаков. Например, у Бродского частотность «л» колеблется от 3,61% («Горбунов и Горчаков») до 4,85% («Зофья»), а у Лермонтова — от 4,31% (стихи 1840 г.) до 6,07% («Мцыри»). К каким курьёзным утверждениям приводит скудость выборки, рассмотрим на примере отношения частотности «р» и «л». Согласно данным Болотских [5], у Некрасова, Тютчева, Блока и Есенина превалирует «р», а у Цветаевой — «л». В действительности же всё наоборот! Особенно вопиющий разрыв по Есенину: отношение частотности этих букв — 1,11 против реального 0,95. Весьма вероятно, что в подсчётах была задействована поэма «Песнь о великом походе», поскольку на таком объёме исключительно в ней фиксируется значительное превышение «р» над «л» (1,3). У Цветаевой же «л» больше только до 1915 г. (табл. 2), в дальнейшем она неизменно «рычит».
Полнокровный статистический анализ — надёжный фундамент для последующих литературоведческих штудий. Полагаясь на неверные данные или интуицию, мы рискуем замутнить образ чужого творчества. Вот недавний пример. Ковтунова после обзора текстов небольшого объёма утверждает: «Любимый звук А. Блока из ряда согласных — сонорный „н“… Блок любит сдвоенное „н“» [18, 41]. Весьма информативно, если не знать, что «н» — самая частотная из согласных у подавляющего большинства поэтов (кроме Бродского, Есенина, Маяковского и Пастернака). Вне конкуренции тут Гиппиус — именно она необыкновенно любит «н», а Блок идёт вровень с Тютчевым и Вяч. Ивановым, уступая Пушкину (в поэмах, особенно в «Евгении Онегине») и Баратынскому; по двойному «н» делит 7-8-е места.
Исходя из всего вышеизложенного, призываю филологов в соответствующих случаях привлекать для сравнения только данные из таблицы 1 настоящей статьи, дабы ошибочными результатами не ввести в заблуждение заинтересованных читателей. Духовное постижение должно основываться на достоверной информации, иначе становишься гражданином «отечества иллюзий».
Характеристики стиля (как авторского, так и функционального) не исчерпываются известными параметрами. «Буквенный» метод — полноправный инструмент в арсенале стилистики как науки. Поле деятельности огромно: на очереди сравнительный анализ предпочтений авторов, в т. ч. в аспекте контрастных пар (как например, основная «р/л», на которую указывали Бальмонт [3, 79], Благой [4, 203], Вейдле [8, 88], Добин [15, 107]) и консонантного коэффициента (жаль, что Никонов [24, 288–290], представляя его в качестве одной из характеристик языка, не избежал стандартной ошибки: переноса данных Пешковского на весь русский язык). А через это — уточнение специфики конкретных стилей и потенциала русского языка.

Поскольку форматирование не позволяет корректно разместить таблицы (основная дана в виде масштабируемой иллюстрации), привожу ссылку на полный текст статьи в формате Word: ссылка на сайт "Истина" в конце моего авторского раздела.

СПИСОК  ЛИТЕРАТУРЫ
1. Андреев Н. Д. Статистико-комбинаторные методы в теоретическом и прикладном языковедении. Л., 1967.
2. Баевский В. Лингвистические, математические, семиотические и компьютерные модели в истории и теории литературы. М., 2001.
3. Бальмонт К. Поэзия как волшебство. М., 1922.
4. Благой Д. Творческий путь Пушкина (1826–1830). М., 1967.
5. Болотская М., Болотский А. О речевом фоне анаграмм // Проблемы изучения анаграмм. М., 1995.
6. Бондарко Л., Зиндер Л., Штерн А. Некоторые статистические характеристики русской речи // Слух и речь в норме и патологии. Вып. 2. Л., 1977.
7. Василевич А. Опыт получения субъективных оценок частот букв русского алфавита // Психологические и психолингвистические проблемы владения языком. М., 1969.
8. Вейдле В. Эмбриология поэзии. М., 2002.
9. Вероятностное прогнозирование в речи. М., 1971.
10. Гейльман Н. Фонетические характеристики спонтанной речи. Л., 1983.
11. Гертнер Р. Фонетическая модификация ритмических структур в стихотворной и прозаической речи. М., 1985.
12. Головин Б. Опыт вероятностно-статистического изучения некоторых явлений истории русского литературного языка XIX–XX вв. // Вопросы языкознания. 1965. № 3.
13. Головин Б. Язык и статистика. М., 1971.
14. Григорьев В. О динамике распределения букв в тексте // Актуальные вопросы структурной и прикладной лингвистики. М., 1980.
15. Добин Е. Поэзия Анны Ахматовой. Л., 1968.
16. Журавлёв А. О некоторых отличиях живой разговорной речи от стилизованной // Русская разговорная речь. Саратов, 1970.
17. Зиндер Л. Русские артикуляционные таблицы // Труды военной краснознамённой инженерной академии связи. Сб. 29-30. Л., 1951.
18. Ковтунова И. Очерки по языку русских поэтов. М., 2003.
19. Левин Ю. Количественные характеристики распределения символов в тексте // Вопросы языкознания. 1967. № 6.
20. Лесскис Г. О зависимости между размером предложения и его структурой // Вопросы языкознания. 1964. № 3.
21. Милевский Т. Исследования по структурной типологии. М., 1963.
22. Мыркин В. Некоторые вопросы понятия речи в корреляции: язык—речь // Вопросы языкознания. 1970. № 1.
23. Налимов В. Вероятностная модель языка. М., 1974.
24. Никонов В. Фоностатистическое измерение междуязыковых расстояний // Исследования по фонологии. М., 1966.
25. Пешковский А. Десять тысяч звуков // Сборник статей. Л., 1925.
26. Пиотровский Р. Информационное измерение печатного текста // Энтропия языка и статистика речи. Мн., 1966.
27. Пиотровский Р., Турыгина Л. Антиномия «язык—речь» и статистическая интерпретация нормы языка // Статистика речи и автоматический анализ текста. Вып. 2. Л., 1971.
28. Разговорная речь в системе функциональных стилей. М., 2003.
29. Серебрякова Л. О стилевой вариативности функционирования видо-временных форм современного русского глагола (несовершенного вида) // Вопросы статистической стилистики. К., 1974.
30. Сиротинина О. Формы времени в разговорной речи // Вопросы статистической стилистики. К., 1974.
31. Трубецкой Н. Основы фонологии. М., 2000.
32. Финкель А. Эвфоника «Незнакомки» // Русский язык. 2002. № 36.
33. Фонетика спонтанной речи. Л., 1988.
34. Фрумкина Р. Вероятность элементов текста и речевое поведение. М., 1971.
35. Харкевич А. Очерки общей теории связи. М., 1955.
36. Шапир М. «Versus» vs «Prosa»: пространство-время поэтического текста // Philologica. 1995. т. 2. № 3/4.
37. Шкловский В. О поэзии и заумном языке // Сб. по теории поэтического языка. Вып. 2. Пг., 1917.
38. Attneave F. Psychological probability as a function of experienced frequency // Journal experience psychological. v. 46. 1953. № 2.
39. Ku;era H. Entropy, Redundancy and Functional Load in Russian and Czech // The 5th International Congress of Slavists. American Contributions. Vol. 1. The Hague. 1963.


Рецензии