******************************************
Частотный анализ всех Произведений Ахматовой на русском языке.
Всего слов: 109007
Уникальные слова: 23700
Энтропия 0,217
*******************************
Частотный анализ всех Стихов Ахматовой
Всего лексем: 35321
Уникальные лексемы: 11516
Энтропия 0,326
********************
*в первой редакции этого эссе была опечатка.
Исправлено.
да опечатка была, это я цифры не из той строки скопировал. Но после всё исправил. А запас, так надо думать, нормуль конечно, Надюш я даже считал её творчество с удалением одно-двух-трёх значных лексем, и получается 23 тысячи. У неё мало коротких слов. Но вот мне жаль удалять вообще всё. например короткое слово - АЛ, это краткая форма Алый. Ну вот красивая же лексема.. как удалять... А приходится, ибо файлы такие, что одни несуразности с буквами, ты глянь, там у неё (да у сех так) в анализе и мягкий знак как лексема показан. это потому, что слова редакция разделяет пробелами, а это можно лишь вручную исправить. Ещё с переносом проблема, если слово имеет перенос, то оно иной раз не устраняется компом, ну не всё комп понимает.. и тогда получается например Напоми - нание это будет две лексемы... и т.д. это целое дело. Лана, я байки. чмоки.
Мы используем файлы cookie для улучшения работы сайта. Оставаясь на сайте, вы соглашаетесь с условиями использования файлов cookies. Чтобы ознакомиться с Политикой обработки персональных данных и файлов cookie, нажмите здесь.