Лингвистический анализ: Ощупывая слона. Заметки по истории русского Интернета (Сергей Кузнецов)
Общая статистика
Длина текста | 691555 знаков |
Длина диалогов | 36414 знаков |
Слов в произведении (СВП) | 100043 слов |
Приблизительно страниц | 385 стр. |
Средняя длина слова | 5.56 знаков |
Предложений в произведении (ПВП) | 5769 предл. |
Средняя длина предложения (СДП) | 116.94 знаков |
Доля диалогов в тексте | 5.27 % |
Доля авторского текста | 94.73 % |
СДП диалогов | 91.19 знаков |
СДП авторского текста | 114.66 знаков |
|
Максимальный фрагмент авторского текста - 69094 знаков (в страницах - примерно 38, начинается где-то с 374 страницы) |
Активный словарный запас
Использовано уникальных слов | 23554 | |
Активный словарный запас (АСЗ) | 21574 | |
Активный не словарный запас (АНСЗ) | 1980 | |
Удельный АСЗ на 3000 слов текста | 1602.24 | 413881 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4253.41 | 362056 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 23547.67 | 57549 место в рейтинге УАСЗ-100000 |
|
Максимальный УАСЗ-3000 (1744) наблюдается примерно на 334 странице |
Минимальный УАСЗ-3000 (1405) наблюдается примерно на 69 странице |
|
Буквы и знаки препинания
Всего букв | 546638 букв |
Всего знаков препинания | 21087 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 11416 | 114.11 |
. точка | 6135 | 61.32 |
- тире | 1278 | 12.77 |
? вопросительный знак | 345 | 3.45 |
! восклицательный знак | 188 | 1.88 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 2 | 0.02 |
?.. вопросительный знак с многоточием | 3 | 0.03 |
!!! тройной восклицательный знак | 11 | 0.11 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 742 | 7.42 |
: двоеточие | 902 | 9.02 |
; точка с запятой | 65 | 0.65 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 42872 | 7.84 |
Б | 8092 | 1.48 |
В | 24114 | 4.41 |
Г | 8660 | 1.58 |
Д | 15395 | 2.82 |
Е-Ё | 47827 | 8.75 |
Ж | 8660 | 1.58 |
З | 8711 | 1.59 |
И-Й | 47797 | 8.74 |
К | 19946 | 3.65 |
Л | 22435 | 4.10 |
М | 18534 | 3.39 |
Н | 37017 | 6.77 |
О | 58566 | 10.71 |
П | 15069 | 2.76 |
Р | 26104 | 4.78 |
С | 30627 | 5.60 |
Т | 37436 | 6.85 |
У | 13774 | 2.52 |
Ф | 1576 | 0.29 |
Х | 4732 | 0.87 |
Ц | 2322 | 0.42 |
Ч | 8391 | 1.54 |
Ш | 3485 | 0.64 |
Щ | 2017 | 0.37 |
Ь-Ъ | 9504 | 1.74 |
Ы | 10210 | 1.87 |
Э | 1945 | 0.36 |
Ю | 3882 | 0.71 |
Я | 10503 | 1.92 |
|
Части речи
Определенных частей речи (ОЧР) | 97643 слов |
Не определенных частей речи (НОЧР) | 2400 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 30689 | 31.430 |
Глагол | 6888 | 14.931 |
Местоимение-существительное | 6888 | 7.054 |
Предлог | 8484 | 11.058 |
Союз | 8761 | 9 |
Прилагательное | 8484 | 8.689 |
Наречие | 5585 | 5.720 |
Местоимение-прилагательное | 4914 | 5.033 |
Частица | 4013 | 4.110 |
Местоименное наречие | 1674 | 1.714 |
Числительное | 651 | 0.667 |
Числительное-прилагательное | 540 | 0.553 |
Междометие | 45 | 0.046 |
Часть композита - сложного слова | 23 | 0.024 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 85.94 | 50.49 | 16.66 | 46.52 | 41.05 | 22.84 | 17.80 | 13.39 | 10.22 | 5.72 | 1.38 | 1.99 | 0.19 | 0.10 |
Глагол | 34.51 | 16.26 | 11.86 | 29.62 | 16.78 | 12.08 | 9.13 | 8.06 | 6.47 | 2.46 | 1.28 | 0.74 | 0.05 | 0.01 |
Местоимение-существительное | 10.99 | 20.97 | 3.56 | 5.62 | 6.87 | 4.66 | 6.72 | 2.04 | 7.13 | 1.45 | 0.35 | 0.17 | 0.00 | 0.00 |
Предлог | 56.75 | 1.95 | 14.14 | 0.39 | 1.33 | 16.49 | 1.15 | 14.71 | 0.19 | 0.20 | 1.60 | 1.58 | 0.07 | 0.03 |
Союз | 21.04 | 13.67 | 10.58 | 9.65 | 4.55 | 7.47 | 7.93 | 4.90 | 5.86 | 3.48 | 0.30 | 0.24 | 0.04 | 0.04 |
Прилагательное | 60.35 | 3.79 | 1.51 | 4.55 | 5.88 | 6.67 | 1.60 | 0.82 | 0.89 | 0.38 | 0.28 | 0.09 | 0.07 | 0.02 |
Наречие | 5.80 | 17.58 | 3.66 | 5.41 | 5.46 | 5.97 | 5.16 | 2.10 | 4.08 | 1.21 | 0.63 | 0.13 | 0.00 | 0.01 |
Местоимение-прилагательное | 23.82 | 4.85 | 4.07 | 3.29 | 1.89 | 5.68 | 2.26 | 1.69 | 1.64 | 0.63 | 0.25 | 0.24 | 0.01 | 0.00 |
Частица | 5.60 | 15.65 | 2.53 | 3.73 | 1.83 | 2.66 | 3.15 | 1.86 | 2.44 | 1.22 | 0.25 | 0.15 | 0.02 | 0.00 |
Местоименное наречие | 1.89 | 3.32 | 1.71 | 1.09 | 3.40 | 1.00 | 1.88 | 0.55 | 1.99 | 0.24 | 0.05 | 0.02 | 0.00 | 0.00 |
Числительное | 4.33 | 0.32 | 0.07 | 0.30 | 0.28 | 0.72 | 0.25 | 0.12 | 0.04 | 0.03 | 0.18 | 0.03 | 0.00 | 0.00 |
Числительное-прилагательное | 2.99 | 0.37 | 0.18 | 0.38 | 0.33 | 0.55 | 0.12 | 0.09 | 0.13 | 0.11 | 0.12 | 0.14 | 0.00 | 0.00 |
Междометие | 0.15 | 0.08 | 0.01 | 0.05 | 0.07 | 0.02 | 0.05 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.12 | 0.00 | 0.00 | 0.00 | 0.01 | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.02 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 18.08 | 26.12 | 28.37 | 30.94 | 30.05 |
Глагол | 8.73 | 15.42 | 18.62 | 18.60 | 18.00 |
Местоимение-существительное | 9.35 | 11.57 | 9.17 | 8.10 | 6.69 |
Предлог | 16.22 | 8.72 | 10.28 | 9.99 | 10.87 |
Союз | 15.28 | 7.64 | 7.20 | 7.61 | 8.30 |
Прилагательное | 6.08 | 6.72 | 7.84 | 7.91 | 8.93 |
Наречие | 11.09 | 7.01 | 6.43 | 5.52 | 5.31 |
Местоимение-прилагательное | 5.53 | 6.90 | 5.10 | 5.02 | 4.67 |
Частица | 4.03 | 6.19 | 4.59 | 3.40 | 4.06 |
Местоименное наречие | 3.88 | 2.24 | 1.12 | 1.37 | 1.62 |
Числительное | 0.37 | 0.53 | 0.68 | 0.92 | 0.85 |
Числительное-прилагательное | 1.26 | 0.92 | 0.60 | 0.59 | 0.59 |
Междометие | 0.09 | 0.02 | 0.00 | 0.04 | 0.04 |
Часть композита - сложного слова | 0.02 | 0.00 | 0.00 | 0.00 | 0.02 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 31.57 | 31.61 | 31.40 | 31.79 | 30.60 |
Глагол | 15.82 | 15.40 | 15.93 | 14.39 | 15.74 |
Местоимение-существительное | 7.03 | 6.98 | 6.10 | 7.06 | 6.19 |
Предлог | 11.30 | 11.53 | 11.44 | 12.03 | 11.57 |
Союз | 8.08 | 8.92 | 9.31 | 8.44 | 9.16 |
Прилагательное | 8.69 | 8.46 | 9.17 | 9.40 | 10.06 |
Наречие | 5.30 | 5.27 | 4.65 | 5.04 | 4.91 |
Местоимение-прилагательное | 5.24 | 4.85 | 4.74 | 4.77 | 5.25 |
Частица | 4.25 | 4.33 | 4.54 | 4.10 | 3.86 |
Местоименное наречие | 1.45 | 1.47 | 1.33 | 1.59 | 1.43 |
Числительное | 0.69 | 0.61 | 0.89 | 0.96 | 0.67 |
Числительное-прилагательное | 0.51 | 0.51 | 0.48 | 0.39 | 0.49 |
Междометие | 0.04 | 0.04 | 0.02 | 0.02 | 0.08 |
Часть композита - сложного слова | 0.02 | 0.02 | 0.00 | 0.02 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 30.82 | 33.22 | 32.02 | 31.10 | 30.98 |
Глагол | 14.52 | 14.21 | 14.01 | 15.72 | 14.17 |
Местоимение-существительное | 6.95 | 6.22 | 6.46 | 6.31 | 6.53 |
Предлог | 11.42 | 10.82 | 11.42 | 11.85 | 10.89 |
Союз | 9.19 | 9.46 | 10.08 | 8.64 | 9.56 |
Прилагательное | 9.27 | 9.49 | 9.27 | 9.58 | 9.28 |
Наречие | 5.39 | 4.77 | 4.68 | 5.47 | 5.78 |
Местоимение-прилагательное | 4.85 | 4.75 | 4.84 | 4.97 | 5.71 |
Частица | 4.34 | 3.96 | 4.49 | 3.77 | 3.96 |
Местоименное наречие | 1.83 | 1.77 | 1.53 | 1.60 | 1.71 |
Числительное | 0.75 | 0.69 | 0.81 | 0.63 | 0.86 |
Числительное-прилагательное | 0.54 | 0.55 | 0.34 | 0.33 | 0.57 |
Междометие | 0.08 | 0.03 | 0.03 | 0.03 | 0.00 |
Часть композита - сложного слова | 0.05 | 0.06 | 0.00 | 0.00 | 0.00 |
Последние комментарии
1 день 28 минут назад
1 день 5 часов назад
1 день 13 часов назад
1 день 15 часов назад
1 день 15 часов назад
3 дней 3 часов назад