Лингвистический анализ: Big data простым языком (Алексей Благирев)
Общая статистика
Длина текста | 271146 знаков |
Длина диалогов | 4471 знаков |
Слов в произведении (СВП) | 36457 слов |
Приблизительно страниц | 151 стр. |
Средняя длина слова | 6.13 знаков |
Предложений в произведении (ПВП) | 2311 предл. |
Средняя длина предложения (СДП) | 114.38 знаков |
Доля диалогов в тексте | 1.65 % |
Доля авторского текста | 98.35 % |
СДП диалогов | 126.77 знаков |
СДП авторского текста | 120.54 знаков |
|
Максимальный фрагмент авторского текста - 248714 знаков (в страницах - примерно 138, начинается где-то с 1 страницы) |
Активный словарный запас
Использовано уникальных слов | 9834 | |
Активный словарный запас (АСЗ) | 8993 | |
Активный не словарный запас (АНСЗ) | 841 | |
Удельный АСЗ на 3000 слов текста | 1523.43 | 284407 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3924.05 | 225789 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1653) наблюдается примерно на 145 странице |
Минимальный УАСЗ-3000 (1381) наблюдается примерно на 116 странице |
|
Буквы и знаки препинания
Всего букв | 216443 букв |
Всего знаков препинания | 6654 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 3478 | 95.40 |
. точка | 2228 | 61.11 |
- тире | 440 | 12.07 |
? вопросительный знак | 120 | 3.29 |
! восклицательный знак | 9 | 0.25 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 0 | 0.00 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 237 | 6.50 |
: двоеточие | 122 | 3.35 |
; точка с запятой | 20 | 0.55 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 16972 | 7.84 |
Б | 3338 | 1.54 |
В | 8899 | 4.11 |
Г | 2978 | 1.38 |
Д | 6537 | 3.02 |
Е-Ё | 17627 | 8.14 |
Ж | 2978 | 1.38 |
З | 3822 | 1.77 |
И-Й | 20135 | 9.30 |
К | 7310 | 3.38 |
Л | 8568 | 3.96 |
М | 6716 | 3.10 |
Н | 15662 | 7.24 |
О | 22965 | 10.61 |
П | 6421 | 2.97 |
Р | 10768 | 4.97 |
С | 10975 | 5.07 |
Т | 15274 | 7.06 |
У | 4725 | 2.18 |
Ф | 969 | 0.45 |
Х | 2500 | 1.16 |
Ц | 1443 | 0.67 |
Ч | 2833 | 1.31 |
Ш | 1034 | 0.48 |
Щ | 687 | 0.32 |
Ь-Ъ | 3908 | 1.81 |
Ы | 5117 | 2.36 |
Э | 809 | 0.37 |
Ю | 1549 | 0.72 |
Я | 4272 | 1.97 |
|
Части речи
Определенных частей речи (ОЧР) | 35111 слов |
Не определенных частей речи (НОЧР) | 1346 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 12507 | 35.621 |
Глагол | 1771 | 14.380 |
Местоимение-существительное | 1771 | 5.044 |
Предлог | 3263 | 11.948 |
Союз | 2823 | 8 |
Прилагательное | 3263 | 9.293 |
Наречие | 1763 | 5.021 |
Местоимение-прилагательное | 2031 | 5.785 |
Частица | 857 | 2.441 |
Местоименное наречие | 531 | 1.512 |
Числительное | 212 | 0.604 |
Числительное-прилагательное | 98 | 0.279 |
Междометие | 9 | 0.026 |
Часть композита - сложного слова | 2 | 0.006 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 104.95 | 48.05 | 13.61 | 64.82 | 43.18 | 27.54 | 17.57 | 21.22 | 6.41 | 7.63 | 0.54 | 0.63 | 0.03 | 0.00 |
Глагол | 37.88 | 18.20 | 6.07 | 27.83 | 12.56 | 17.29 | 8.52 | 8.26 | 4.13 | 1.34 | 1.31 | 0.31 | 0.06 | 0.06 |
Местоимение-существительное | 9.43 | 16.43 | 1.59 | 2.56 | 5.24 | 4.10 | 5.16 | 1.99 | 2.91 | 0.66 | 0.26 | 0.11 | 0.00 | 0.00 |
Предлог | 65.45 | 2.22 | 12.82 | 1.05 | 0.91 | 17.80 | 0.83 | 14.47 | 0.11 | 0.14 | 2.22 | 1.42 | 0.03 | 0.00 |
Союз | 24.84 | 15.35 | 6.86 | 6.32 | 3.39 | 6.49 | 5.24 | 5.92 | 3.47 | 2.11 | 0.23 | 0.14 | 0.03 | 0.00 |
Прилагательное | 70.97 | 4.44 | 0.83 | 4.13 | 4.50 | 5.30 | 0.97 | 0.63 | 0.34 | 0.51 | 0.23 | 0.06 | 0.03 | 0.00 |
Наречие | 5.61 | 17.72 | 2.79 | 4.56 | 3.99 | 4.84 | 4.04 | 1.82 | 3.25 | 0.77 | 0.77 | 0.06 | 0.00 | 0.00 |
Местоимение-прилагательное | 25.86 | 8.91 | 2.96 | 4.76 | 2.28 | 6.04 | 3.45 | 1.59 | 1.31 | 0.37 | 0.20 | 0.03 | 0.09 | 0.00 |
Частица | 2.96 | 8.97 | 1.62 | 2.11 | 0.77 | 1.97 | 2.05 | 1.34 | 1.22 | 1.14 | 0.26 | 0.00 | 0.00 | 0.00 |
Местоименное наречие | 1.45 | 3.25 | 1.11 | 0.83 | 3.36 | 0.60 | 2.25 | 0.60 | 1.25 | 0.40 | 0.00 | 0.03 | 0.00 | 0.00 |
Числительное | 4.53 | 0.03 | 0.03 | 0.34 | 0.09 | 0.83 | 0.14 | 0.00 | 0.00 | 0.03 | 0.03 | 0.00 | 0.00 | 0.00 |
Числительное-прилагательное | 2.05 | 0.20 | 0.09 | 0.17 | 0.14 | 0.14 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Междометие | 0.14 | 0.03 | 0.06 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.06 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 23.35 | 33.01 | 33.59 | 34.71 | 32.78 |
Глагол | 8.94 | 16.00 | 17.16 | 18.44 | 17.82 |
Местоимение-существительное | 7.66 | 8.80 | 6.63 | 5.84 | 4.52 |
Предлог | 17.33 | 8.55 | 9.70 | 11.13 | 11.27 |
Союз | 12.22 | 5.94 | 6.78 | 5.54 | 7.27 |
Прилагательное | 6.57 | 6.81 | 8.43 | 9.22 | 10.18 |
Наречие | 9.12 | 5.17 | 6.68 | 5.69 | 5.51 |
Местоимение-прилагательное | 7.20 | 7.64 | 5.56 | 4.84 | 5.51 |
Частица | 3.47 | 4.64 | 2.63 | 1.91 | 2.55 |
Местоименное наречие | 3.51 | 1.55 | 1.66 | 1.76 | 1.30 |
Числительное | 0.09 | 0.68 | 0.78 | 0.60 | 0.94 |
Числительное-прилагательное | 0.55 | 1.06 | 0.34 | 0.20 | 0.36 |
Междометие | 0.00 | 0.14 | 0.05 | 0.05 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 34.73 | 35.28 | 36.31 | 33.27 | 35.07 |
Глагол | 16.40 | 14.61 | 13.86 | 14.13 | 13.88 |
Местоимение-существительное | 3.75 | 4.38 | 4.15 | 4.31 | 5.20 |
Предлог | 12.06 | 12.53 | 12.16 | 11.76 | 12.76 |
Союз | 7.29 | 8.26 | 7.44 | 9.04 | 8.43 |
Прилагательное | 10.61 | 9.35 | 9.77 | 12.06 | 8.98 |
Наречие | 4.77 | 4.70 | 4.38 | 4.85 | 4.52 |
Местоимение-прилагательное | 5.95 | 6.46 | 6.42 | 6.03 | 6.32 |
Частица | 2.52 | 2.24 | 2.67 | 2.13 | 2.29 |
Местоименное наречие | 0.96 | 1.26 | 1.82 | 1.60 | 1.86 |
Числительное | 0.64 | 0.60 | 0.85 | 0.47 | 0.56 |
Числительное-прилагательное | 0.27 | 0.33 | 0.11 | 0.35 | 0.12 |
Междометие | 0.05 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.06 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 32.61 | 34.73 | 33.21 | 34.84 | 33.48 |
Глагол | 15.32 | 14.74 | 12.92 | 12.33 | 13.43 |
Местоимение-существительное | 5.26 | 4.26 | 4.43 | 6.00 | 4.86 |
Предлог | 12.56 | 12.58 | 14.65 | 12.33 | 13.16 |
Союз | 8.81 | 9.29 | 8.87 | 9.12 | 10.60 |
Прилагательное | 10.85 | 11.67 | 10.14 | 11.09 | 10.78 |
Наречие | 4.73 | 4.61 | 4.73 | 4.27 | 4.33 |
Местоимение-прилагательное | 5.46 | 4.05 | 6.61 | 5.26 | 4.59 |
Частица | 2.83 | 2.31 | 2.63 | 2.63 | 2.47 |
Местоименное наречие | 1.31 | 1.05 | 0.90 | 1.56 | 1.33 |
Числительное | 0.26 | 0.49 | 0.75 | 0.33 | 0.88 |
Числительное-прилагательное | 0.00 | 0.14 | 0.15 | 0.25 | 0.09 |
Междометие | 0.00 | 0.07 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
1 день 16 часов назад
1 день 21 часов назад
1 день 23 часов назад
2 дней 19 минут назад
2 дней 1 час назад
2 дней 2 часов назад