Лингвистический анализ: Не лги себе. Почему Big Data знает тебя лучше, чем ты сам, и как использовать это, чтобы добиться успеха (Сет Стивенс-Давидовиц)
Общая статистика
Длина текста | 396811 знаков |
Длина диалогов | 110 знаков |
Слов в произведении (СВП) | 55399 слов |
Приблизительно страниц | 221 стр. |
Средняя длина слова | 5.82 знаков |
Предложений в произведении (ПВП) | 3643 предл. |
Средняя длина предложения (СДП) | 106.02 знаков |
Доля диалогов в тексте | 0.03 % |
Доля авторского текста | 99.97 % |
СДП диалогов | 36.00 знаков |
СДП авторского текста | 113.97 знаков |
|
Максимальный фрагмент авторского текста - 267768 знаков (в страницах - примерно 149, начинается где-то с 1 страницы) |
Активный словарный запас
Использовано уникальных слов | 13422 | |
Активный словарный запас (АСЗ) | 11599 | |
Активный не словарный запас (АНСЗ) | 1823 | |
Удельный АСЗ на 3000 слов текста | 1473.23 | 366095 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 3799.09 | 304580 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1753) наблюдается примерно на 215 странице |
Минимальный УАСЗ-3000 (1322) наблюдается примерно на 24 странице |
|
Буквы и знаки препинания
Всего букв | 303889 букв |
Всего знаков препинания | 11061 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 5728 | 103.40 |
. точка | 3518 | 63.50 |
- тире | 599 | 10.81 |
? вопросительный знак | 340 | 6.14 |
! восклицательный знак | 39 | 0.70 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 0 | 0.00 |
!!! тройной восклицательный знак | 1 | 0.02 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 282 | 5.09 |
: двоеточие | 465 | 8.39 |
; точка с запятой | 89 | 1.61 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 22630 | 7.45 |
Б | 5177 | 1.70 |
В | 13529 | 4.45 |
Г | 4558 | 1.50 |
Д | 9465 | 3.11 |
Е-Ё | 26959 | 8.87 |
Ж | 4558 | 1.50 |
З | 4897 | 1.61 |
И-Й | 27054 | 8.90 |
К | 9041 | 2.98 |
Л | 12693 | 4.18 |
М | 10085 | 3.32 |
Н | 20350 | 6.70 |
О | 32292 | 10.63 |
П | 8353 | 2.75 |
Р | 13861 | 4.56 |
С | 16666 | 5.48 |
Т | 20722 | 6.82 |
У | 6959 | 2.29 |
Ф | 706 | 0.23 |
Х | 3194 | 1.05 |
Ц | 1203 | 0.40 |
Ч | 5180 | 1.70 |
Ш | 2260 | 0.74 |
Щ | 1373 | 0.45 |
Ь-Ъ | 5844 | 1.92 |
Ы | 6851 | 2.25 |
Э | 1064 | 0.35 |
Ю | 2369 | 0.78 |
Я | 5599 | 1.84 |
|
Части речи
Определенных частей речи (ОЧР) | 52029 слов |
Не определенных частей речи (НОЧР) | 3370 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 16584 | 31.875 |
Глагол | 3865 | 15.828 |
Местоимение-существительное | 3865 | 7.429 |
Предлог | 4620 | 11.966 |
Союз | 4099 | 8 |
Прилагательное | 4620 | 8.880 |
Наречие | 2755 | 5.295 |
Местоимение-прилагательное | 3068 | 5.897 |
Частица | 1642 | 3.156 |
Местоименное наречие | 493 | 0.948 |
Числительное | 288 | 0.554 |
Числительное-прилагательное | 144 | 0.277 |
Междометие | 6 | 0.012 |
Часть композита - сложного слова | 4 | 0.008 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 80.28 | 57.72 | 16.66 | 58.45 | 36.84 | 21.03 | 18.51 | 17.01 | 7.02 | 3.48 | 1.04 | 0.63 | 0.08 | 0.00 |
Глагол | 37.48 | 17.34 | 13.36 | 30.29 | 15.55 | 15.01 | 10.01 | 10.01 | 6.44 | 1.44 | 1.13 | 0.21 | 0.00 | 0.00 |
Местоимение-существительное | 13.15 | 25.52 | 2.86 | 5.05 | 6.04 | 5.88 | 6.78 | 2.34 | 5.52 | 0.73 | 0.37 | 0.04 | 0.00 | 0.00 |
Предлог | 60.10 | 2.38 | 17.05 | 1.08 | 1.38 | 17.22 | 1.17 | 16.32 | 0.13 | 0.10 | 1.44 | 1.23 | 0.00 | 0.06 |
Союз | 18.12 | 14.74 | 11.42 | 7.86 | 3.82 | 5.54 | 5.23 | 6.00 | 4.38 | 1.04 | 0.38 | 0.25 | 0.00 | 0.00 |
Прилагательное | 63.25 | 4.69 | 1.88 | 4.59 | 5.92 | 4.69 | 1.25 | 1.04 | 0.88 | 0.27 | 0.19 | 0.10 | 0.02 | 0.02 |
Наречие | 6.61 | 15.13 | 3.86 | 4.48 | 4.07 | 8.86 | 4.50 | 1.98 | 2.25 | 0.79 | 0.37 | 0.06 | 0.00 | 0.00 |
Местоимение-прилагательное | 28.46 | 6.40 | 3.63 | 4.38 | 1.92 | 7.15 | 2.04 | 1.58 | 2.52 | 0.37 | 0.35 | 0.17 | 0.00 | 0.00 |
Частица | 4.81 | 11.80 | 2.48 | 2.48 | 1.31 | 2.04 | 2.29 | 2.06 | 1.06 | 1.08 | 0.15 | 0.02 | 0.00 | 0.00 |
Местоименное наречие | 1.13 | 1.83 | 0.86 | 0.63 | 1.50 | 0.63 | 0.96 | 0.40 | 1.27 | 0.17 | 0.02 | 0.04 | 0.00 | 0.00 |
Числительное | 3.34 | 0.46 | 0.13 | 0.25 | 0.19 | 0.65 | 0.17 | 0.17 | 0.04 | 0.00 | 0.08 | 0.02 | 0.02 | 0.00 |
Числительное-прилагательное | 1.86 | 0.25 | 0.08 | 0.12 | 0.23 | 0.06 | 0.04 | 0.06 | 0.04 | 0.02 | 0.02 | 0.00 | 0.00 | 0.00 |
Междометие | 0.06 | 0.02 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.06 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 19.50 | 26.37 | 29.74 | 31.75 | 30.48 |
Глагол | 9.66 | 19.71 | 18.07 | 20.31 | 18.18 |
Местоимение-существительное | 11.55 | 10.42 | 10.28 | 7.23 | 6.59 |
Предлог | 15.70 | 9.20 | 9.82 | 10.45 | 12.20 |
Союз | 17.90 | 7.08 | 7.57 | 6.92 | 7.13 |
Прилагательное | 4.70 | 6.78 | 7.88 | 8.19 | 8.63 |
Наречие | 8.44 | 5.70 | 5.29 | 5.16 | 5.03 |
Местоимение-прилагательное | 7.40 | 6.63 | 5.75 | 5.69 | 6.59 |
Частица | 2.47 | 5.73 | 3.86 | 2.53 | 3.22 |
Местоименное наречие | 1.89 | 0.96 | 0.67 | 0.83 | 0.89 |
Числительное | 0.38 | 0.72 | 0.64 | 0.59 | 0.73 |
Числительное-прилагательное | 0.38 | 0.72 | 0.40 | 0.34 | 0.32 |
Междометие | 0.03 | 0.00 | 0.03 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 32.99 | 32.64 | 31.77 | 31.35 | 32.20 |
Глагол | 16.78 | 16.44 | 15.34 | 14.95 | 15.56 |
Местоимение-существительное | 6.44 | 6.31 | 6.38 | 6.14 | 6.73 |
Предлог | 11.89 | 12.28 | 13.99 | 12.13 | 12.29 |
Союз | 5.88 | 7.32 | 7.83 | 7.97 | 8.14 |
Прилагательное | 9.78 | 9.47 | 8.34 | 9.92 | 10.52 |
Наречие | 5.02 | 4.75 | 5.06 | 5.57 | 5.36 |
Местоимение-прилагательное | 6.87 | 6.10 | 6.19 | 6.60 | 4.43 |
Частица | 2.54 | 2.67 | 3.17 | 3.62 | 3.22 |
Местоименное наречие | 1.06 | 1.18 | 1.17 | 0.72 | 0.85 |
Числительное | 0.53 | 0.59 | 0.47 | 0.72 | 0.36 |
Числительное-прилагательное | 0.20 | 0.24 | 0.29 | 0.31 | 0.28 |
Междометие | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.03 | 0.00 | 0.00 | 0.00 | 0.04 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 30.41 | 30.32 | 31.38 | 29.72 | 32.28 |
Глагол | 16.45 | 16.32 | 14.17 | 14.11 | 14.41 |
Местоимение-существительное | 7.00 | 6.63 | 6.78 | 7.08 | 7.78 |
Предлог | 13.62 | 13.40 | 13.41 | 14.00 | 11.49 |
Союз | 7.47 | 7.46 | 8.10 | 8.25 | 7.29 |
Прилагательное | 9.28 | 11.03 | 9.72 | 11.40 | 11.19 |
Наречие | 5.54 | 5.05 | 5.11 | 5.20 | 4.50 |
Местоимение-прилагательное | 5.50 | 5.89 | 6.12 | 5.64 | 6.44 |
Частица | 3.31 | 2.18 | 3.74 | 3.10 | 3.16 |
Местоименное наречие | 0.82 | 0.60 | 0.76 | 0.61 | 0.79 |
Числительное | 0.60 | 0.65 | 0.46 | 0.61 | 0.61 |
Числительное-прилагательное | 0.00 | 0.46 | 0.25 | 0.22 | 0.06 |
Междометие | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.06 | 0.00 |
Последние комментарии
2 часов 12 минут назад
8 часов 35 минут назад
8 часов 43 минут назад
9 часов 11 минут назад
9 часов 15 минут назад
9 часов 15 минут назад