Лингвистический анализ: Совместимость. Как контролировать искусственный интеллект (Стюарт Рассел)
Общая статистика
Длина текста | 680519 знаков |
Длина диалогов | 1596 знаков |
Слов в произведении (СВП) | 89735 слов |
Приблизительно страниц | 379 стр. |
Средняя длина слова | 6.21 знаков |
Предложений в произведении (ПВП) | 4987 предл. |
Средняя длина предложения (СДП) | 133.50 знаков |
Доля диалогов в тексте | 0.23 % |
Доля авторского текста | 99.77 % |
СДП диалогов | 198.63 знаков |
СДП авторского текста | 138.04 знаков |
|
Максимальный фрагмент авторского текста - 314714 знаков (в страницах - примерно 175, начинается где-то с 1 страницы) |
Активный словарный запас
Использовано уникальных слов | 20491 | |
Активный словарный запас (АСЗ) | 17591 | |
Активный не словарный запас (АНСЗ) | 2900 | |
Удельный АСЗ на 3000 слов текста | 1602.22 | 434861 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4172.88 | 127081 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1841) наблюдается примерно на 333 странице |
Минимальный УАСЗ-3000 (1236) наблюдается примерно на 211 странице |
|
Буквы и знаки препинания
Всего букв | 523029 букв |
Всего знаков препинания | 18499 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 10580 | 117.90 |
. точка | 5083 | 56.64 |
- тире | 670 | 7.47 |
? вопросительный знак | 204 | 2.27 |
! восклицательный знак | 77 | 0.86 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 1 | 0.01 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 673 | 7.50 |
: двоеточие | 1041 | 11.60 |
; точка с запятой | 170 | 1.89 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 36418 | 6.96 |
Б | 8947 | 1.71 |
В | 21878 | 4.18 |
Г | 8184 | 1.56 |
Д | 14788 | 2.83 |
Е-Ё | 47809 | 9.14 |
Ж | 8184 | 1.56 |
З | 8368 | 1.60 |
И-Й | 48427 | 9.26 |
К | 14694 | 2.81 |
Л | 20766 | 3.97 |
М | 18715 | 3.58 |
Н | 36427 | 6.96 |
О | 57345 | 10.96 |
П | 14948 | 2.86 |
Р | 24053 | 4.60 |
С | 27618 | 5.28 |
Т | 36363 | 6.95 |
У | 11570 | 2.21 |
Ф | 1407 | 0.27 |
Х | 4708 | 0.90 |
Ц | 2662 | 0.51 |
Ч | 8811 | 1.68 |
Ш | 3434 | 0.66 |
Щ | 2213 | 0.42 |
Ь-Ъ | 9639 | 1.84 |
Ы | 10675 | 2.04 |
Э | 2012 | 0.38 |
Ю | 4412 | 0.84 |
Я | 10795 | 2.06 |
|
Части речи
Определенных частей речи (ОЧР) | 83411 слов |
Не определенных частей речи (НОЧР) | 6324 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 28587 | 34.272 |
Глагол | 4714 | 14.881 |
Местоимение-существительное | 4714 | 5.652 |
Предлог | 9088 | 10.798 |
Союз | 6890 | 8 |
Прилагательное | 9088 | 10.895 |
Наречие | 4738 | 5.680 |
Местоимение-прилагательное | 3915 | 4.694 |
Частица | 2729 | 3.272 |
Местоименное наречие | 641 | 0.768 |
Числительное | 368 | 0.441 |
Числительное-прилагательное | 294 | 0.352 |
Междометие | 19 | 0.023 |
Часть композита - сложного слова | 9 | 0.011 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 93.70 | 53.48 | 14.72 | 56.64 | 42.20 | 32.43 | 20.94 | 15.69 | 7.28 | 3.12 | 0.76 | 1.53 | 0.14 | 0.07 |
Глагол | 38.22 | 16.68 | 8.58 | 26.65 | 13.42 | 18.00 | 9.26 | 7.97 | 7.58 | 1.15 | 0.96 | 0.30 | 0.05 | 0.00 |
Местоимение-существительное | 9.18 | 18.62 | 1.93 | 2.84 | 5.84 | 4.22 | 6.10 | 1.61 | 5.23 | 0.77 | 0.10 | 0.07 | 0.00 | 0.01 |
Предлог | 58.81 | 1.99 | 10.85 | 1.27 | 1.20 | 18.16 | 1.33 | 11.56 | 0.28 | 0.12 | 1.31 | 1.09 | 0.02 | 0.00 |
Союз | 22.37 | 15.90 | 10.26 | 5.56 | 3.11 | 8.69 | 5.69 | 4.46 | 5.43 | 0.73 | 0.20 | 0.19 | 0.00 | 0.00 |
Прилагательное | 80.31 | 5.41 | 1.52 | 4.47 | 5.91 | 7.65 | 1.55 | 0.79 | 0.74 | 0.35 | 0.18 | 0.07 | 0.00 | 0.00 |
Наречие | 4.83 | 18.10 | 3.82 | 4.41 | 4.56 | 9.64 | 6.59 | 1.53 | 2.30 | 0.54 | 0.38 | 0.07 | 0.01 | 0.00 |
Местоимение-прилагательное | 24.59 | 4.39 | 2.09 | 2.69 | 1.79 | 5.83 | 2.16 | 1.26 | 1.62 | 0.17 | 0.28 | 0.08 | 0.00 | 0.01 |
Частица | 4.50 | 12.24 | 1.97 | 2.90 | 1.69 | 3.01 | 2.54 | 1.62 | 1.31 | 0.66 | 0.22 | 0.07 | 0.00 | 0.00 |
Местоименное наречие | 0.71 | 1.56 | 0.52 | 0.30 | 2.55 | 0.49 | 0.46 | 0.18 | 0.88 | 0.04 | 0.01 | 0.00 | 0.00 | 0.00 |
Числительное | 3.17 | 0.18 | 0.08 | 0.11 | 0.08 | 0.48 | 0.10 | 0.14 | 0.04 | 0.01 | 0.00 | 0.02 | 0.00 | 0.00 |
Числительное-прилагательное | 2.13 | 0.25 | 0.17 | 0.14 | 0.25 | 0.30 | 0.08 | 0.10 | 0.05 | 0.02 | 0.02 | 0.00 | 0.00 | 0.00 |
Междометие | 0.12 | 0.01 | 0.00 | 0.00 | 0.01 | 0.04 | 0.00 | 0.02 | 0.00 | 0.01 | 0.00 | 0.01 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.07 | 0.00 | 0.00 | 0.00 | 0.00 | 0.02 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 22.20 | 34.76 | 33.10 | 33.93 | 35.41 |
Глагол | 7.54 | 15.29 | 18.71 | 18.33 | 16.33 |
Местоимение-существительное | 10.75 | 8.30 | 5.83 | 5.63 | 4.72 |
Предлог | 17.40 | 7.66 | 9.53 | 9.72 | 10.61 |
Союз | 9.07 | 5.29 | 7.04 | 6.14 | 6.91 |
Прилагательное | 8.00 | 10.07 | 9.69 | 11.14 | 11.53 |
Наречие | 12.51 | 6.82 | 5.90 | 5.70 | 4.77 |
Местоимение-прилагательное | 7.17 | 4.62 | 3.72 | 4.67 | 4.37 |
Частица | 2.13 | 4.89 | 4.84 | 3.33 | 3.42 |
Местоименное наречие | 1.45 | 0.58 | 0.70 | 0.56 | 1.02 |
Числительное | 0.31 | 0.66 | 0.59 | 0.60 | 0.50 |
Числительное-прилагательное | 1.39 | 1.06 | 0.32 | 0.21 | 0.38 |
Междометие | 0.08 | 0.00 | 0.00 | 0.02 | 0.05 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.02 | 0.02 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 33.27 | 34.01 | 35.29 | 34.75 | 34.09 |
Глагол | 17.50 | 16.00 | 15.66 | 14.68 | 13.82 |
Местоимение-существительное | 4.57 | 4.57 | 4.29 | 4.87 | 4.80 |
Предлог | 10.77 | 11.68 | 11.14 | 12.20 | 12.02 |
Союз | 7.58 | 7.85 | 7.56 | 8.09 | 8.62 |
Прилагательное | 12.32 | 11.68 | 12.47 | 11.82 | 11.76 |
Наречие | 5.27 | 5.37 | 4.71 | 5.17 | 4.51 |
Местоимение-прилагательное | 4.28 | 4.06 | 4.47 | 4.19 | 5.28 |
Частица | 3.11 | 3.13 | 3.03 | 2.86 | 3.68 |
Местоименное наречие | 0.61 | 0.66 | 0.63 | 0.60 | 0.83 |
Числительное | 0.44 | 0.61 | 0.44 | 0.52 | 0.43 |
Числительное-прилагательное | 0.24 | 0.38 | 0.31 | 0.16 | 0.17 |
Междометие | 0.00 | 0.00 | 0.00 | 0.05 | 0.00 |
Часть композита - сложного слова | 0.05 | 0.00 | 0.00 | 0.03 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 34.83 | 33.47 | 31.88 | 34.07 | 31.62 |
Глагол | 14.27 | 14.85 | 14.99 | 13.81 | 14.13 |
Местоимение-существительное | 4.79 | 5.49 | 5.89 | 5.23 | 6.27 |
Предлог | 11.07 | 11.23 | 11.78 | 11.69 | 12.20 |
Союз | 8.86 | 9.17 | 9.67 | 10.52 | 9.44 |
Прилагательное | 11.64 | 11.26 | 11.94 | 10.77 | 11.67 |
Наречие | 5.21 | 5.27 | 4.88 | 4.59 | 5.02 |
Местоимение-прилагательное | 4.67 | 4.70 | 4.78 | 4.84 | 5.02 |
Частица | 3.20 | 3.27 | 2.58 | 3.00 | 2.98 |
Местоименное наречие | 0.84 | 0.70 | 0.90 | 0.71 | 0.98 |
Числительное | 0.42 | 0.44 | 0.54 | 0.64 | 0.42 |
Числительное-прилагательное | 0.15 | 0.16 | 0.17 | 0.14 | 0.23 |
Междометие | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 |
Последние комментарии
1 день 16 часов назад
1 день 17 часов назад
1 день 17 часов назад
1 день 17 часов назад
1 день 20 часов назад
1 день 20 часов назад