Лингвистический анализ: Антология машинного обучения. Важнейшие исследования в области ИИ за последние 60 лет (Терренс Сейновски)
Общая статистика
Длина текста | 569963 знаков |
Длина диалогов | 0 знаков |
Слов в произведении (СВП) | 76062 слов |
Приблизительно страниц | 317 стр. |
Средняя длина слова | 6.05 знаков |
Предложений в произведении (ПВП) | 6029 предл. |
Средняя длина предложения (СДП) | 91.56 знаков |
Доля диалогов в тексте | 0.00 % |
Доля авторского текста | 100 % |
СДП диалогов | 0.00 знаков |
СДП авторского текста | 87.34 знаков |
Активный словарный запас
Использовано уникальных слов | 18371 | |
Активный словарный запас (АСЗ) | 15164 | |
Активный не словарный запас (АНСЗ) | 3207 | |
Удельный АСЗ на 3000 слов текста | 1609.79 | 366095 место в рейтинге УАСЗ-3000 |
Удельный АСЗ на 10000 слов текста | 4227.44 | 304580 место в рейтинге УАСЗ-10000 |
Удельный АСЗ на 100000 слов текста | 0.00 | |
|
Максимальный УАСЗ-3000 (1802) наблюдается примерно на 266 странице |
Минимальный УАСЗ-3000 (1517) наблюдается примерно на 283 странице |
|
Буквы и знаки препинания
Всего букв | 420569 букв |
Всего знаков препинания | 16709 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 7638 | 100.42 |
. точка | 6724 | 88.40 |
- тире | 827 | 10.87 |
? вопросительный знак | 142 | 1.87 |
! восклицательный знак | 24 | 0.32 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 0 | 0.00 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 651 | 8.56 |
: двоеточие | 519 | 6.82 |
; точка с запятой | 184 | 2.42 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 30673 | 7.29 |
Б | 7222 | 1.72 |
В | 17696 | 4.21 |
Г | 7389 | 1.76 |
Д | 11834 | 2.81 |
Е-Ё | 35805 | 8.51 |
Ж | 7389 | 1.76 |
З | 7073 | 1.68 |
И-Й | 40107 | 9.54 |
К | 13954 | 3.32 |
Л | 17672 | 4.20 |
М | 14376 | 3.42 |
Н | 29641 | 7.05 |
О | 46297 | 11.01 |
П | 11216 | 2.67 |
Р | 21671 | 5.15 |
С | 21149 | 5.03 |
Т | 26054 | 6.19 |
У | 9708 | 2.31 |
Ф | 1773 | 0.42 |
Х | 4759 | 1.13 |
Ц | 2198 | 0.52 |
Ч | 6356 | 1.51 |
Ш | 2356 | 0.56 |
Щ | 1369 | 0.33 |
Ь-Ъ | 6747 | 1.60 |
Ы | 9366 | 2.23 |
Э | 1344 | 0.32 |
Ю | 2968 | 0.71 |
Я | 8303 | 1.97 |
|
Части речи
Определенных частей речи (ОЧР) | 68347 слов |
Не определенных частей речи (НОЧР) | 7715 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 25777 | 37.715 |
Глагол | 3238 | 14.286 |
Местоимение-существительное | 3238 | 4.738 |
Предлог | 7870 | 12.352 |
Союз | 5007 | 7 |
Прилагательное | 7870 | 11.515 |
Наречие | 2959 | 4.329 |
Местоимение-прилагательное | 3108 | 4.547 |
Частица | 1122 | 1.642 |
Местоименное наречие | 481 | 0.704 |
Числительное | 387 | 0.566 |
Числительное-прилагательное | 178 | 0.260 |
Междометие | 9 | 0.013 |
Часть композита - сложного слова | 5 | 0.007 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 112.98 | 57.12 | 14.41 | 67.80 | 41.27 | 38.39 | 16.68 | 19.17 | 3.79 | 3.57 | 1.16 | 0.70 | 0.07 | 0.01 |
Глагол | 39.30 | 16.07 | 7.17 | 31.47 | 10.58 | 19.21 | 7.65 | 6.03 | 2.81 | 1.01 | 1.21 | 0.34 | 0.00 | 0.01 |
Местоимение-существительное | 8.12 | 18.27 | 1.39 | 3.00 | 5.08 | 3.10 | 3.75 | 0.98 | 2.82 | 0.50 | 0.22 | 0.12 | 0.01 | 0.01 |
Предлог | 71.01 | 1.76 | 9.29 | 0.66 | 0.78 | 23.44 | 1.39 | 12.20 | 0.06 | 0.09 | 1.70 | 1.13 | 0.01 | 0.01 |
Союз | 19.62 | 15.64 | 8.46 | 6.42 | 2.52 | 8.62 | 4.92 | 3.45 | 2.69 | 0.56 | 0.32 | 0.01 | 0.03 | 0.00 |
Прилагательное | 91.14 | 3.28 | 0.91 | 4.48 | 4.74 | 8.24 | 0.98 | 0.56 | 0.38 | 0.34 | 0.06 | 0.04 | 0.00 | 0.01 |
Наречие | 5.43 | 14.13 | 2.49 | 4.24 | 3.75 | 6.42 | 3.48 | 1.35 | 1.33 | 0.34 | 0.32 | 0.01 | 0.00 | 0.00 |
Местоимение-прилагательное | 20.21 | 8.52 | 1.79 | 3.28 | 1.90 | 4.73 | 2.56 | 0.80 | 1.16 | 0.19 | 0.19 | 0.16 | 0.00 | 0.00 |
Частица | 2.47 | 6.66 | 0.66 | 1.57 | 0.50 | 1.55 | 1.27 | 0.82 | 0.38 | 0.35 | 0.13 | 0.06 | 0.00 | 0.00 |
Местоименное наречие | 0.78 | 1.10 | 0.67 | 0.34 | 1.98 | 0.48 | 0.53 | 0.07 | 0.95 | 0.09 | 0.03 | 0.03 | 0.00 | 0.00 |
Числительное | 4.35 | 0.10 | 0.04 | 0.09 | 0.07 | 0.70 | 0.04 | 0.03 | 0.03 | 0.01 | 0.19 | 0.00 | 0.00 | 0.00 |
Числительное-прилагательное | 1.61 | 0.22 | 0.10 | 0.15 | 0.07 | 0.25 | 0.04 | 0.01 | 0.01 | 0.00 | 0.13 | 0.00 | 0.00 | 0.00 |
Междометие | 0.07 | 0.00 | 0.00 | 0.03 | 0.03 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.06 | 0.00 | 0.00 | 0.00 | 0.00 | 0.01 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 29.25 | 39.85 | 35.02 | 37.67 | 37.50 |
Глагол | 5.61 | 18.08 | 19.32 | 17.50 | 16.56 |
Местоимение-существительное | 10.62 | 6.59 | 5.29 | 4.35 | 3.95 |
Предлог | 22.55 | 8.18 | 11.98 | 12.70 | 12.74 |
Союз | 8.07 | 3.33 | 4.75 | 5.12 | 6.36 |
Прилагательное | 9.40 | 9.90 | 10.82 | 12.25 | 11.86 |
Наречие | 7.26 | 4.92 | 5.32 | 3.93 | 3.87 |
Местоимение-прилагательное | 4.50 | 4.46 | 3.87 | 3.57 | 3.95 |
Частица | 0.86 | 2.79 | 2.09 | 1.44 | 1.36 |
Местоименное наречие | 0.84 | 0.69 | 0.34 | 0.58 | 0.67 |
Числительное | 0.43 | 0.56 | 0.70 | 0.66 | 0.72 |
Числительное-прилагательное | 0.60 | 0.64 | 0.46 | 0.21 | 0.37 |
Междометие | 0.02 | 0.00 | 0.00 | 0.03 | 0.03 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.03 | 0.00 | 0.05 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 37.62 | 38.25 | 35.45 | 35.99 | 34.66 |
Глагол | 14.92 | 14.65 | 15.06 | 15.86 | 15.56 |
Местоимение-существительное | 3.80 | 3.85 | 4.41 | 3.96 | 3.79 |
Предлог | 13.28 | 12.55 | 13.36 | 11.74 | 13.27 |
Союз | 6.97 | 7.58 | 7.85 | 7.69 | 9.02 |
Прилагательное | 12.05 | 11.03 | 11.53 | 11.50 | 11.64 |
Наречие | 3.69 | 3.62 | 4.35 | 3.75 | 4.37 |
Местоимение-прилагательное | 4.62 | 5.34 | 5.11 | 5.76 | 4.59 |
Частица | 1.39 | 1.58 | 1.58 | 1.89 | 1.75 |
Местоименное наречие | 0.74 | 0.71 | 0.70 | 0.79 | 0.54 |
Числительное | 0.82 | 0.68 | 0.38 | 0.95 | 0.64 |
Числительное-прилагательное | 0.11 | 0.17 | 0.20 | 0.12 | 0.16 |
Междометие | 0.00 | 0.00 | 0.03 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 34.86 | 34.82 | 35.48 | 34.77 | 33.90 |
Глагол | 14.79 | 14.21 | 14.75 | 14.90 | 14.15 |
Местоимение-существительное | 5.04 | 4.58 | 4.02 | 4.94 | 4.43 |
Предлог | 13.68 | 12.74 | 13.01 | 12.32 | 14.91 |
Союз | 8.10 | 9.27 | 7.72 | 9.09 | 8.55 |
Прилагательное | 12.10 | 12.35 | 12.01 | 12.45 | 12.09 |
Наречие | 3.70 | 3.61 | 4.05 | 3.44 | 4.21 |
Местоимение-прилагательное | 4.71 | 5.37 | 5.33 | 4.85 | 4.79 |
Частица | 1.61 | 1.83 | 2.16 | 1.70 | 1.61 |
Местоименное наречие | 0.81 | 0.47 | 0.73 | 0.75 | 0.67 |
Числительное | 0.44 | 0.50 | 0.42 | 0.62 | 0.40 |
Числительное-прилагательное | 0.17 | 0.25 | 0.27 | 0.12 | 0.27 |
Междометие | 0.00 | 0.00 | 0.04 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.04 | 0.00 |
Последние комментарии
2 часов 24 минут назад
8 часов 46 минут назад
8 часов 54 минут назад
9 часов 22 минут назад
9 часов 26 минут назад
9 часов 27 минут назад