Лингвистический анализ: От бумажной карты к ГИС. Опыт векторизации топографических карт в среде Spotlight (Валерий Полозюк)
Общая статистика
Длина текста | 15048 знаков |
Длина диалогов | 65 знаков |
Слов в произведении (СВП) | 1895 слов |
Приблизительно страниц | 9 стр. |
Средняя длина слова | 6.57 знаков |
Предложений в произведении (ПВП) | 134 предл. |
Средняя длина предложения (СДП) | 109.34 знаков |
Доля диалогов в тексте | 0.43 % |
Доля авторского текста | 99.57 % |
СДП диалогов | 65.00 знаков |
СДП авторского текста | 108.36 знаков |
|
Максимальный фрагмент авторского текста - 8642 знаков (в страницах - примерно 5, начинается где-то с 1 страницы) |
Активный словарный запас
Использовано уникальных слов | 1022 | |
Активный словарный запас (АСЗ) | 961 | |
Активный не словарный запас (АНСЗ) | 61 | |
Удельный АСЗ на 3000 слов текста | 0.00 | |
Удельный АСЗ на 10000 слов текста | 0.00 | |
Удельный АСЗ на 100000 слов текста | 0.00 | |
Буквы и знаки препинания
Всего букв | 11831 букв |
Всего знаков препинания | 380 знаков |
Знак | Кол-во (шт.) | Средн. кол-во на 1000 слов (шт.) |
, запятая | 143 | 75.46 |
. точка | 140 | 73.88 |
- тире | 31 | 16.36 |
? вопросительный знак | 2 | 1.06 |
! восклицательный знак | 1 | 0.53 |
... многоточие | 0 | 0.00 |
!.. восклицательный знак с многоточием | 0 | 0.00 |
?.. вопросительный знак с многоточием | 0 | 0.00 |
!!! тройной восклицательный знак | 0 | 0.00 |
?! вопросительный знак с восклицанием | 0 | 0.00 |
" кавычка | 0 | 0.00 |
() скобки | 33 | 17.41 |
: двоеточие | 24 | 12.66 |
; точка с запятой | 6 | 3.17 |
Буква | Кол-во (шт.) | Частота использования (в %) |
А | 932 | 7.88 |
Б | 213 | 1.80 |
В | 469 | 3.96 |
Г | 178 | 1.50 |
Д | 306 | 2.59 |
Е-Ё | 973 | 8.22 |
Ж | 178 | 1.50 |
З | 210 | 1.77 |
И-Й | 1162 | 9.82 |
К | 447 | 3.78 |
Л | 408 | 3.45 |
М | 425 | 3.59 |
Н | 677 | 5.72 |
О | 1273 | 10.76 |
П | 384 | 3.25 |
Р | 815 | 6.89 |
С | 587 | 4.96 |
Т | 804 | 6.80 |
У | 254 | 2.15 |
Ф | 79 | 0.67 |
Х | 98 | 0.83 |
Ц | 73 | 0.62 |
Ч | 161 | 1.36 |
Ш | 54 | 0.46 |
Щ | 30 | 0.25 |
Ь-Ъ | 196 | 1.66 |
Ы | 220 | 1.86 |
Э | 43 | 0.36 |
Ю | 82 | 0.69 |
Я | 205 | 1.73 |
|
Части речи
Определенных частей речи (ОЧР) | 1785 слов |
Не определенных частей речи (НОЧР) | 110 слов |
Часть речи | Кол-во (шт.) | % в тексте (ОЧР - 100%) |
Существительное | 789 | 44.202 |
Глагол | 58 | 13.725 |
Местоимение-существительное | 58 | 3.249 |
Предлог | 190 | 12.045 |
Союз | 105 | 6 |
Прилагательное | 190 | 10.644 |
Наречие | 75 | 4.202 |
Местоимение-прилагательное | 55 | 3.081 |
Частица | 29 | 1.625 |
Местоименное наречие | 9 | 0.504 |
Числительное | 6 | 0.336 |
Числительное-прилагательное | 7 | 0.392 |
Междометие | 1 | 0.056 |
Часть композита - сложного слова | 1 | 0.056 |
Биграммы частей речи
В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.
| Существительное | Глагол | Местоимение-существительное | Предлог | Союз | Прилагательное | Наречие | Местоимение-прилагательное | Частица | Местоименное наречие | Числительное | Числительное-прилагательное | Междометие | Часть композита - сложного слова |
Существительное | 179.83 | 66.11 | 11.76 | 66.11 | 35.29 | 43.14 | 17.37 | 12.32 | 4.48 | 2.80 | 1.12 | 0.56 | 0.56 | 0.00 |
Глагол | 48.18 | 12.89 | 2.80 | 30.25 | 8.40 | 17.37 | 9.52 | 3.92 | 1.68 | 0.56 | 1.12 | 0.00 | 0.00 | 0.56 |
Местоимение-существительное | 8.40 | 8.96 | 1.68 | 1.68 | 1.68 | 3.92 | 2.80 | 0.56 | 1.68 | 1.12 | 0.00 | 0.00 | 0.00 | 0.00 |
Предлог | 68.91 | 5.04 | 7.84 | 2.24 | 1.68 | 17.93 | 2.80 | 8.96 | 0.56 | 0.00 | 1.12 | 3.36 | 0.00 | 0.00 |
Союз | 21.29 | 10.08 | 3.92 | 8.96 | 1.68 | 4.48 | 3.92 | 2.24 | 2.24 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Прилагательное | 85.15 | 6.16 | 0.00 | 2.24 | 4.48 | 7.28 | 0.00 | 0.56 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Наречие | 3.36 | 16.25 | 1.12 | 3.92 | 1.68 | 7.28 | 3.36 | 1.68 | 2.80 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 |
Местоимение-прилагательное | 17.93 | 1.68 | 2.80 | 1.12 | 1.12 | 2.80 | 0.56 | 0.56 | 2.24 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Частица | 3.36 | 8.40 | 0.00 | 2.80 | 0.56 | 0.56 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Местоименное наречие | 0.00 | 1.68 | 0.00 | 0.00 | 2.24 | 0.56 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Числительное | 2.80 | 0.00 | 0.00 | 0.00 | 0.00 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Числительное-прилагательное | 2.80 | 0.00 | 0.56 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Междометие | 0.00 | 0.00 | 0.00 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.56 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Части речи на позициях в предложении
Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»
| Номер слова в предложении |
| 1 | 2 | 3 | 4 | 5 |
Существительное | 24.43 | 43.93 | 45.00 | 38.61 | 43.43 |
Глагол | 12.21 | 10.28 | 17.00 | 14.85 | 18.18 |
Местоимение-существительное | 6.11 | 7.48 | 7.00 | 2.97 | 1.01 |
Предлог | 22.90 | 12.15 | 13.00 | 15.84 | 13.13 |
Союз | 10.69 | 2.80 | 4.00 | 3.96 | 4.04 |
Прилагательное | 6.87 | 5.61 | 5.00 | 12.87 | 12.12 |
Наречие | 7.63 | 3.74 | 5.00 | 5.94 | 4.04 |
Местоимение-прилагательное | 6.11 | 6.54 | 1.00 | 2.97 | 3.03 |
Частица | 0.76 | 2.80 | 3.00 | 1.98 | 0.00 |
Местоименное наречие | 0.76 | 0.00 | 0.00 | 0.00 | 0.00 |
Числительное | 0.76 | 0.00 | 0.00 | 0.00 | 1.01 |
Числительное-прилагательное | 0.76 | 4.67 | 0.00 | 0.00 | 0.00 |
Междометие | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 6 | 7 | 8 | 9 | 10 |
Существительное | 46.32 | 51.61 | 39.33 | 42.68 | 52.56 |
Глагол | 12.63 | 20.43 | 10.11 | 14.63 | 19.23 |
Местоимение-существительное | 1.05 | 1.08 | 2.25 | 2.44 | 1.28 |
Предлог | 7.37 | 11.83 | 20.22 | 8.54 | 7.69 |
Союз | 9.47 | 4.30 | 3.37 | 4.88 | 1.28 |
Прилагательное | 13.68 | 6.45 | 11.24 | 15.85 | 8.97 |
Наречие | 4.21 | 2.15 | 5.62 | 4.88 | 1.28 |
Местоимение-прилагательное | 0.00 | 1.08 | 4.49 | 3.66 | 6.41 |
Частица | 2.11 | 1.08 | 2.25 | 1.22 | 1.28 |
Местоименное наречие | 1.05 | 0.00 | 0.00 | 1.22 | 0.00 |
Числительное | 2.11 | 0.00 | 0.00 | 0.00 | 0.00 |
Числительное-прилагательное | 0.00 | 0.00 | 1.12 | 0.00 | 0.00 |
Междометие | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
| Номер слова в предложении |
| 11 | 12 | 13 | 14 | 15 |
Существительное | 40.00 | 47.83 | 42.37 | 34.48 | 40.74 |
Глагол | 14.67 | 7.25 | 15.25 | 17.24 | 9.26 |
Местоимение-существительное | 2.67 | 5.80 | 3.39 | 3.45 | 5.56 |
Предлог | 10.67 | 14.49 | 8.47 | 3.45 | 7.41 |
Союз | 9.33 | 0.00 | 11.86 | 8.62 | 7.41 |
Прилагательное | 12.00 | 10.14 | 8.47 | 17.24 | 14.81 |
Наречие | 6.67 | 5.80 | 6.78 | 10.34 | 3.70 |
Местоимение-прилагательное | 2.67 | 5.80 | 1.69 | 1.72 | 5.56 |
Частица | 1.33 | 0.00 | 1.69 | 3.45 | 1.85 |
Местоименное наречие | 0.00 | 1.45 | 0.00 | 0.00 | 1.85 |
Числительное | 0.00 | 1.45 | 0.00 | 0.00 | 0.00 |
Числительное-прилагательное | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Междометие | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 |
Часть композита - сложного слова | 0.00 | 0.00 | 0.00 | 0.00 | 1.85 |
Последние комментарии
1 день 1 час назад
1 день 8 часов назад
1 день 8 часов назад
1 день 8 часов назад
1 день 8 часов назад
1 день 8 часов назад