Статистика лингвистического анализа библиотеки и средние значения всех книг
Анализ проводился только над русскоязычными текстами. Минимальный размер обрабатываемой fb2 книги - 50 Кб. За одну страницу принято среднее значение в 1800 символов. Уникальные слова - это все встреченные уникальные слова при разборе (включая слова с ошибками, в разных склонениях, придуманные слова и имена и т.д.)
Суммарные данные анализа:
Всего обработано | 516013 книг |
Суммарная длинна текстов | 208,210,045,068 знаков |
Суммарная длинна диалогов | 57,443,647,151 знаков |
Суммарное количество слов | 31,281,380,910 слов |
Всего страниц | 115,930,137 страниц |
Всего предложений | 2,806,095,405 предложений |
Средние данные книг:
Средняя длинна текста | 403498 знаков |
Средняя длинна диалогов | 111322 знаков |
Среднее количество слов в произведении | 60621 слов |
Среднее количество страниц в произведении | 225 страниц |
Средняя длина слова | 5.29 знаков |
Среднее количество предложений в произведении | 5438 предложений |
Средняя длина предложения | 80 знаков |
Средняя доля диалогов в тексте | 27 % |
Средняя доля авторского текста | 73 % |
СДП диалогов | 69 знаков |
СДП авторского текста | 96 знаков |
Средний активный словарный запас
Всего использовано уникальных слов | 2,474,436 слов |
Средний активный авторский словарный запас (САСЗ) | 12825 |
Средний активный авторский не словарный запас (САНСЗ) | 463 |
Удельный САСЗ на 3000 слов текста | 1488 |
Удельный САСЗ на 10000 слов текста | 3857 |
Удельный САСЗ на 100000 слов текста | 20886 |
Статистика букв и знаков препинания
Всего букв | 164,943,013,073 букв |
Всего знаков препинания | 7,241,675,792 знаков |
Знак | Суммарное количество (шт.) | Суммарное среднее количество на 1000 слов (шт.) |
, запятая | 3,526,185,221 | 112.58 |
. точка | 2,472,854,761 | 80.42 |
- тире | 412,222,283 | 14.05 |
? вопросительный знак | 275,248,858 | 9.27 |
! восклицательный знак | 191,816,808 | 7.01 |
... многоточие | 21,213,218 | 0.83 |
!.. восклицательный знак с многоточием | 5,268,637 | 0.2 |
?.. вопросительный знак с многоточием | 4,212,335 | 0.15 |
!!! тройной восклицательный знак | 1,724,025 | 0.08 |
?! вопросительный знак с восклицанием | 9,949,755 | 0.39 |
" кавычка | 38,792,038 | 1.44 |
() скобки | 64,203,161 | 2.09 |
: двоеточие | 151,487,899 | 5.18 |
; точка с запятой | 66,496,933 | 2.1 |
Буква | Всего (шт.) | Средняя частота использования (в %) |
А | 13,446,477,697 | 8.21 |
Б | 2,761,943,480 | 1.68 |
В | 7,277,285,480 | 4.38 |
Г | 2,840,961,238 | 1.71 |
Д | 4,975,407,945 | 3.02 |
Е-Ё | 13,848,382,347 | 8.38 |
Ж | 2,840,961,238 | 1.71 |
З | 2,773,552,326 | 1.69 |
И-Й | 13,283,583,797 | 7.97 |
К | 5,564,238,841 | 3.41 |
Л | 7,894,750,625 | 4.8 |
М | 5,341,444,707 | 3.24 |
Н | 10,906,622,166 | 6.57 |
О | 18,209,518,366 | 10.98 |
П | 4,656,556,423 | 2.82 |
Р | 7,492,513,618 | 4.49 |
С | 8,871,348,825 | 5.34 |
Т | 10,204,157,567 | 6.21 |
У | 4,601,648,157 | 2.83 |
Ф | 319,358,664 | 0.19 |
Х | 1,499,729,957 | 0.9 |
Ц | 650,065,762 | 0.39 |
Ч | 2,414,543,707 | 1.48 |
Ш | 1,348,573,507 | 0.84 |
Щ | 594,024,237 | 0.35 |
Ь-Ъ | 3,246,291,176 | 1.99 |
Ы | 3,098,858,093 | 1.89 |
Э | 569,163,295 | 0.34 |
Ю | 1,013,673,362 | 0.62 |
Я | 3,555,834,458 | 2.17 |
|
Сумма частей речи
Часть речи | Всего в текстах (шт.) | средний % в текстах |
Существительное | 8,534,388,742 | 23.17 |
Глагол | 2,978,762,003 | 20.7 |
Местоимение-существительное | 2,978,762,003 | 15.72 |
Предлог | 2,256,701,271 | 10.35 |
Союз | 2,716,374,327 | 8 |
Прилагательное | 2,256,701,271 | 5.95 |
Наречие | 1,852,201,040 | 5.68 |
Местоимение-прилагательное | 1,388,510,615 | 4.16 |
Частица | 1,445,227,641 | 3.77 |
Местоименное наречие | 506,359,186 | 1.39 |
Числительное | 178,991,005 | 0.53 |
Числительное-прилагательное | 73,237,184 | 0.16 |
Междометие | 31,498,143 | 0.04 |
Часть композита - сложного слова | 5,046,129 | 0.01 |
Последние комментарии
3 минут 59 секунд назад
28 минут 2 секунд назад
3 часов 20 минут назад
3 часов 37 минут назад
7 часов 6 минут назад
7 часов 39 минут назад