КулЛиб - Классная библиотека! Скачать книги бесплатно
Всего книг - 719573 томов
Объем библиотеки - 1440 Гб.
Всего авторов - 276253
Пользователей - 125349

Последние комментарии

Новое на форуме

Новое в блогах

Впечатления

sewowich про Евтушенко: Отряд (Боевая фантастика)

2medicus: Лучше вспомни, как почти вся Европа с 1939 по 1945 была товарищем по оружию для германского вермахта: шла в Ваффен СС, устраивала холокост, пекла снаряды для Третьего рейха. А с 1933 по 39 и позже англосаксонские корпорации вкладывали в индустрию Третьего рейха, "Форд" и "Дженерал Моторс" ставили там свои заводы. А 17 сентября 1939, когда советские войска вошли в Зап.Белоруссию и Зап.Украину (которые, между прочим, были ранее захвачены Польшей

  подробнее ...

Рейтинг: +1 ( 1 за, 0 против).
medicus про Евтушенко: Отряд (Боевая фантастика)

cit anno:
"Но чтобы смертельные враги — бойцы Рабоче — Крестьянской Красной Армии и солдаты германского вермахта стали товарищами по оружию, должно случиться что — то из ряда вон выходящее"

Как в 39-м, когда они уже были товарищами по оружию?

Рейтинг: 0 ( 2 за, 2 против).
iv4f3dorov про Лопатин: Приказ простой… (Альтернативная история)

Дочитал до строчки:"...а Пиррова победа комбату совсем не требовалась, это плохо отразится в резюме." Афтырь очередной щегол-недоносок с антисоветским говнищем в башке. ДЭбил, в СА у офицеров было личное дело, а резюме у недоносков вроде тебя.

Рейтинг: +3 ( 4 за, 1 против).
medicus про Демина: Не выпускайте чудовищ из шкафа (Детективная фантастика)

Очень. Рублёные. Фразы. По несколько слов. Каждая. Слог от этого выглядит специфическим. Тяжко это читать. Трудно продираться. Устал. На 12% бросил.

Рейтинг: +1 ( 1 за, 0 против).
kiyanyn про Деревянко: Что не так со структурой атомов? (Физика)

Первый признак псевдонаучного бреда на физмат темы - отсутствие формул (или наличие тривиальных, на уровне школьной арифметики) - имеется :)

Отсутствие ссылок на чужие работы - тоже.

Да эти все формальные критерии и ни к чему, и так видно, что автор в физике остановился на уровне учебника 6-7 класса. Даже на советскую "Детскую энциклопедию" не тянет.

Чего их всех так тянет именно в физику? писали б что-то юридически-экономическое

  подробнее ...

Рейтинг: +4 ( 4 за, 0 против).

Машинное обучение доступным языком [Елена Капаца] (pdf) читать постранично, страница - 1

-  Машинное обучение доступным языком  [Ознакомительный фрагмент] 1.21 Мб, 25с. скачать: (pdf) - (pdf+fbd)  читать: (полностью) - (постранично) - Елена Капаца

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

Елена Капаца
Машинное обучение
доступным языком

«Автор»
2023

Капаца Е.
Машинное обучение доступным языком / Е. Капаца — «Автор»,
2023

ISBN 978-5-0060-1962-1
Краткий гайд для новичков по машинному и глубокому обучению с разбором
кода. Здесь вы найдете необходимый минимум по предмету, истолкованный
языком, понятным школьнику. Некоторые разделы написаны с помощью
chatGPT. По прочтении вы избавитесь от страха перед технологией и освоите
базовый инструментарий подготовки данных, их загрузке в модель и ее
донастройки. Подходит студентам технических специальностей.

ISBN 978-5-0060-1962-1

© Капаца Е., 2023
© Автор, 2023

Е. Капаца. «Машинное обучение доступным языком»

Содержание
Введение
Машинное обучение
Данные
Классическая таблица
Текстовый документ
Графы
Аудиодорожки
Временной ряд
Последовательные данные
Пространственные данные
Изображения
ETL
Облачные вычисления
DWH
EDA
Удаление дубликатов
Обработка пропусков
Конец ознакомительного фрагмента.

5
8
9
9
10
10
11
11
12
13
14
16
16
18
20
23
24
25

4

Е. Капаца. «Машинное обучение доступным языком»

Елена Капаца
Машинное обучение доступным языком
Введение
Приступая к изучению машинного обучения, студенты легко и непринужденно добиваются… запутанности. Пара-тройка непонятных терминов или неясностей при расчете – и все:
мозг теряет нить и начинает воспринимать “по диагонали”. Продираться через непонятное
довольно трудоёмко. Не каждый день у нас есть ресурс догугливать непонятное. Не каждый
запрос в Google даст лаконичный понятный ответ.
Моя задача – описать детали этой мозаики языком, понятным старшекласснику. Я намеренно буду избегать формул, потому что знаю: каждая из них сокращает число читателей.
Однако в книге будет код, и он будет расширенно комментироваться.
Минимальное требование к читателю – знание основ Python. Книга фокусируется на
машинном обучении, и потому останавливаться на терминах вроде “переменной” и “списка”
я не буду.
Если вы чувствуете, что пересиливаете себя при чтении, лучше сделайте перерыв. В Data
Science будет предостаточно информации, однако в этой книге я постаралась собрать повторяющиеся в работе термины. Добиться их понимания особенно важно.
Некоторые главы будут базироваться на полноценных моделях и скриптах. В машинном
обучении принято использовать так называемые ноутбуки – наборы ячеек с исполняемыми
кусками кода:

5

Е. Капаца. «Машинное обучение доступным языком»

Все используемые в дальнейшем ноутбуки можно открыть, запустить и скопировать себе
для дальнейших экспериментов. Инструменты ML имеют свойство совершенствоваться, а это
значит, что спустя 3-4 года после выхода книги некоторые участки кода вам придется отлаживать с помощью поисковиков.
Машинное обучение – это абстрактная концепция. Ее основные компоненты стоит описывать просто, пускай даже это вызовет раздражение профессионалов. Эта книга – серия
взаимосвязанных статей. Их основная цель – осветить основные и популярные термины во
взаимосвязи друг с другом. Ключевые понятия при первом упоминании я буду дополнять
англоязычным термином. Так вы всегда сможете с легкостью отыскать дополнительные материалы.
Немалое влияние на меня оказал бестселлер Максима Ильяхова и Людмилы Сарычевой
“Пиши, сокращай”. Потому эта книга написана в информационном стиле 1 и изобилует упрощениями. Если вы сохраните по прочтении ощущение удобства чтения и желание взбираться
на эту познавательную гору дальше, то моя цель достигнута.
1

Информационный стиль – инструмент для очистки текста от лишнего, для обнажения самой сердцевины текста.

6

Е. Капаца. «Машинное обучение доступным языком»

Вы всегда можете “напитаться” полноценными зубодробительными статьями на моем
сайте helenkapatsa.ru.
Приятного чтения! Я буду рада вашим предложениям и фидбэку в целом
(kapatsahelen@gmail.com). Вы также можете запросить PDF-версию с цветовой разметкой кода.
Это упростит восприятие материала.

7

Е. Капаца. «Машинное обучение доступным языком»

Машинное обучение
Что же это такое? Машинное обучение (machine learning, ML) – наука о том, как заставить компьютеры выполнять объемную вычислительную задачу без явного программирования.
Классическим алгоритмам дают точные и полные правила для выполнения задачи, моделям Машинного обучения – данные. Мы говорим, что «подгоняем модель к данным» или
«модель обучена на данных».
Проиллюстрируем это на простом примере. Предположим, мы хотим спрогнозировать
цену дачного дома на основе:
• площади
• размера придомового участка
• количества комнат.
Мы могли бы попытаться построить классический алгоритм, который решает эту проблему. Этот алгоритм возьмет три вышеупомянутых признака (feature) и выдаст прогнозируемую цену на основе явного правила. Но на практике эта формула часто неочевидна.
Однако мы