КулЛиб - Классная библиотека! Скачать книги бесплатно
Всего книг - 706140 томов
Объем библиотеки - 1347 Гб.
Всего авторов - 272734
Пользователей - 124656

Последние комментарии

Новое на форуме

Новое в блогах

Впечатления

a3flex про Невзоров: Искусство оскорблять (Публицистика)

Да, тварь редкостная.

Рейтинг: 0 ( 1 за, 1 против).
DXBCKT про Гончарова: Крылья Руси (Героическая фантастика)

Обычно я стараюсь никогда не «копировать» одних впечатлений сразу о нескольких томах, однако в отношении части четвертой (и пятой) это похоже единственно правильное решение))

По сути — что четвертая, что пятая часть, это некий «финал пьесы», в котором слелись как многочисленные дворцовые интриги (тайны, заговоры, перевороты и пр), так и вся «геополитика» в целом...

В остальном же — единственная возможная претензия (субъективная

  подробнее ...

Рейтинг: 0 ( 0 за, 0 против).
medicus про Федотов: Ну, привет, медведь! (Попаданцы)

По аннотации сложилось впечатление, что это очередная писанина про аристократа, написанная рукой дегенерата.

cit anno: "...офигевшая в край родня [...] не будь я барон Буровин!".

Барон. "Офигевшая" родня. Не охамевшая, не обнаглевшая, не осмелевшая, не распустившаяся... Они же там, поди, имения, фабрики и миллионы делят, а не полторашку "Жигулёвского" на кухне "хрущёвки". Но хочется, хочется глянуть внутрь, вдруг всё не так плохо.

Итак: главный

  подробнее ...

Рейтинг: 0 ( 0 за, 0 против).
Dima1988 про Турчинов: Казка про Добромола (Юмористическая проза)

А продовження буде ?

Рейтинг: -1 ( 0 за, 1 против).
Colourban про Невзоров: Искусство оскорблять (Публицистика)

Автор просто восхитительная гнида. Даже слушая перлы Валерии Ильиничны Новодворской я такой мерзости и представить не мог. И дело, естественно, не в том, как автор определяет Путина, это личное мнение автора, на которое он, безусловно, имеет право. Дело в том, какие миазмы автор выдаёт о своей родине, то есть стране, где он родился, вырос, получил образование и благополучно прожил всё своё сытое, но, как вдруг выясняется, абсолютно

  подробнее ...

Рейтинг: +2 ( 3 за, 1 против).

Элементы прикладной математики [Яков Борисович Зельдович] (pdf) читать онлайн

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

Зельдович Я.Б.
Мышкис А.Д.

Элементы прикладной
математики

МОСКВА
ФИЗМАТЛИТ ®

УДК 512.6, 517, 519.2
ББК 22.14, 22.16, 22.17
З 50
З е л ь д о в и ч Я. Б., М ы ш к и с А. Д. Элементы прикладной математики. — 5-е изд., испр. и дополн. — М.: ФИЗМАТЛИТ, 2008. — 592 с. —
ISBN 978-5-9221-0775-4.
В задачах физики, техники и в практических вычислениях используются численные и графические методы, ряды. В книге содержатся полезные
приемы таких вычислений. В наглядной форме даются основные сведения о
комплексных переменных, линейных дифференциальных уравнениях, векторах
и векторных полях и вариационном исчислении.
Формальные доказательства в большинстве случаев заменены наводящими
соображениями; за счет этого упрощено и облегчено применение математических понятий. Подробно анализируются некоторые физические задачи, в
частности относящиеся к оптике и механике.
Для студентов технических университетов в качестве пособия к изучаемому ими курсу математики.

c ФИЗМАТЛИТ, 2008


ISBN 978-5-9221-0775-4

c Я. Б. Зельдович, А. Д. Мышкис, 2008


ОГЛАВЛЕНИЕ
Предисловие к третьему изданию . . . . . . . . . . . . . . . . . . . . . . 7
Предисловие к пятому изданию. . . . . . . . . . . . . . . . . . . . . . . 10
Г л а в а I. Некоторые численные методы . . . . . .
§ 1. Численное интегрирование. . . . . . . . . .
§ 2. Вычисление сумм при помощи интегралов
§ 3. Численное решение уравнений . . . . . . .
Ответы и решения. . . . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

11
12
17
25
34

Г л а в а II. Математическая обработка результатов опыта . . . . .
§ 1. Таблицы и разности. . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Интегрирование и дифференцирование функций,
заданных таблично . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 3. Подбор формул по данным опыта по методу
наименьших квадратов . . . . . . . . . . . . . . . . . . . . . . . .
§ 4. Графический способ подбора формул . . . . . . . . . . . . . .
Ответы и решения. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36

Г л а в а III. Дополнительные сведения об интегралах и рядах
§ 1. Несобственные интегралы . . . . . . . . . . . . . . . . . .
§ 2. Интегрирование быстроменяющихся функций . . . . .
§ 3. Формула Стирлинга . . . . . . . . . . . . . . . . . . . . . .
§ 4. Интегрирование быстроколеблющихся функций . . . .
§ 5. Числовые ряды. . . . . . . . . . . . . . . . . . . . . . . . . .
§ 6. Интегралы, зависящие от параметра . . . . . . . . . . . .
Ответы и решения. . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

61
61
69
77
79
82
93
97

Г л а в а IV. Функции нескольких переменных . . . . . . . . . .
§ 1. Частные производные. . . . . . . . . . . . . . . . . . . . . .
§ 2. Геометрический смысл функции двух переменных . . .
§ 3. Неявные функции . . . . . . . . . . . . . . . . . . . . . . . .
§ 4. Радиолампа . . . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 5. Огибающая семейства линий . . . . . . . . . . . . . . . . .
§ 6. Ряд Тейлора и задачи на экстремум . . . . . . . . . . . . .
§ 7. Кратные интегралы . . . . . . . . . . . . . . . . . . . . . . .
§ 8. Многомерное пространство и число степеней свободы .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

100
100
107
109
117
120
122
129
139
143

36
41
45
51
58

Г л а в а V. Функции комплексного переменного . . . . . . . . . . . 146
§ 1. Простейшие свойства комплексных чисел. . . . . . . . . . . 146
§ 2. Сопряженные комплексные числа . . . . . . . . . . . . . . . . 149

4

ОГЛАВЛЕНИЕ

ОГЛАВЛЕНИЕ

§ 3. Возведение в мнимую степень. Формула Эйлера .
§ 4. Логарифмы и корни . . . . . . . . . . . . . . . . . . . .
§ 5. Описание гармонических колебаний с помощью
показательной функции от мнимого аргумента. . .
§ 6. Производная функции комплексного переменного
§ 7. Гармонические функции . . . . . . . . . . . . . . . . .
§ 8. Интеграл от функции комплексного переменного .
§ 9. Вычеты . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . .
Г л а в а VI. Дельта&функция Дирака . . . . . . . .
§ 1. Дельта@функция Дирака δ(x) . . . . . . . .
§ 2. Функция Грина. . . . . . . . . . . . . . . . .
§ 3. Функции, связанные с дельта@функцией .
§ 4. Понятие об интеграле Стилтьеса. . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

. . . . . 152
. . . . . 156
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

159
166
168
170
175
183

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

187
187
192
197
202
203

Г л а в а VII. Дифференциальные уравнения . . . . . . . . . . . .
§ 1. Геометрический смысл дифференциального уравнения
первого порядка . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Интегрируемые типы уравнений первого порядка. . . .
§ 3. Линейные однородные уравнения второго порядка
с постоянными коэффициентами . . . . . . . . . . . . . .
§ 4. Простейшее линейное неоднородное уравнение
второго порядка . . . . . . . . . . . . . . . . . . . . . . . . .
§ 5. Линейные неоднородные уравнения второго порядка
с постоянными коэффициентами . . . . . . . . . . . . . .
§ 6. Устойчивые и неустойчивые решения . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . 205

. . 228
. . 235
. . 240

Г л а в а VIII. Дальнейшие сведения о дифференциальных
уравнениях . . . . . . . . . . . . . . . . . . . . . . .
§ 1. Особые точки . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Системы дифференциальных уравнений . . . . . . . .
§ 3. Определители и решение линейных систем
с постоянными коэффициентами . . . . . . . . . . . . .
§ 4. Устойчивость по Ляпунову состояния равновесия . .
§ 5. Построение приближенных формул для решения . . .
§ 6. Адиабатическое изменение решения . . . . . . . . . . .
§ 7. Численное решение дифференциальных уравнений .
§ 8. Краевые задачи . . . . . . . . . . . . . . . . . . . . . . . . .
§ 9. Пограничный слой. . . . . . . . . . . . . . . . . . . . . . .
§ 10. Подобие явлений . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

. . 205
. . 208
. . 216
. . 222

. . . 242
. . . 242
. . . 244
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

247
252
255
263
266
275
281
282

5

§ 11. Применяйте компьютеры! . . . . . . . . . . . . . . . . . . . . 286
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
Г л а в а IX. Векторы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296

§ 1. Линейные действия над векторами . .
§ 2. Скалярное произведение векторов . .
§ 3. Производная от вектора . . . . . . . . .
§ 4. Движение материальной точки . . . . .
§ 5. Понятие о тензорах . . . . . . . . . . . .
§ 6. Многомерное векторное пространство
Ответы и решения . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

297
301
304
306
310
314
318

Г л а в а X. Теория поля . . . . . . . . . . . . . . . . . . . . .
§ 1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Скалярное поле и градиент . . . . . . . . . . . . . .
§ 3. Потенциальная энергия и cила . . . . . . . . . . . .
§ 4. Поле скорости и поток . . . . . . . . . . . . . . . . .
§ 5. Электростатическое поле, его потенциал и поток
§ 6. Примеры . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 7. Общее векторное поле и его дивергенция . . . . .
§ 8. Дивергенция поля скорости и уравнение
неразрывности . . . . . . . . . . . . . . . . . . . . . .
§ 9. Дивергенция электрического поля
и уравнение Пуассона. . . . . . . . . . . . . . . . . .
§ 10. Вектор площадки и давление . . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

321
321
322
326
332
335
339
348

. . . . . . 352
. . . . . . 355
. . . . . . 358
. . . . . . 363

Г л а в а XI. Векторное произведение и вращение . . . . .
§ 1. Векторное произведение векторов . . . . . . . . . . .
§ 2. Некоторые приложения к механике . . . . . . . . . .
§ 3. Движение в поле центральных сил . . . . . . . . . .
§ 4. Вращение твердого тела . . . . . . . . . . . . . . . . .
§ 5. Симметрические и антисимметрические тензоры .
§ 6. Истинные векторы и псевдовекторы . . . . . . . . .
§ 7. Ротор векторного поля . . . . . . . . . . . . . . . . . .
§ 8. Оператор Гамильтона «набла» . . . . . . . . . . . . .
§ 9. Потенциальные поля . . . . . . . . . . . . . . . . . . .
§ 10. Ротор поля скорости . . . . . . . . . . . . . . . . . . .
§ 11. Магнитное поле и электрический ток . . . . . . . .
§ 12. Электромагнитное поле и уравнения Максвелла .
§ 13. Потенциал в многосвязной области . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

366
366
370
373
381
383
389
391
397
400
404
406
410
414
416

4

ОГЛАВЛЕНИЕ

ОГЛАВЛЕНИЕ

§ 3. Возведение в мнимую степень. Формула Эйлера .
§ 4. Логарифмы и корни . . . . . . . . . . . . . . . . . . . .
§ 5. Описание гармонических колебаний с помощью
показательной функции от мнимого аргумента. . .
§ 6. Производная функции комплексного переменного
§ 7. Гармонические функции . . . . . . . . . . . . . . . . .
§ 8. Интеграл от функции комплексного переменного .
§ 9. Вычеты . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . .
Г л а в а VI. Дельта&функция Дирака . . . . . . . .
§ 1. Дельта@функция Дирака δ(x) . . . . . . . .
§ 2. Функция Грина. . . . . . . . . . . . . . . . .
§ 3. Функции, связанные с дельта@функцией .
§ 4. Понятие об интеграле Стилтьеса. . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

. . . . . 152
. . . . . 156
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

159
166
168
170
175
183

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

187
187
192
197
202
203

Г л а в а VII. Дифференциальные уравнения . . . . . . . . . . . .
§ 1. Геометрический смысл дифференциального уравнения
первого порядка . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Интегрируемые типы уравнений первого порядка. . . .
§ 3. Линейные однородные уравнения второго порядка
с постоянными коэффициентами . . . . . . . . . . . . . .
§ 4. Простейшее линейное неоднородное уравнение
второго порядка . . . . . . . . . . . . . . . . . . . . . . . . .
§ 5. Линейные неоднородные уравнения второго порядка
с постоянными коэффициентами . . . . . . . . . . . . . .
§ 6. Устойчивые и неустойчивые решения . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . . .

. . 205

. . 228
. . 235
. . 240

Г л а в а VIII. Дальнейшие сведения о дифференциальных
уравнениях . . . . . . . . . . . . . . . . . . . . . . .
§ 1. Особые точки . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Системы дифференциальных уравнений . . . . . . . .
§ 3. Определители и решение линейных систем
с постоянными коэффициентами . . . . . . . . . . . . .
§ 4. Устойчивость по Ляпунову состояния равновесия . .
§ 5. Построение приближенных формул для решения . . .
§ 6. Адиабатическое изменение решения . . . . . . . . . . .
§ 7. Численное решение дифференциальных уравнений .
§ 8. Краевые задачи . . . . . . . . . . . . . . . . . . . . . . . . .
§ 9. Пограничный слой. . . . . . . . . . . . . . . . . . . . . . .
§ 10. Подобие явлений . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

. . 205
. . 208
. . 216
. . 222

. . . 242
. . . 242
. . . 244
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

247
252
255
263
266
275
281
282

5

§ 11. Применяйте компьютеры! . . . . . . . . . . . . . . . . . . . . 286
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
Г л а в а IX. Векторы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296

§ 1. Линейные действия над векторами . .
§ 2. Скалярное произведение векторов . .
§ 3. Производная от вектора . . . . . . . . .
§ 4. Движение материальной точки . . . . .
§ 5. Понятие о тензорах . . . . . . . . . . . .
§ 6. Многомерное векторное пространство
Ответы и решения . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

297
301
304
306
310
314
318

Г л а в а X. Теория поля . . . . . . . . . . . . . . . . . . . . .
§ 1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Скалярное поле и градиент . . . . . . . . . . . . . .
§ 3. Потенциальная энергия и cила . . . . . . . . . . . .
§ 4. Поле скорости и поток . . . . . . . . . . . . . . . . .
§ 5. Электростатическое поле, его потенциал и поток
§ 6. Примеры . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 7. Общее векторное поле и его дивергенция . . . . .
§ 8. Дивергенция поля скорости и уравнение
неразрывности . . . . . . . . . . . . . . . . . . . . . .
§ 9. Дивергенция электрического поля
и уравнение Пуассона. . . . . . . . . . . . . . . . . .
§ 10. Вектор площадки и давление . . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

321
321
322
326
332
335
339
348

. . . . . . 352
. . . . . . 355
. . . . . . 358
. . . . . . 363

Г л а в а XI. Векторное произведение и вращение . . . . .
§ 1. Векторное произведение векторов . . . . . . . . . . .
§ 2. Некоторые приложения к механике . . . . . . . . . .
§ 3. Движение в поле центральных сил . . . . . . . . . .
§ 4. Вращение твердого тела . . . . . . . . . . . . . . . . .
§ 5. Симметрические и антисимметрические тензоры .
§ 6. Истинные векторы и псевдовекторы . . . . . . . . .
§ 7. Ротор векторного поля . . . . . . . . . . . . . . . . . .
§ 8. Оператор Гамильтона «набла» . . . . . . . . . . . . .
§ 9. Потенциальные поля . . . . . . . . . . . . . . . . . . .
§ 10. Ротор поля скорости . . . . . . . . . . . . . . . . . . .
§ 11. Магнитное поле и электрический ток . . . . . . . .
§ 12. Электромагнитное поле и уравнения Максвелла .
§ 13. Потенциал в многосвязной области . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

366
366
370
373
381
383
389
391
397
400
404
406
410
414
416

6

ОГЛАВЛЕНИЕ

Г л а в а XII. Вариационное исчисление . . . . . . . . . . . . . .
§ 1. Пример перехода от конечного числа степеней
свободы к бесконечному . . . . . . . . . . . . . . . . . . .
§ 2. Функционал. . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 3. Необходимое условие экстремума . . . . . . . . . . . . .
§ 4. Уравнение Эйлера . . . . . . . . . . . . . . . . . . . . . . .
§ 5. Всегда ли существует решение поставленной задачи?
§ 6. Варианты основной задачи . . . . . . . . . . . . . . . . .
§ 7. Условный экстремум для конечного числа степеней
свободы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 8. Условный экстремум в вариационном исчислении . .
§ 9. Задачи на экстремум с ограничениями . . . . . . . . . .
§ 10. Вариационные принципы. Принцип Ферма в оптике
§ 11. Принцип наименьшего действия . . . . . . . . . . . . .
§ 12. Прямые методы . . . . . . . . . . . . . . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

421
427
431
433
439
443

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

445
448
456
458
465
469
473

Г л а в а XIII. Теория вероятностей . . . . . . . . . . .
§ 1. Постановка вопроса . . . . . . . . . . . . . . . .
§ 2. Умножение вероятностей . . . . . . . . . . . .
§ 3. Анализ результатов многих испытаний . . .
§ 4. Энтропия. . . . . . . . . . . . . . . . . . . . . . .
§ 5. Радиоактивный распад. Формула Пуассона .
§ 6. Другой вывод распределения Пуассона . . .
§ 7. Непрерывно распределенные величины . . .
§ 8. Случай весьма большого числа испытаний .
§ 9. Корреляционная зависимость . . . . . . . . .
§ 10. О распределении простых чисел . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

479
479
482
487
499
504
508
510
515
522
527
533

Г л а в а XIV. Преобразование Фурье . . . . . . . . . . . . . . . . .
§ 1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Формулы преобразования Фурье . . . . . . . . . . . . . . .
§ 3. Причинность и дисперсионные соотношения. . . . . . . .
§ 4. Свойства преобразования Фурье. . . . . . . . . . . . . . . .
§ 5. Преобразование колокола и принцип неопределенности
§ 6. Спектральный анализ периодической функции . . . . . .
§ 7. Пространство Гильберта . . . . . . . . . . . . . . . . . . . . .
§ 8. Модуль и фаза спектральной плотности . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

538
538
542
549
554
561
566
570
575
578

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

. . . 421

Предметный указатель . . . . . . . . . . . . . . . . . . . . . . . . . . . 582

ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ
Эта книга является не систематическим учебником, а скорее, кни@
гой для чтения. На простых примерах, взятых из физики, на различных
математических задачах мы старались ввести читателя в круг идей
и методов, широко распространенных сейчас в приложениях матема@
тики к физике, технике и некоторым другим областям. Некоторые из
этих идей и методов (такие, как применение дельта@функции, принци@
па суперпозиции, получение асимптотических выражений и т.д.) еще
недостаточно освещаются в распространенных математических учеб@
никах для нематематиков, так что здесь наша книга может служить до@
полнением к этим учебникам. Нашей целью было пояснить основные
идеи математических методов и общие закономерности рассматривае@
мых явлений. Напротив, формальные доказательства, рассмотрение
исключений и усложняющих факторов по возможности опущены. Вза@
мен этого мы в некоторых местах старались входить более подробно
в физическую картину рассматриваемых процессов.
Предполагается, что читатель владеет основами дифференциально@
го и интегрального исчислений для функций одной переменной, вклю@
чая разложение таких функций в степенны′ е ряды, и может применять
эти разделы математики к решению физических задач. Достаточно (но
не необходимо!), например, знакомство с книгой Я.Б. Зельдовича
«Высшая математика для начинающих и ее приложения к физике», на
которую мы будем иногда ссылаться, обозначая ее буквами ВМ (имеет@
ся в виду издание 5, «Наука», 1970). Более того, настоящая книга в ка@
кой@то степени может рассматриваться как продолжение ВМ.
В немногих местах изложение близко книге А. Д. Мышкиса «Лекции
по высшей математике», издание 4 («Наука», 1973)*. Тем не менее на@
стоящая книга является совершенно самостоятельной, поскольку от
читателя никаких специальных познаний, помимо только что указан@
ных, не потребуется.
Содержание книги ясно из прилагаемого оглавления. Ее не обяза@
тельно читать подряд: читатель может знакомиться с интересующими
его разделами независимо от других разделов и только в явно указывае@
мых случаях из этих других разделов потребуются отдельные сведения.
* Вскоре должно выйти 5@е, значительно переработанное и дополненное издание
этой книги.

6

ОГЛАВЛЕНИЕ

Г л а в а XII. Вариационное исчисление . . . . . . . . . . . . . .
§ 1. Пример перехода от конечного числа степеней
свободы к бесконечному . . . . . . . . . . . . . . . . . . .
§ 2. Функционал. . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 3. Необходимое условие экстремума . . . . . . . . . . . . .
§ 4. Уравнение Эйлера . . . . . . . . . . . . . . . . . . . . . . .
§ 5. Всегда ли существует решение поставленной задачи?
§ 6. Варианты основной задачи . . . . . . . . . . . . . . . . .
§ 7. Условный экстремум для конечного числа степеней
свободы. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 8. Условный экстремум в вариационном исчислении . .
§ 9. Задачи на экстремум с ограничениями . . . . . . . . . .
§ 10. Вариационные принципы. Принцип Ферма в оптике
§ 11. Принцип наименьшего действия . . . . . . . . . . . . .
§ 12. Прямые методы . . . . . . . . . . . . . . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

421
427
431
433
439
443

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

445
448
456
458
465
469
473

Г л а в а XIII. Теория вероятностей . . . . . . . . . . .
§ 1. Постановка вопроса . . . . . . . . . . . . . . . .
§ 2. Умножение вероятностей . . . . . . . . . . . .
§ 3. Анализ результатов многих испытаний . . .
§ 4. Энтропия. . . . . . . . . . . . . . . . . . . . . . .
§ 5. Радиоактивный распад. Формула Пуассона .
§ 6. Другой вывод распределения Пуассона . . .
§ 7. Непрерывно распределенные величины . . .
§ 8. Случай весьма большого числа испытаний .
§ 9. Корреляционная зависимость . . . . . . . . .
§ 10. О распределении простых чисел . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

479
479
482
487
499
504
508
510
515
522
527
533

Г л а в а XIV. Преобразование Фурье . . . . . . . . . . . . . . . . .
§ 1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
§ 2. Формулы преобразования Фурье . . . . . . . . . . . . . . .
§ 3. Причинность и дисперсионные соотношения. . . . . . . .
§ 4. Свойства преобразования Фурье. . . . . . . . . . . . . . . .
§ 5. Преобразование колокола и принцип неопределенности
§ 6. Спектральный анализ периодической функции . . . . . .
§ 7. Пространство Гильберта . . . . . . . . . . . . . . . . . . . . .
§ 8. Модуль и фаза спектральной плотности . . . . . . . . . . .
Ответы и решения . . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

538
538
542
549
554
561
566
570
575
578

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.

. . . 421

Предметный указатель . . . . . . . . . . . . . . . . . . . . . . . . . . . 582

ПРЕДИСЛОВИЕ К ТРЕТЬЕМУ ИЗДАНИЮ
Эта книга является не систематическим учебником, а скорее, кни@
гой для чтения. На простых примерах, взятых из физики, на различных
математических задачах мы старались ввести читателя в круг идей
и методов, широко распространенных сейчас в приложениях матема@
тики к физике, технике и некоторым другим областям. Некоторые из
этих идей и методов (такие, как применение дельта@функции, принци@
па суперпозиции, получение асимптотических выражений и т.д.) еще
недостаточно освещаются в распространенных математических учеб@
никах для нематематиков, так что здесь наша книга может служить до@
полнением к этим учебникам. Нашей целью было пояснить основные
идеи математических методов и общие закономерности рассматривае@
мых явлений. Напротив, формальные доказательства, рассмотрение
исключений и усложняющих факторов по возможности опущены. Вза@
мен этого мы в некоторых местах старались входить более подробно
в физическую картину рассматриваемых процессов.
Предполагается, что читатель владеет основами дифференциально@
го и интегрального исчислений для функций одной переменной, вклю@
чая разложение таких функций в степенны′ е ряды, и может применять
эти разделы математики к решению физических задач. Достаточно (но
не необходимо!), например, знакомство с книгой Я.Б. Зельдовича
«Высшая математика для начинающих и ее приложения к физике», на
которую мы будем иногда ссылаться, обозначая ее буквами ВМ (имеет@
ся в виду издание 5, «Наука», 1970). Более того, настоящая книга в ка@
кой@то степени может рассматриваться как продолжение ВМ.
В немногих местах изложение близко книге А. Д. Мышкиса «Лекции
по высшей математике», издание 4 («Наука», 1973)*. Тем не менее на@
стоящая книга является совершенно самостоятельной, поскольку от
читателя никаких специальных познаний, помимо только что указан@
ных, не потребуется.
Содержание книги ясно из прилагаемого оглавления. Ее не обяза@
тельно читать подряд: читатель может знакомиться с интересующими
его разделами независимо от других разделов и только в явно указывае@
мых случаях из этих других разделов потребуются отдельные сведения.
* Вскоре должно выйти 5@е, значительно переработанное и дополненное издание
этой книги.

8

ПРЕДИСЛОВИЕ

Поэтому для удобства в начале отдельных глав и параграфов указыва@
ются сведения из предыдущих глав, знакомство с которыми необходи@
мо. Нумерация параграфов и формул производится в каждой главе
самостоятельно, а при ссылках в пределах одной главы ее номер не ука@
зывается.
Книга может быть полезна студентам — инженерам, физикам и
представителям других специальностей (в том числе, заочникам), на@
чиная, примерно, с середины второго семестра 1@го курса в качестве по@
собия к изучаемому ими курсу математики. Она пригодна и практику,
если он захочет подробней ознакомиться с тем или иным разделом ма@
тематики, который может понадобиться ему в его работе.
Несомненно, что разнородный материал трудно читать активно. Це@
леустремленная проработка обычно подразумевает читателя, перед кото@
рым жизнь поставила в данный момент одну определенную задачу. Такой
читатель склонен пропускать все, что не относится к его задаче.
Возникает общий вопрос: целесообразно ли читать подобную книгу
«впрок», не будет ли такое чтение поверхностным, не окажутся ли при@
веденные в ней советы забытыми вскоре после прочтения?
В ответ на это авторы могут высказать два аргумента.
Во@первых, мы везде старались давать не только практические ре@
цепты, но и те глубокие общие идеи, из которых эти рецепты возникают.
Такие идеи обогащают интеллект читателя, развивают его научный
кругозор, дают возможность по@иному взглянуть на окружающий мир
и потому задерживаются гораздо прочнее.
Второй аргумент относится к психологии памяти. Очень часто бы@
вает так, что хотя Вы не можете воспроизвести прочитанное все под@
ряд, в том порядке, в котором материал Вам преподносился, но этот
материал не изгладился из памяти! Отдельные его части могут быть
воспроизведены Вами при ассоциативном воспоминании, например,
когда Вы сталкиваетесь с задачей, требующей того или иного приема.
Даже смутное воспоминание о том, где можно найти этот материал,
и то часто оказывается полезным*. Говоря грубо, имеются вещи, поня@
тия и связи, которые мы вспоминаем лишь тогда, когда это нам очень
нужно. Вспомните, что сказал по аналогичному поводу монах Варлаам:
«Я давно не читывал и худо разбираю, а тут уж разберу, как дело до пет@
ли доходит».
Итак, читайте нашу книгу и изучайте ее. Помните любимое выска@
зывание Леонтия Магницкого в его знаменитой «Арифметике»:
«Умствуй и придет!» Но даже если нет возможности изучать ее глубоко,
читайте, как детектив, и, может быть, она поможет Вам найти решение
трудных задач.
* Следуя 3. Фрейду, можно было бы сказать, что забытые теоремы находятся в под@
сознании, где@то рядом с подавленными импульсами раннего детства.

ПРЕДИСЛОВИЕ

9

Пусть судьба хранит Вас от петли, но не от трудностей.
Только решая трудные задачи, человек полностью раскрывает свой
талант, свои возможности, только в трудных задачах он дает макси@
мальную отдачу.
Мы будем благодарны читателям за любые замечания по содержа@
нию и изложению материала книги. Несомненно, что на отдельных
местах книги сказались различные навыки ее авторов, один из которых
является физиком, а другой — математиком. Порой мы упорно тянули
в разные стороны. Теперь сюда приложит свои усилия еще и читатель,
так что все эти усилия будут складываться*. Подобный случай был
разобран еще в известной басне Крылова, однако мы надеемся, что
у нас результаты будут не столь плачевны.
Авторы выражают свою признательность К. А. Семендяеву, кото@
рый прочитал рукопись книги и сделал ряд ценных замечаний.
По истечении четырех лет оказалось необходимым новое, третье из@
дание книги. Этот факт авторы рассматривают как одобрение основно@
го замысла — вооружить читателя практически полезными методами и
сведениями, предельно упрощая и облегчая формальные определения
и доказательства.
Вместе с тем, новое издание налагает и новую ответственность. Поэ@
тому книга была подвергнута тщательному пересмотру (в котором
большое участие принял редактор А. А. Овчинников) и добавлены
важные разделы.
В третьем издании значительно переработаны §§ IX.1, IX.2, расши@
рены §§ X.9, XIV.4, XIV.7, добавлены §§ III.4, VIII.10, IX.5, XI.3, XI.5
и XIV.8. При этом были учтены замечания А.Н. Тихонова, которому ав@
торы выражают свою признательность.
В третьей главе подробнее рассмотрено интегрирование быстроко@
леблющихся функций. В главе VIII добавлен параграф о подобии явле@
ний, в котором с физической и математической сторон рассматриваются
теория размерности, понятие подобия и автомодельности.
В главах IX и XI более подробно и четко даны определения вектора
и тензора, связь этих понятий с линейными преобразованиями. Подробно
рассмотрены симметрические и антисимметрические тензоры; в частнос@
ти, описано введение псевдовектора, эквивалентного антисимметрично@
му тензору в трехмерном пространстве. Добавлена физическая задача
о движении точки в поле центральных сил. Продолжено исследование за@
дач о вращении твердого тела. Эти задачи были и остаются классически@
ми примерами приложения теории обыкновенных дифференциальных
уравнений к физике.
В связи c теорией спектрального разложения рассмотрен вопрос
о фазе Фурье@компонент; потеря информации при переходах к спек@
* Сложение сил по векторному закону изложено в гл. IX.

8

ПРЕДИСЛОВИЕ

Поэтому для удобства в начале отдельных глав и параграфов указыва@
ются сведения из предыдущих глав, знакомство с которыми необходи@
мо. Нумерация параграфов и формул производится в каждой главе
самостоятельно, а при ссылках в пределах одной главы ее номер не ука@
зывается.
Книга может быть полезна студентам — инженерам, физикам и
представителям других специальностей (в том числе, заочникам), на@
чиная, примерно, с середины второго семестра 1@го курса в качестве по@
собия к изучаемому ими курсу математики. Она пригодна и практику,
если он захочет подробней ознакомиться с тем или иным разделом ма@
тематики, который может понадобиться ему в его работе.
Несомненно, что разнородный материал трудно читать активно. Це@
леустремленная проработка обычно подразумевает читателя, перед кото@
рым жизнь поставила в данный момент одну определенную задачу. Такой
читатель склонен пропускать все, что не относится к его задаче.
Возникает общий вопрос: целесообразно ли читать подобную книгу
«впрок», не будет ли такое чтение поверхностным, не окажутся ли при@
веденные в ней советы забытыми вскоре после прочтения?
В ответ на это авторы могут высказать два аргумента.
Во@первых, мы везде старались давать не только практические ре@
цепты, но и те глубокие общие идеи, из которых эти рецепты возникают.
Такие идеи обогащают интеллект читателя, развивают его научный
кругозор, дают возможность по@иному взглянуть на окружающий мир
и потому задерживаются гораздо прочнее.
Второй аргумент относится к психологии памяти. Очень часто бы@
вает так, что хотя Вы не можете воспроизвести прочитанное все под@
ряд, в том порядке, в котором материал Вам преподносился, но этот
материал не изгладился из памяти! Отдельные его части могут быть
воспроизведены Вами при ассоциативном воспоминании, например,
когда Вы сталкиваетесь с задачей, требующей того или иного приема.
Даже смутное воспоминание о том, где можно найти этот материал,
и то часто оказывается полезным*. Говоря грубо, имеются вещи, поня@
тия и связи, которые мы вспоминаем лишь тогда, когда это нам очень
нужно. Вспомните, что сказал по аналогичному поводу монах Варлаам:
«Я давно не читывал и худо разбираю, а тут уж разберу, как дело до пет@
ли доходит».
Итак, читайте нашу книгу и изучайте ее. Помните любимое выска@
зывание Леонтия Магницкого в его знаменитой «Арифметике»:
«Умствуй и придет!» Но даже если нет возможности изучать ее глубоко,
читайте, как детектив, и, может быть, она поможет Вам найти решение
трудных задач.
* Следуя 3. Фрейду, можно было бы сказать, что забытые теоремы находятся в под@
сознании, где@то рядом с подавленными импульсами раннего детства.

ПРЕДИСЛОВИЕ

9

Пусть судьба хранит Вас от петли, но не от трудностей.
Только решая трудные задачи, человек полностью раскрывает свой
талант, свои возможности, только в трудных задачах он дает макси@
мальную отдачу.
Мы будем благодарны читателям за любые замечания по содержа@
нию и изложению материала книги. Несомненно, что на отдельных
местах книги сказались различные навыки ее авторов, один из которых
является физиком, а другой — математиком. Порой мы упорно тянули
в разные стороны. Теперь сюда приложит свои усилия еще и читатель,
так что все эти усилия будут складываться*. Подобный случай был
разобран еще в известной басне Крылова, однако мы надеемся, что
у нас результаты будут не столь плачевны.
Авторы выражают свою признательность К. А. Семендяеву, кото@
рый прочитал рукопись книги и сделал ряд ценных замечаний.
По истечении четырех лет оказалось необходимым новое, третье из@
дание книги. Этот факт авторы рассматривают как одобрение основно@
го замысла — вооружить читателя практически полезными методами и
сведениями, предельно упрощая и облегчая формальные определения
и доказательства.
Вместе с тем, новое издание налагает и новую ответственность. Поэ@
тому книга была подвергнута тщательному пересмотру (в котором
большое участие принял редактор А. А. Овчинников) и добавлены
важные разделы.
В третьем издании значительно переработаны §§ IX.1, IX.2, расши@
рены §§ X.9, XIV.4, XIV.7, добавлены §§ III.4, VIII.10, IX.5, XI.3, XI.5
и XIV.8. При этом были учтены замечания А.Н. Тихонова, которому ав@
торы выражают свою признательность.
В третьей главе подробнее рассмотрено интегрирование быстроко@
леблющихся функций. В главе VIII добавлен параграф о подобии явле@
ний, в котором с физической и математической сторон рассматриваются
теория размерности, понятие подобия и автомодельности.
В главах IX и XI более подробно и четко даны определения вектора
и тензора, связь этих понятий с линейными преобразованиями. Подробно
рассмотрены симметрические и антисимметрические тензоры; в частнос@
ти, описано введение псевдовектора, эквивалентного антисимметрично@
му тензору в трехмерном пространстве. Добавлена физическая задача
о движении точки в поле центральных сил. Продолжено исследование за@
дач о вращении твердого тела. Эти задачи были и остаются классически@
ми примерами приложения теории обыкновенных дифференциальных
уравнений к физике.
В связи c теорией спектрального разложения рассмотрен вопрос
о фазе Фурье@компонент; потеря информации при переходах к спек@
* Сложение сил по векторному закону изложено в гл. IX.

30

НЕКОТОРЫЕ ЧИСЛЕННЫЕ МЕТОДЫ

[Гл. I

свой итерационный метод, причем одни из них могут оказаться быстро
сходящимися и потому наиболее удобными, другие — медленно сходя+
щимися, а третьи — даже вовсе расходящимися.
Приведенное выше решение уравнения (21) можно теперь понять
так: уравнение переписано в равносильной форме
x 3 − 3x − 1
x=x−
,
3x 2 − 3

после чего применен метод итераций, начиная с значения х0 = 2.
В общем виде метод Ньютона для уравнения (18) сводится к тому
(см. (20) и далее), что это уравнение переписывается в равносильной
форме
f(x)
x=x−
,
f′(x)

(28)

после чего применяется метод итераций. Эта форма могла бы показать+
ся несколько искусственной: хотя и легко показать равносильность
уравнений (18) и (28), т.е. из (18) вывести (28) и обратно, но не сразу
видно, чем помогает знаменатель f ′ (x). Однако легко проверить, что
производная от правой части, т.е.

один из наиболее универсальных методов в прикладной математике.
Поясним этот метод на простом примере.
Пусть требуется найти решение трансцендентного уравнения
e x −1 = 2 − x + α

(29)

при малых α . Заметим для этого, что при α = 0 можно найти простым
подбором решение: x = 1. Поэтому если решение уравнения (29), зави+
сящее от α, искать разложенным в ряд по степеням α,
x = x0 + aα + bα 2 + cα 3 + K,

то, подставляя α = 0, получим, что x 0 должно равняться 1. Подставим
теперь разложение
x = 1 + aα + bα 2 + cα 3 + K

(30)

в обе части уравнения (29) и воспользуемся известным разложением
показательной функции и в ряд Тейлора; это даст
1+

aα + bα 2 + cα 3 + K ( aα + bα 2 + cα 3 + K )2
+
+
1!
2!
+

( aα + bα 2 + cα 3 + K )3
+ K = 2 − (1 + aα + bα 2 + cα 3 + K ) + α .
3!

1 + aα + bα 2 + cα 3 +

* Скорость этой сходимости легко установить на следующем простом типичном при+
мере. Пусть рассматриваются приближения по способу Ньютона к нулевому корню
уравнения x + x 2 = 0. Эти приближения связаны друг с другом соотношением
x n + x n2
x n2
=
< x n2 .
1 + 2x n
1 + 2x n

a2 2
a3 3
α + abα 3 +
α +K=
2
6
= 1 − aα − bα 2 − cα 3 − K + α .

Приравнивая в обеих частях коэффициенты при одинаковых степе+
нях α, получим соотношения
a = − a + 1,
a2
= −b,
2
3
a
c + ab +
= − c,
6
. . . . . . . . . . . .
b+

откуда последовательно найдем
1
a= ,
2

b=−

1
,
16

c=

1
, ...
192

Подставляя эти значения в (30), получаем искомое решение уравнения
(29) в виде ряда

Допустим, что 0 < x0 < 1; тогда мы последовательно получим
n

x 1 < x 02 , x 2 < x 12 < x 04 , x 3 < x 22 < x 08 , K , x n < x 02 , K
Можно показать, что и в общем случае скорость сходимости метода Ньютона имеет
n

31

3

обращается в нуль при x = x , где x —решение уравнения (18). Значит
(см. рассуждения, связанные с оценкой (27)), чем ближе последова+
тельные приближения подходят к x, тем быстрее сходится процесс.
Более того, так как при выполнении оценки (27) итерации схо+
дятся не медленнее, чем прогрессия со знаменателем k, то мы по+
лучаем, что метод Ньютона сходится быстрее геометрической про+
грессии с любым знаменателем!*
Перейдем теперь к описанию метода малого параметра (он же ме
тод возмущений), который, как и метод итераций, представляет собой

порядок a 2 (0 < a < 1).

ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ

Раскрыв скобки и удержания члены до α , получим



f⎞
f ′f ′ − ff ′′ ff ′′
= 2,
⎜x − ⎟ =1−

f′⎠
f′2
f′

xn +1 = xn −

§ 3]

x =1+

α α2 α3

+
+ K,
2 16 192

хорошо сходящегося при небольших α .

(31)

30

НЕКОТОРЫЕ ЧИСЛЕННЫЕ МЕТОДЫ

[Гл. I

свой итерационный метод, причем одни из них могут оказаться быстро
сходящимися и потому наиболее удобными, другие — медленно сходя+
щимися, а третьи — даже вовсе расходящимися.
Приведенное выше решение уравнения (21) можно теперь понять
так: уравнение переписано в равносильной форме
x 3 − 3x − 1
x=x−
,
3x 2 − 3

после чего применен метод итераций, начиная с значения х0 = 2.
В общем виде метод Ньютона для уравнения (18) сводится к тому
(см. (20) и далее), что это уравнение переписывается в равносильной
форме
f(x)
x=x−
,
f′(x)

(28)

после чего применяется метод итераций. Эта форма могла бы показать+
ся несколько искусственной: хотя и легко показать равносильность
уравнений (18) и (28), т.е. из (18) вывести (28) и обратно, но не сразу
видно, чем помогает знаменатель f ′ (x). Однако легко проверить, что
производная от правой части, т.е.

один из наиболее универсальных методов в прикладной математике.
Поясним этот метод на простом примере.
Пусть требуется найти решение трансцендентного уравнения
e x −1 = 2 − x + α

(29)

при малых α . Заметим для этого, что при α = 0 можно найти простым
подбором решение: x = 1. Поэтому если решение уравнения (29), зави+
сящее от α, искать разложенным в ряд по степеням α,
x = x0 + aα + bα 2 + cα 3 + K,

то, подставляя α = 0, получим, что x 0 должно равняться 1. Подставим
теперь разложение
x = 1 + aα + bα 2 + cα 3 + K

(30)

в обе части уравнения (29) и воспользуемся известным разложением
показательной функции и в ряд Тейлора; это даст
1+

aα + bα 2 + cα 3 + K ( aα + bα 2 + cα 3 + K )2
+
+
1!
2!
+

( aα + bα 2 + cα 3 + K )3
+ K = 2 − (1 + aα + bα 2 + cα 3 + K ) + α .
3!

1 + aα + bα 2 + cα 3 +

* Скорость этой сходимости легко установить на следующем простом типичном при+
мере. Пусть рассматриваются приближения по способу Ньютона к нулевому корню
уравнения x + x 2 = 0. Эти приближения связаны друг с другом соотношением
x n + x n2
x n2
=
< x n2 .
1 + 2x n
1 + 2x n

a2 2
a3 3
α + abα 3 +
α +K=
2
6
= 1 − aα − bα 2 − cα 3 − K + α .

Приравнивая в обеих частях коэффициенты при одинаковых степе+
нях α, получим соотношения
a = − a + 1,
a2
= −b,
2
3
a
c + ab +
= − c,
6
. . . . . . . . . . . .
b+

откуда последовательно найдем
1
a= ,
2

b=−

1
,
16

c=

1
, ...
192

Подставляя эти значения в (30), получаем искомое решение уравнения
(29) в виде ряда

Допустим, что 0 < x0 < 1; тогда мы последовательно получим
n

x 1 < x 02 , x 2 < x 12 < x 04 , x 3 < x 22 < x 08 , K , x n < x 02 , K
Можно показать, что и в общем случае скорость сходимости метода Ньютона имеет
n

31

3

обращается в нуль при x = x , где x —решение уравнения (18). Значит
(см. рассуждения, связанные с оценкой (27)), чем ближе последова+
тельные приближения подходят к x, тем быстрее сходится процесс.
Более того, так как при выполнении оценки (27) итерации схо+
дятся не медленнее, чем прогрессия со знаменателем k, то мы по+
лучаем, что метод Ньютона сходится быстрее геометрической про+
грессии с любым знаменателем!*
Перейдем теперь к описанию метода малого параметра (он же ме
тод возмущений), который, как и метод итераций, представляет собой

порядок a 2 (0 < a < 1).

ЧИСЛЕННОЕ РЕШЕНИЕ УРАВНЕНИЙ

Раскрыв скобки и удержания члены до α , получим



f⎞
f ′f ′ − ff ′′ ff ′′
= 2,
⎜x − ⎟ =1−

f′⎠
f′2
f′

xn +1 = xn −

§ 3]

x =1+

α α2 α3

+
+ K,
2 16 192

хорошо сходящегося при небольших α .

(31)

§ 1]

ТАБЛИЦЫ И РАЗНОСТИ

37

вать шагом, таблицы. Соответствующие значения функции, помещен
ные в таблице, обозначим через y 0 = y(x 0 ) , y 1 = y(x 1 ), K , y n = y(x n ).
Приращения переменной х все одинаковые и равны h. Прираще
ния переменной y, вообще говоря, различные. Они называются первыми
разностями (более подробно разностями первого порядка) иобознача
ются через

ГЛАВА II
МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА
В практической работе часто бывает так, что зависимость между пе
ременными величинами — скажем х и у получается в результате
опыта, измерений. Обычно в таком случае эта зависимость оказывает
ся заданной при помощи таблицы, в которой для каждого значения х,
при котором проводилось измерение, поставлено соответствующее,
найденное путем измерения значение у. Поэтому мы рассмотрим в
этой главе сначала общие правила действий с таблицами, а затем те но
вые моменты, которые возникают при обработке результатов опытов.
§ 1. Таблицы и разности
Нам часто приходится рассматривать функции, заданные с по
мощью таблицы. Это могут быть математические таблицы, например
таблицы логарифмов, синусов, квадратов и т.п. Это могут быть физи
ческие таблицы, взятые из какихлибо справочников, например табли
цы зависимости температуры кипения той или иной жидкости от
давления и т.п. Наконец, зависимость между переменными величина
ми может получиться в виде не вполне обработанных результатов опы
та, измерений. Во всех этих случаях численные значения зависимой
переменной задаются с помощью таблицы при определенных числен
ных значениях независимой переменной. Функции, заданные таким
образом, могут входить в дальнейшие операции, в частности, может по
требоваться эти функции дифференцировать или интегрировать. Мо
гут понадобиться значения функции при промежуточных, не
выписанных в таблице, значениях независимой переменной (задача
интерполяции) или при значениях независимой переменной, лежащих
за пределами таблицы (задача экстраполяции)*.
Мы будем считать для простоты, что независимая переменная х
принимает значения, образующие арифметическую прогрессию,
т.е. x = x 0 , x = x 1 = x 0 + h, x = x 2 = x 0 + 2h, K , x = x n = x 0 + nh; эти
значения аргумента будем условно называть целыми, a h — назы

δy1 / 2 = y1 − y0 , δy1 + 1 / 2 = y2 − y1 , δy2 + 1 / 2 = y3 − y2 , K , δyn −1 / 2 = yn − yn −1 ,

так как их естественно сопоставлять полуцелым значениям х, т.е. сере
динам между соседними «целыми» значениями аргумента:
x1 / 2 = x0 + h / 2, x1 + 1 / 2 = x0 + 3 h / 2, K , xn −1 / 2 = x0 + ( n − 1 / 2 )h*.

От этих разностей можно опять брать разности, в результате чего полу
чатся вторые разности, определенные вновь для «целых» значе
ний х:
δ 2 y1 = δy1 + 1 / 2 − δy1 / 2 , δ 2 y2 = δy2 + 1 / 2 − δy1 + 1 / 2 , K , δ 2 yn −1 = δyn −1 / 2 − δyn − 3 / 2

(двойка сверху здесь означает порядок разности, а не показатель степе
ни) и т.д.
Приведем в качестве примера отрывок из таблицы десятичных ло
5
гарифмов с вычисленными разностями, которые умножены на 10 .
Таблица 1
k

0

1/2

1

3/2

2

5/2

3

7/2

xk
yk
105δyk
105δ2yk
105δ3yk

10,0

10,05

10,1
1,00432

10,15

10,2
1,00860

10,25

10,3
1,01284

10,35

1,00000
432

428

424

–4

–4

419
–5

0

–1

2

Продолжение табл. 1
k

4

9/2

5

11/2

6

13/2

7

xk
yk
105δyk
105δ2yk
105δ3yk

10,4
1,01703

10,45

10,5
1,02119

10,55

10,6
1,02531

10,65

10,7
1,02938

416
–3

412

407

–4
–1

–5
–1

* Иногда разность y k + 1 − y k сопоставляется не значению x = x k + 1 / 2 , а значению
x = x k . Тогда она обычно обозначается Δ y k , т.е. Δ y k = Δ y x = x = y k + 1 − y k . При таком
k

* Слова «интерполяция» и «экстраполяция» происходят от латинских корней «ин
тер» — внутри, «экстра» — снаружи, «полюс» — точка.

обозначении, как у нас, т.е. y k + 1 − y k = δy k + 1 / 2 = δy
тральными.

x = x k + 1/ 2

, разности называются цен

§ 1]

ТАБЛИЦЫ И РАЗНОСТИ

37

вать шагом, таблицы. Соответствующие значения функции, помещен
ные в таблице, обозначим через y 0 = y(x 0 ) , y 1 = y(x 1 ), K , y n = y(x n ).
Приращения переменной х все одинаковые и равны h. Прираще
ния переменной y, вообще говоря, различные. Они называются первыми
разностями (более подробно разностями первого порядка) и обознача
ются через

ГЛАВА II
МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА
В практической работе часто бывает так, что зависимость между пе
ременными величинами — скажем х и у получается в результате
опыта, измерений. Обычно в таком случае эта зависимость оказывает
ся заданной при помощи таблицы, в которой для каждого значения х,
при котором проводилось измерение, поставлено соответствующее,
найденное путем измерения значение у. Поэтому мы рассмотрим в
этой главе сначала общие правила действий с таблицами, а затем те но
вые моменты, которые возникают при обработке результатов опытов.
§ 1. Таблицы и разности
Нам часто приходится рассматривать функции, заданные с по
мощью таблицы. Это могут быть математические таблицы, например
таблицы логарифмов, синусов, квадратов и т.п. Это могут быть физи
ческие таблицы, взятые из какихлибо справочников, например табли
цы зависимости температуры кипения той или иной жидкости от
давления и т.п. Наконец, зависимость между переменными величина
ми может получиться в виде не вполне обработанных результатов опы
та, измерений. Во всех этих случаях численные значения зависимой
переменной задаются с помощью таблицы при определенных числен
ных значениях независимой переменной. Функции, заданные таким
образом, могут входить в дальнейшие операции, в частности, может по
требоваться эти функции дифференцировать или интегрировать. Мо
гут понадобиться значения функции при промежуточных, не
выписанных в таблице, значениях независимой переменной (задача
интерполяции) или при значениях независимой переменной, лежащих
за пределами таблицы (задача экстраполяции)*.
Мы будем считать для простоты, что независимая переменная х
принимает значения, образующие арифметическую прогрессию,
т.е. x = x 0 , x = x 1 = x 0 + h, x = x 2 = x 0 + 2h, K , x = x n = x 0 + nh; эти
значения аргумента будем условно называть целыми, a h — назы

δy1 / 2 = y1 − y0 , δy1 + 1 / 2 = y2 − y1 , δy2 + 1 / 2 = y3 − y2 , K , δyn −1 / 2 = yn − yn −1 ,

так как их естественно сопоставлять полуцелым значениям х, т.е. сере
динам между соседними «целыми» значениями аргумента:
x1 / 2 = x0 + h / 2, x1 + 1 / 2 = x0 + 3 h / 2, K , xn −1 / 2 = x0 + ( n − 1 / 2 )h*.

От этих разностей можно опять брать разности, в результате чего полу
чатся вторые разности, определенные вновь для «целых» значе
ний х:
δ 2 y1 = δy1 + 1 / 2 − δy1 / 2 , δ 2 y2 = δy2 + 1 / 2 − δy1 + 1 / 2 , K , δ 2 yn −1 = δyn −1 / 2 − δyn − 3 / 2

(двойка сверху здесь означает порядок разности, а не показатель степе
ни) и т.д.
Приведем в качестве примера отрывок из таблицы десятичных ло
5
гарифмов с вычисленными разностями, которые умножены на 10 .
Таблица 1
k

0

1/2

1

3/2

2

5/2

3

7/2

xk
yk
105δyk
105δ2yk
105δ3yk

10,0

10,05

10,1
1,00432

10,15

10,2
1,00860

10,25

10,3
1,01284

10,35

1,00000
432

428

424

–4

–4

419
–5

0

–1

2

Продолжение табл. 1
k

4

9/2

5

11/2

6

13/2

7

xk
yk
105δyk
105δ2yk
105δ3yk

10,4
1,01703

10,45

10,5
1,02119

10,55

10,6
1,02531

10,65

10,7
1,02938

416
–3

412

407

–4
–1

–5
–1

* Иногда разность y k + 1 − y k сопоставляется не значению x = x k + 1 / 2 , а значению
x = x k . Тогда она обычно обозначается Δ y k , т.е. Δ y k = Δ y x = x = y k + 1 − y k . При таком
k

* Слова «интерполяция» и «экстраполяция» происходят от латинских корней «ин
тер» — внутри, «экстра» — снаружи, «полюс» — точка.

обозначении, как у нас, т.е. y k + 1 − y k = δy k + 1 / 2 = δy
тральными.

x = x k + 1/ 2

, разности называются цен

38

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Малость вторых разностей по сравнению с первыми и их почти по
стоянство (третьи разности имеют уже порядок ошибок округления)
в приведенном примере указывают на плавность хода изменения
функции, на отсутствие случайных «выпадов» из этого хода. Такая за
кономерность может проявляться в разностях более высокого порядка
и всегда свидетельствует о «правиль
ности» хода изменения функции (ср.
B
y
упражнение 2). Конечно, если шаг не
δyk+12
мал, а также вблизи точек разрыва
A
и т.п., разности могут и не быть ма
h
лыми, но обычно в них проявляется
yk+1
yk+2 та или иная закономерность.
yk
Разности широко применяются
при интерполяции. Пусть требуется
yk–1
s
x найти значение у при некотором
значении х, заключенном между
xk x xk+12 xk+1
xk+2
0
xk–1
табличными значениями x k и x k +1 .
Рис. 4.
Самый простой способ — линейная
интерполяция — состоит в прибли
женной замене изучаемой функции на линейную функцию, причем
так, чтобы обе функции совпадали при x = x k и при x = x k +1 (рис. 4);
геометрически это означает замену дуги AB неизвестного нам гра
фика, показанного на рис. 4 штрихами, на хорду АВ, соединяющую две
его известные точки А и В. Обозначим x − x k = s. Так как линейная
функция выражается уравнением первой степени, то искомое значе
ние у зависит от s по формуле
y = a + bs,

(1)

где a и b — некоторые коэффициенты. Из условий при x k и x k +1
получаем y k = a, y k +1 = a + bh, откуда
δyk + 1 / 2 = yk + 1 − yk = b h.

Выражая отсюда а и b и подставляя в (1), получаем окончательно
формулу для линейной интерполяции
s
y = y k + δy k + 1 / 2 .
h

(2)

§ 1]

ТАБЛИЦЫ И РАЗНОСТИ

39

поляцию рассматриваемой функции в сторону x < x 0 , а при k = n − 1
и s > h — в сторону х > хп. Конечно, при экстраполяции нельзя далеко
уходить от табличных значений х, так как принятый нами линейный
закон изменения функции оправдывается лишь на малом интервале
изменения х.
Формулу линейной интерполяции (2), как и последующие форму
лы, можно переписать в виде, не содержащем разностей. Подставляя
в (2) выражение δy k +1 / 2 = y k +1 − y k , получим равносильную формулу
y = yk +

yk + 1 − yk
s⎞
s

s = ⎜ 1 − ⎟ yk + yk + 1 .

h
h⎠
h

Хорошо видно, что при изменении s от 0 до h коэффициент при уk
меняется от 1 до 0, а коэффициент при y k +1 — от 0 до 1; таким образом,
при s = 0 получается у = уk, а при s = h получается у = уk+1.
Бо´льшую точность дает квадратичная интерполяция, при которой
изучаемая функция приближенно заменяется на квадратичную функ
цию, причем так, чтобы обе функции совпадали при x = x k , x k +1 и
x k +2 (это в других обозначениях было проделано в § I.1 при выводе
формулы Симпсона). Указанную квадратичную функцию удобно ис
кать в виде
y = a + bs + cs( s − h ).

(3)

Согласно условию
yk = a ,

yk + 2 = a + b ⋅ 2 h + c ⋅ 2 h 2 ,

yk + 1 = a + bh,

откуда
δy

k+

1
2

= yk + 1 − yk = bh,
δ 2 y k + 1 = δy

δy
k+

k+

3
2

3
2

= yk + 2 − yk + 1 = 2 сh 2 + bh,

− δy

k+

1
2

= 2 сh 2 .

Выражая отсюдa а, b, с и подставляя в (3), получаем формулу Ньюто
на для квадратичной интерполяции
y = y k + δy

1
k+
2

s δ 2 yk + 1 s ⎛ s ⎞
+
⎜ − 1⎟ .
h
h ⎝h ⎠
2

(4)

(Выведите эту формулу из подобия треугольников на рис. 4.) Форму
лой (2) можно пользоваться, если изучаемая функция на интервале от
хk до xk + 1 мало отличается от линейной, т.е. если h достаточно
мало´*. При k = 0 и s < 0 формула (2) осуществляет линейную экстра

Как и выше, эту формулу можно использовать также для экстраполя
ции. Формула (4) не совсем симметрична: в ней использованы значе
ния уk, y k +1 и y k +2 , тогда как х расположен между xk и хk+1. Если
обратить направление оси х и подобным же образом использовать
значения y k +1 , уk и y k −1 , то взамен (4) мы получим формулу

* Из более точной формулы (4) нетрудно вывести, что при малом h ошибка при ли
нейной интерполяции имеет порядок h2, так как такой порядок имеют вторые разности.


⎞ h − s δ2 y h − s ⎛ h − s ⎞
k
y = yk + 1 + ⎜⎜ −δy 1 ⎟⎟
+
− 1⎟ ,

k+ ⎠

2
h
h ⎝ h

2

(5)

38

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Малость вторых разностей по сравнению с первыми и их почти по
стоянство (третьи разности имеют уже порядок ошибок округления)
в приведенном примере указывают на плавность хода изменения
функции, на отсутствие случайных «выпадов» из этого хода. Такая за
кономерность может проявляться в разностях более высокого порядка
и всегда свидетельствует о «правиль
ности» хода изменения функции (ср.
B
y
упражнение 2). Конечно, если шаг не
δyk+12
мал, а также вблизи точек разрыва
A
и т.п., разности могут и не быть ма
h
лыми, но обычно в них проявляется
yk+1
yk+2 та или иная закономерность.
yk
Разности широко применяются
при интерполяции. Пусть требуется
yk–1
s
x найти значение у при некотором
значении х, заключенном между
xk x xk+12 xk+1
xk+2
0
xk–1
табличными значениями x k и x k +1 .
Рис. 4.
Самый простой способ — линейная
интерполяция — состоит в прибли
женной замене изучаемой функции на линейную функцию, причем
так, чтобы обе функции совпадали при x = x k и при x = x k +1 (рис. 4);
геометрически это означает замену дуги AB неизвестного нам гра
фика, показанного на рис. 4 штрихами, на хорду АВ, соединяющую две
его известные точки А и В. Обозначим x − x k = s. Так как линейная
функция выражается уравнением первой степени, то искомое значе
ние у зависит от s по формуле
y = a + bs,

(1)

где a и b — некоторые коэффициенты. Из условий при x k и x k +1
получаем y k = a, y k +1 = a + bh, откуда
δyk + 1 / 2 = yk + 1 − yk = b h.

Выражая отсюда а и b и подставляя в (1), получаем окончательно
формулу для линейной интерполяции
s
y = y k + δy k + 1 / 2 .
h

(2)

§ 1]

ТАБЛИЦЫ И РАЗНОСТИ

39

поляцию рассматриваемой функции в сторону x < x 0 , а при k = n − 1
и s > h — в сторону х > хп. Конечно, при экстраполяции нельзя далеко
уходить от табличных значений х, так как принятый нами линейный
закон изменения функции оправдывается лишь на малом интервале
изменения х.
Формулу линейной интерполяции (2), как и последующие форму
лы, можно переписать в виде, не содержащем разностей. Подставляя
в (2) выражение δy k +1 / 2 = y k +1 − y k , получим равносильную формулу
y = yk +

yk + 1 − yk
s⎞
s

s = ⎜ 1 − ⎟ yk + yk + 1 .

h
h⎠
h

Хорошо видно, что при изменении s от 0 до h коэффициент при уk
меняется от 1 до 0, а коэффициент при y k +1 — от 0 до 1; таким образом,
при s = 0 получается у = уk, а при s = h получается у = уk+1.
Бо´льшую точность дает квадратичная интерполяция, при которой
изучаемая функция приближенно заменяется на квадратичную функ
цию, причем так, чтобы обе функции совпадали при x = x k , x k +1 и
x k +2 (это в других обозначениях было проделано в § I.1 при выводе
формулы Симпсона). Указанную квадратичную функцию удобно ис
кать в виде
y = a + bs + cs( s − h ).

(3)

Согласно условию
yk = a ,

yk + 2 = a + b ⋅ 2 h + c ⋅ 2 h 2 ,

yk + 1 = a + bh,

откуда
δy

k+

1
2

= yk + 1 − yk = bh,
δ 2 y k + 1 = δy

δy
k+

k+

3
2

3
2

= yk + 2 − yk + 1 = 2 сh 2 + bh,

− δy

k+

1
2

= 2 сh 2 .

Выражая отсюдa а, b, с и подставляя в (3), получаем формулу Ньюто
на для квадратичной интерполяции
y = y k + δy

1
k+
2

s δ 2 yk + 1 s ⎛ s ⎞
+
⎜ − 1⎟ .
h
h ⎝h ⎠
2

(4)

(Выведите эту формулу из подобия треугольников на рис. 4.) Форму
лой (2) можно пользоваться, если изучаемая функция на интервале от
хk до xk + 1 мало отличается от линейной, т.е. если h достаточно
мало´*. При k = 0 и s < 0 формула (2) осуществляет линейную экстра

Как и выше, эту формулу можно использовать также для экстраполя
ции. Формула (4) не совсем симметрична: в ней использованы значе
ния уk, y k +1 и y k +2 , тогда как х расположен между xk и хk+1. Если
обратить направление оси х и подобным же образом использовать
значения y k +1 , уk и y k −1 , то взамен (4) мы получим формулу

* Из более точной формулы (4) нетрудно вывести, что при малом h ошибка при ли
нейной интерполяции имеет порядок h2, так как такой порядок имеют вторые разности.


⎞ h − s δ2 y h − s ⎛ h − s ⎞
k
y = yk + 1 + ⎜⎜ −δy 1 ⎟⎟
+
− 1⎟ ,

k+ ⎠

2
h
h ⎝ h

2

(5)

40

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

несимметричную уже в другую сторону. Взяв теперь полусумму пра,
вых частей формул (4) и (5), получим симметричную формулу Бесселя
y=

2
2
yk + yk + 1
⎛ s 1⎞ δ y k + δ y k + 1 s ⎛ s ⎞
+ δy 1 ⎜ − ⎟ +
⎜ − 1⎟ ,
k+ ⎝ h
2
2⎠
4
h ⎝h ⎠
2

обладающую высокой точностью. Мы предоставим читателю преобра,
зовать формулы Ньютона и Бесселя так, чтобы у оказался выраженным
непосредственно через «узловые» значения уk, а не через их разности.
Подобным образом можно было бы вывести интерполяционные
формулы еще более высокой степени. Однако, так как точность экспе,
риментальных данных ограничена, равно как и точность применяемых
таблиц функций, то обычно применение разностей слишком высокого
порядка не оправдано. В большинстве случаев (за исключением изме,
рений и вычислений, проводимых с особо высокой точностью) бывает
достаточно вторых или даже только первых разностей.
Если изучаемая функция разрывна, то интерполяцию можно прово,
дить только на интервалах, не содержащих точек разрыва; если не обра,
тить на это внимания, то интерполяция может дать совершенно
неправильное представление о действительном поведении функции.
Так, на рис. 5 показана зависимость внутренней энергии, которой обла,
дает единица массы воды при нормальном давлении, от температуры*.

Рис. 5.

Рис. 6.

Эта зависимость имеет разрывы при температурах фазовых переходов,
т.е. при замерзании и при испарении воды. Там же пунктиром показан
результат квадратичной интерполяции в случае, если выбранные
«узловые» точки отвечают различным фазам; видно, что эта интерпо,
ляция искажает реальную картину. Аналогичное искажение получает,
ся при разрыве производной (т.е. при изломе графика) у изучаемой
функции. Так, на рис. 6 пунктиром показан результат линейной интер,
поляции при наличии «острого» максимума; хорошо видна ошибка, по,
лучающаяся вблизи этого максимума.
* Чаще пользуются так называемой энтальпией (теплосодержанием) H = E + pV ,
где р — давление, а V — объем. Теплоемкость при постоянном давлении равна как раз произ,
водной от H по ␽.

§ 2]

ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ

41

Упражнения
1. Пусть y0 = 100
, ; y1 = 125
, ; y2 = 165
, ; y2 = 2,34. Найдите y3 / 2 по форму,
лам (2), (4), (5) и по формуле Бесселя.
2. Проверьте, что если таблица составлена для многочлена степени n,
то разности порядка n постоянны, а разности порядка n + 1 равны нулю.

§ 2. Интегрирование и дифференцирование функций,
заданных таблично
Интегрирование функций, заданных таблично, ничем не замеча,
тельно. Ведь и раньше при численном интегрировании функций, за,
данных формулами, мы сперва составляли таблицу подынтегральной
функции (см. § I.1).
При вычислении производной функции, заданной таблицей, следу,
ет иметь в виду, что лучший способ найти производную y ′(x) по двум
значениям функции — это взять такие значения справа и слева на рав,
ном расстоянии от того значения х, для которого мы хотим подсчитать
величину производной


h⎞
h⎞
y ⎜x + ⎟ − y ⎜x − ⎟


2⎠
2⎠
.
y′( x ) ≈
h

Таким образом, если даны значения y для значений х, располо,
женных через равные промежутки (т.е. в арифметической прогрессии),
то удобно вычислять производные в серединах промежутков. Другими
словами, если значения y были заданы для «целых» значений х (см.
§ 1), то значения y ′ будут подсчитаны для «полуцелых» значений х.
По значениям y ′ можно таким же способом найти производную
от y ′, т.е. y ′′. При этом значения y ′′ получатся снова для целых зна,
чений х. Можно выразить y ′′ непосредственно через у:


h⎞
h⎞
y′ ⎜ x + ⎟ − y′ ⎜ x − ⎟


2⎠
2⎠
y′′( x ) ≈

h
y(x + h) − y(x) y(x) − y(x − h)

y ( x + h ) − 2 y( x ) + y ( x − h )
h
h

=
.
h
h2

Указанные сейчас формулы удобно записать в обозначениях § 1:
y′

k+

1
2




h ⎞ y ( xk + h ) − y ( xk )
=
= y′ ⎜⎜ x 1 ⎟⎟ = y′ ⎜ xk + ⎟ ≈

2⎠
h
⎝ k+ 2⎠

δy

k+

h

1
2

;

это равенство и является обоснованием того, что разность y k +1 − y k

40

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

несимметричную уже в другую сторону. Взяв теперь полусумму пра,
вых частей формул (4) и (5), получим симметричную формулу Бесселя
y=

2
2
yk + yk + 1
⎛ s 1⎞ δ y k + δ y k + 1 s ⎛ s ⎞
+ δy 1 ⎜ − ⎟ +
⎜ − 1⎟ ,
k+ ⎝ h
2
2⎠
4
h ⎝h ⎠
2

обладающую высокой точностью. Мы предоставим читателю преобра,
зовать формулы Ньютона и Бесселя так, чтобы у оказался выраженным
непосредственно через «узловые» значения уk, а не через их разности.
Подобным образом можно было бы вывести интерполяционные
формулы еще более высокой степени. Однако, так как точность экспе,
риментальных данных ограничена, равно как и точность применяемых
таблиц функций, то обычно применение разностей слишком высокого
порядка не оправдано. В большинстве случаев (за исключением изме,
рений и вычислений, проводимых с особо высокой точностью) бывает
достаточно вторых или даже только первых разностей.
Если изучаемая функция разрывна, то интерполяцию можно прово,
дить только на интервалах, не содержащих точек разрыва; если не обра,
тить на это внимания, то интерполяция может дать совершенно
неправильное представление о действительном поведении функции.
Так, на рис. 5 показана зависимость внутренней энергии, которой обла,
дает единица массы воды при нормальном давлении, от температуры*.

Рис. 5.

Рис. 6.

Эта зависимость имеет разрывы при температурах фазовых переходов,
т.е. при замерзании и при испарении воды. Там же пунктиром показан
результат квадратичной интерполяции в случае, если выбранные
«узловые» точки отвечают различным фазам; видно, что эта интерпо,
ляция искажает реальную картину. Аналогичное искажение получает,
ся при разрыве производной (т.е. при изломе графика) у изучаемой
функции. Так, на рис. 6 пунктиром показан результат линейной интер,
поляции при наличии «острого» максимума; хорошо видна ошибка, по,
лучающаяся вблизи этого максимума.
* Чаще пользуются так называемой энтальпией (теплосодержанием) H = E + pV ,
где р — давление, а V — объем. Теплоемкость при постоянном давлении равна как раз произ,
водной от H по ␽.

§ 2]

ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ

41

Упражнения
1. Пусть y0 = 100
, ; y1 = 125
, ; y2 = 165
, ; y2 = 2,34. Найдите y3 / 2 по форму,
лам (2), (4), (5) и по формуле Бесселя.
2. Проверьте, что если таблица составлена для многочлена степени n,
то разности порядка n постоянны, а разности порядка n + 1 равны нулю.

§ 2. Интегрирование и дифференцирование функций,
заданных таблично
Интегрирование функций, заданных таблично, ничем не замеча,
тельно. Ведь и раньше при численном интегрировании функций, за,
данных формулами, мы сперва составляли таблицу подынтегральной
функции (см. § I.1).
При вычислении производной функции, заданной таблицей, следу,
ет иметь в виду, что лучший способ найти производную y ′(x) по двум
значениям функции — это взять такие значения справа и слева на рав,
ном расстоянии от того значения х, для которого мы хотим подсчитать
величину производной


h⎞
h⎞
y ⎜x + ⎟ − y ⎜x − ⎟


2⎠
2⎠
.
y′( x ) ≈
h

Таким образом, если даны значения y для значений х, располо,
женных через равные промежутки (т.е. в арифметической прогрессии),
то удобно вычислять производные в серединах промежутков. Другими
словами, если значения y были заданы для «целых» значений х (см.
§ 1), то значения y ′ будут подсчитаны для «полуцелых» значений х.
По значениям y ′ можно таким же способом найти производную
от y ′, т.е. y ′′. При этом значения y ′′ получатся снова для целых зна,
чений х. Можно выразить y ′′ непосредственно через у:


h⎞
h⎞
y′ ⎜ x + ⎟ − y′ ⎜ x − ⎟


2⎠
2⎠
y′′( x ) ≈

h
y(x + h) − y(x) y(x) − y(x − h)

y ( x + h ) − 2 y( x ) + y ( x − h )
h
h

=
.
h
h2

Указанные сейчас формулы удобно записать в обозначениях § 1:
y′

k+

1
2




h ⎞ y ( xk + h ) − y ( xk )
=
= y′ ⎜⎜ x 1 ⎟⎟ = y′ ⎜ xk + ⎟ ≈

2⎠
h
⎝ k+ 2⎠

δy

k+

h

1
2

;

это равенство и является обоснованием того, что разность y k +1 − y k

42

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

мы относили значению x = x

k+

1
2

[Гл. II

. Аналогично

y′′k ≈

δ 2 yk
.
h2

Приведем пример (таблица 2)*.
Таблица 2
x

y

1,00

1,6487

1,10

1,7333

1,20

1,8221

1,30

1,9155

1,40

2,0138

1,50

2,1170

y′

0,846
0,888
0,934
0,983
1,032

y ′′

0,42
0,46
0,49
0,49

Если нужны значения y ′ для других х, то их можно получить ин,
терполяцией. В частности, для целых х получаем с помощью интерпо,
ляции
y′k ≈

1
2


⎞ 1 y −y
y
− yk ⎞ yk + 1 − yk −1
k −1
⎜ y′ 1 + y′ 1 ⎟ ≈ ⎛⎜ k
+ k +1
.
⎟ =
⎜ k−
⎟ 2⎝

k
+
2h
h
h

2
2⎠

§ 2]

ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ

43

Однако при таком способе мы, во,первых, получим значений производ,
ных на одно меньше, чем при первом способе, во,вторых, мы получаем
меньше сведений о поведении производной на концах промежутка.
Так, в таблице 2 мы знаем производную при x = 1,05 (около начала
промежутка x = 1) и при x = 1,45 (около конца промежутка x = 1,5),
а в таблице 3 лишь при x = 1,1 и при x = 1,4, т.е. при значениях аргу,
мента, более удаленных от концов промежутка. Наконец, при вычисле,
нии значений y ′ для нецелых (в частности, для полуцелых) значений
х с помощью интерполяции значения, полученные из таблицы 2, ока,
зываются достовернее значений, полученных из таблицы 3, так как на,
клон кривой более точно передают маленькие хорды, чем большие.
Поэтому первый способ предпочтителен.
Очень важные, принципиальные вопросы возникают в связи с огра,
ниченной точностью и ошибками, присущими каждому измерению.
При вычислении интеграла каждое отдельное измеренное значе,
ние y умножается на величину Δх. Поэтому при увеличении числа
отдельных измеренных значений функции y коэффициент, с кото,
рым в выражение интеграла входит каждое отдельное значение, умень,
шается обратно пропорционально числу промежутков Δх.
Следовательно, уменьшается и ошибка в интеграле, происходящая
за счет ошибок при каждом отдельном измерении величины y.
При вычислении производной разность двух значений y делится
на Δх. Чем меньше промежуток Δх, т.е. чем меньше знаменатель, тем

Таким образом, можно сразу определять значения y ′ для целых х по
значениям y при целых х справа и слева (см. таблицу 3).
Таблица 3
y′

x

y

1,00

1,6487

1,10

1,7333

0,867

1,20

1,8221

0,911

1,30

1,9155

0,958

1,40

2,0138

1,008

1,50

2,1170

* В таблице не выписаны полуцелые значения аргумента.

Рис. 7.

бо´льшую ошибку в величину производной вносит данная ошибка
в каждом измеренном значении у. Поэтому производная функции, за,
данной экспериментальными значениями, оказывается известной
с меньшей точностью, чем сама эта функция.
Разницу между дифференцированием и интегрированием поясним
примером.
На рис. 7 изображены две кривые — одна нарисована сплошной ли,
нией, другая пунктиром. Сплошная кривая — это график функции

42

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

мы относили значению x = x

k+

1
2

[Гл. II

. Аналогично

y′′k ≈

δ 2 yk
.
h2

Приведем пример (таблица 2)*.
Таблица 2
x

y

1,00

1,6487

1,10

1,7333

1,20

1,8221

1,30

1,9155

1,40

2,0138

1,50

2,1170

y′

0,846
0,888
0,934
0,983
1,032

y ′′

0,42
0,46
0,49
0,49

Если нужны значения y ′ для других х, то их можно получить ин,
терполяцией. В частности, для целых х получаем с помощью интерпо,
ляции
y′k ≈

1
2


⎞ 1 y −y
y
− yk ⎞ yk + 1 − yk −1
k −1
⎜ y′ 1 + y′ 1 ⎟ ≈ ⎛⎜ k
+ k +1
.
⎟ =
⎜ k−
⎟ 2⎝

k
+
2h
h
h

2
2⎠

§ 2]

ИНТЕГРИРОВАНИЕ И ДИФФЕРЕНЦИРОВАНИЕ

43

Однако при таком способе мы, во,первых, получим значений производ,
ных на одно меньше, чем при первом способе, во,вторых, мы получаем
меньше сведений о поведении производной на концах промежутка.
Так, в таблице 2 мы знаем производную при x = 1,05 (около начала
промежутка x = 1) и при x = 1,45 (около конца промежутка x = 1,5),
а в таблице 3 лишь при x = 1,1 и при x = 1,4, т.е. при значениях аргу,
мента, более удаленных от концов промежутка. Наконец, при вычисле,
нии значений y ′ для нецелых (в частности, для полуцелых) значений
х с помощью интерполяции значения, полученные из таблицы 2, ока,
зываются достовернее значений, полученных из таблицы 3, так как на,
клон кривой более точно передают маленькие хорды, чем большие.
Поэтому первый способ предпочтителен.
Очень важные, принципиальные вопросы возникают в связи с огра,
ниченной точностью и ошибками, присущими каждому измерению.
При вычислении интеграла каждое отдельное измеренное значе,
ние y умножается на величину Δх. Поэтому при увеличении числа
отдельных измеренных значений функции y коэффициент, с кото,
рым в выражение интеграла входит каждое отдельное значение, умень,
шается обратно пропорционально числу промежутков Δх.
Следовательно, уменьшается и ошибка в интеграле, происходящая
за счет ошибок при каждом отдельном измерении величины y.
При вычислении производной разность двух значений y делится
на Δх. Чем меньше промежуток Δх, т.е. чем меньше знаменатель, тем

Таким образом, можно сразу определять значения y ′ для целых х по
значениям y при целых х справа и слева (см. таблицу 3).
Таблица 3
y′

x

y

1,00

1,6487

1,10

1,7333

0,867

1,20

1,8221

0,911

1,30

1,9155

0,958

1,40

2,0138

1,008

1,50

2,1170

* В таблице не выписаны полуцелые значения аргумента.

Рис. 7.

бо´льшую ошибку в величину производной вносит данная ошибка
в каждом измеренном значении у. Поэтому производная функции, за,
данной экспериментальными значениями, оказывается известной
с меньшей точностью, чем сама эта функция.
Разницу между дифференцированием и интегрированием поясним
примером.
На рис. 7 изображены две кривые — одна нарисована сплошной ли,
нией, другая пунктиром. Сплошная кривая — это график функции

44

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II
2

y = x − 01
, x 2 , пунктирная — график функции y 1 = x − 01
, x 2 + 05
, e −8 ( x − 3 ) .
Из рисунка видно, что одна кривая заметно отличается от другой лишь в не,
большом промежутке изменения х.
На рис. 8 показаны графики
x

x

0

0

§ 3]

ПОДБОР ФОРМУЛ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

45

Так как формула строится с учетом всех опытных данных, то значе,
ние производной при каждом значении х будет найдено по формуле
с учетом всех данных, а не только двух–трех ближайших.

I (x) = ∫ y dx и I 1 (x) = ∫ y 1 dx (пун,
ктирная кривая). Мы видим, что от,
личие между кривыми y(x) и y 1 (x)
дает небольшую добавку в интеграл
I 1 (x), заметную на графике лишь при
х > 2,8. В целом кривые I (x) и
I 1 (x) отличаются мало.
На рис. 9 показаны графики про,
изводных y ′ (x) и y 1′ (x). Мы видим,
что небольшое изменение функции
Рис. 8.
в малом промежутке вызвало в этом
промежутке большие изменения
производной. Еще сильнее разнятся вторые производные. Их графики
изображены на рис. 10, где масштаб по оси y взят в два раза меньше,
чем на рис. 7–9.
В случае, когда кривая получена из опыта, небольшое изменение
хода кривой на каком,либо промежутке может быть результатом
Рис. 10.

Поэтому естественно ожидать, что случайные ошибки в отдельных из,
мерениях меньше скажутся на величине производной.
Подбор формулы, описывающей результаты опыта, вообще являет,
ся существенной частью обработки экспериментальных данных. Задаче
подбора формулы по данным опыта посвящены два следующих параг,
рафа.
Упражнение

Рис. 9.

ошибки отдельного опыта. Из предыдущего примера видно, что на ве,
личине интеграла такие отдельные ошибки сказываются незначитель,
но, а на величину производной (и особенно высших производных) они
влияют сильно.
Для того чтобы получить надежные значения производной, нужно
сперва подобрать формулу, хорошо описывающую опытные данные,
а затем находить производную, пользуясь этой формулой.

В условиях упражнения 2 к § 1 подсчитайте значения y′ для полуцелых
значений х, приняв Δх = h = 0,5. Проинтерполируйте результат линейно,
а также по формулам (4) и (5) на целые значения х.

§ 3. Подбор формул по данным опыта по методу
наименьших квадратов
Подбор формул по экспериментальным данным называют подбором
эмпирических формул. На самом деле, конечно, формула тем лучше, чем
больше теоретических представлений вложено в нее, чем в меньшей
степени она является эмпирической. В действительности нужно сперва

44

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II
2

y = x − 01
, x 2 , пунктирная — график функции y 1 = x − 01
, x 2 + 05
, e −8 ( x − 3 ) .
Из рисунка видно, что одна кривая заметно отличается от другой лишь в не,
большом промежутке изменения х.
На рис. 8 показаны графики
x

x

0

0

§ 3]

ПОДБОР ФОРМУЛ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

45

Так как формула строится с учетом всех опытных данных, то значе,
ние производной при каждом значении х будет найдено по формуле
с учетом всех данных, а не только двух–трех ближайших.

I (x) = ∫ y dx и I 1 (x) = ∫ y 1 dx (пун,
ктирная кривая). Мы видим, что от,
личие между кривыми y(x) и y 1 (x)
дает небольшую добавку в интеграл
I 1 (x), заметную на графике лишь при
х > 2,8. В целом кривые I (x) и
I 1 (x) отличаются мало.
На рис. 9 показаны графики про,
изводных y ′ (x) и y 1′ (x). Мы видим,
что небольшое изменение функции
Рис. 8.
в малом промежутке вызвало в этом
промежутке большие изменения
производной. Еще сильнее разнятся вторые производные. Их графики
изображены на рис. 10, где масштаб по оси y взят в два раза меньше,
чем на рис. 7–9.
В случае, когда кривая получена из опыта, небольшое изменение
хода кривой на каком,либо промежутке может быть результатом
Рис. 10.

Поэтому естественно ожидать, что случайные ошибки в отдельных из,
мерениях меньше скажутся на величине производной.
Подбор формулы, описывающей результаты опыта, вообще являет,
ся существенной частью обработки экспериментальных данных. Задаче
подбора формулы по данным опыта посвящены два следующих параг,
рафа.
Упражнение

Рис. 9.

ошибки отдельного опыта. Из предыдущего примера видно, что на ве,
личине интеграла такие отдельные ошибки сказываются незначитель,
но, а на величину производной (и особенно высших производных) они
влияют сильно.
Для того чтобы получить надежные значения производной, нужно
сперва подобрать формулу, хорошо описывающую опытные данные,
а затем находить производную, пользуясь этой формулой.

В условиях упражнения 2 к § 1 подсчитайте значения y′ для полуцелых
значений х, приняв Δх = h = 0,5. Проинтерполируйте результат линейно,
а также по формулам (4) и (5) на целые значения х.

§ 3. Подбор формул по данным опыта по методу
наименьших квадратов
Подбор формул по экспериментальным данным называют подбором
эмпирических формул. На самом деле, конечно, формула тем лучше, чем
больше теоретических представлений вложено в нее, чем в меньшей
степени она является эмпирической. В действительности нужно сперва

46

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

задаться видом формулы, а затем, пользуясь результатами опыта, опре,
делять значения различных постоянных величин, входящих в нее.
Перед тем как приступить к подбору формулы, полезно нанести
опытные данные на график, после чего на глаз, от руки провести через
полученные точки наиболее правдоподобную кривую. При этом сразу
выявляются те данные, в которых можно подозревать большие ошиб,
ки. Очень важно при проведении кривой, кроме экспериментальных
точек, использовать общие соображения о том, как должна вести себя
кривая при значениях аргумента, весьма близких к нулю, при больших
значениях аргумента, проходит ли кривая через начало координат, пе,
ресекает ли координатные оси, касается ли их и т.п.
Итак, пусть эта предварительная работа проделана, выбран вид
формулы и нужно определить значения входящих в формулу постоян,
ных величин.
Как это сделать?
Рассмотрим наиболее простой пример.
Предположим, что y пропорционально х, т.е. ищем формулу вида
y = kx. Задача сводится к определению коэффициента k. Каждый опыт
дает определенное значение k, именно
kn =

yn
,
xn

где x n , y n — значения величин х, y, полученные в n,м опыте.
Индекс n у величины k показывает, что это — значение, соответству,
ющее n,м опыту. Из значений k n можно образовать среднее, положив
p

∑ kn

k = n =1 ,
p

где p — общее число опытов. Мы получаем формулу y = kx.
Отметим, что это — самый простой, но не самый лучший способ вы,
бора величины k. В самом деле, пусть х есть величина, характеризую,
щая условия опыта, которую мы задаем точно, а y есть результат
опыта, причем этот результат содержит в себе некоторую ошибку изме,
рения. Допустим, что и при малых и при больших значениях y ошибка
измерения Δy примерно одинакова. Тогда ошибка в величине kn, рав,
Δy n
ная
, тем больше, чем меньше хп. Следовательно, определяя вели,
xn
чину k, лучше ориентироваться на опыты с большими хп.
Поставим задачу о нахождении того значения k, при котором функ,
ция y = kx наилучшим образом соответствует опытным данным.
(Смысл нечеткого выражения «наилучшим образом» станет ясен из
дальнейшего.) За меру отклонения функции от экспериментальных

§ 3]

ПОДБОР ФОРМУЛ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

47

данных для n,го опыта выберем величину (y n − kx n )2 . Почему берет,
ся именно величина (y n − kx n )2 , а не y n − kx n ? Ясно, что оба знака
уклонения kxn от уп нехороши: плохо, если k таково, что yn < kxn, но
также нехорошо, если k таково, что уп > kxn. Если бы за меру отклоне,
ния мы взяли величину y n − kx n , а затем стали находить сумму откло,
нений в нескольких опытах, то мы могли бы получить весьма малую
величину за счет взаимного уничтожения отдельных слагаемых боль,
шой величины, но разных знаков. Это, однако, вовсе не говорило бы
о том, что взятая функция y = kx хороша. Если же за меру отклонения
взять (y n − kx n )2 , то такого взаимного уничтожения не произойдет,
так как все величины (y n − kx n )2 положительны. Отметим, что вмес,
то (y n − kx n )2 в принципе можно было бы взять y n − kx n ,
(y n − kx n )4 и т.д. Однако при этом дальнейшие вычисления значитель,
но усложнились бы.
В качестве меры общей ошибки S в описании опытных данных
функцией y = kx возьмем сумму мер отклонений для всех опытов, т.е.
p

S = ∑ ( yn − kxn )2 .

(6)

n =1

Метод определения констант, входящих в формулу, из требования,
чтобы общее отклонение S было наименьшим, называется методом
наименьших квадратов.
Заметим, что если одна величина y n − kx n = 10, т.е. при каком,то
одном x = x n формула дает ошибку в 10 единиц, то в величину S это
внесет 100 единиц. С другой стороны, наличие 10 ошибок по 1 единице
каждая внесет в S всего 10 единиц. Поэтому ясно, что на величи,
ну S сильнее всего влияют самые большие ошибки, а малые ошибки,
даже если они встречаются часто, влияют мало. Метод наименьших
квадратов нацелен на уменьшение самых больших отклонений.
Для того чтобы найти k = k , при котором S наименьшее, решим
dS
уравнение
= 0. Пользуясь (6), находим
dk
p

dS
= 2 ∑ ( yn − kxn )( − xn ) = 0,
dk
n =1

откуда
p

p

n =1

n =1

2 k ∑ xn2 − 2 ∑ xn yn = 0,

что дает
p

k=k =

∑ x n yn
n =1
p



n =1

xn2

=

x1 y1 + x2 y2 + K + x p y p
x12 + x22 + K + x 2p

.

(7)

46

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

задаться видом формулы, а затем, пользуясь результатами опыта, опре,
делять значения различных постоянных величин, входящих в нее.
Перед тем как приступить к подбору формулы, полезно нанести
опытные данные на график, после чего на глаз, от руки провести через
полученные точки наиболее правдоподобную кривую. При этом сразу
выявляются те данные, в которых можно подозревать большие ошиб,
ки. Очень важно при проведении кривой, кроме экспериментальных
точек, использовать общие соображения о том, как должна вести себя
кривая при значениях аргумента, весьма близких к нулю, при больших
значениях аргумента, проходит ли кривая через начало координат, пе,
ресекает ли координатные оси, касается ли их и т.п.
Итак, пусть эта предварительная работа проделана, выбран вид
формулы и нужно определить значения входящих в формулу постоян,
ных величин.
Как это сделать?
Рассмотрим наиболее простой пример.
Предположим, что y пропорционально х, т.е. ищем формулу вида
y = kx. Задача сводится к определению коэффициента k. Каждый опыт
дает определенное значение k, именно
kn =

yn
,
xn

где x n , y n — значения величин х, y, полученные в n,м опыте.
Индекс n у величины k показывает, что это — значение, соответству,
ющее n,м опыту. Из значений k n можно образовать среднее, положив
p

∑ kn

k = n =1 ,
p

где p — общее число опытов. Мы получаем формулу y = kx.
Отметим, что это — самый простой, но не самый лучший способ вы,
бора величины k. В самом деле, пусть х есть величина, характеризую,
щая условия опыта, которую мы задаем точно, а y есть результат
опыта, причем этот результат содержит в себе некоторую ошибку изме,
рения. Допустим, что и при малых и при больших значениях y ошибка
измерения Δy примерно одинакова. Тогда ошибка в величине kn, рав,
Δy n
ная
, тем больше, чем меньше хп. Следовательно, определяя вели,
xn
чину k, лучше ориентироваться на опыты с большими хп.
Поставим задачу о нахождении того значения k, при котором функ,
ция y = kx наилучшим образом соответствует опытным данным.
(Смысл нечеткого выражения «наилучшим образом» станет ясен из
дальнейшего.) За меру отклонения функции от экспериментальных

§ 3]

ПОДБОР ФОРМУЛ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

47

данных для n,го опыта выберем величину (y n − kx n )2 . Почему берет,
ся именно величина (y n − kx n )2 , а не y n − kx n ? Ясно, что оба знака
уклонения kxn от уп нехороши: плохо, если k таково, что yn < kxn, но
также нехорошо, если k таково, что уп > kxn. Если бы за меру отклоне,
ния мы взяли величину y n − kx n , а затем стали находить сумму откло,
нений в нескольких опытах, то мы могли бы получить весьма малую
величину за счет взаимного уничтожения отдельных слагаемых боль,
шой величины, но разных знаков. Это, однако, вовсе не говорило бы
о том, что взятая функция y = kx хороша. Если же за меру отклонения
взять (y n − kx n )2 , то такого взаимного уничтожения не произойдет,
так как все величины (y n − kx n )2 положительны. Отметим, что вмес,
то (y n − kx n )2 в принципе можно было бы взять y n − kx n ,
(y n − kx n )4 и т.д. Однако при этом дальнейшие вычисления значитель,
но усложнились бы.
В качестве меры общейошибки S в описании опытных данных
функцией y = kx возьмем сумму мер отклонений для всех опытов, т.е.
p

S = ∑ ( yn − kxn )2 .

(6)

n =1

Метод определения констант, входящих в формулу, из требования,
чтобы общее отклонение S было наименьшим, называется методом
наименьших квадратов.
Заметим, что если одна величина y n − kx n = 10, т.е. при каком,то
одном x = x n формула дает ошибку в 10 единиц, то в величину S это
внесет 100 единиц. С другой стороны, наличие 10 ошибок по 1 единице
каждая внесет в S всего 10 единиц. Поэтому ясно, что на величи,
ну S сильнее всего влияют самые большие ошибки, а малые ошибки,
даже если они встречаются часто, влияют мало. Метод наименьших
квадратов нацелен на уменьшение самых больших отклонений.
Для того чтобы найти k = k , при котором S наименьшее, решим
dS
уравнение
= 0. Пользуясь (6), находим
dk
p

dS
= 2 ∑ ( yn − kxn )( − xn ) = 0,
dk
n =1

откуда
p

p

n =1

n =1

2 k ∑ xn2 − 2 ∑ xn yn = 0,

что дает
p

k=k =

∑ x n yn
n =1
p



n =1

xn2

=

x1 y1 + x2 y2 + K + x p y p
x12 + x22 + K + x 2p

.

(7)

48

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

Если в каждом опыте получается точно
(7) получаем
k=

y n = kx n , то из формулы

x1 ⋅ kx1 + x2 ⋅ kx2 + K + x p ⋅ kx p
x12

+

x22

+ K+

[Гл. II

x 2p

p

x12 + x22 + K + x 2p

.

kmax x12 + kmax x22 + K + kmax x 2p
x12 + x22 + K + x 2p

Надо выбрать числа k и b так, чтобы величина S была наименьшей.
Для этого поступим так. Если бы b было уже найдено, то в правой
части (9) можно было бы изменять только k, поэтому должно было бы
быть*
p

(8)

Среди величин k1, k2, ..., kp, полученных в различных опытах, есть
наибольшая величина kmax и наименьшая kmin. Если заменить в пра,
вой части (8) все kn на kmax, то дробь только возрастет и мы получим

∂S
= 2 ∑ ( yn − kxn − b )( − xn ) = 0.
∂k
n =1

С другой стороны, если бы уже было найдено k, то должно было бы
быть
p

∂S
= −2 ∑ ( yn − kxn − b ) = 0.
∂b
n =1

= kmax .

Совершенно аналогично доказывается, что k > k min .

Эти два условия дают нам следующую систему уравнений для опреде,
ления чисел k и b:

Таким образом, величина k , найденная из условия минимума S,
удовлетворяет неравенствам k min < k < k max , т.е. действительно явля,
ется средней из всех значений k1, k2, ..., kp, однако это среднее состав,
ляется по более сложному правилу, нежели
k1 + k2 + K + k p
p

(9)

n =1

k1 x12 + k2 x22 + K + k p x 2p

k=

49

менить метод наименьших квадратов. Величина S для этого случая да,
ется формулой
S = ∑ ( yn − kxn − b )2 .

yn
различна, то, подстав,
xn
ляя в (7) вместо уп его значение kn xn, получим

k <

ПОДБОР ФОРМУЛ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

= k.

Если для различных опытов величина k n =

k=

§ 3]

.

В формуле (8) каждая величина kn входит в числитель с множите,
лем x 2n . Этот множитель называют весом*.
Ясно, что чем больше вес x 2n , тем сильнее влияет на величину k из,
мерение, соответствующее значению х = хп. Это подтверждает выска,
занную ранее мысль о том, что измерения с большими хп важнее для
правильного определения k.
Если нет оснований предполагать, что у = 0 при х = 0, то наиболее
простой является формула y = kx + b. В этом случае также можно при,
* Название «вес» происходит от следующей механической аналогии. Представим себе
шкалу, на которой откладываются расстояния k1, k2, ..., kp и в соответствующих точках
шкалы помещаются грузы. Если все эти грузы одинаковые, то центр тяжести такой системы
k1 + k2 + K + k p
. Если же
(весом самой шкалы пренебрегаем) находится в точке шкалы k =
p
в точку k1 поместить груз веса x 12 , в точку k2 — груз веса x 22 , ..., в точку kp — груз
веса x 2p , то положение центра тяжести дается формулой (8). Таким образом, эта формула
соответствует представлению о разной значимости, разном весе различных наблюдений.

p

p

p

n =1

n =1









∑ xn yn − k ∑ xn2 − b ∑ xn = 0,

n =1
p

p

n =1

n =1

∑ yn − k ∑ x n

− bp

= 0.

(10)

Из системы уравнений (10) нетрудно найти числа k и b. С этой
целью обозначим для краткости
p

p

σ1 = ∑ xn ,

σ 2 = ∑ xn2

n =1

n =1

p

r0 = ∑ yn
n =1

p

r1 = ∑ xn yn .
n =1

Тогда систему (10) можно переписать в виде
σ 2 k + σ1b = r1 , ⎫

σ1 k + pb = r0 . ⎭

Решая ее, получим
k=

pr1 − r0 σ1
,
pσ 2 − σ12

b=

r0 σ 2 − r1 σ1
.
pσ 2 − σ12

На описанный метод можно смотреть также с иной точки зрения.
* При рассмотрении функции от нескольких переменных производная по одной из
этих переменных при зафиксированных остальных обозначается с помощью буквы д,
а не d (ср., например, ВМ, § II. 12). Подробнее об этом мы поговорим в гл. IV.

48

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

Если в каждом опыте получается точно
(7) получаем
k=

y n = kx n , то из формулы

x1 ⋅ kx1 + x2 ⋅ kx2 + K + x p ⋅ kx p
x12

+

x22

+ K+

[Гл. II

x 2p

p

x12 + x22 + K + x 2p

.

kmax x12 + kmax x22 + K + kmax x 2p
x12 + x22 + K + x 2p

Надо выбрать числа k и b так, чтобы величина S была наименьшей.
Для этого поступим так. Если бы b было уже найдено, то в правой
части (9) можно было бы изменять только k, поэтому должно было бы
быть*
p

(8)

Среди величин k1, k2, ..., kp, полученных в различных опытах, есть
наибольшая величина kmax и наименьшая kmin. Если заменить в пра,
вой части (8) все kn на kmax, то дробь только возрастет и мы получим

∂S
= 2 ∑ ( yn − kxn − b )( − xn ) = 0.
∂k
n =1

С другой стороны, если бы уже было найдено k, то должно было бы
быть
p

∂S
= −2 ∑ ( yn − kxn − b ) = 0.
∂b
n =1

= kmax .

Совершенно аналогично доказывается, что k > k min .

Эти два условия дают нам следующую систему уравнений для опреде,
ления чисел k и b:

Таким образом, величина k , найденная из условия минимума S,
удовлетворяет неравенствам k min < k < k max , т.е. действительно явля,
ется средней из всех значений k1, k2, ..., kp, однако это среднее состав,
ляется по более сложному правилу, нежели
k1 + k2 + K + k p
p

(9)

n =1

k1 x12 + k2 x22 + K + k p x 2p

k=

49

менить метод наименьших квадратов. Величина S для этого случая да,
ется формулой
S = ∑ ( yn − kxn − b )2 .

yn
различна, то, подстав,
xn
ляя в (7) вместо уп его значение kn xn, получим

k <

ПОДБОР ФОРМУЛ ПО МЕТОДУ НАИМЕНЬШИХ КВАДРАТОВ

= k.

Если для различных опытов величина k n =

k=

§ 3]

.

В формуле (8) каждая величина kn входит в числитель с множите,
лем x 2n . Этот множитель называют весом*.
Ясно, что чем больше вес x 2n , тем сильнее влияет на величину k из,
мерение, соответствующее значению х = хп. Это подтверждает выска,
занную ранее мысль о том, что измерения с большими хп важнее для
правильного определения k.
Если нет оснований предполагать, что у = 0 при х = 0, то наиболее
простой является формула y = kx + b. В этом случае также можно при,
* Название «вес» происходит от следующей механической аналогии. Представим себе
шкалу, на которой откладываются расстояния k1, k2, ..., kp и в соответствующих точках
шкалы помещаются грузы. Если все эти грузы одинаковые, то центр тяжести такой системы
k1 + k2 + K + k p
. Если же
(весом самой шкалы пренебрегаем) находится в точке шкалы k =
p
в точку k1 поместить груз веса x 12 , в точку k2 — груз веса x 22 , ..., в точку kp — груз
веса x 2p , то положение центра тяжести дается формулой (8). Таким образом, эта формула
соответствует представлению о разной значимости, разном весе различных наблюдений.

p

p

p

n =1

n =1









∑ xn yn − k ∑ xn2 − b ∑ xn = 0,

n =1
p

p

n =1

n =1

∑ yn − k ∑ x n

− bp

= 0.

(10)

Из системы уравнений (10) нетрудно найти числа k и b. С этой
целью обозначим для краткости
p

p

σ1 = ∑ xn ,

σ 2 = ∑ xn2

n =1

n =1

p

r0 = ∑ yn
n =1

p

r1 = ∑ xn yn .
n =1

Тогда систему (10) можно переписать в виде
σ 2 k + σ1b = r1 , ⎫

σ1 k + pb = r0 . ⎭

Решая ее, получим
k=

pr1 − r0 σ1
,
pσ 2 − σ12

b=

r0 σ 2 − r1 σ1
.
pσ 2 − σ12

На описанный метод можно смотреть также с иной точки зрения.
* При рассмотрении функции от нескольких переменных производная по одной из
этих переменных при зафиксированных остальных обозначается с помощью буквы д,
а не d (ср., например, ВМ, § II. 12). Подробнее об этом мы поговорим в гл. IV.

50

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Задавшись формой линейной зависимости

§ 4]

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

б)

y = kx + b

между рассматриваемыми величинами х и у, мы получаем два неиз,
вестных параметра k и b. В результате измерений мы приходим к со,
отношениям между этими параметрами

Упражнения
1. Подберите формулу вида y = kx методом наименьших квадратов в слу,
чае следующих данных опыта:
а)
x

0,25

0,50

0,75

1,00

1,25

1,50

1,75

2,00

y

0,40

0,50

0,90

1,28

1,60

1,66

2,02

2,40

x

0,25

0,50

0,75

1,00

1,25

y

0,16

0,18

0,80

0,60

1,08

x

0,4

0,8

1,2

1,6

2,0

y

0,69

1,44

2,08

2,74

3,52

в)

kx1 + b = y1 , ⎫

kx2 + b = y2 , ⎪

......... ⎪
kx p + b = y p , ⎪⎭

т.е. к системе из p уравнении с двумя неизвестными. Такая система
при р > 2 является переопределенной, так как в принципе достаточно
двух уравнений, чтобы найти эти неизвестные. Однако учитывая, что
физические величины х и у замеряются с определенной погрешнос,
тью, мы получаем, что в случае двух измерений (т.е. при р = 2) на значе,
ния k и b могут существенно влиять случайные ошибки измерений,
так что при этом точность результата останется неясной. Поэтому
уменьшение числа уравнений, содержащих такие случайные факторы,
опасно. Напротив, чем больше измерений, т.е. чем в большей степени
система переопределена, тем лучше, так как тогда случайные ошибки
отдельных измерений погашают друг друга, и решение, найденное по
методу наименьших квадратов, становится более достоверным.
Не представляет труда обобщить метод наименьших квадратов для
случая более сложных зависимостей между величинами х и у. Сле,
дует отметить, однако, что метод наименьших квадратов часто приво,
дит к довольно громоздким вычислениям. В случаях, когда искомые
параметры входят в участвующие зависимости нелинейно, метод при,
водит к системе нелинейных уравнений, и вычислительные трудности
особенно возрастают. Поэтому в практической работе зачастую более
эффективными оказываются графические методы подбора формул, ко,
торые мы рассмотрим в следующем параграфе.

51

Нанесите на график в каждом из трех случаев табличные точки и прямую,
полученную по методу наименьших квадратов. (Графики стройте на милли,
метровой бумаге.)
2. По данным следующей таблицы подберите числа k и b для формулы
y = kx + b методом наименьших квадратов:
x

–0,20

0,20

0,40

0,60

0,70

0,80

y

0,96

1,40

1,56

1,74

1,92

2,04

3. Пусть даны две точки (х1; y1) и (х2; y2) . Будем по этим данным подбирать
числа k и b для уравнения прямой y = kx + b методом наименьших квадра,
тов. Покажите, что при этом получим абсолютно точный результат, т.е. полу,
чится уравнение прямой, проходящей через указанные две точки.

§ 4. Графический способ подбора формул
Напомним, что уравнение прямой линии имеет вид y = kx + b, при,
чем числа k и b имеют простой геометрический смысл (см., напри,
мер, ВМ, § IV.4): b есть величина отрезка, отсекаемого прямой на
оси y, a k есть тангенс угла α наклона прямой к оси x (рис. 11).
Пусть предполагается, что величины y и x связаны линейно, т.е.
y = kx + b. Нанесем экспериментальные точки на график. Наложив на гра,
фик прозрачную линейку и передвигая ее, нетрудно получить такую пря,
мую, к которой экспериментальные точки лежат ближе всего (рис. 12).
Y
Проведя эту прямую, мы определяем из чертежа b и k = .
X
Большое преимущество графического способа связано с его нагляд,
ностью. Если экспериментальные точки ложатся на прямую, за исклю,
чением отдельных выпавших точек, то эти точки наглядно выделяются
и видно, какие точки следует проверить. Если экспериментальные точ,
ки в целом не лежат на прямой, то это также видно из графика. В этом

50

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Задавшись формой линейной зависимости

§ 4]

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

б)

y = kx + b

между рассматриваемыми величинами х и у, мы получаем два неиз,
вестных параметра k и b. В результате измерений мы приходим к со,
отношениям между этими параметрами

Упражнения
1. Подберите формулу вида y = kx методом наименьших квадратов в слу,
чае следующих данных опыта:
а)
x

0,25

0,50

0,75

1,00

1,25

1,50

1,75

2,00

y

0,40

0,50

0,90

1,28

1,60

1,66

2,02

2,40

x

0,25

0,50

0,75

1,00

1,25

y

0,16

0,18

0,80

0,60

1,08

x

0,4

0,8

1,2

1,6

2,0

y

0,69

1,44

2,08

2,74

3,52

в)

kx1 + b = y1 , ⎫

kx2 + b = y2 , ⎪

......... ⎪
kx p + b = y p , ⎪⎭

т.е. к системе из p уравнении с двумя неизвестными. Такая система
при р > 2 является переопределенной, так как в принципе достаточно
двух уравнений, чтобы найти эти неизвестные. Однако учитывая, что
физические величины х и у замеряются с определенной погрешнос,
тью, мы получаем, что в случае двух измерений (т.е. при р = 2) на значе,
ния k и b могут существенно влиять случайные ошибки измерений,
так что при этом точность результата останется неясной. Поэтому
уменьшение числа уравнений, содержащих такие случайные факторы,
опасно. Напротив, чем больше измерений, т.е. чем в большей степени
система переопределена, тем лучше, так как тогда случайные ошибки
отдельных измерений погашают друг друга, и решение, найденное по
методу наименьших квадратов, становится более достоверным.
Не представляет труда обобщить метод наименьших квадратов для
случая более сложных зависимостей между величинами х и у. Сле,
дует отметить, однако, что метод наименьших квадратов часто приво,
дит к довольно громоздким вычислениям. В случаях, когда искомые
параметры входят в участвующие зависимости нелинейно, метод при,
водит к системе нелинейных уравнений, и вычислительные трудности
особенно возрастают. Поэтому в практической работе зачастую более
эффективными оказываются графические методы подбора формул, ко,
торые мы рассмотрим в следующем параграфе.

51

Нанесите на график в каждом из трех случаев табличные точки и прямую,
полученную по методу наименьших квадратов. (Графики стройте на милли,
метровой бумаге.)
2. По данным следующей таблицы подберите числа k и b для формулы
y = kx + b методом наименьших квадратов:
x

–0,20

0,20

0,40

0,60

0,70

0,80

y

0,96

1,40

1,56

1,74

1,92

2,04

3. Пусть даны две точки (х1; y1) и (х2; y2) . Будем по этим данным подбирать
числа k и b для уравнения прямой y = kx + b методом наименьших квадра,
тов. Покажите, что при этом получим абсолютно точный результат, т.е. полу,
чится уравнение прямой, проходящей через указанные две точки.

§ 4. Графический способ подбора формул
Напомним, что уравнение прямой линии имеет вид y = kx + b, при,
чем числа k и b имеют простой геометрический смысл (см., напри,
мер, ВМ, § IV.4): b есть величина отрезка, отсекаемого прямой на
оси y, a k есть тангенс угла α наклона прямой к оси x (рис. 11).
Пусть предполагается, что величины y и x связаны линейно, т.е.
y = kx + b. Нанесем экспериментальные точки на график. Наложив на гра,
фик прозрачную линейку и передвигая ее, нетрудно получить такую пря,
мую, к которой экспериментальные точки лежат ближе всего (рис. 12).
Y
Проведя эту прямую, мы определяем из чертежа b и k = .
X
Большое преимущество графического способа связано с его нагляд,
ностью. Если экспериментальные точки ложатся на прямую, за исклю,
чением отдельных выпавших точек, то эти точки наглядно выделяются
и видно, какие точки следует проверить. Если экспериментальные точ,
ки в целом не лежат на прямой, то это также видно из графика. В этом

52

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

случае зависимость между величинами х, у имеет более сложный
вид, нежели y = kx + b. Кроме этого, при применении графического спо,
соба не нужны сравнительно длинные расчеты, связанные с методом
наименьших квадратов, в которые всегда может вкрасться вычисли,
тельная ошибка.

§ 4]

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

53

где α — коэффициент теплоотдачи, a S — поверхность проволоки,
при больших температурах коэффициент α также непостоянен.
Однако равенство температур для токов i и –i по,прежнему имеет
место. Поэтому естественно добавить в формулу T = ai2 + b, которая
теперь может оказаться неточной, член ci4 (а не ci 3 ).
Итак, ищем формулу в виде T = сi4 + ai2 + b.
Заметим, что Т=b при i = 0, так что b не отличается от температу,
ры окружающей среды, а потому известно (см. выше). Перепишем фор,
мулу так:
T −b
= ci 2 + a .
i2

Вводя новые переменные x = i2 , y =

Рис. 11.

Рис. 12.

Прямая линия занимает исключительное положение в графическом
подборе формул. Никакая другая линия не может быть так просто и вмес,
те с тем так надежно проведена по данным точкам. Всякий, кто в практике
лабораторной работы сравнивал определение чисел k и b в уравнении
прямой по графику с определением их по методу наименьших квадратов,
знает, что различие всегда весьма невелико.
Как же подобрать, пользуясь графиком, константы, входящие в фор,
мулу, если эта формула имеет более сложный вид, нежели y = kx + b?
Рассмотрим пример.
Пусть исследуется зависимость между температурой Т проволоки
и силой i постоянного тока, текущего по этой проволоке. Ясно, что из,
менение направления тока не меняет величины Т, т.е. Т(–i) = Т(i). По,
этому зависимость вида T = ai + b не годится. Будем искать формулу
вида T = ai2 + b. График функции T(i) есть парабола, а провести на
глаз параболу трудно. Поэтому введем новую переменную z = i2 , тогда
T = az + b, так что в координатах z, T искомая зависимость изобража,
ется прямой линией. При этом значение температуры b = T 0 при отсу,
тствии тока можно считать известным, так что остается определить
2
коэффициент a при i .
При большой силе тока, когда достигаются высокие температуры,
сопротивление проволоки нельзя считать постоянным. Поэтому теп,
ловая мощность (количество тепла, выделяющееся в единицу време,
ни), равная W = Ri2 , в действительности не просто пропорциональна
i2 , так как меняется R. В уравнени теплового баланса
W = Ri 2 = αS (T − T0 ),

T −b

, получаем y = cx + a,
i2
т.е. х и у связаны линейной зависимостью. Построив график в коор,
динатах х, у, легко определить числа a и c.
Таким образом, общая идея графического метода состоит в том, что
надо ввести новые переменные так, чтобы в этих переменных интересу,
ющая нас зависимость становилась линейной.
Приведем еще несколько примеров.
Часто встречается такая зависимость между х и у, когда заведомо
известно, что при х = 0 должно быть у = 0, но опытные данные на гра,
фике не ложатся на прямую. В этом случае может оказаться справедли,
вой формула
y = ax + bx 2 .

Разделим все члены на х, получим
чаем линейную зависимость z от x

y
y
= a + bx. Положив
= z , полу,
x
x

z = a + bx.

Другая формула, которая может оказаться годной для этого случая,
п
это у = ах . Как определить показатель степени n? Для этого пролога,
рифмируем обе части формулы:
lg y = n lg x + lg a .

Вводя новые переменные z = lg y, t = lg x, получим линейную зависимость
z = lg a + nt.

Закон радиоактивного распада описывается формулой n = n0 e − ωt ,
где n — число атомов, еще не распавшихся к моменту времени t; п0 —
общее число атомов, ω — вероятность распада. Логарифмируя обе час,
ти формулы, получим
ln n = ln n0 − ωt.

52

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

случае зависимость между величинами х, у имеет более сложный
вид, нежели y = kx + b. Кроме этого, при применении графического спо,
соба не нужны сравнительно длинные расчеты, связанные с методом
наименьших квадратов, в которые всегда может вкрасться вычисли,
тельная ошибка.

§ 4]

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

53

где α — коэффициент теплоотдачи, a S — поверхность проволоки,
при больших температурах коэффициент α также непостоянен.
Однако равенство температур для токов i и –i по,прежнему имеет
место. Поэтому естественно добавить в формулу T = ai2 + b, которая
теперь может оказаться неточной, член ci4 (а не ci 3 ).
Итак, ищем формулу в виде T = сi4 + ai2 + b.
Заметим, что Т=b при i = 0, так что b не отличается от температу,
ры окружающей среды, а потому известно (см. выше). Перепишем фор,
мулу так:
T −b
= ci 2 + a .
i2

Вводя новые переменные x = i2 , y =

Рис. 11.

Рис. 12.

Прямая линия занимает исключительное положение в графическом
подборе формул. Никакая другая линия не может быть так просто и вмес,
те с тем так надежно проведена по данным точкам. Всякий, кто в практике
лабораторной работы сравнивал определение чисел k и b в уравнении
прямой по графику с определением их по методу наименьших квадратов,
знает, что различие всегда весьма невелико.
Как же подобрать, пользуясь графиком, константы, входящие в фор,
мулу, если эта формула имеет более сложный вид, нежели y = kx + b?
Рассмотрим пример.
Пусть исследуется зависимость между температурой Т проволоки
и силой i постоянного тока, текущего по этой проволоке. Ясно, что из,
менение направления тока не меняет величины Т, т.е. Т(–i) = Т(i). По,
этому зависимость вида T = ai + b не годится. Будем искать формулу
вида T = ai2 + b. График функции T(i) есть парабола, а провести на
глаз параболу трудно. Поэтому введем новую переменную z = i2 , тогда
T = az + b, так что в координатах z, T искомая зависимость изобража,
ется прямой линией. При этом значение температуры b = T 0 при отсу,
тствии тока можно считать известным, так что остается определить
2
коэффициент a при i .
При большой силе тока, когда достигаются высокие температуры,
сопротивление проволоки нельзя считать постоянным. Поэтому теп,
ловая мощность (количество тепла, выделяющееся в единицу време,
ни), равная W = Ri2 , в действительности не просто пропорциональна
i2 , так как меняется R. В уравнени теплового баланса
W = Ri 2 = αS (T − T0 ),

T −b

, получаем y = cx + a,
i2
т.е. х и у связаны линейной зависимостью. Построив график в коор,
динатах х, у, легко определить числа a и c.
Таким образом, общая идея графического метода состоит в том, что
надо ввести новые переменные так, чтобы в этих переменных интересу,
ющая нас зависимость становилась линейной.
Приведем еще несколько примеров.
Часто встречается такая зависимость между х и у, когда заведомо
известно, что при х = 0 должно быть у = 0, но опытные данные на гра,
фике не ложатся на прямую. В этом случае может оказаться справедли,
вой формула
y = ax + bx 2 .

Разделим все члены на х, получим
чаем линейную зависимость z от x

y
y
= a + bx. Положив
= z , полу,
x
x

z = a + bx.

Другая формула, которая может оказаться годной для этого случая,
п
это у = ах . Как определить показатель степени n? Для этого пролога,
рифмируем обе части формулы:
lg y = n lg x + lg a .

Вводя новые переменные z = lg y, t = lg x, получим линейную зависимость
z = lg a + nt.

Закон радиоактивного распада описывается формулой n = n0 e − ωt ,
где n — число атомов, еще не распавшихся к моменту времени t; п0 —
общее число атомов, ω — вероятность распада. Логарифмируя обе час,
ти формулы, получим
ln n = ln n0 − ωt.

54

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Следовательно, мы получим прямую линию в координатаx t, y = ln n.
(Подробнее о радиоактивном распаде см. ВМ, § V. 3.)
При исследовании зависимости какой2либо величины х от темпе2
ратуры T очень часто получается формула вида
x = Be



A
kT

.

Такая формула получается в тех случаях*, когда дают вклад только те
молекулы (или электроны), энергия которых больше величины А; ве2
эрг ⎞

личина k — постоянная Больцмана ⎜ k = 1,4⋅ 10 −16
⎟.
град ⎠

A 1
. Зависимость становит2
Логарифмируя, получим ln x = ln B −
k T
1
ся линейной, если рассматривать величины y =
и z = ln x , действи2
T
A
тельно, z = ln B − y.
k
Во всех рассмотренных нами примерах мы после выбора вида фор2
мулы вводили новые переменные так, чтобы зависимость между этими
новыми переменными была линейной. Может, однако, случиться, что
в новых переменных экспериментальные точки не будут ложиться на
прямую. Это означает, что вид формулы выбран неудачно, следует под2
бирать формулу другого вида.
Пусть проделан ряд опытов, в которых при значениях аргумента
х1, х2, . . . , хp получены значения функции y1, y2, . . . , yp. Пусть зна2
чения аргумента расположены в порядке возрастания х1 < х2 < . . . < хp.
Определение ожидаемого из опыта значения y при значении х, лежа2
щем внутри исследованного промежутка изменения аргумента
(х1 < х2 < хp), составляет задачу интерполяций (ср. начало § 1).
Интерполяцию легко и просто произвести, если подобрана эмпири2
ческая формула. При этом если формула подобрана хорошо, то интер2
поляция обычно дает хорошие результаты, редко приводит к большим
ошибкам. Значительно труднее другая задача: найти, какое значе2
ние y следует ожидать из опыта при некотором значении x, лежащем
вне исследованного на опыте промежутка изменения аргумента, на2
пример при х > хp . Определение такого значения по данным опыта со2
ставляет задачу экстраполяции.
Решение задачи об экстраполяции в каждом конкретном случае тре2
бует глубокого понимания существа изучаемого явления, такую задачу
нельзя решать формально, пользуясь подобранной формулой. (Пра2
вильно высказалась по этому поводу Кретя Патачкувна в книге «Пи»:
«Очень трудно что2либо предвидеть, особенно на будущее».)
* Несколько таких случаев рассмотрено в ВМ, гл. VII.

§ 4]

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

55

Например, если по экспериментальным данным подобрана форму2
ла вида y = a + bx + cx 2 + px 3 , причем она очень хорошо описывает ре2
зультаты опыта, то, как правило, члены cx 2 , px 3 вводятся в формулу,
чтобы описать отклонение экспериментальных точек от прямой в том
промежутке изменения х, где производились измерения. При этом
члены cx 2 и px 3 обычно носят характер малых поправок к главному
члену a + bx .
Если же, пользуясь такой формулой, мы будем производить экстра2
поляцию у для больших, далеких от исследованных на опыте, значе2
ний х, то члены cx 2 и px 3 начнут играть главную роль, что, однако,
может совершенно не соответствовать существу явления. Положение
вещей напоминает сказку Андерсена, в которой тень, отделившись от
человека, начинает жить самостоятельно, делает карьеру и, наконец, за2
ставляет самого человека служить ей.
Если при неограниченном возрастании x величина у приближает2
ся к определенному значению y ∞ , то бывает полезно отыскать это зна2
чение. Такая задача называется
экстраполяцией на бесконечность.
При ее решении часто оказывается
целесообразным ввести новую не2
зависимую переменную z, кото2
рая оставалась бы конечной при
1
x = ∞, например z = . После та2
x
кого перехода интервал (по z), на
который производится экстрапо2
ляция, будет уже конечным.
Рис. 13.
Рассмотрим пример.
Пусть в длинном заряде взрывчатого вещества с одного конца при
помощи капсуля вызвана детонация (взрыв), которая начинает рас2
пространяться по длине заряда. Ясно, что при весьма большой длине
заряда действие его на какую2либо преграду перестает зависеть от дли2
ны заряда. Действительно, когда мы увеличиваем длину достаточно
длинного заряда, то мы увеличиваем количество взрывчатого вещес2
тва, находящегося далеко от преграды, а потому оказывающего весьма
малое действие. Пусть, например, через у обозначена максимальная
толщина стальной стенки, которую разрушает заряд длины x. На гра2
фике рис. 13 нанесены опытные данные. Из рисунка видно, что с рос2
том x величина у приближается к определенному значению y ∞ .
Однако определить по графику это значение y ∞ нельзя.
Как же найти его? Предположим, что при больших x формула имеет
a
1
вид y = y ∞ − . Введя новую переменную z = , получаем y = y ∞ − a ⋅ z.
x
x

54

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Следовательно, мы получим прямую линию в координатаx t, y = ln n.
(Подробнее о радиоактивном распаде см. ВМ, § V. 3.)
При исследовании зависимости какой2либо величины х от темпе2
ратуры T очень часто получается формула вида
x = Be



A
kT

.

Такая формула получается в тех случаях*, когда дают вклад только те
молекулы (или электроны), энергия которых больше величины А; ве2
эрг ⎞

личина k — постоянная Больцмана ⎜ k = 1,4⋅ 10 −16
⎟.
град ⎠

A 1
. Зависимость становит2
Логарифмируя, получим ln x = ln B −
k T
1
ся линейной, если рассматривать величины y =
и z = ln x , действи2
T
A
тельно, z = ln B − y.
k
Во всех рассмотренных нами примерах мы после выбора вида фор2
мулы вводили новые переменные так, чтобы зависимость между этими
новыми переменными была линейной. Может, однако, случиться, что
в новых переменных экспериментальные точки не будут ложиться на
прямую. Это означает, что вид формулы выбран неудачно, следует под2
бирать формулу другого вида.
Пусть проделан ряд опытов, в которых при значениях аргумента
х1, х2, . . . , хp получены значения функции y1, y2, . . . , yp. Пусть зна2
чения аргумента расположены в порядке возрастания х1 < х2 < . . . < хp.
Определение ожидаемого из опыта значения y при значении х, лежа2
щем внутри исследованного промежутка изменения аргумента
(х1 < х2 < хp), составляет задачу интерполяций (ср. начало § 1).
Интерполяцию легко и просто произвести, если подобрана эмпири2
ческая формула. При этом если формула подобрана хорошо, то интер2
поляция обычно дает хорошие результаты, редко приводит к большим
ошибкам. Значительно труднее другая задача: найти, какое значе2
ние y следует ожидать из опыта при некотором значении x, лежащем
вне исследованного на опыте промежутка изменения аргумента, на2
пример при х > хp . Определение такого значения по данным опыта со2
ставляет задачу экстраполяции.
Решение задачи об экстраполяции в каждом конкретном случае тре2
бует глубокого понимания существа изучаемого явления, такую задачу
нельзя решать формально, пользуясь подобранной формулой. (Пра2
вильно высказалась по этому поводу Кретя Патачкувна в книге «Пи»:
«Очень трудно что2либо предвидеть, особенно на будущее».)
* Несколько таких случаев рассмотрено в ВМ, гл. VII.

§ 4]

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

55

Например, если по экспериментальным данным подобрана форму2
ла вида y = a + bx + cx 2 + px 3 , причем она очень хорошо описывает ре2
зультаты опыта, то, как правило, члены cx 2 , px 3 вводятся в формулу,
чтобы описать отклонение экспериментальных точек от прямой в том
промежутке изменения х, где производились измерения. При этом
члены cx 2 и px 3 обычно носят характер малых поправок к главному
члену a + bx .
Если же, пользуясь такой формулой, мы будем производить экстра2
поляцию у для больших, далеких от исследованных на опыте, значе2
ний х, то члены cx 2 и px 3 начнут играть главную роль, что, однако,
может совершенно не соответствовать существу явления. Положение
вещей напоминает сказку Андерсена, в которой тень, отделившись от
человека, начинает жить самостоятельно, делает карьеру и, наконец, за2
ставляет самого человека служить ей.
Если при неограниченном возрастании x величина у приближает2
ся к определенному значению y ∞ , то бывает полезно отыскать это зна2
чение. Такая задача называется
экстраполяцией на бесконечность.
При ее решении часто оказывается
целесообразным ввести новую не2
зависимую переменную z, кото2
рая оставалась бы конечной при
1
x = ∞, например z = . После та2
x
кого перехода интервал (по z), на
который производится экстрапо2
ляция, будет уже конечным.
Рис. 13.
Рассмотрим пример.
Пусть в длинном заряде взрывчатого вещества с одного конца при
помощи капсуля вызвана детонация (взрыв), которая начинает рас2
пространяться по длине заряда. Ясно, что при весьма большой длине
заряда действие его на какую2либо преграду перестает зависеть от дли2
ны заряда. Действительно, когда мы увеличиваем длину достаточно
длинного заряда, то мы увеличиваем количество взрывчатого вещес2
тва, находящегося далеко от преграды, а потому оказывающего весьма
малое действие. Пусть, например, через у обозначена максимальная
толщина стальной стенки, которую разрушает заряд длины x. На гра2
фике рис. 13 нанесены опытные данные. Из рисунка видно, что с рос2
том x величина у приближается к определенному значению y ∞ .
Однако определить по графику это значение y ∞ нельзя.
Как же найти его? Предположим, что при больших x формула имеет
a
1
вид y = y ∞ − . Введя новую переменную z = , получаем y = y ∞ − a ⋅ z.
x
x

56

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Теперь y ∞ соответствует значению z = 0. Построив данные опыта в ко*
ординатах x, y*, мы можем на глаз определить предполагаемое значе*
ние у при z = 0 (рис. 14).
a
Формула y = y ∞ − справедлива лишь для достаточно больших x.
x
a
a
она дает y = 0, а если x <
, то получаем даже y < 0, что
При x =
y∞
y∞
совершенно бессмысленно. Поэ*
тому на рис. 14 точки, полученные
из опыта, лежат не на прямой, а на
кривой, однако в координа*
тах z, y можно эту кривую экс*
траполировать на z = 0, что соот*
ветствует y = ∞.
Из физического смысла задачи
ясно еще, что должно быть y = 0
при x = 0. Наиболее простая фор*
мула, отражающая оба известных
Рис. 14.
нам свойства функции y (y = 0
при x = 0 и у неограниченно приближается к значению y ∞ , если х не*
ограниченно возрастает), имеет вид
y=

y∞ x
.
x+b

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

57

Упражнения
1. По данным следующей таблицы подберите формулу вида y = ax 2 + b:
x

0,5

1,0

1,5

2,0

2,5

3,0

y

1,20

1,10

2,35

3,05

4,40

5,50

Решите задачу двумя способами:
а) методом наименьших квадратов,
б) графически.
2. Графическим способом подберите формулу вида y = ax 2 + bx, если ре*
зультаты опыта таковы:
x

0

0,5

1,0

1,5

2,0

2,5

3,0

y

0

1,7

3,1

3,8

3,9

3,8

3,0

3. По данным таблицы

(11)

Как определить, пользуясь экспериментальными данными, посто*
янные y ∞ и b?
Для этого перепишем формулу так:

x

1

2

3

4

y

0,5

1,4

2,5

4

подберите формулу вида y = Ax b . (Примените графический способ.)
4. Результаты измерений дали следующее:

1 x+b
,
=
y y∞ x

или
1
1
b 1
=
+
⋅ .
y y∞ y∞ x

Поэтому можно надеяться, что если мы будем строить на графике

§ 4]

1
в за*
y

1
1
b
и
. Даже
, то получим прямую линию и определим
x
y∞ y∞
если точки будут плохо ложиться на прямую, то все равно экстраполяция
по такому графику надежнее, чем по графику рис. 14, так как формула (11)
построена с учетом двух (а не одного, как раньше) свойств функции y(x).

висимости от

* На графиках рис. 13 и 14 точки, соответствующие друг другу, снабжены одинако*
выми номерами.

x

0,5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

y

1,66

1,58

1,50

1,44

1,37

1,30

1,22

1,17

Кроме того, известно следующее:
а) при неограниченном увеличении x величина у приближается к нулю;
б) при х = 0 величина у имеет вполне определенное значение. Этим усло*
виям удовлетворяют, например, такие простые формулы:
y=

1
B + Cx

и

y = Ae − kx ,

Подберите значения параметров, входящих в эти формулы. Пользуясь фор*
мулами, получите значения у при x = 1,25; x = 3,75; x = –1; x = –2; x = –3.
Сравните результаты.

56

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

Теперь y ∞ соответствует значению z = 0. Построив данные опыта в ко*
ординатах x, y*, мы можем на глаз определить предполагаемое значе*
ние у при z = 0 (рис. 14).
a
Формула y = y ∞ − справедлива лишь для достаточно больших x.
x
a
a
она дает y = 0, а если x <
, то получаем даже y < 0, что
При x =
y∞
y∞
совершенно бессмысленно. Поэ*
тому на рис. 14 точки, полученные
из опыта, лежат не на прямой, а на
кривой, однако в координа*
тах z, y можно эту кривую экс*
траполировать на z = 0, что соот*
ветствует y = ∞.
Из физического смысла задачи
ясно еще, что должно быть y = 0
при x = 0. Наиболее простая фор*
мула, отражающая оба известных
Рис. 14.
нам свойства функции y (y = 0
при x = 0 и у неограниченно приближается к значению y ∞ , если х не*
ограниченно возрастает), имеет вид
y=

y∞ x
.
x+b

ГРАФИЧЕСКИЙ СПОСОБ ПОДБОРА ФОРМУЛ

57

Упражнения
1. По данным следующей таблицы подберите формулу вида y = ax 2 + b:
x

0,5

1,0

1,5

2,0

2,5

3,0

y

1,20

1,10

2,35

3,05

4,40

5,50

Решите задачу двумя способами:
а) методом наименьших квадратов,
б) графически.
2. Графическим способом подберите формулу вида y = ax 2 + bx, если ре*
зультаты опыта таковы:
x

0

0,5

1,0

1,5

2,0

2,5

3,0

y

0

1,7

3,1

3,8

3,9

3,8

3,0

3. По данным таблицы

(11)

Как определить, пользуясь экспериментальными данными, посто*
янные y ∞ и b?
Для этого перепишем формулу так:

x

1

2

3

4

y

0,5

1,4

2,5

4

подберите формулу вида y = Ax b . (Примените графический способ.)
4. Результаты измерений дали следующее:

1 x+b
,
=
y y∞ x

или
1
1
b 1
=
+
⋅ .
y y∞ y∞ x

Поэтому можно надеяться, что если мы будем строить на графике

§ 4]

1
в за*
y

1
1
b
и
. Даже
, то получим прямую линию и определим
x
y∞ y∞
если точки будут плохо ложиться на прямую, то все равно экстраполяция
по такому графику надежнее, чем по графику рис. 14, так как формула (11)
построена с учетом двух (а не одного, как раньше) свойств функции y(x).

висимости от

* На графиках рис. 13 и 14 точки, соответствующие друг другу, снабжены одинако*
выми номерами.

x

0,5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

y

1,66

1,58

1,50

1,44

1,37

1,30

1,22

1,17

Кроме того, известно следующее:
а) при неограниченном увеличении x величина у приближается к нулю;
б) при х = 0 величина у имеет вполне определенное значение. Этим усло*
виям удовлетворяют, например, такие простые формулы:
y=

1
B + Cx

и

y = Ae − kx ,

Подберите значения параметров, входящих в эти формулы. Пользуясь фор*
мулами, получите значения у при x = 1,25; x = 3,75; x = –1; x = –2; x = –3.
Сравните результаты.

58

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

ОТВЕТЫ И РЕШЕНИЯ

3. Уравнение прямой имеет вид y = kx + b. Числа k и b определяются из
условий y = y1 при x = x1 и y = y2 при x = x2 . Получаем систему уравнений

5. Результаты опыта дали следующее:
x

1,0

1,5

2,0

3,0

4,0

5,0

y

1,6

1,7

2,0

2,3

2,4

2,5

Известно, кроме того, что при неограниченном возрастании x величи/
на у приближается к некоторому значению y∞ . Найдите это предельное зна/
чение двумя способами:
B
а) подбирая формулу вида y = A + ;
x
ax
б) подбирая формулу вида y =
.
x+b

kx1 + b = y1 , ⎫

kx2 + b = y2 , ⎭
из которой находим
k=

§1
1. По формуле (2) y3 / 2 = 145
, ; по формуле (4) y3 / 2 = 141
, ; по формуле (5)

= ( xi + h )n − xin = nhxin −1 +

h⎞

δy x = x i′ = nh ⎜ x′i − ⎟

2⎠

+

n( n − 1) 2 n − 2
h xi + K
2

n( n − 1) 2 ⎛
h⎞
h ⎜ x′i − ⎟

2
2⎠

∂S
∂k

(12)

= −2 [( y1 − kx1 − b )x1 + ( y2 − kx2 − b )x2 ],

k = пост

= −2 [( y1 − kx1 − b ) + ( y2 − kx2 − b )].

Приравнивая эти производные нулю, получаем систему уравнений
( y1 − kx1 − b )x1 + ( y2 − kx2 − b )x2 = 0, ⎫

y1 − kx1 − b + y2 − kx2 − b = 0. ⎭

+K

§2
y1′ 2 = 0,50; y′3 2 = 0,80; y′5 2 = 138
, . По линейной интерполяции y1′ = 0,65;
y′2 = 109
, . По формуле (4) y1′ = 0,62.По формуле (5) y′2 = 106
, .

b = пост

∂S
∂b

n−2

Раскрыв в правой части скобки, мы видим, что в этом примере разности образу/
ют последовательность значений многочлена степени n − 1. То же будет для
функции y = ax n (a = const), так как при образовании разностей коэффици/
ент a служит общим множителем. Заметив, что при сложении функций их
разности также складываются, мы заключаем, что для любого многочлена сте/
пени n разности образуют последовательность значений некоторого многоч/
лена степени n − 1. Значит, вторые разности образуют последовательность
значений многочлена степени n − 2 и т.д., а n/е разности — последовательность
значений многочлена нулевой степени, т.е. константы. Поэтому разности
( n + 1)/го порядка в этом случае равны нулю.

§3
1. а) y = 118
, x; б) y = 0,78 x; в) y = 1,75 x.
2. y = 103
, x − 119
, .

x1 y2 − x2 y1
.
x1 − x2

S = ( y1 − kx1 − b )2 + ( y2 − kx2 − b )2 .

Обозначив xi + h / 2 = x′i , получим
n −1

b=

Покажем, что такие же значения k и b мы получим, применяя метод наи/
меньших квадратов.
В нашем случае

y3 / 2 = 143
, ; по наиболее точной формуле Бесселя y3 / 2 = 142
, .
2. Если yi = y x = x i = xin , а Δx = h, то по формуле бинома Ньютона
x =xi + h / 2

y1 − y2
,
x1 − x2

Поэтому

ОТВЕТЫ И РЕШЕНИЯ

δy i + 1 / 2 = δy

59

Решая систему, находим те же значения (12).
Впрочем, совпадение результатов можно вывести и из того простого сооб/
ражения, что через любые две точки можно провести одну прямую линию.
§4
1. Для применения метода наименьших квадратов составляем сумму.
6

S = ∑ ( yk −axk2 − b )2 .
k =1

Действуя дальше обычным способом, находим a = 0,48; b = 123
, , т.е. искомая
формула
y = 0,48 x 2 + 123
, .
Для того чтобы решить задачу графически, вводим новую переменную
t = x 2 , тогда y = at + b. В координатах ( t; y ) получаем прямую линию. Нанеся
точки ( t k = xk2 ; yk ) на график, находим a = 0,49; b = 135
, , т.е.
, .
y = 0,49 x 2 + 135
y
= z, тогда z = ax + b. Построив точки в координатах ( x; z ),
x
найдем a = −102
, , b = 4, так что y = −102
, x 2 + 4 x.
2. Полагаем

58

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

ОТВЕТЫ И РЕШЕНИЯ

3. Уравнение прямой имеет вид y = kx + b. Числа k и b определяются из
условий y = y1 при x = x1 и y = y2 при x = x2 . Получаем систему уравнений

5. Результаты опыта дали следующее:
x

1,0

1,5

2,0

3,0

4,0

5,0

y

1,6

1,7

2,0

2,3

2,4

2,5

Известно, кроме того, что при неограниченном возрастании x величи/
на у приближается к некоторому значению y∞ . Найдите это предельное зна/
чение двумя способами:
B
а) подбирая формулу вида y = A + ;
x
ax
б) подбирая формулу вида y =
.
x+b

kx1 + b = y1 , ⎫

kx2 + b = y2 , ⎭
из которой находим
k=

§1
1. По формуле (2) y3 / 2 = 145
, ; по формуле (4) y3 / 2 = 141
, ; по формуле (5)

= ( xi + h )n − xin = nhxin −1 +

h⎞

δy x = x i′ = nh ⎜ x′i −

2⎠

+

n( n − 1) 2 n − 2
h xi + K
2

n( n − 1) 2 ⎛
h⎞
h ⎜ x′i − ⎟

2
2⎠

∂S
∂k

(12)

= −2 [( y1 − kx1 − b )x1 + ( y2 − kx2 − b )x2 ],

k = пост

= −2 [( y1 − kx1 − b ) + ( y2 − kx2 − b )].

Приравнивая эти производные нулю, получаем систему уравнений
( y1 − kx1 − b )x1 + ( y2 − kx2 − b )x2 = 0, ⎫

y1 − kx1 − b + y2 − kx2 − b = 0. ⎭

+K

§2
y1′ 2 = 0,50; y′3 2 = 0,80; y′5 2 = 138
, . По линейной интерполяции y1′ = 0,65;
y′2 = 109
, . По формуле (4) y1′ = 0,62.По формуле (5) y′2 = 106
, .

b = пост

∂S
∂b

n−2

Раскрыв в правой части скобки, мы видим, что в этом примере разности образу/
ют последовательность значений многочлена степени n − 1. То же будет для
функции y = ax n (a = const), так как при образовании разностей коэффици/
ент a служит общим множителем. Заметив, что при сложении функций их
разности также складываются, мы заключаем, что для любого многочлена сте/
пени n разности образуют последовательность значений некоторого многоч/
лена степени n − 1. Значит, вторые разности образуют последовательность
значений многочлена степени n − 2 и т.д., а n/е разности — последовательность
значений многочлена нулевой степени, т.е. константы. Поэтому разности
( n + 1)/го порядка в этом случае равны нулю.

§3
1. а) y = 118
, x; б) y = 0,78 x; в) y = 1,75 x.
2. y = 103
, x − 119
, .

x1 y2 − x2 y1
.
x1 − x2

S = ( y1 − kx1 − b )2 + ( y2 − kx2 − b )2 .

Обозначив xi + h / 2 = x′i , получим
n −1

b=

Покажем, что такие же значения k и b мы получим, применяя метод наи/
меньших квадратов.
В нашем случае

y3 / 2 = 143
, ; по наиболее точной формуле Бесселя y3 / 2 = 142
, .
2. Если yi = y x = x i = xin , а Δx = h, то по формуле бинома Ньютона
x =xi + h / 2

y1 − y2
,
x1 − x2

Поэтому

ОТВЕТЫ И РЕШЕНИЯ

δy i + 1 / 2 = δy

59

Решая систему, находим те же значения (12).
Впрочем, совпадение результатов можно вывести и из того простого сооб/
ражения, что через любые две точки можно провести одну прямую линию.
§4
1. Для применения метода наименьших квадратов составляем сумму.
6

S = ∑ ( yk −axk2 − b )2 .
k =1

Действуя дальше обычным способом, находим a = 0,48; b = 123
, , т.е. искомая
формула
y = 0,48 x 2 + 123
, .
Для того чтобы решить задачу графически, вводим новую переменную
t = x 2 , тогда y = at + b. В координатах ( t; y ) получаем прямую линию. Нанеся
точки ( t k = xk2 ; yk ) на график, находим a = 0,49; b = 135
, , т.е.
, .
y = 0,49 x 2 + 135
y
= z, тогда z = ax + b. Построив точки в координатах ( x; z ),
x
найдем a = −102
, , b = 4, так что y = −102
, x 2 + 4 x.
2. Полагаем

60

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

3. В этом случае по осям координат надо откладывать соответственно lg x
и lg y. Получим A = 0,5; b = 15
, ; y = 0,5 x1 ,5 .
1
; y = 1,74 e −0 ,1 x . Значе2
4. Графическим способом находим y =
0,56 + 0,07 x
ния у, найденные по первой и по второй из этих формул при нескольких ука2
занных значениях, сведены в следующую таблицу:
x

Значение у по
первой формуле

Значение у
по второй формуле

1,25

1,54

1,54

3,75

1,22

1,20

–1

2,01

2,00

–2

2,38

2,12

–3

2,86

2,35

Смысл последнего расчета состоит в следующем: интерполяция, как упо2
миналось в тексте, редко приводит к большим ошибкам, в нашем случае обе
формулы при x = 125
, и при x = 3,75 дают весьма близкие результаты; экс2
траполяция, наоборот, мало надежна. Из таблицы видно, что чем дальше отсто2
ит x от табличных, тем сильнее разнятся значения у, полученные по разным
формулам. Отметим еще, что при x = −8 первая формула вообще теряет
смысл, а при x < −8 первая формула дает y < 0, а вторая y > 0.
5. а) y∞ = 2,8; б) y∞ = 2,9.

ГЛАВА III
ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ
И РЯДАХ
§ 1. Несобственные интегралы
При обычном определении интеграла (см., например, ВМ, § I.8) счи2
тается, что интервал интегрирования конечен и что подынтегральная
функция на нем не обращается в бесконечность. Такие интегралы назы2
ваются интегралами в собственном смысле или, коротко, собственными.
Если хотя бы одно из этих двух условий не выполнено, то интеграл назы2
вается несобственным. Такие интегралы встречаются уже в простых за2
дачах интегрального исчисления (см., например, ВМ, §§ II.16, III.3,
VI.2). Здесь мы рассмотрим эти интегралы более подробно.
Рассмотрим сначала интеграл вида


I = ∫ f ( x ) dx,

(1)

a

где нижний предел а и подынтегральная функция f (x) при а  x < 
предполагаются конечными. Такой интеграл является несобственным
из2за того, что его верхний предел бесконечен; как говорят, он имеет
особенность на верхнем пределе.
Допустим, что интеграл (1) получился при решении некоторой фи2
зической задачи и переменная х имеет непосредственный физический
смысл (длина, время и т.п.). Тогда реально x изменяется не до беско2
нечности, а до какого2то очень большого, но конечного предела, кото2
рый мы обозначим через N, т.е. взамен (1) надо рассмотреть интеграл
N

I N = ∫ f ( x ) dx.

(2)

a

Может оказаться, что интеграл (2), хотя и зависит от N, но при дос2
таточно больших N практически не меняется. Тогда это значение при2
нимается за значение интеграла (1); более точно, тогда принимается


N

a

a

f ( x ) dx,
∫ f ( x ) dx = Nlim
→∞ ∫

60

МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ ОПЫТА

[Гл. II

3. В этом случае по осям координат надо откладывать соответственно lg x
и lg y. Получим A = 0,5; b = 15
, ; y = 0,5 x1 ,5 .
1
; y = 1,74 e −0 ,1 x . Значе2
4. Графическим способом находим y =
0,56 + 0,07 x
ния у, найденные по первой и по второй из этих формул при нескольких ука2
занных значениях, сведены в следующую таблицу:
x

Значение у по
первой формуле

Значение у
по второй формуле

1,25

1,54

1,54

3,75

1,22

1,20

–1

2,01

2,00

–2

2,38

2,12

–3

2,86

2,35

Смысл последнего расчета состоит в следующем: интерполяция, как упо2
миналось в тексте, редко приводит к большим ошибкам, в нашем случае обе
формулы при x = 125
, и при x = 3,75 дают весьма близкие результаты; экс2
траполяция, наоборот, мало надежна. Из таблицы видно, что чем дальше отсто2
ит x от табличных, тем сильнее разнятся значения у, полученные по разным
формулам. Отметим еще, что при x = −8 первая формула вообще теряет
смысл, а при x < −8 первая формула дает y < 0, а вторая y > 0.
5. а) y∞ = 2,8; б) y∞ = 2,9.

ГЛАВА III
ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ
И РЯДАХ
§ 1. Несобственные интегралы
При обычном определении интеграла (см., например, ВМ, § I.8) счи2
тается, что интервал интегрирования конечен и что подынтегральная
функция на нем не обращается в бесконечность. Такие интегралы назы2
ваются интегралами в собственном смысле или, коротко, собственными.
Если хотя бы одно из этих двух условий не выполнено, то интеграл назы2
вается несобственным. Такие интегралы встречаются уже в простых за2
дачах интегрального исчисления (см., например, ВМ, §§ II.16, III.3,
VI.2). Здесь мы рассмотрим эти интегралы более подробно.
Рассмотрим сначала интеграл вида


I = ∫ f ( x ) dx,

(1)

a

где нижний предел а и подынтегральная функция f (x) при а  x < 
предполагаются конечными. Такой интеграл является несобственным
из2за того, что его верхний предел бесконечен; как говорят, он имеет
особенность на верхнем пределе.
Допустим, что интеграл (1) получился при решении некоторой фи2
зической задачи и переменная х имеет непосредственный физический
смысл (длина, время и т.п.). Тогда реально x изменяется не до беско2
нечности, а до какого2то очень большого, но конечного предела, кото2
рый мы обозначим через N, т.е. взамен (1) надо рассмотреть интеграл
N

I N = ∫ f ( x ) dx.

(2)

a

Может оказаться, что интеграл (2), хотя и зависит от N, но при дос2
таточно больших N практически не меняется. Тогда это значение при2
нимается за значение интеграла (1); более точно, тогда принимается


N

a

a

f ( x ) dx,
∫ f ( x ) dx = Nlim
→∞ ∫

62

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

а интеграл (1) называется сходящимся. Из этого предела и равенства


N

a

a



∫ f ( x ) dx = ∫ f ( x ) dx + ∫ f ( x ) dx
N

видно, что основной вклад в сходящийся интеграл дает его «конечная»
(«собственная») часть, тогда как вклад особенности при достаточно
большом N как угодно мал. Другими словами, в случае сходимости
интеграла (1) можно «реальный» интеграл (2) при большом N, кото7
рое часто бывает точно и не известно, заменять на «предельный» интег7
рал (1), который обычно проще в теоретических исследованиях.
Если значение интеграла (1) с ростом N не «устанавливается»,
а стремится к бесконечности или колеблется, не имея определенного
предела, то интеграл (1) называется расходящимся. В этом случае зна7
чение интеграла (2) при больших N существенно зависит от N и за7
менить (2) на (1) нельзя. Тогда может возникнуть вопрос о более
детальной характеристике поведения интеграла (2) при возраста7
нии N, т.е. о получении асимптотических формул для этого интеграла.
(Кстати, такой вопрос возникает и для сходящихся интегралов (1), так
как установить лишь факт сходимости или расходимости и даже найти
численное значение в случае сходимости часто оказывается недоста7
точным — может понадобиться еще сам закон сходимости.)
Из сказанного следует, что факт сходимости или расходимости ин7
теграла (1) зависит только от поведения функции f (x) «в особеннос7
ти интеграла», т.е. при x → ∞. Наиболее часто этот факт распознается
C
при помощи сравнения f (x) со степенной функцией p , от которой
x
интеграл легко берется. Рассмотрим интеграл


IN =



x0

C
dx
xp

C = const,

(3)

§ 1]

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ

Значит, в этом случае интеграл (3) расходится к бесконечности, т.е. со7
ответствующий интеграл IN, взятый от х0 до N, стремится к беско7
нечности при возрастании N. Выражение для IN получится, если
в правую часть (4) подставить IN вместо  (и в других случаях выра7
жение для IN , если соответствующий неопределенный интеграл берет7
ся, получается весьма просто). Хорошо видно, что в этом выражении
для больших N главным членом при р > 1 будет первый, а при р < 1 —
второй.
При р = 1 интеграл (3) равен


C

∫x

dx = C ln x


x0

x0



−p
∫ Cx dx =

x0

Cx − p + 1
−p + 1


x0

= −C

1
( p − 1)x p −1


x0

=

C
C
. (4)

( p − 1)x0p −1 ( p − 1)∞ p −1

Здесь приходится различать два случая. Именно, если р > 1, то
р — 1 > 0, ∞ p −1 = ∞ и последний член в правой части (4) равен нулю.
Значит, в этом случае интеграл (3) сходится. Если же р < 1, то
1
∞ p −1 = 1 − p = 0 и потому последний член в (4) равен бесконечности.


= C ln ∞ − C ln x0 = ∞,

т.е. интеграл также расходится к бесконечности. Итак, интеграл (3)
сходится при р > 1 и расходится при р  1.
На основе этого результата мы можем заключить, например, что ин7
теграл


1

∫ 3 x 2 + 1 dx,

(5)

0

имеющий особенность на верхнем пределе, расходится к бесконечнос7
ти, так как при больших х подынтегральная функция
1
3

асимптотически равна

2

x +1

1
x2/3

=

1
x2/3

1
3

1 + x −2

,

, т.е. в данном случае p =

(6)

2
< 1. Напротив,
3

интеграл


1



3

x +1

0

где х0 — любое положительное число (если взять х0 отрицательным,
то интеграл будет иметь особенность также и при х = 0, где подынтег7
ральная функция обращается в бесконечность). Этот интеграл легко
взять:

63

dx

(7)

сходящийся, так как подынтегральная функция асимптотически, при
1
3
x → ∞, равна 3 / 2 , т.е. в данном случае p = > 1. Интеграл
2
x


∫e

−x 2

dx

(8)

0

также сходящийся, так как подынтегральная функция при x → ∞ стре7
мится к нулю быстрее любой степени х. Во всех этих примерах соотве7
тствующие неопределенные интегралы не выражаются через элементар7
ные функции, так что установить сходимость при помощи вычисления
неопределенного интеграла было бы затруднительно.

62

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

а интеграл (1) называется сходящимся. Из этого предела и равенства


N

a

a



∫ f ( x ) dx = ∫ f ( x ) dx + ∫ f ( x ) dx
N

видно, что основной вклад в сходящийся интеграл дает его «конечная»
(«собственная») часть, тогда как вклад особенности при достаточно
большом N как угодно мал. Другими словами, в случае сходимости
интеграла (1) можно «реальный» интеграл (2) при большом N, кото7
рое часто бывает точно и не известно, заменять на «предельный» интег7
рал (1), который обычно проще в теоретических исследованиях.
Если значение интеграла (1) с ростом N не «устанавливается»,
а стремится к бесконечности или колеблется, не имея определенного
предела, то интеграл (1) называется расходящимся. В этом случае зна7
чение интеграла (2) при больших N существенно зависит от N и за7
менить (2) на (1) нельзя. Тогда может возникнуть вопрос о более
детальной характеристике поведения интеграла (2) при возраста7
нии N, т.е. о получении асимптотических формул для этого интеграла.
(Кстати, такой вопрос возникает и для сходящихся интегралов (1), так
как установить лишь факт сходимости или расходимости и даже найти
численное значение в случае сходимости часто оказывается недоста7
точным — может понадобиться еще сам закон сходимости.)
Из сказанного следует, что факт сходимости или расходимости ин7
теграла (1) зависит только от поведения функции f (x) «в особеннос7
ти интеграла», т.е. при x → ∞. Наиболее часто этот факт распознается
C
при помощи сравнения f (x) со степенной функцией p , от которой
x
интеграл легко берется. Рассмотрим интеграл


IN =



x0

C
dx
xp

C = const,

(3)

§ 1]

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ

Значит, в этом случае интеграл (3) расходится к бесконечности, т.е. со7
ответствующий интеграл IN, взятый от х0 до N, стремится к беско7
нечности при возрастании N. Выражение для IN получится, если
в правую часть (4) подставить IN вместо  (и в других случаях выра7
жение для IN , если соответствующий неопределенный интеграл берет7
ся, получается весьма просто). Хорошо видно, что в этом выражении
для больших N главным членом при р > 1 будет первый, а при р < 1 —
второй.
При р = 1 интеграл (3) равен


C

∫x

dx = C ln x


x0

x0



−p
∫ Cx dx =

x0

Cx − p + 1
−p + 1


x0

= −C

1
( p − 1)x p −1


x0

=

C
C
. (4)

( p − 1)x0p −1 ( p − 1)∞ p −1

Здесь приходится различать два случая. Именно, если р > 1, то
р — 1 > 0, ∞ p −1 = ∞ и последний член в правой части (4) равен нулю.
Значит, в этом случае интеграл (3) сходится. Если же р < 1, то
1
∞ p −1 = 1 − p = 0 и потому последний член в (4) равен бесконечности.


= C ln ∞ − C ln x0 = ∞,

т.е. интеграл также расходится к бесконечности. Итак, интеграл (3)
сходится при р > 1 и расходится при р  1.
На основе этого результата мы можем заключить, например, что ин7
теграл


1

∫ 3 x 2 + 1 dx,

(5)

0

имеющий особенность на верхнем пределе, расходится к бесконечнос7
ти, так как при больших х подынтегральная функция
1
3

асимптотически равна

2

x +1

1
x2/3

=

1
x2/3

1
3

1 + x −2

,

, т.е. в данном случае p =

(6)

2
< 1. Напротив,
3

интеграл


1



3

x +1

0

где х0 — любое положительное число (если взять х0 отрицательным,
то интеграл будет иметь особенность также и при х = 0, где подынтег7
ральная функция обращается в бесконечность). Этот интеграл легко
взять:

63

dx

(7)

сходящийся, так как подынтегральная функция асимптотически, при
1
3
x → ∞, равна 3 / 2 , т.е. в данном случае p = > 1. Интеграл
2
x


∫e

−x 2

dx

(8)

0

также сходящийся, так как подынтегральная функция при x → ∞ стре7
мится к нулю быстрее любой степени х. Во всех этих примерах соотве7
тствующие неопределенные интегралы не выражаются через элементар7
ные функции, так что установить сходимость при помощи вычисления
неопределенного интеграла было бы затруднительно.

64

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Нетрудно получить асимптотические выражения трех последних
интегралов, взятых от 0 до N, при увеличении N. Для расходящегося
интеграла вида (1) применяется следующий прием: подбирается функ7
ция f1 (x), от которой интеграл берется просто, причем асимптотичес7
ки (при x → ∞) почти равная f (x); тогда в правой части равенства
N

N

N

a

a

a

§ 1]

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ

Для интеграла (7) получаем
N



0

dx
3

x +1



=∫

0



dx
3

x +1

−∫

N

1
x

(1 + x −3 )−1 / 2 dx ≈

3



N

dx

a

N

dx

0

N

0

−x 2





2

3


1
1 
dx + ∫ 

 dx =
3 2
3 2
x
x 
a  x +1

a

N

= C1 + 3 3 N − 3 3 a + ∫

a

N



Здесь мы перешли от

к

0



a

0

∫ , где а — какое7либо положительное число

N

−2 / 3
∫ x dx, имеющего особенность на нижнем
0

пределе. Можно проверить, что последний интеграл в (9) при N → ∞
сходящийся и потому при больших N все выражение (9) имеет асим7
птотическое представление 3 3 N + C + бесконечно малая, где С — не7
которая постоянная. Чтобы найти значение постоянной С, надо
воспользоваться равенством
N

C ≈∫

dx
3

0

x2 + 1

−3 3 N

для некоторого N, причем интеграл в правой части подсчитать по од7
ной из формул численного интегрирования.
Аналогично исследуется асимптотическое поведение интегралов
(7) и (8). Для сходящегося интеграла часто оказывается полезным пре7
образование
N





a

N

∫ f ( x ) dx = ∫ f ( x ) dx − ∫ f ( x ) dx.
a

2

1 −N 2 1 e−x
1 −N 2
e
+ ∫ 3 dx ≈ E −
e .
2N
2N x
2N

Постоянная Е, т.е. значение интеграла (8), как мы увидим в § IV.7, рав7
на π / 2.
В качестве другого примера рассмотрим несобственный интеграл

N

(хотя это в данном примере необязательно), чтобы избежать несо7
бственного интеграла

=E −

(9)


1
1 


 dx.
 3 x2 + 1 3 x2 

2
,
N

2
1
de − x =
x
2
N



2

dx = D −



2

N

0

N

1

= C1 + ∫

x

N

3

dx = ∫ e − x dx − ∫ e − x dx = E + ∫

a

N

x +1

1

−∫

где постоянную D, равную значению интеграла (7), можно подсчитать,
как С в предыдущем абзаце.
К интегралу (8) применяем интегрирование по частям:

∫e

∫ 3 x2 + 1 = ∫ 3 x2 + 1 + ∫ 3 x2 + 1 =
0

3

0

dx



dx

≈∫

∫ f ( x ) dx = ∫ f1 ( x ) dx + ∫ [ f ( x ) − f1 ( x )] dx

первый интеграл (главный член) легко исследуется, а второй может ока7
заться сходящимся при N → ∞ или же к нему можно применить тот же
прием. Для интеграла (5) естественно принять f1 (x) = x −2 / 3 , т.е. написать

65

∫ sin x dx.

(10)

В данном случае интеграл по конечному промежутку
N

I N = ∫ sin x dx = − cos x
0

N

= 1 − cos N .

(11)

0

При возрастании N значение cos N колеблется и не имеет опреде7
ленного предела. Значит, интеграл (10) расходящийся, причем «коле7
бательным» способом.
Легко проверить, что введение под знак интеграла (10) затухающего
множителя e − αx (α = const > 0) приводит к сходящемуся интегралу


∫e

− αx

sin x dx.

0

Можно доказать, что сходится и интеграл более общего вида


∫ f ( x ) sin x dx,
0

где f(x) — любая убывающая функция, стремящаяся к нулю при
x → ∞.

64

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Нетрудно получить асимптотические выражения трех последних
интегралов, взятых от 0 до N, при увеличении N. Для расходящегося
интеграла вида (1) применяется следующий прием: подбирается функ7
ция f1 (x), от которой интеграл берется просто, причем асимптотичес7
ки (при x → ∞) почти равная f (x); тогда в правой части равенства
N

N

N

a

a

a

§ 1]

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ

Для интеграла (7) получаем
N



0

dx
3

x +1



=∫

0



dx
3

x +1

−∫

N

1
x

(1 + x −3 )−1 / 2 dx ≈

3



N

dx

a

N

dx

0

N

0

−x 2





2

3


1
1 
dx + ∫ 

 dx =
3 2
3 2
x
x 
a  x +1

a

N

= C1 + 3 3 N − 3 3 a + ∫

a

N



Здесь мы перешли от

к

0



a

0

∫ , где а — какое7либо положительное число

N

−2 / 3
∫ x dx, имеющего особенность на нижнем
0

пределе. Можно проверить, что последний интеграл в (9) при N → ∞
сходящийся и потому при больших N все выражение (9) имеет асим7
птотическое представление 3 3 N + C + бесконечно малая, где С — не7
которая постоянная. Чтобы найти значение постоянной С, надо
воспользоваться равенством
N

C ≈∫

dx
3

0

x2 + 1

−3 3 N

для некоторого N, причем интеграл в правой части подсчитать по од7
ной из формул численного интегрирования.
Аналогично исследуется асимптотическое поведение интегралов
(7) и (8). Для сходящегося интеграла часто оказывается полезным пре7
образование
N





a

N

∫ f ( x ) dx = ∫ f ( x ) dx − ∫ f ( x ) dx.
a

2

1 −N 2 1 e−x
1 −N 2
e
+ ∫ 3 dx ≈ E −
e .
2N
2N x
2N

Постоянная Е, т.е. значение интеграла (8), как мы увидим в § IV.7, рав7
на π / 2.
В качестве другого примера рассмотрим несобственный интеграл

N

(хотя это в данном примере необязательно), чтобы избежать несо7
бственного интеграла

=E −

(9)


1
1 


 dx.
 3 x2 + 1 3 x2 

2
,
N

2
1
de − x =
x
2
N



2

dx = D −



2

N

0

N

1

= C1 + ∫

x

N

3

dx = ∫ e − x dx − ∫ e − x dx = E + ∫

a

N

x +1

1

−∫

где постоянную D, равную значению интеграла (7), можно подсчитать,
как С в предыдущем абзаце.
К интегралу (8) применяем интегрирование по частям:

∫e

∫ 3 x2 + 1 = ∫ 3 x2 + 1 + ∫ 3 x2 + 1 =
0

3

0

dx



dx

≈∫

∫ f ( x ) dx = ∫ f1 ( x ) dx + ∫ [ f ( x ) − f1 ( x )] dx

первый интеграл (главный член) легко исследуется, а второй может ока7
заться сходящимся при N → ∞ или же к нему можно применить тот же
прием. Для интеграла (5) естественно принять f1 (x) = x −2 / 3 , т.е. написать

65

∫ sin x dx.

(10)

В данном случае интеграл по конечному промежутку
N

I N = ∫ sin x dx = − cos x
0

N

= 1 − cos N .

(11)

0

При возрастании N значение cos N колеблется и не имеет опреде7
ленного предела. Значит, интеграл (10) расходящийся, причем «коле7
бательным» способом.
Легко проверить, что введение под знак интеграла (10) затухающего
множителя e − αx (α = const > 0) приводит к сходящемуся интегралу


∫e

− αx

sin x dx.

0

Можно доказать, что сходится и интеграл более общего вида


∫ f ( x ) sin x dx,
0

где f(x) — любая убывающая функция, стремящаяся к нулю при
x → ∞.

66

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Несобственные интегралы отличного от (1) вида рассматриваются
аналогично (1). Например, пусть дан интеграл
b

∫ f ( x ) dx,

(12)

a

для которого пределы интегрирования конечны, но подынтегральная
функция при x → a обращается в бесконечность, т.е. интеграл имеет
особенность при x = a. Тогда особенность «отрезают», т.е. рассматри7
вают взамен (12) интеграл
b

∫ f ( x ) dx,

(13)

§ 1]

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ

пренебречь, то скорость v истечения жидкос7
ти из сосуда с достаточной точностью описыва7
ется законом Торричелли
v = 2 gh .

Поэтому объем, вытекший за время dt, равен
σv dt = σ 2 gh dt.

С другой стороны, тот же объем равен –Sdh
(надо учесть, что h убывает и потому dh < 0).
Приравнивая оба выражения, получим, что

a+ ε

где ε — малое положительное число. Если при достаточно малом ε ин7
теграл (13) практически перестает зависеть от ε, то интеграл (12) на7
зывают сходящимся и полагают
b

b

f ( x ) dx.
∫ f ( x ) dx = εlim
→0 ∫

В этом случае от интеграла (13) (который часто появляется при реше7
нии физической задачи, так как все физические величины конечны)
можно перейти к более простому интегралу (12), т.е. вкладом особен7
ности в интеграл (12) можно пренебречь. Если же интеграл (13) при
малых ε существенно зависит от ε, т.е. при ε → 0 он не имеет конеч7
ного предела, а стремится к бесконечности или колеблется, не имея
определенного предела, то интеграл (12) называется расходящимся; в
этом случае переходить от (13) к (12) нельзя.
Факт сходимости или расходимости несобственного интеграла
вида (12) обычно устанавливают, сравнивая подынтегральную
C
функцию f(x) со степенной функцией
, также равной беско7
(x − a) p
нечноcти при x = a и легко интегрируемой. Мы предоставляем читате7
лю проверить, что несобственный интеграл
b

C

∫ (x − a )p

dx

(C = const)

σ 2 gh d t = − S d h,

(14)

a

сходится при р < 1 и расходится при р  1.
Рассмотрим для примера задачу об истечении жидкости из цилин7
дрического сосуда, в дне которого проделано отверстие площади σ
(рис. 15). Высота h уровня жидкости зависит от времени t, т.е. h = h(t).
Если жидкость не вязкая и силами поверхностного натяжения можно

dt = −

т.е.

Рис. 15.

S dh
.
σ 2g h

Чтобы получить полное время T истечения, надо произвести интегри7
рование:
T =−

a+ ε

a

67

S
σ 2g

0



H

dh
h

=−

S h1 / 2
σ 2g 1
2

0
H

=

S
σ

2H
.
g

(15)

Реально истечение происходит не до h = 0, а до h = ε, где ε — неко7
торая величина, сравнимая с шероховатостями дна или с толщиной
смачивающей пленки, т.е. формулу (15) надо было бы писать в виде
T =−

S
σ 2g

ε



H

dh
h

.

(16)

Однако так как несобственный интеграл (15) получился сходящимся

冢это показали вычисления (15), да к тому же рассматриваемый интег7
1
рал — это интеграл вида (14) при p = 冣 , то интеграл (16) можно заме7
2
нить на (15). Как видим, в данном примере ε нам не было точно
известно, но оно и несущественно, так как для сходящегося интеграла
важно только знать, что ε мало´.
При численном интегрировании (ср. § I.1) несобственные интегра7
лы требуют особенного внимания. Часто заданный интеграл представ7
ляют в виде суммы собственного, полученного исключением интерва7
ла около особенности из интервала интегрирования, и несобственного,
взятого по интервалу около особенности. Первый находят численно,
а во втором применяется разложение в какой7либо ряд или просто под7
ынтегральная функция приближенно заменяется на какую7либо дру7
гую функцию (например, степенную), от которой интеграл взять легко.

66

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Несобственные интегралы отличного от (1) вида рассматриваются
аналогично (1). Например, пусть дан интеграл
b

∫ f ( x ) dx,

(12)

a

для которого пределы интегрирования конечны, но подынтегральная
функция при x → a обращается в бесконечность, т.е. интеграл имеет
особенность при x = a. Тогда особенность «отрезают», т.е. рассматри7
вают взамен (12) интеграл
b

∫ f ( x ) dx,

(13)

§ 1]

НЕСОБСТВЕННЫЕ ИНТЕГРАЛЫ

пренебречь, то скорость v истечения жидкос7
ти из сосуда с достаточной точностью описыва7
ется законом Торричелли
v = 2 gh .

Поэтому объем, вытекший за время dt, равен
σv dt = σ 2 gh dt.

С другой стороны, тот же объем равен –Sdh
(надо учесть, что h убывает и потому dh < 0).
Приравнивая оба выражения, получим, что

a+ ε

где ε — малое положительное число. Если при достаточно малом ε ин7
теграл (13) практически перестает зависеть от ε, то интеграл (12) на7
зывают сходящимся и полагают
b

b

f ( x ) dx.
∫ f ( x ) dx = εlim
→0 ∫

В этом случае от интеграла (13) (который часто появляется при реше7
нии физической задачи, так как все физические величины конечны)
можно перейти к более простому интегралу (12), т.е. вкладом особен7
ности в интеграл (12) можно пренебречь. Если же интеграл (13) при
малых ε существенно зависит от ε, т.е. при ε → 0 он не имеет конеч7
ного предела, а стремится к бесконечности или колеблется, не имея
определенного предела, то интеграл (12) называется расходящимся; в
этом случае переходить от (13) к (12) нельзя.
Факт сходимости или расходимости несобственного интеграла
вида (12) обычно устанавливают, сравнивая подынтегральную
C
функцию f(x) со степенной функцией
, также равной беско7
(x − a) p
нечноcти при x = a и легко интегрируемой. Мы предоставляем читате7
лю проверить, что несобственный интеграл
b

C

∫ (x − a )p

dx

(C = const)

σ 2 gh d t = − S d h,

(14)

a

сходится при р < 1 и расходится при р  1.
Рассмотрим для примера задачу об истечении жидкости из цилин7
дрического сосуда, в дне которого проделано отверстие площади σ
(рис. 15). Высота h уровня жидкости зависит от времени t, т.е. h = h(t).
Если жидкость не вязкая и силами поверхностного натяжения можно

dt = −

т.е.

Рис. 15.

S dh
.
σ 2g h

Чтобы получить полное время T истечения, надо произвести интегри7
рование:
T =−

a+ ε

a

67

S
σ 2g

0



H

dh
h

=−

S h1 / 2
σ 2g 1
2

0
H

=

S
σ

2H
.
g

(15)

Реально истечение происходит не до h = 0, а до h = ε, где ε — неко7
торая величина, сравнимая с шероховатостями дна или с толщиной
смачивающей пленки, т.е. формулу (15) надо было бы писать в виде
T =−

S
σ 2g

ε



H

dh
h

.

(16)

Однако так как несобственный интеграл (15) получился сходящимся

冢это показали вычисления (15), да к тому же рассматриваемый интег7
1
рал — это интеграл вида (14) при p = 冣 , то интеграл (16) можно заме7
2
нить на (15). Как видим, в данном примере ε нам не было точно
известно, но оно и несущественно, так как для сходящегося интеграла
важно только знать, что ε мало´.
При численном интегрировании (ср. § I.1) несобственные интегра7
лы требуют особенного внимания. Часто заданный интеграл представ7
ляют в виде суммы собственного, полученного исключением интерва7
ла около особенности из интервала интегрирования, и несобственного,
взятого по интервалу около особенности. Первый находят численно,
а во втором применяется разложение в какой7либо ряд или просто под7
ынтегральная функция приближенно заменяется на какую7либо дру7
гую функцию (например, степенную), от которой интеграл взять легко.

68

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ
π

В качестве примера вычислим

dx



[Гл. III

sin x
ция неограниченно возрастает при приближении x к 0 и при прибли+
жении х к π. Разобьем промежуток интегрирования на три части: от 0
π
π


до , от
до
и от
до π. В первом промежутке можно считать,
6
6
6
6
что sin x ≈ x, так как х невелико. Поэтому
dx

sin x



0

π /6



0

dx
=2 x
x

π /6

=2

0

π
= 1447
, *.
6


< x < π, воспользуемся формулой
6
sin x = sin(π − x) , и так как величина π − x мала, то sin(π − x) ≈ π − x.
Окончательно в этом промежутке sin x ≈ π − x. Получаем
π

dx

sin x 5∫π




6

dx
= −2 π − x
π −x

6

π

6

=2

π
= 1447
, .
6

Интеграл по среднему промежутку подсчитаем по формуле Симпсона,
разбивая этот промежуток на две части. Получим

6

∫π

dx
π
≈ [1414
+ 4 ⋅ 1 + 1414
,
, ] = 2,384.
sin x 6

6

Следовательно,
π



0

dx
≈ 1447
+ 2,384 + 1447
= 5,278.
,
,
sin x

Точное значение этого интеграла (с тремя десятичными знаками) есть
5,244.
* Для большей точности здесь можно применить разложение в ряд
α


0

dx
sin x

α

=∫
0

1 ⎛ sin x ⎞


x ⎝ x ⎠
α

−1 / 2

α

dx = ∫
0


x2
x4
1 ⎛
+
− K⎟
⎜1 −
3!
5!
x ⎝


−1 / 2

dx =




1 ⎛
α2
α4
x2
x4
+
+ K⎟ .
+
+ K⎟ dx = α ⎜ 2 +
⎜1 +
12
160
30
720
x




0
Однако при применяемой степени точности вычислений поправка ничтожна (получится
1,454); полезным является только то, что мы узнаем о степени достоверности полученно+
го результата.
=∫

69

Упражнение
π /2

Вычислите интеграл



0

3

dx
, проводя вычисления с тремя десятичными
sin x

знаками.

§ 2. Интегрирование быстроменяющихся функций
При численном интегрировании полезно уметь заранее оценить по+
рядок величины интеграла. Из геометрического смысла интеграла
b

В третьем промежутке, т.е. при

π

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

. Здесь подынтегральная функ+

0

π /6

§ 2]

I = ∫ y( x ) dx
a

сразу вытекает очевидная оценка
b

I < ∫ ymax dx = ymax (b − a ),
a

где y max — наибольшее значение подынтегральной функции у(х) на
промежутке интегрирования. Если эта функция положительна и мало
меняется на промежутке интегрирования, то можно принять y ≈ y max ,
т.е.
I - ymax (b − a )

(17)

(эта оценка уже встречалась в ВМ, § II.16).
Отметим сразу же, что оценкой (17), как и дальнейшими оценками
этого параграфа, неудобно пользоваться для знакопеременных функ+
ций у(х). В этом случае промежуток интегрирования можно разбить
на несколько частей так, чтобы внутри каждого из полученных проме+
жутков у(х) сохраняла знак, после чего оценить интегралы по этим
промежуткам. Однако суммарная оценка будет удовлетворительной,
только если вклад интегралов одного знака существенно превосходит
вклад интегралов противоположного знака.
Поэтому мы впредь в этом параграфе будем считать подынтеграль+
ную функцию положительной на интервале интегрирования.
Если функция у(х) на промежутке интегрирования, оставаясь по+
ложительной, очень быстро убывает, а b сравнительно велико, то
оценка (17) может привести к большим ошибкам. В самом деле, по+
льзуясь оценкой (17), мы заменяем функцию ее максимальным значе+
нием. Однако если функция изменяется быстро, то ее значения близки
к максимальному только в малой части области интегрирования. В ка+
b

честве примера рассмотрим I = ∫ e − x dx (b > 0). Максимальное значе+
0

ние подынтегральная функция на промежутке интегрирования
получает при х = 0; это максимальное значение равно 1. Оценка (17)

68

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ
π

В качестве примера вычислим

dx



[Гл. III

sin x
ция неограниченно возрастает при приближении x к 0 и при прибли+
жении х к π. Разобьем промежуток интегрирования на три части: от 0
π
π


до , от
до
и от
до π. В первом промежутке можно считать,
6
6
6
6
что sin x ≈ x, так как х невелико. Поэтому
dx

sin x



0

π /6



0

dx
=2 x
x

π /6

=2

0

π
= 1447
, *.
6


< x < π, воспользуемся формулой
6
sin x = sin(π − x) , и так как величина π − x мала, то sin(π − x) ≈ π − x.
Окончательно в этом промежутке sin x ≈ π − x. Получаем
π

dx

sin x 5∫π




6

dx
= −2 π − x
π −x

6

π

6

=2

π
= 1447
, .
6

Интеграл по среднему промежутку подсчитаем по формуле Симпсона,
разбивая этот промежуток на две части. Получим

6

∫π

dx
π
≈ [1414
+ 4 ⋅ 1 + 1414
,
, ] = 2,384.
sin x 6

6

Следовательно,
π



0

dx
≈ 1447
+ 2,384 + 1447
= 5,278.
,
,
sin x

Точное значение этого интеграла (с тремя десятичными знаками) есть
5,244.
* Для большей точности здесь можно применить разложение в ряд
α


0

dx
sin x

α

=∫
0

1 ⎛ sin x ⎞


x ⎝ x ⎠
α

−1 / 2

α

dx = ∫
0


x2
x4
1 ⎛
+
− K⎟
⎜1 −
3!
5!
x ⎝


−1 / 2

dx =




1 ⎛
α2
α4
x2
x4
+
+ K⎟ .
+
+ K⎟ dx = α ⎜ 2 +
⎜1 +
12
160
30
720
x




0
Однако при применяемой степени точности вычислений поправка ничтожна (получится
1,454); полезным является только то, что мы узнаем о степени достоверности полученно+
го результата.
=∫

69

Упражнение
π /2

Вычислите интеграл



0

3

dx
, проводя вычисления с тремя десятичными
sin x

знаками.

§ 2. Интегрирование быстроменяющихся функций
При численном интегрировании полезно уметь заранее оценить по+
рядок величины интеграла. Из геометрического смысла интеграла
b

В третьем промежутке, т.е. при

π

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

. Здесь подынтегральная функ+

0

π /6

§ 2]

I = ∫ y( x ) dx
a

сразу вытекает очевидная оценка
b

I < ∫ ymax dx = ymax (b − a ),
a

где y max — наибольшее значение подынтегральной функции у(х) на
промежутке интегрирования. Если эта функция положительна и мало
меняется на промежутке интегрирования, то можно принять y ≈ y max ,
т.е.
I - ymax (b − a )

(17)

(эта оценка уже встречалась в ВМ, § II.16).
Отметим сразу же, что оценкой (17), как и дальнейшими оценками
этого параграфа, неудобно пользоваться для знакопеременных функ+
ций у(х). В этом случае промежуток интегрирования можно разбить
на несколько частей так, чтобы внутри каждого из полученных проме+
жутков у(х) сохраняла знак, после чего оценить интегралы по этим
промежуткам. Однако суммарная оценка будет удовлетворительной,
только если вклад интегралов одного знака существенно превосходит
вклад интегралов противоположного знака.
Поэтому мы впредь в этом параграфе будем считать подынтеграль+
ную функцию положительной на интервале интегрирования.
Если функция у(х) на промежутке интегрирования, оставаясь по+
ложительной, очень быстро убывает, а b сравнительно велико, то
оценка (17) может привести к большим ошибкам. В самом деле, по+
льзуясь оценкой (17), мы заменяем функцию ее максимальным значе+
нием. Однако если функция изменяется быстро, то ее значения близки
к максимальному только в малой части области интегрирования. В ка+
b

честве примера рассмотрим I = ∫ e − x dx (b > 0). Максимальное значе+
0

ние подынтегральная функция на промежутке интегрирования
получает при х = 0; это максимальное значение равно 1. Оценка (17)

70

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

дает I ≈ b. Однако в данном примере для интеграла легко получить
точную формулу: I ≈ 1 − e − b . Составим таблицу зависимости точного
значения величины I от b:
b
I

0 0,1
0 0,095

0,2 0,5
0,18 0,39

1
2
0,63 0,86

§ 2]

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

Типичным примером быстроменяющейся функции может служить
показательная функция y = Ce − kx (С > 0; k > 0). Выберем значение m
в формуле (18) из условия, чтобы формула (18) была абсолютно точна


для ∫ Ce − kx dx.

3
5
10
0,95 0,993 0,99996

a

Из таблицы видно, что пока b мало´ (при этом функция в области
интегрирования изменяется мало), оценка (17) неплоха. Однако
если b велико, то приближение I ≈ b становится очень плохим.
Пусть функция у(х) на всем промежутке интегрирования быстро убы7
вает. Тогда максимальное значение функции достигается на левом конце
промежутка, т.e . при х = а. (Отметим, что отсюда не следует равенства
dy
= y ′(a) = 0; см. рис. 16.). Так как
dx x = a
для быстрозатухающей функции у(х)

Так как y = Ce − kx , y ′ = − kCe − kx , то y(a) = Ce − ka , y ′(a) = kCe − ka ,
поэтому формула (18) дает
I =m

C 2 e −2 ka
Ce − ka m
=m
=
y( a ).
− ka
k
k
Cke

Точное значение рассматриваемого интеграла есть


I = ∫ Ce − kx dx = −
a

Сравнивая результаты, получаем

b

интеграл I = ∫ ydx не может сущес7

му формула (18) принимает вид

твенно изменяться при увеличении b,
то грубая оценка интеграла I не дол7
жна включать b, мы как бы полагаем
b = ∞. Естественно считать, что в этом
случае интеграл приближенно равен
Рис. 16.
произведению y max = y(a) на некото7
рую не зависящую от b длину ∆x про7
межутка интегрирования. Эта длина при заданном у(а) должна быть
тем меньше, чем быстрее убывает функция, т.е. чем больше y ′(a) . Ве7
личину ∆x такой же размерности, что и х, можно построить, исходя из
величин у(а) и y ′(a) , единственным способом

I≈

a

∆x =

y(a )
m,
y′( a )

где m — безразмерный коэффициент пропорциональности. После это7
го получаем
I ≈ y ( a )∆x =

y2 (a )
m.
y′( a )

(18)

Если функция у(х) возрастает на промежутке интегрирования, то
она достигает максимума на правом конце промежутка, т.е. при x = b.
В этом случае формула (18) принимает вид
I≈

y 2 (b )
m.
y′(b )

71

C − kx
e
k


a

=

1
y( a ).
k

m
1
y(a) = y(a), откуда m = 1. Поэто7
k
k
y2 (a )
.
y′( a )

(19)

Эта формула в случае бесконечного промежутка для быстроменяю7
щихся функций другого вида, а также в случае конечного промежутка,
вообще говоря, не является точной, однако дает неплохие результаты.
Для того чтобы выяснить наглядный геометрический смысл оценки
(19), поступим следующим образом. Проведем к кривой у = у (х) каса7
тельную в точке А (рис. 16) и найдем длину отрезка A1N. Уравнение
касательной есть y − y(a) = y ′(a)(x − a); полагая в нем y = 0, получим
y(a)
, или,
точку пересечения касательной с осью х. Это дает x = a −
y ′(a)
замечая, что y ′(a) < 0, так как у(х) — убывающая функция, получаем
y(a)
. Поэтому
x =a+
y ′(a)
y( a )
y( a )
−a =
= ∆ x.
y′( a )
y′( a )

A1 N = a +

Оценка интеграла по формуле (19) соответствует замене площади под
кривой у = у(х) площадью прямоугольника, изображенного
на рис. 16.

1
dx
П р и м е р. Найдем по формуле (19) ∫ 8 . Здесь y = 8 ,
x
x
1
8
y ′ = − 9 , поэтому y(1) = 1, y ′(1) = 8,
x


dx

1

∫ x 8 ≈ 8 = 0,125.
1

70

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

дает I ≈ b. Однако в данном примере для интеграла легко получить
точную формулу: I ≈ 1 − e − b . Составим таблицу зависимости точного
значения величины I от b:
b
I

0 0,1
0 0,095

0,2 0,5
0,18 0,39

1
2
0,63 0,86

§ 2]

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

Типичным примером быстроменяющейся функции может служить
показательная функция y = Ce − kx (С > 0; k > 0). Выберем значение m
в формуле (18) из условия, чтобы формула (18) была абсолютно точна


для ∫ Ce − kx dx.

3
5
10
0,95 0,993 0,99996

a

Из таблицы видно, что пока b мало´ (при этом функция в области
интегрирования изменяется мало), оценка (17) неплоха. Однако
если b велико, то приближение I ≈ b становится очень плохим.
Пусть функция у(х) на всем промежутке интегрирования быстро убы7
вает. Тогда максимальное значение функции достигается на левом конце
промежутка, т.e . при х = а. (Отметим, что отсюда не следует равенства
dy
= y ′(a) = 0; см. рис. 16.). Так как
dx x = a
для быстрозатухающей функции у(х)

Так как y = Ce − kx , y ′ = − kCe − kx , то y(a) = Ce − ka , y ′(a) = kCe − ka ,
поэтому формула (18) дает
I =m

C 2 e −2 ka
Ce − ka m
=m
=
y( a ).
− ka
k
k
Cke

Точное значение рассматриваемого интеграла есть


I = ∫ Ce − kx dx = −
a

Сравнивая результаты, получаем

b

интеграл I = ∫ ydx не может сущес7

му формула (18) принимает вид

твенно изменяться при увеличении b,
то грубая оценка интеграла Iне дол7
жна включать b, мы как бы полагаем
b = ∞. Естественно считать, что в этом
случае интеграл приближенно равен
Рис. 16.
произведению y max = y(a) на некото7
рую не зависящую от b длину ∆x про7
межутка интегрирования. Эта длина при заданном у(а) должна быть
тем меньше, чем быстрее убывает функция, т.е. чем больше y ′(a) . Ве7
личину ∆x такой же размерности, что и х, можно построить, исходя из
величин у(а) и y ′(a) , единственным способом

I≈

a

∆x =

y(a )
m,
y′( a )

где m — безразмерный коэффициент пропорциональности. После это7
го получаем
I ≈ y ( a )∆x =

y2 (a )
m.
y′( a )

(18)

Если функция у(х) возрастает на промежутке интегрирования, то
она достигает максимума на правом конце промежутка, т.е. при x = b.
В этом случае формула (18) принимает вид
I≈

y 2 (b )
m.
y′(b )

71

C − kx
e
k


a

=

1
y( a ).
k

m
1
y(a) = y(a), откуда m = 1. Поэто7
k
k
y2 (a )
.
y′( a )

(19)

Эта формула в случае бесконечного промежутка для быстроменяю7
щихся функций другого вида, а также в случае конечного промежутка,
вообще говоря, не является точной, однако дает неплохие результаты.
Для того чтобы выяснить наглядный геометрический смысл оценки
(19), поступим следующим образом. Проведем к кривой у = у (х) каса7
тельную в точке А (рис. 16) и найдем длину отрезка A1N. Уравнение
касательной есть y − y(a) = y ′(a)(x − a); полагая в нем y = 0, получим
y(a)
, или,
точку пересечения касательной с осью х. Это дает x = a −
y ′(a)
замечая, что y ′(a) < 0, так как у(х) — убывающая функция, получаем
y(a)
. Поэтому
x =a+
y ′(a)
y( a )
y( a )
−a =
= ∆ x.
y′( a )
y′( a )

A1 N = a +

Оценка интеграла по формуле (19) соответствует замене площади под
кривой у = у(х) площадью прямоугольника, изображенного
на рис. 16.

1
dx
П р и м е р. Найдем по формуле (19) ∫ 8 . Здесь y = 8 ,
x
x
1
8
y ′ = − 9 , поэтому y(1) = 1, y ′(1) = 8,
x


dx

1

∫ x 8 ≈ 8 = 0,125.
1

72

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ


Точное значение этого интеграла есть I = ∫
1

dx
x

8

=−



1
7x

7

1

=

[Гл. III

1
= 0143
, .
7

Ошибка составляет 13%.
Часто встречается другой вид интегралов, у которых подынтегральная
функция у(х) достигает максимума при х = хт где7то внутри промежут7
ка интегрирования (рис. 17, а). При
этом в точке максимума y ′(x) = 0.
Можно разбить интеграл на два ин7
теграла от а до хт и от хт до b.
Тогда в каждом из них подынтег7
ральная функция достигает макси7
мума на краю промежутка. Может
показаться, что задача сведена к
предыдущей. В действительности
это не так, разбиение интеграла на
два ничего не дает, так как при
х = хт все равно y ′ = 0 и оценка
(19) неприменима. Значит, это де7
Рис. 17.
йствительно новый случай и надо
по7другому выделять из всего промежутка интегрирования необходи7
мую его часть ∆x. Идея заключается в том, что в этом случае величина
∆x определяется значением y ′′(x m ), т.е. определяется величиной кри7
визны в точке максимума. Из чертежа ясно, что чем круче кривая, тем
меньше следует брать ∆x. Размерность второй производной совпадает с
y
размерностью величины 2 . Поэтому величина той же размерности, что
x
y( x m )
и ∆x, получается из велчин y(x m ) и y ′′(x m ) так: ∆x = l
*.
y ′′(x m )
* К выражению такого вида для ∆x мы можем прийти еще так: разложим у(х) в ряд
Тейлора вблизи максимума, т.е. по степеням х – хт, и возьмем два первых члена, которые
1
не обращаются в нуль. Получим y (x ) = y (x m ) + (x − x m ) 2 ⋅ y ′′(x m ). Найдем значение
2
разности x − x m = ∆x , при которой обращается в нуль это приближенное выражение для у(х):
y(x m ) +

1
(x − x m ) 2 ⋅ y ′′(x m ) = 0,
2

§ 2]

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

(Мы пишем y ′′(x m ) , а не y ′′(x m ), потому что y ′′(x m ) < 0, так как при
х = хт функция у(х) имеет максимум.) Величина l есть безразмерный
коэффициент. Для интеграла получаем оценку

2 y(x m )
=
y ′′(x m )

+∞

∫ y dx, где

была абсолютно точна для

−∞

2

y( x ) = Ce − kx , k > 0, C > 0.
2

(График функции y = Ce − kx для случая С = 3, k = 0,5 изображен на
рис. 17, б.)
В этом случае хт = 0, у(хт) = С, y ′′(x m ) = −2Ck. По формуле (20)
находим
C3
lC
.
=
2Ck
2k

I =l

+∞

+ ∆x

∫ Ce

− kx 2

dx, выполним

−∞

в нем замену переменной по формуле z = x k , dz =
+∞

∫ Ce

− kx 2

dx =

k

−∞



Величина интеграла

∫e

− z2



C

∫e

−z2

k dx. Получим

dz.

−∞

dz может быть найдена точно: в § IV.7 мы

−∞

π . Поэтому

покажем, что этот интеграл равен
+∞

∫ Ce

− kx 2

dx = C

−∞

π
.
k

Сравнивая эту формулу с (21), находим
2k

2 y(x m )
.
y ′′(x m )

1
4


I≈ ∫
y (x m ) + (x − x m ) 2 y ′′(x m ) dx = y (x m ) ∆x =


2
3

x m − ∆x 
m

(21)

Чтобы найти точное значение интеграла

откуда l =

=C

32 y 3 (x m )
.
9 y ′′(x m )

π
,
k

2π . Формула (20) принимает вид

Соответственно приближенное значение для I получается равным
x

(20)

Значение коэффициента l определим из условия, чтобы формула (20)

lC


y 3 ( xm )
.
y′′( xm )

y( xm )
=l
y′′( xm )

I ≈ y( xm ) ⋅ ∆x = l ⋅ y( xm )

откуда
∆x = x − x m =

73

I ≈ 2π

y 3 ( xm )
.
y′′( xm )

(22)

72

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ


Точное значение этого интеграла есть I = ∫
1

dx
x

8

=−



1
7x

7

1

=

[Гл. III

1
= 0143
, .
7

Ошибка составляет 13%.
Часто встречается другой вид интегралов, у которых подынтегральная
функция у(х) достигает максимума при х = хт где7то внутри промежут7
ка интегрирования (рис. 17, а). При
этом в точке максимума y ′(x) = 0.
Можно разбить интеграл на два ин7
теграла от а до хт и от хт до b.
Тогда в каждом из них подынтег7
ральная функция достигает макси7
мума на краю промежутка. Может
показаться, что задача сведена к
предыдущей. В действительности
это не так, разбиение интеграла на
два ничего не дает, так как при
х = хт все равно y ′ = 0 и оценка
(19) неприменима. Значит, это де7
Рис. 17.
йствительно новый случай и надо
по7другому выделять из всего промежутка интегрирования необходи7
мую его часть ∆x. Идея заключается в том, что в этом случае величина
∆x определяется значением y ′′(x m ), т.е. определяется величиной кри7
визны в точке максимума. Из чертежа ясно, что чем круче кривая, тем
меньше следует брать ∆x. Размерность второй производной совпадает с
y
размерностью величины 2 . Поэтому величина той же размерности, что
x
y( x m )
и ∆x, получается из велчин y(x m ) и y ′′(x m ) так: ∆x = l
*.
y ′′(x m )
* К выражению такого вида для ∆x мы можем прийти еще так: разложим у(х) в ряд
Тейлора вблизи максимума, т.е. по степеням х – хт, и возьмем два первых члена, которые
1
не обращаются в нуль. Получим y (x ) = y (x m ) + (x − x m ) 2 ⋅ y ′′(x m ). Найдем значение
2
разности x − x m = ∆x , при которой обращается в нуль это приближенное выражение для у(х):
y(x m ) +

1
(x − x m ) 2 ⋅ y ′′(x m ) = 0,
2

§ 2]

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

(Мы пишем y ′′(x m ) , а не y ′′(x m ), потому что y ′′(x m ) < 0, так как при
х = хт функция у(х) имеет максимум.) Величина l есть безразмерный
коэффициент. Для интеграла получаем оценку

2 y(x m )
=
y ′′(x m )

+∞

∫ y dx, где

была абсолютно точна для

−∞

2

y( x ) = Ce − kx , k > 0, C > 0.
2

(График функции y = Ce − kx для случая С = 3, k = 0,5 изображен на
рис. 17, б.)
В этом случае хт = 0, у(хт) = С, y ′′(x m ) = −2Ck. По формуле (20)
находим
C3
lC
.
=
2Ck
2k

I =l

+∞

+ ∆x

∫ Ce

− kx 2

dx, выполним

−∞

в нем замену переменной по формуле z = x k , dz =
+∞

∫ Ce

− kx 2

dx =

k

−∞



Величина интеграла

∫e

− z2



C

∫e

−z2

k dx. Получим

dz.

−∞

dz может быть найдена точно: в § IV.7 мы

−∞

π . Поэтому

покажем, что этот интеграл равен
+∞

∫ Ce

− kx 2

dx = C

−∞

π
.
k

Сравнивая эту формулу с (21), находим
2k

2 y(x m )
.
y ′′(x m )

1
4


I≈ ∫
y (x m ) + (x − x m ) 2 y ′′(x m ) dx = y (x m ) ∆x =


2
3

x m − ∆x 
m

(21)

Чтобы найти точное значение интеграла

откуда l =

=C

32 y 3 (x m )
.
9 y ′′(x m )

π
,
k

2π . Формула (20) принимает вид

Соответственно приближенное значение для I получается равным
x

(20)

Значение коэффициента l определим из условия, чтобы формула (20)

lC


y 3 ( xm )
.
y′′( xm )

y( xm )
=l
y′′( xm )

I ≈ y( xm ) ⋅ ∆x = l ⋅ y( xm )

откуда
∆x = x − x m =

73

I ≈ 2π

y 3 ( xm )
.
y′′( xm )

(22)

74

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Таким образом, для двух типов быстроменяющихся функций мы
получили две формулы (19) и (22), причем коэффициенты в этих фор7
мулах подобраны так, что формулы точны для интегралов по бесконеч7
ному промежутку от типичных функций: формула (19) точнa для



+∞

a

−∞

− kx
∫ Ce dx, а формула (22) — для

∫ Ce

− kx 2

dx. При другом выборе

типичных функций формулы содержали бы другие коэффициенты.
Определим, например, значение коэффициента l из условия, чтобы
+∞
C
формула (20) была точна для I = ∫
dx, C > 0, k > 0. (Читатель
2
−∞ 1 + kx
C
имеет максимум при
легко убедится сам, что функция y =
1 + kx 2
C
3kx 2 − 1
, то (20) дает
, y ′′ = 2Ck
x m = 0.) Так как y =
2
1 + kx
(1 + kx 2 ) 3

Для того чтобы вычислить интеграл точно, положим

Поэтому

lC
2k

=


k

C
k

+∞



−∞

Точное значение рассматриваемого интеграла есть


dx
1
1
=

n
− n + 1 (1 + x )n −1
(1 + x )
0

(n)
I òî÷í
=∫

мулу
2 y 3 ( xm )
.
y′′( xm )

Однако предпочтение отдается именно формулам (19) и (22). При7
чина этого заключается в следующем. Оказывается, что если получать
быстроменяющиеся функции путем возведения в степень n ка7
кой7либо данной функции f(х), для которой f (x) < f (x m ) при
x ≠ x m , то при достаточно больших n относительная погрешность
формул (19) и (22) становится как угодно малой.
Поясним сказанное двумя примерами.
1. Будем интегрировать последовательные степени функции
1
в пределах от х = 0 до х = ∞. Для этого обозначим u n = u n =
u=
1+ x
1
; это — быстроменяющиеся функции первого типа
=
(1 + x) n


0

=

1
.
n −1

Отношение
=

n −1
.
n

n−1
тем ближе к единице, чем больше n, то при весьма
n
больших n получаем
Так как дробь

n)
Iï(ðèáë

dz

.
=
1+ z2
k

, откуда l = π 2 . В этом случае мы получаем фор7

I ≈π

1
(n)
I прибл
= .
n

I ò î÷í

k x = z,

75

с максимумом на краю, причем чем больше показатель степени п, тем

dx
круче спадает функция ип при увеличении х от 0. Найдем I ( n ) = ∫
n
0 (1 + x )
при помощи формулы (19).
−n
Так как u n′ =
, то u n′ (0) = n, а потому приближенное зна7
(1 + x) n +1
чение этого интеграла есть

(n)

dz = k dx, тогда
I=

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

n)
Iï(ðèáë

C3
lC
.
=
2Ck
2k

I =l

§ 2]

n)
I ò(î÷í

≈ 1,

что и утверждалось. При выборе в формуле (18) m ≠ 1 значение m
осталось бы в правой части последней формулы, т.е. при боль7
ших n мы получили бы систематическую ошибку.
1
, причем −∞ < x < ∞. Образуем быстроменяю7
2. Пусть z =
1+ x 2
1
. Это функции второго типа, с мак7
щиеся функции z n = z n =
(1 + x 2 ) n
симумом внутри области (в данном случае хт = 0). Найдем
+∞
dx
приближенно величину I ( n ) = ∫
, пользуясь формулой (22).
(
1
+
x2 )n
−∞
π
n)
Получим I (прибл
. Интеграл I ( n ) можно вычислить точно, при
=
n
этом он оказывается равным
n)
I ò(î÷í
=

1 ⋅ 3 ⋅ 5 K (2 n − 3 )
π *.
2 ⋅ 4 ⋅ 6 K (2 n − 2 )

* Докажите это, интегрируя равенство

′
2n − 3
2n − 2
x
 (1 + x 2 ) n − 1  = − (1 + x 2 ) n − 1 + (1 + x 2 ) n .



74

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Таким образом, для двух типов быстроменяющихся функций мы
получили две формулы (19) и (22), причем коэффициенты в этих фор7
мулах подобраны так, что формулы точны для интегралов по бесконеч7
ному промежутку от типичных функций: формула (19) точнa для



+∞

a

−∞

− kx
∫ Ce dx, а формула (22) — для

∫ Ce

− kx 2

dx. При другом выборе

типичных функций формулы содержали бы другие коэффициенты.
Определим, например, значение коэффициента l из условия, чтобы
+∞
C
формула (20) была точна для I = ∫
dx, C > 0, k > 0. (Читатель
2
−∞ 1 + kx
C
имеет максимум при
легко убедится сам, что функция y =
1 + kx 2
C
3kx 2 − 1
, то (20) дает
, y ′′ = 2Ck
x m = 0.) Так как y =
2
1 + kx
(1 + kx 2 ) 3

Для того чтобы вычислить интеграл точно, положим

Поэтому

lC
2k

=


k

C
k

+∞



−∞

Точное значение рассматриваемого интеграла есть


dx
1
1
=

n
− n + 1 (1 + x )n −1
(1 + x )
0

(n)
I òî÷í
=∫

мулу
2 y 3 ( xm )
.
y′′( xm )

Однако предпочтение отдается именно формулам (19) и (22). При7
чина этого заключается в следующем. Оказывается, что если получать
быстроменяющиеся функции путем возведения в степень n ка7
кой7либо данной функции f(х), для которой f (x) < f (x m ) при
x ≠ x m , то при достаточно больших n относительная погрешность
формул (19) и (22) становится как угодно малой.
Поясним сказанное двумя примерами.
1. Будем интегрировать последовательные степени функции
1
в пределах от х = 0 до х = ∞. Для этого обозначим u n = u n =
u=
1+ x
1
; это — быстроменяющиеся функции первого типа
=
(1 + x) n


0

=

1
.
n −1

Отношение
=

n −1
.
n

n−1
тем ближе к единице, чем больше n, то при весьма
n
больших n получаем
Так как дробь

n)
Iï(ðèáë

dz

.
=
1+ z2
k

, откуда l = π 2 . В этом случае мы получаем фор7

I ≈π

1
(n)
I прибл
= .
n

I ò î÷í

k x = z,

75

с максимумом на краю, причем чем больше показатель степени п, тем

dx
круче спадает функция ип при увеличении х от 0. Найдем I ( n ) = ∫
n
0 (1 + x )
при помощи формулы (19).
−n
Так как u n′ =
, то u n′ (0) = n, а потому приближенное зна7
(1 + x) n +1
чение этого интеграла есть

(n)

dz = k dx, тогда
I=

ИНТЕГРИРОВАНИЕ БЫСТРОМЕНЯЮЩИХСЯ ФУНКЦИЙ

n)
Iï(ðèáë

C3
lC
.
=
2Ck
2k

I =l

§ 2]

n)
I ò(î÷í

≈ 1,

что и утверждалось. При выборе в формуле (18) m ≠ 1 значение m
осталось бы в правой части последней формулы, т.е. при боль7
ших n мы получили бы систематическую ошибку.
1
, причем −∞ < x < ∞. Образуем быстроменяю7
2. Пусть z =
1+ x 2
1
. Это функции второго типа, с мак7
щиеся функции z n = z n =
(1 + x 2 ) n
симумом внутри области (в данном случае хт = 0). Найдем
+∞
dx
приближенно величину I ( n ) = ∫
, пользуясь формулой (22).
(
1
+
x2 )n
−∞
π
n)
Получим I (прибл
. Интеграл I ( n ) можно вычислить точно, при
=
n
этом он оказывается равным
n)
I ò(î÷í
=

1 ⋅ 3 ⋅ 5 K (2 n − 3 )
π *.
2 ⋅ 4 ⋅ 6 K (2 n − 2 )

* Докажите это, интегрируя равенство

′
2n − 3
2n − 2
x
 (1 + x 2 ) n − 1  = − (1 + x 2 ) n − 1 + (1 + x 2 ) n .



76

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Отношение
(n)

Iï ðèáë
(n)

I ò î÷í

=

2 ⋅ 4 ⋅ 6 K (2 n − 2 )
.
πn 1 ⋅ 3 ⋅ 5 K (2 n − 3 )

(23)

Подсчитаем значения правой части (23) для нескольких значений n.
При n = 2 получаем 0,797. При n = 4 получаем 0,904; при n = 6 полу7
чаем 0,938; при n = 8 получаем 0,962; наконец, при n = 10 получаем
0,978. Таким образом, при увеличении n значение правой части
в фoрмуле (23) приближается к 1*.
n
Перейдем к общему случаю. Рассмотрим y = [ f (x)] , где функция
f(x) > 0 имеет единственную точку максимума. Пусть ln f (x) = ϕ(x),
тогда f (x) = e ϕ( x ) . Поэтому
y = en

ϕ (x )

.

(24)

b

Величина интеграла I = ∫ y dx определяется главным образом зна7
a

чениями подынтегральной функции в той области, где у не слишком
сильно отличается от своего максимального значения.
Ясно, что у достигает максимума одновременно с ϕ(x), т.е. при од7
ном и том же значении х = хт. Для того чтобы у уменьшилось в е раз
по сравнению с y max , нужно, чтобы nϕ(x) было на единицу меньше,
чем nϕ(x m ), т.е. чтобы было nϕ(x) = nϕ(x m ) − 1, откуда
1
ϕ( x ) = ϕ( xm ) − .
n

Чем больше n, тем меньше ϕ(x) отличается от ϕ(x m ). Поэтому
чем больше n, тем точнее замена ϕ(x) первыми двумя не равными
нулю членами ее разложения в ряд Тейлора. Записав два члена разло7
жения, получим ϕ(x) = ϕ(x m ) + (x − x m ) ϕ ′(x m ) (для функции, имею7
1
щей максимум на границе) либо ϕ(x) = ϕ(x m ) + (x − x m )2 ϕ ′′(x m )
2
(для функции, имеющей максимум внутри промежутка).
В первом случае, пользуясь формулой (24), находим
y=e

n ϕ (xm )+ n(x −xm ) ϕ ′ (xm )

= Ae

−b (x −xm )

,

Во втором случае получаем
y=e

1
n ( x − x m ) 2 ⋅ ϕ ′′ ( x m )
2

= Ae

−c (x −xm )2

ФОРМУЛА СТИРЛИНГА

77

Таким образом, функция у(х) может быть приближенно заменена
либо функцией, для которой абсолютно точна формула (19), либо
функцией, для которой абсолютно точна формула (22), притом эта за7
мена тем точнее, чем больше n.
Будем предполагать для простоты, что хт = 0. Тогда для построения
быстроменяющейся функции можно было бы от f(x) перейти не к
n
[f (x)] , а к f (nx). Однако при таком переходе обе части формулы (19)
или соответственно (22) просто делятся на n, т.е. относительная ошиб7
ка обеих формул не меняется. Это связано с тем, что при указанном пе7
реходе относительная доля вклада в интеграл больших и малых
значений функции f(x) сохраняется неизменной (тогда как при пере7
n
ходе от f(x) к [ f (x)] доля малых значений с ростом n стремится
к нулю).
В заключение упомянем о книге А.Б. Мигдала и В.П. Крайнова
«Приближенные методы квантовой механики» (Физматгиз, 1966),
в которой приведен ряд методов оценок интегралов и других математи7
ческих выражений.
Упражнения


x dx
, разбив его на сумму двух ин7
+ ex
1
0

1. Найдите величину интеграла I = ∫


3

x dx
x dx
.
+∫
x
+
e
+ ex
1
1
0
3

тегралов: I = ∫

Первый интеграл вычислите по формуле

Симпсона, а второй по формулам настоящего параграфа. Вычисления ведите
с тремя знаками после запятой.


2

2. Найдите величину интеграла I = ∫ x e − x dx, разбив его на сумму двух
a

интегралов: I = ∫ x e
0

−x 2



dx + ∫ x e

0

−x 2

dx, и находя первый интеграл по форму7

a

лам § I.1, а второй — по формулам § 2. Рассмотрите случаи а = 1; 2. Вычисления
ведите с тремя знаками после запятой.


3. Оцените величину интеграла

∫e

−x 2

dx , рассмотренного на стр. 65.

N

где положено A = e n ϕ( x m ) , b = − nϕ ′(x m ) = n ϕ ′(x m ) .
n ϕ (xm )+

§ 3]

,

1
1
где положено c = − nϕ ′′(x m ) = n ϕ ′′(x m ) .
2
2
* Более строго это можно доказать с помощью формулы Стирлинга (см. упражнение к § 3).

§ 3. Формула Стирлинга
В качестве интересного примера применения формул § 2 мы сейчас
получим удобную формулу для приближенного вычисления величины
n! = n(n − 1)(n − 2) K 3 ⋅ 2 ⋅ 1 при больших значениях n. Эта формула бу7
дет очень полезна при изучении теории вероятностей. С помощью ин7

76

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Отношение
(n)

Iï ðèáë
(n)

I ò î÷í

=

2 ⋅ 4 ⋅ 6 K (2 n − 2 )
.
πn 1 ⋅ 3 ⋅ 5 K (2 n − 3 )

(23)

Подсчитаем значения правой части (23) для нескольких значений n.
При n = 2 получаем 0,797. При n = 4 получаем 0,904; при n = 6 полу7
чаем 0,938; при n = 8 получаем 0,962; наконец, при n = 10 получаем
0,978. Таким образом, при увеличении n значение правой части
в фoрмуле (23) приближается к 1*.
n
Перейдем к общему случаю. Рассмотрим y = [ f (x)] , где функция
f(x) > 0 имеет единственную точку максимума. Пусть ln f (x) = ϕ(x),
тогда f (x) = e ϕ( x ) . Поэтому
y = en

ϕ (x )

.

(24)

b

Величина интеграла I = ∫ y dx определяется главным образом зна7
a

чениями подынтегральной функции в той области, где у не слишком
сильно отличается от своего максимального значения.
Ясно, что у достигает максимума одновременно с ϕ(x), т.е. при од7
ном и том же значении х = хт. Для того чтобы у уменьшилось в е раз
по сравнению с y max , нужно, чтобы nϕ(x) было на единицу меньше,
чем nϕ(x m ), т.е. чтобы было nϕ(x) = nϕ(x m ) − 1, откуда
1
ϕ( x ) = ϕ( xm ) − .
n

Чем больше n, тем меньше ϕ(x) отличается от ϕ(x m ). Поэтому
чем больше n, тем точнее замена ϕ(x) первыми двумя не равными
нулю членами ее разложения в ряд Тейлора. Записав два члена разло7
жения, получим ϕ(x) = ϕ(x m ) + (x − x m ) ϕ ′(x m ) (для функции, имею7
1
щей максимум на границе) либо ϕ(x) = ϕ(x m ) + (x − x m )2 ϕ ′′(x m )
2
(для функции, имеющей максимум внутри промежутка).
В первом случае, пользуясь формулой (24), находим
y=e

n ϕ (xm )+ n(x −xm ) ϕ ′ (xm )

= Ae

−b (x −xm )

,

Во втором случае получаем
y=e

1
n ( x − x m ) 2 ⋅ ϕ ′′ ( x m )
2

= Ae

−c (x −xm )2

ФОРМУЛА СТИРЛИНГА

77

Таким образом, функция у(х) может быть приближенно заменена
либо функцией, для которой абсолютно точна формула (19), либо
функцией, для которой абсолютно точна формула (22), притом эта за7
мена тем точнее, чем больше n.
Будем предполагать для простоты, что хт = 0. Тогда для построения
быстроменяющейся функции можно было бы от f(x) перейти не к
n
[f (x)] , а к f (nx). Однако при таком переходе обе части формулы (19)
или соответственно (22) просто делятся на n, т.е. относительная ошиб7
ка обеих формул не меняется. Это связано с тем, что при указанном пе7
реходе относительная доля вклада в интеграл больших и малых
значений функции f(x) сохраняется неизменной (тогда как при пере7
n
ходе от f(x) к [ f (x)] доля малых значений с ростом n стремится
к нулю).
В заключение упомянем о книге А.Б. Мигдала и В.П. Крайнова
«Приближенные методы квантовой механики» (Физматгиз, 1966),
в которой приведен ряд методов оценок интегралов и других математи7
ческих выражений.
Упражнения


x dx
, разбив его на сумму двух ин7
+ ex
1
0

1. Найдите величину интеграла I = ∫


3

x dx
x dx
.
+∫
x
+
e
+ ex
1
1
0
3

тегралов: I = ∫

Первый интеграл вычислите по формуле

Симпсона, а второй по формулам настоящего параграфа. Вычисления ведите
с тремя знаками после запятой.


2

2. Найдите величину интеграла I = ∫ x e − x dx, разбив его на сумму двух
a

интегралов: I = ∫ x e
0

−x 2



dx + ∫ x e

0

−x 2

dx, и находя первый интеграл по форму7

a

лам § I.1, а второй — по формулам § 2. Рассмотрите случаи а = 1; 2. Вычисления
ведите с тремя знаками после запятой.


3. Оцените величину интеграла

∫e

−x 2

dx , рассмотренного на стр. 65.

N

где положено A = e n ϕ( x m ) , b = − nϕ ′(x m ) = n ϕ ′(x m ) .
n ϕ (xm )+

§ 3]

,

1
1
где положено c = − nϕ ′′(x m ) = n ϕ ′′(x m ) .
2
2
* Более строго это можно доказать с помощью формулы Стирлинга (см. упражнение к § 3).

§ 3. Формула Стирлинга
В качестве интересного примера применения формул § 2 мы сейчас
получим удобную формулу для приближенного вычисления величины
n! = n(n − 1)(n − 2) K 3 ⋅ 2 ⋅ 1 при больших значениях n. Эта формула бу7
дет очень полезна при изучении теории вероятностей. С помощью ин7

78

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

тегрирования по частям легко установить (см., например, ВМ, § III.3),
что при целом положительном n справедливо равенство


n −x
∫ x e dx = n !.
0

Оценим этот интеграл по способу предыдущего параграфа.
В нашем случае y = x n e − x , y ′ = (nx n −1 − x n ) e − x . Приравнивая нулю
первую производную, получим два значения: x = 0 и x = n. Нетрудно

§ 4]

ИНТЕГРИРОВАНИЕ БЫСТРОКОЛЕБЛЮЩИХСЯ ФУНКЦИЙ
n

79



x −x 
ний в § 2, если представить x e
как n  e n  , однако даже при

n


малых n она дает очень хорошие результаты, например:
1
1
8%;
2π   = 092
, , ошибка
n = 1;
n! = 1,
 e
2
2
»
4%;
4π   = 192
, ,
n = 2;
n! = 2,
 e
3
3
»
2,7%;
6π   = 5,84,
n = 3;
n! = 6,
 e
n

−x

n

4

n = 4;

n! = 24,

4
,,
8π   = 235
 e

n = 5;

n! = 120,

5
10π  
 e

»

2,1%;

»

1,7%.

5

= 118,
Упражнение

Докажите, что отношение (23) при n → ∞ стремится к 1.
У к а з а н и е. Домножьте числитель и знаменатель дроби на ее числитель.

§ 4. Интегрирование быстроколеблющихся функций

Рис. 18.

убедиться, что при x = n функция у(х) имеет максимум, а при x = 0 она
равна нулю. (На рис. 18 изображены графики функции y = x n e − x для
n = 3 и n = 4.) Итак, для вычисления интеграла нужно рассматривать об7
ласть максимума x = n функции, т.е. пользоваться формулой (22).
Найдем y ′′, получим y ′′ = n(n − 1) x n −2 − 2nx n −1 + x n e − x . Следо7

[

вательно, y ′′(n) = − n n −1 e − n = −
I≈

]

n

1  n
  . Поэтому
n  e

2 πy 3 ( n )
 n
= 2π  
 e
y′′( n )

3n

 n
n 
 e

−n

n

 n
= 2 πn   .
 e

При изучении быстро осциллирующих воздействий на физические
системы приходится рассматривать интегралы от быстроколеблющихся
функций, т.е. функций, которые
на конечном интервале интегри7
рования много раз меняют знак.
Такие интегралы имеют свои
специфические особенности.
Пусть надо вычислить ин7
теграл
b

I = ∫ F ( x ) dx,

(25)
Рис. 19.

a

Итак,
n

 n
n ! ≈ 2πn   .
 e

Эта формула называется формулой Стирлинга. Ее относительная
погрешность стремится к нулю с ростом п



где график функции F(x) имеет
вид, изображенный на рис. 19. Будем сначала считать ω — частоту ко7
лебаний — постоянной, а амплитуду меняющейся по закону y = f (x);
другими словами, будем считать, что интеграл (25) имеет вид
b

I = ∫ f ( x )sin(ωx + α ) dx,

это вытекает из рассужде7

a

где ω велико.

(26)

78

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

тегрирования по частям легко установить (см., например, ВМ, § III.3),
что при целом положительном n справедливо равенство


n −x
∫ x e dx = n !.
0

Оценим этот интеграл по способу предыдущего параграфа.
В нашем случае y = x n e − x , y ′ = (nx n −1 − x n ) e − x . Приравнивая нулю
первую производную, получим два значения: x = 0 и x = n. Нетрудно

§ 4]

ИНТЕГРИРОВАНИЕ БЫСТРОКОЛЕБЛЮЩИХСЯ ФУНКЦИЙ
n

79



x −x 
ний в § 2, если представить x e
как n  e n  , однако даже при

n


малых n она дает очень хорошие результаты, например:
1
1
8%;
2π   = 092
, , ошибка
n = 1;
n! = 1,
 e
2
2
»
4%;
4π   = 192
, ,
n = 2;
n! = 2,
 e
3
3
»
2,7%;
6π   = 5,84,
n = 3;
n! = 6,
 e
n

−x

n

4

n = 4;

n! = 24,

4
,,
8π   = 235
 e

n = 5;

n! = 120,

5
10π  
 e

»

2,1%;

»

1,7%.

5

= 118,
Упражнение

Докажите, что отношение (23) при n → ∞ стремится к 1.
У к а з а н и е. Домножьте числитель и знаменатель дроби на ее числитель.

§ 4. Интегрирование быстроколеблющихся функций

Рис. 18.

убедиться, что при x = n функция у(х) имеет максимум, а при x = 0 она
равна нулю. (На рис. 18 изображены графики функции y = x n e − x для
n = 3 и n = 4.) Итак, для вычисления интеграла нужно рассматривать об7
ласть максимума x = n функции, т.е. пользоваться формулой (22).
Найдем y ′′, получим y ′′ = n(n − 1) x n −2 − 2nx n −1 + x n e − x . Следо7

[

вательно, y ′′(n) = − n n −1 e − n = −
I≈

]

n

1  n
  . Поэтому
n  e

2 πy 3 ( n )
 n
= 2π  
 e
y′′( n )

3n

 n
n 
 e

−n

n

 n
= 2 πn   .
 e

При изучении быстро осциллирующих воздействий на физические
системы приходится рассматривать интегралы от быстроколеблющихся
функций, т.е. функций, которые
на конечном интервале интегри7
рования много раз меняют знак.
Такие интегралы имеют свои
специфические особенности.
Пусть надо вычислить ин7
теграл
b

I = ∫ F ( x ) dx,

(25)
Рис. 19.

a

Итак,
n

 n
n ! ≈ 2πn   .
 e

Эта формула называется формулой Стирлинга. Ее относительная
погрешность стремится к нулю с ростом п



где график функции F(x) имеет
вид, изображенный на рис. 19. Будем сначала считать ω — частоту ко7
лебаний — постоянной, а амплитуду меняющейся по закону y = f (x);
другими словами, будем считать, что интеграл (25) имеет вид
b

I = ∫ f ( x )sin(ωx + α ) dx,

это вытекает из рассужде7

a

где ω велико.

(26)

80

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Из рис. 19 ясно, что при большом ω интеграл (26) мал, так как его
положительная часть почти нейтрализуется отрицательной. Для более
точной оценки произведем интегрирование по частям, что даст
b

I≈

1
1
[ f ( a )cos(ωa + α ) − f (b )cos(ωb + α )] + ω ∫ f ′( x )cos(ωx + α ) dx. (27)
ω
a

Полученный интеграл имеет вид (26), а потому весь последний член
при большом ω имеет порядок малости выше, чем 1/ω. Отбрасывая
этот член, получаем приближенную формулу
I≈

1
[ f ( a )cos(ωa + α ) − f (b )cos(ωb + α )].
ω

(28)

Этот результат можно выразить и через подынтегральную функцию
F(x) исходного интеграла (25): так как

§ 4]

ИНТЕГРИРОВАНИЕ БЫСТРОКОЛЕБЛЮЩИХСЯ ФУНКЦИЙ

рования; впрочем, это находится в согласии с полученными в § I.2
приближенными формулами для знакочередующихся сумм.
(Отметим, что в предыдущих формулах надо было считать, что функ7
ция f(x) и ее производные рассматриваемых порядков внутри интерва7
ла интегрирования непрерывны. Если f(x) имеет там конечный скачок
при х = с, то надо перейти к сумме интегралов от а до с и от с до b,
после чего к каждому из этих интегралов применить указанные преобра7
зования, в результате чего точка х = с даст свой вклад в асимптотичес7
кие формулы. Особенно существен этот вклад в важном случае, когда
a = −∞, b = ∞ и f(x) при x = ± ∞ обращается в нуль вместе со всеми
своими производными, так как тогда правые части формул (28) и (30)
равны нулю. Более глубоко этот вопрос будет освещен в § XIV.4.)
b

Рассмотрим в качестве примера интеграл I = ∫ e − x sinωx dx. Его
0

F ′( x ) = f ′( x )sin(ωx + α ) + ωf ( x )cos(ωx + α ) ≈ ωf ( x )cos(ωx + α ),

точное значение равно

то можно написать также
I≈

I ò î÷í =

b
1
1
[F ′( a ) − F ′(b )] = − ω 2 F ′( x ) a.
ω2

(29)

1
[ f ( a )cos(ωa + α ) − f (b )cos(ωa + α )] +
ω
1
+ 2 [ f ′(b )sin(ωb + α ) − f ′( a )sin(ωa + α )].
ω

1
ω2

(30)

1

 b
2 F ′( x ) + ω 2 F ′′′( x ) ⋅ a.

Эта формула, как и (30), верна с точностью до членов порядка

I ( 28 ) =

1
(1 − e − b cos ωb );
ω

формула (29) — значение
I ( 29 ) =

Здесь также можно написать формулу, аналогичную (29). Для этого
надо из выражений для F ′(x) и F ′′′(x) вычислить f (x)cos(ωx + α) и
1
1
f ′(x)sin(ωx + α) с точностью до членов порядка 2 и результат
ω
ω
подставить в (30). Пропуская выкладки, которые мы предоставляем
читателю, напишем окончательную формулу:
I ≈−

e−b
ω

(sin ωb + ω cos ωb ).
2
1+ ω
1 + ω2

Формула (28) дает приближенное значение

Для дальнейшего уточнения можно в правой части (27) произвести
еще одно интегрирование по частям; после отбрасывания полученного
интеграла мы придем к приближенной формуле
I≈

81

[

]

1
ω − e − b (ω cos ωb − sin ωb ) .
ω2

Обе приближенные формулы имеют погрешность порядка 1 / ω 2 .
Рассмотрим теперь случай, когда быстроколеблющаяся функция F(x)
под знаком интеграла (25) имеет график, как на рис. 20, т.е. меняет как
свою амплитуду, так и частоту.
В этом случае интеграл (25) часто
бывает возможно записать в виде
b

I = ∫ f ( x ) sin(ωϕ ( x ) + α ) dx, (31)
a

1

.
3

ω
По описанной схеме можно производить и дальнейшее уточнение
асимптотических формул для I; однако получающиеся формулы бу7
дут все более громоздкими и все менее удобными для практического
применения. На практике чаще всего пользуются формулами (28) или
(29). Интересно, что во всех этих формулах участвуют значения функ7
ций f или F и их производных только на концах интервала интегри7

где ϕ(x) — возрастающая (но
уже не с постоянной скоростью!)
функция.
Рис. 20.
Интеграл (31) можно привес7
ти к виду (26) с помощью замены переменной интегрирования ϕ(x) = s.
Если обозначить через x = g (s) обратную функцию, мы получим
ϕ (b )

I=



f ( g( s )) g′( s ) sin (ωs + α ) ds .

ϕ (a)

80

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Из рис. 19 ясно, что при большом ω интеграл (26) мал, так как его
положительная часть почти нейтрализуется отрицательной. Для более
точной оценки произведем интегрирование по частям, что даст
b

I≈

1
1
[ f ( a )cos(ωa + α ) − f (b )cos(ωb + α )] + ω ∫ f ′( x )cos(ωx + α ) dx. (27)
ω
a

Полученный интеграл имеет вид (26), а потому весь последний член
при большом ω имеет порядок малости выше, чем 1/ω. Отбрасывая
этот член, получаем приближенную формулу
I≈

1
[ f ( a )cos(ωa + α ) − f (b )cos(ωb + α )].
ω

(28)

Этот результат можно выразить и через подынтегральную функцию
F(x) исходного интеграла (25): так как

§ 4]

ИНТЕГРИРОВАНИЕ БЫСТРОКОЛЕБЛЮЩИХСЯ ФУНКЦИЙ

рования; впрочем, это находится в согласии с полученными в § I.2
приближенными формулами для знакочередующихся сумм.
(Отметим, что в предыдущих формулах надо было считать, что функ7
ция f(x) и ее производные рассматриваемых порядков внутри интерва7
ла интегрирования непрерывны. Если f(x) имеет там конечный скачок
при х = с, то надо перейти к сумме интегралов от а до с и от с до b,
после чего к каждому из этих интегралов применить указанные преобра7
зования, в результате чего точка х = с даст свой вклад в асимптотичес7
кие формулы. Особенно существен этот вклад в важном случае, когда
a = −∞, b = ∞ и f(x) при x = ± ∞ обращается в нуль вместе со всеми
своими производными, так как тогда правые части формул (28) и (30)
равны нулю. Более глубоко этот вопрос будет освещен в § XIV.4.)
b

Рассмотрим в качестве примера интеграл I = ∫ e − x sinωx dx. Его
0

F ′( x ) = f ′( x )sin(ωx + α ) + ωf ( x )cos(ωx + α ) ≈ ωf ( x )cos(ωx + α ),

точное значение равно

то можно написать также
I≈

I ò î÷í =

b
1
1
[F ′( a ) − F ′(b )] = − ω 2 F ′( x ) a.
ω2

(29)

1
[ f ( a )cos(ωa + α ) − f (b )cos(ωa + α )] +
ω
1
+ 2 [ f ′(b )sin(ωb + α ) − f ′( a )sin(ωa + α )].
ω

1
ω2

(30)

1

 b
2 F ′( x ) + ω 2 F ′′′( x ) ⋅ a.

Эта формула, как и (30), верна с точностью до членов порядка

I ( 28 ) =

1
(1 − e − b cos ωb );
ω

формула (29) — значение
I ( 29 ) =

Здесь также можно написать формулу, аналогичную (29). Для этого
надо из выражений для F ′(x) и F ′′′(x) вычислить f (x)cos(ωx + α) и
1
1
f ′(x)sin(ωx + α) с точностью до членов порядка 2 и результат
ω
ω
подставить в (30). Пропуская выкладки, которые мы предоставляем
читателю, напишем окончательную формулу:
I ≈−

e−b
ω

(sin ωb + ω cos ωb ).
2
1+ ω
1 + ω2

Формула (28) дает приближенное значение

Для дальнейшего уточнения можно в правой части (27) произвести
еще одно интегрирование по частям; после отбрасывания полученного
интеграла мы придем к приближенной формуле
I≈

81

[

]

1
ω − e − b (ω cos ωb − sin ωb ) .
ω2

Обе приближенные формулы имеют погрешность порядка 1 / ω 2 .
Рассмотрим теперь случай, когда быстроколеблющаяся функция F(x)
под знаком интеграла (25) имеет график, как на рис. 20, т.е. меняет как
свою амплитуду, так и частоту.
В этом случае интеграл (25) часто
бывает возможно записать в виде
b

I = ∫ f ( x ) sin(ωϕ ( x ) + α ) dx, (31)
a

1

.
3

ω
По описанной схеме можно производить и дальнейшее уточнение
асимптотических формул для I; однако получающиеся формулы бу7
дут все более громоздкими и все менее удобными для практического
применения. На практике чаще всего пользуются формулами (28) или
(29). Интересно, что во всех этих формулах участвуют значения функ7
ций f или F и их производных только на концах интервала интегри7

где ϕ(x) — возрастающая (но
уже не с постоянной скоростью!)
функция.
Рис. 20.
Интеграл (31) можно привес7
ти к виду (26) с помощью замены переменной интегрирования ϕ(x) = s.
Если обозначить через x = g (s) обратную функцию, мы получим
ϕ (b )

I=



f ( g( s )) g′( s ) sin (ωs + α ) ds .

ϕ (a)

82

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Применение приближенной формулы (28) дает
I ≈−

1
[ f ( g( s )) g′( s ) cos(ωs + α )]
ω
=−

ϕ (b )
s =ϕ (a)

=


1  f(x)
cos (ωϕ ( x ) + α )

ω ϕ′( x )


b

(32)

x =a

(при этом мы воспользовались формулой g ′(s) = 1 / ϕ ′(x) для произ7
водной обратной функции). Если ϕ(x) ≡ x, то формула (32) переходит
в (28). Видоизмененная формула (29), которую мы предлагаем вывести
читателю, приобретает вид
I ≈−

F ′( x )

b

ω 2[ϕ′( x )]

2

.

§ 5]

ЧИСЛОВЫЕ РЯДЫ

В этом случае ряд (33) называется сходящимся, а сумма его полагается
равной S. Таким образом, в случае сходимости можно от частичной
суммы с большим номером переходить к полной сумме ряда и обратно,
т.е. вклад особенности в полную сумму ряда не является существен7
ным, он как угодно мал при большом n;
2) частичная сумма может стремиться к бесконечности или может
колебаться, не имея определенного предела. В этом случае ряд (33) на7
зывается расходящимся.
Простейший пример сходящегося ряда дает сумма бесконечной
убывающей геометрической прогрессии
a + aq + aq 2 + ... + aq n −1 + aq n + ... ( q < 1).

Sn = a

Упражнения
a

cos ωx
dx.
1 + x2
−a

n

женным формулам (28), (29) и (30). Сравните полученные значения с точны7
ми, найденными по таблицам интегрального синуса.

§ 5. Числовые ряды
Числовым рядом называется «бесконечная сумма» чисел
a1 + a 2 + a 3 + ... + a n + a n +1 + ...*.

(33)

Конечно, это не совсем «настоящая» сумма, так как реально можно сло7
жить лишь конечное количество чисел, это — сумма «с особенностью»,
аналогичной особенности для несобственных интегралов, рассмотрен7
ных в § 1. Поэтому и подход к понятию суммы ряда (33) аналогичен
тому, который был применен в § 1. Именно, сначала особенность как
бы отрезают, т.е. рассматривают частичные суммы ряда (33)
S 2 = a1 + a 2 ,

S = lim S n =
n→ ∞

a
.
1− q

Ряд 1+ 1 + 1 + ... — это пример ряда, расходящегося к бесконечности,
а ряд 1 – 1 + 1 – 1 + 1 – 1 + ... — это пример ряда, расходящегося «колеба7
тельным образом», так как его частичные суммы последовательно рав7
ны 1, 0, 1, 0, 1, ... и не имеют определенного предела.
Так как у сходящегося ряда частичные суммы с большими номера7
ми почти одинаковы, то его члены с большими номерами почти равны
нулю; более точно: если ряд (33) сходится, то его «общий член» ап
с возрастанием номера стремится к нулю. Однако и у расходящегося
ряда общий член может стремиться к нулю: например, так будет для
расходящегося ряда
1
1
1
+
+ ... +
+ ...
2
3
n

1+

(То, что этот ряд расходится, можно показать так: S n = 1 +

S 3 = a1 + a 2 + a 3 , ... ,

S n = a1 + a 2 + a 3 + ... + a n .

1 − qn
,
1− q

и так как при больших n степенью q можно пренебречь, то в пределе
получаем сумму ряда (35)



2. Напишите аналог формулы (30) для интеграла (31).
2
sin ωx
3. Вычислите интеграл I = ∫
dx при ω = 1 и ω = 10 по прибли7
x
1

S1 = a1 ,

(35)

В данном примере, как известно,

a

1. Примените формулы (28), (29) и (30) к интегралу

83

(34)

Если теперь увеличивать n, т.е. «исчерпывать особенность», и следить за
поведением частичной суммы (34), то могут представиться два случая:
1) частичная сумма может приближаться к определенному конечно7
му пределу S, так что для больших n она практически простo равна S.
* Такие ряды встречались в ВМ, начиная с § II.17. Здесь мы рассмотрим эти ряды бо7
лее систематично. В этом параграфе используются результаты § I.2.

+

1
3

+ ... +

1
n

>

1
n

+

1
n

+

1
n

+ ... +

1
n

=n

1
n

=

1
2

+

n n
→ ∞.) Сле7
→∞

довательно, только по этому признаку нельзя установить сходимость
ряда. Тем не менее, если зависимость общего члена ап от номера n нам
известна и имеет не очень сложный вид, то сходимость или расходимость
ряда (33) обычно бывает нетрудно установить на основании других при7
знаков, которые мы вскоре укажем. Если же такой простой зависимости

82

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Применение приближенной формулы (28) дает
I ≈−

1
[ f ( g( s )) g′( s ) cos(ωs + α )]
ω
=−

ϕ (b )
s =ϕ (a)

=


1  f(x)
cos (ωϕ ( x ) + α )

ω ϕ′( x )


b

(32)

x =a

(при этом мы воспользовались формулой g ′(s) = 1 / ϕ ′(x) для произ7
водной обратной функции). Если ϕ(x) ≡ x, то формула (32) переходит
в (28). Видоизмененная формула (29), которую мы предлагаем вывести
читателю, приобретает вид
I ≈−

F ′( x )

b

ω 2[ϕ′( x )]

2

.

§ 5]

ЧИСЛОВЫЕ РЯДЫ

В этом случае ряд (33) называется сходящимся, а сумма его полагается
равной S. Таким образом, в случае сходимости можно от частичной
суммы с большим номером переходить к полной сумме ряда и обратно,
т.е. вклад особенности в полную сумму ряда не является существен7
ным, он как угодно мал при большом n;
2) частичная сумма может стремиться к бесконечности или может
колебаться, не имея определенного предела. В этом случае ряд (33) на7
зывается расходящимся.
Простейший пример сходящегося ряда дает сумма бесконечной
убывающей геометрической прогрессии
a + aq + aq 2 + ... + aq n −1 + aq n + ... ( q < 1).

Sn = a

Упражнения
a

cos ωx
dx.
1 + x2
−a

n

женным формулам (28), (29) и (30). Сравните полученные значения с точны7
ми, найденными по таблицам интегрального синуса.

§ 5. Числовые ряды
Числовым рядом называется «бесконечная сумма» чисел
a1 + a 2 + a 3 + ... + a n + a n +1 + ...*.

(33)

Конечно, это не совсем «настоящая» сумма, так как реально можно сло7
жить лишь конечное количество чисел, это — сумма «с особенностью»,
аналогичной особенности для несобственных интегралов, рассмотрен7
ных в § 1. Поэтому и подход к понятию суммы ряда (33) аналогичен
тому, который был применен в § 1. Именно, сначала особенность как
бы отрезают, т.е. рассматривают частичные суммы ряда (33)
S 2 = a1 + a 2 ,

S = lim S n =
n→ ∞

a
.
1− q

Ряд 1+ 1 + 1 + ... — это пример ряда, расходящегося к бесконечности,
а ряд 1 – 1 + 1 – 1 + 1 – 1 + ... — это пример ряда, расходящегося «колеба7
тельным образом», так как его частичные суммы последовательно рав7
ны 1, 0, 1, 0, 1, ... и не имеют определенного предела.
Так как у сходящегося ряда частичные суммы с большими номера7
ми почти одинаковы, то его члены с большими номерами почти равны
нулю; более точно: если ряд (33) сходится, то его «общий член» ап
с возрастанием номера стремится к нулю. Однако и у расходящегося
ряда общий член может стремиться к нулю: например, так будет для
расходящегося ряда
1
1
1
+
+ ... +
+ ...
2
3
n

1+

(То, что этот ряд расходится, можно показать так: S n = 1 +

S 3 = a1 + a 2 + a 3 , ... ,

S n = a1 + a 2 + a 3 + ... + a n .

1 − qn
,
1− q

и так как при больших n степенью q можно пренебречь, то в пределе
получаем сумму ряда (35)



2. Напишите аналог формулы (30) для интеграла (31).
2
sin ωx
3. Вычислите интеграл I = ∫
dx при ω = 1 и ω = 10 по прибли7
x
1

S1 = a1 ,

(35)

В данном примере, как известно,

a

1. Примените формулы (28), (29) и(30) к интегралу

83

(34)

Если теперь увеличивать n, т.е. «исчерпывать особенность», и следить за
поведением частичной суммы (34), то могут представиться два случая:
1) частичная сумма может приближаться к определенному конечно7
му пределу S, так что для больших n она практически простo равна S.
* Такие ряды встречались в ВМ, начиная с § II.17. Здесь мы рассмотрим эти ряды бо7
лее систематично. В этом параграфе используются результаты § I.2.

+

1
3

+ ... +

1
n

>

1
n

+

1
n

+

1
n

+ ... +

1
n

=n

1
n

=

1
2

+

n n
→ ∞.) Сле7
→∞

довательно, только по этому признаку нельзя установить сходимость
ряда. Тем не менее, если зависимость общего члена ап от номера n нам
известна и имеет не очень сложный вид, то сходимость или расходимость
ряда (33) обычно бывает нетрудно установить на основании других при7
знаков, которые мы вскоре укажем. Если же такой простой зависимости

84

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

установить не удается, то просто вычисляют члены один за другим, и если
они выходят за пределы принятой точности вычисления, причем нет основания ожидать, что дальнейшие члены дадут в сумму существенный
вклад, то все дальнейшие члены отбрасывают, ряд объявляют сходящимся, а его сумму равной частичной сумме вычисленных членов.
Первый признак сходимости ряда (33), так называемый признак Да
ламбера, основан на аналогии с суммой бесконечной геометрической
прогрессии (35). Для «чистой» прогрессии (35) отношение каждого
последующего члена к предыдущему есть величина постоянная (равная знаменателю q прогрессии). Допустим теперь, что для ряда (33)
отношение

§ 5]

ЧИСЛОВЫЕ РЯДЫ

85

Таким образом, если интеграл


∫ f ( x ) dx

(38)

1

сходится, то правая часть (37) при n → ∞ остается конечной, т.е. ряд
(33) сходится. Если же интеграл (38) расходится к бесконечности, то
и ряд (33) расходится.
Рассмотрим, например, ряд
1
1
1
1
+
+
+ ... + p + ... ,
n
1p 2 p 3 p

(39)

который получается из ряда (36) при a = 1, когда признак Даламбера
не действует. Чтобы применить интегральный признак Коши, надо
рассмотреть интеграл

a n +1
an

последующего члена к предыдущему уже не постоянно, но стремится
к некоторому пределу q с возрастанием номера. Тогда для больших n
это отношение приблизительно равно q и, как и ряд (35), ряд (33) схоa
дится, если q = lim n +1 < 1, ряд (33) расходится, если q > 1. И тольn→ ∞ a n
ко если q = 1, то по признаку Даламберa нельзя установить, сходится
ли ряд (33), так что приходится применять другие признаки.
Рассмотрим, например, ряд
a a2 a3
an
+ p + p + ... + p + ...
p
1
2
3
n

(36)

Применяя признак Даламбера, найдем
⎡ a n+1
a
an ⎤
a
= a.
lim n + 1 = lim ⎢
: p ⎥ = lim
p
p
a
1
(
+
)
n
n
n→ ∞
n→ ∞ ⎣
n
⎦ n→ ∞ ⎛1 + 1 ⎞



n⎠

Таким образом, при a < 1 ряд (36) сходится со скоростью геометрической прогрессии, а при a > 1 — расходится; при a = ±1 признак
Даламбера к ряду (36) неприменим.
Рассмотрим теперь более сильный интегральный признак Коши,
применимый к ряду с положительными членами. Допустим, что известно выражение общего члена ап ряда (33) в виде функции от номера n,
т.е. a n = f (n), причем функция f (n) положительна и убывает с ростом n. Тогда в силу формулы (I.9) в качестве приближенного значения
для частичной суммы (34) можно принять
n

1
1
S n = a1 + a 2 + ... + a n = f (1) + f (2 ) + ... + f ( n ) ≈ ∫ f ( x ) dx + f (1) + f ( n ). (37)
2
2
1



dx

∫ xp.
1

Этот интеграл был рассмотрен в § 1 (формула (3)), где мы показали,
что он сходится при p > 1 и расходится при p1. Значит, и ряд (39)
сходится при p > 1 и расходится при p1. В частности, при p = 1 получаем так называемый гармонический ряд
1+

1 1
1
+ + ... + + ... = ∞.
2 3
n

Что касается рядов с членами произвольного знака, то здесь часто
применяется признак Лейбница, согласно которому ряд
a1 − a 2 + a 3 − a 4 + a 5 − a 6 + ...

(40)

(все аi считаются положительными, так что знаки двух соседних слагаемых противоположны) сходится,
если
a1 > a 2 > a 3 > ... > a n > ...→ 0

(41)

В самом деле, если на некоторой
Рис. 21.
вспомогательной оси изобразить
(рис. 21) частичные суммы ряда
(32), то из условия (41) вытекает, что переход от S 1 к S 2 , от S 2 к S 3 ,
от S 3 к S 4 и т.д. имеет вид затухающих колебаний, т.е. эти частичные
суммы стремятся к определенному пределу.
Таким образом, например, ряд
1−

сходится при любом p > 0.

1
1
1
+

+ ...
2p 3p 4p

(42)

84

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

установить не удается, то просто вычисляют члены один за другим, и если
они выходят за пределы принятой точности вычисления, причем нет основания ожидать, что дальнейшие члены дадут в сумму существенный
вклад, то все дальнейшие члены отбрасывают, ряд объявляют сходящимся, а его сумму равной частичной сумме вычисленных членов.
Первый признак сходимости ряда (33), так называемый признак Да
ламбера, основан на аналогии с суммой бесконечной геометрической
прогрессии (35). Для «чистой» прогрессии (35) отношение каждого
последующего члена к предыдущему есть величина постоянная (равная знаменателю q прогрессии). Допустим теперь, что для ряда (33)
отношение

§ 5]

ЧИСЛОВЫЕ РЯДЫ

85

Таким образом, если интеграл


∫ f ( x ) dx

(38)

1

сходится, то правая часть (37) при n → ∞ остается конечной, т.е. ряд
(33) сходится. Если же интеграл (38) расходится к бесконечности, то
и ряд (33) расходится.
Рассмотрим, например, ряд
1
1
1
1
+
+
+ ... + p + ... ,
n
1p 2 p 3 p

(39)

который получается из ряда (36) при a = 1, когда признак Даламбера
не действует. Чтобы применить интегральный признак Коши, надо
рассмотреть интеграл

a n +1
an

последующего члена к предыдущему уже не постоянно, но стремится
к некоторому пределу q с возрастанием номера. Тогда для больших n
это отношение приблизительно равно q и, как и ряд (35), ряд (33) схоa
дится, если q = lim n +1 < 1, ряд (33) расходится, если q > 1. И тольn→ ∞ a n
ко если q = 1, то по признаку Даламберa нельзя установить, сходится
ли ряд (33), так что приходится применять другие признаки.
Рассмотрим, например, ряд
a a2 a3
an
+ p + p + ... + p + ...
p
1
2
3
n

(36)

Применяя признак Даламбера, найдем
⎡ a n+1
a
an ⎤
a
= a.
lim n + 1 = lim ⎢
: p ⎥ = lim
p
p
a
1
(
+
)
n
n
n→ ∞
n→ ∞ ⎣
n
⎦ n→ ∞ ⎛1 + 1 ⎞



n⎠

Таким образом, при a < 1 ряд (36) сходится со скоростью геометрической прогрессии, а при a > 1 — расходится; при a = ±1 признак
Даламбера к ряду (36) неприменим.
Рассмотрим теперь более сильный интегральный признак Коши,
применимый к ряду с положительными членами. Допустим, что известно выражение общего члена ап ряда (33) в виде функции от номера n,
т.е. a n = f (n), причем функция f (n) положительна и убывает с ростом n. Тогда в силу формулы (I.9) в качестве приближенного значения
для частичной суммы (34) можно принять
n

1
1
S n = a1 + a 2 + ... + a n = f (1) + f (2 ) + ... + f ( n ) ≈ ∫ f ( x ) dx + f (1) + f ( n ). (37)
2
2
1



dx

∫ xp.
1

Этот интеграл был рассмотрен в § 1 (формула (3)), где мы показали,
что он сходится при p > 1 и расходится при p1. Значит, и ряд (39)
сходится при p > 1 и расходится при p1. В частности, при p = 1 получаем так называемый гармонический ряд
1+

1 1
1
+ + ... + + ... = ∞.
2 3
n

Что касается рядов с членами произвольного знака, то здесь часто
применяется признак Лейбница, согласно которому ряд
a1 − a 2 + a 3 − a 4 + a 5 − a 6 + ...

(40)

(все аi считаются положительными, так что знаки двух соседних слагаемых противоположны) сходится,
если
a1 > a 2 > a 3 > ... > a n > ...→ 0

(41)

В самом деле, если на некоторой
Рис. 21.
вспомогательной оси изобразить
(рис. 21) частичные суммы ряда
(32), то из условия (41) вытекает, что переход от S 1 к S 2 , от S 2 к S 3 ,
от S 3 к S 4 и т.д. имеет вид затухающих колебаний, т.е. эти частичные
суммы стремятся к определенному пределу.
Таким образом, например, ряд
1−

сходится при любом p > 0.

1
1
1
+

+ ...
2p 3p 4p

(42)

86

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Если, как в предыдущем признаке, члены ряда (40) имеют вид f(n),
то приближенное значение его суммы можно подсчитать по методам
§ I.2. О способах уточнения этого значения будет сказано ниже.
Сходящиеся ряды с членами произвольного знака (не обязательно
знакочередующиеся, как (40)), бывают двух типов:
1) может оказаться, что сходятся как «положительная часть» исходного ряда (т.е. ряд, составленный из одних положительных членов
исходного ряда), так и его «отрицательная часть». Тогда исходный ряд
называется абсолютно сходящимся, так как сходится и ряд, составленный из абсолютных величин его членов;
2) может оказаться, что и положительная и отрицательная части
исходного ряда расходятся к бесконечности, но сам ряд сходится из-за
компенсации этих бесконечностей. Такой ряд называется неабсолютно
сходящимся, так как ряд, составленный из абсолютных величин его
членов, расходится.
Например, вспоминая о ряде (39), мы заключаем, что ряд (42) при
p > 1 абсолютно сходящийся, а при 0 < p1 неабсолютно сходящийся.
Со сходящимися рядами можно производить такие же действия,
как и с конечными суммами, так как практически сумма сходящегося
ряда просто равна его частичной сумме с достаточно большим номером. Не совсем очевидное осложнение возникает при перестановке
членов сходящегося ряда. Именно, на сумме абсолютно сходящегося
ряда такая перестановка не сказывается, но неабсолютно сходящийся
ряд может после перестановки членов изменить свою сумму или даже
стать расходящимся, так как такая перестановка может изменить или
даже нарушить «компенсацию бесконечностей», о которой было
сказано выше. Рассмотрим, например, сходящийся ряд
1−

1
1
1
1
1
+

+

+ ...
2
3
4
5
6

(43)

и переставим в нем члены так, чтобы за двумя положительными следовал один отрицательный:
1+

1
1
1
1
1
1

+
+

+
+
3
2
5
7
4
9

1
1

+ ...
11
6

(44)

Частичная сумма S 3 n с номером 3n этого ряда состоит из группы положительных слагаемых
1
1
1
1
1
1+
+
+
+ ... +
+
3
5
7
4n − 3
4n − 1

и группы отрицательных слагаемых


1
1
1
.

− ...−
2
4
2n

§ 5]

ЧИСЛОВЫЕ РЯДЫ

87

Но первая сумма превосходит
1
1
1
1
1
1
,
+
+
+
+ ... +
+
2
4
6
8
4n − 2
4n

и потому общая сумма
Sn >

1
1
1
1
+
+ ... +
+
=
2n + 2
2n + 4
4n − 2
4n
=

1 ⎛ 1
+

2 ⎝ n+1

1
1
1 ⎞
+ ... +
+
⎟.
n+2
2n − 1
2n ⎠

В силу оценки (I.11) правая часть приближенно равна
2n+

1
2

1
2

∫1

n+


1
1
1⎞
dx = 2 ⎜ 2 n + − n + ⎟ =
2
2
x



2


1
1 ⎞
= 2n ⎜ 2 +
− 1+
⎯→ ∞.
⎟ ⎯⎯
2n
2 n ⎠ n→ ∞


Итак, из двух рядов (43) и (44), различающихся лишь порядком
членов, первый сходится, а второй расходится к бесконечности.
Если мы хотим, как это часто делают на практике, заменить сумму
ряда на частичную сумму нескольких его первых членов, то для этого
ряд должен не просто сходиться, а быстро сходиться, чтобы, взяв небольшое число членов, мы почти исчерпали полную сумму, получив ее
с хорошей точностью. Для медленно сходящихся рядов (ими, в частности, обычно оказываются неабсолютно сходящиеся ряды) приходится остаток ряда не отбрасывать, а оценивать по методам § I.2.
Как для сходящихся, так и для расходящихся рядов бывает существенно найти асимптотический закон изменения частичной суммы
в процессе увеличения ее номера. Это можно сделать с помощью методов § I.2, т.е. с помощью применения формул (I.9), (I.11), (I.14) или
(I.15), хотя при этом получается определенная ошибка. Ограничимся
для простоты рядами с положительными членами. Обычно частичная
сумма ряда имеет вид
f ( a ) + f ( a + h ) + f ( a + 2 h ) + ... + f ( a + nh ),

где число членов возрастает за счет увеличения n, а величина h оста1 1
ется неизменной. Так, например, из суммы S 3 = 1 + + получается
2 3
сумма
S5 = 1 +

1 1 1 1
+ + +
2 3 4 5

86

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Если, как в предыдущем признаке, члены ряда (40) имеют вид f(n),
то приближенное значение его суммы можно подсчитать по методам
§ I.2. О способах уточнения этого значения будет сказано ниже.
Сходящиеся ряды с членами произвольного знака (не обязательно
знакочередующиеся, как (40)), бывают двух типов:
1) может оказаться, что сходятся как «положительная часть» исходного ряда (т.е. ряд, составленный из одних положительных членов
исходного ряда), так и его «отрицательная часть». Тогда исходный ряд
называется абсолютно сходящимся, так как сходится и ряд, составленный из абсолютных величин его членов;
2) может оказаться, что и положительная и отрицательная части
исходного ряда расходятся к бесконечности, но сам ряд сходится из-за
компенсации этих бесконечностей. Такой ряд называется неабсолютно
сходящимся, так как ряд, составленный из абсолютных величин его
членов, расходится.
Например, вспоминая о ряде (39), мы заключаем, что ряд (42) при
p > 1 абсолютно сходящийся, а при 0 < p1 неабсолютно сходящийся.
Со сходящимися рядами можно производить такие же действия,
как и с конечными суммами, так как практически сумма сходящегося
ряда просто равна его частичной сумме с достаточно большим номером. Не совсем очевидное осложнение возникает при перестановке
членов сходящегося ряда. Именно, на сумме абсолютно сходящегося
ряда такая перестановка не сказывается, но неабсолютно сходящийся
ряд может после перестановки членов изменить свою сумму или даже
стать расходящимся, так как такая перестановка может изменить или
даже нарушить «компенсацию бесконечностей», о которой было
сказано выше. Рассмотрим, например, сходящийся ряд
1−

1
1
1
1
1
+

+

+ ...
2
3
4
5
6

(43)

и переставим в нем члены так, чтобы за двумя положительными следовал один отрицательный:
1+

1
1
1
1
1
1

+
+

+
+
3
2
5
7
4
9

1
1

+ ...
11
6

(44)

Частичная сумма S 3 n с номером 3n этого ряда состоит из группы положительных слагаемых
1
1
1
1
1
1+
+
+
+ ... +
+
3
5
7
4n − 3
4n − 1

и группы отрицательных слагаемых


1
1
1
.

− ...−
2
4
2n

§ 5]

ЧИСЛОВЫЕ РЯДЫ

87

Но первая сумма превосходит
1
1
1
1
1
1
,
+
+
+
+ ... +
+
2
4
6
8
4n − 2
4n

и потому общая сумма
Sn >

1
1
1
1
+
+ ... +
+
=
2n + 2
2n + 4
4n − 2
4n
=

1 ⎛ 1
+

2 ⎝ n+1

1
1
1 ⎞
+ ... +
+
⎟.
n+2
2n − 1
2n ⎠

В силу оценки (I.11) правая часть приближенно равна
2n+

1
2

1
2

∫1

n+


1
1
1⎞
dx = 2 ⎜ 2 n + − n + ⎟ =
2
2
x



2


1
1 ⎞
= 2n ⎜ 2 +
− 1+
⎯→ ∞.
⎟ ⎯⎯
2n
2 n ⎠ n→ ∞


Итак, из двух рядов (43) и (44), различающихся лишь порядком
членов, первый сходится, а второй расходится к бесконечности.
Если мы хотим, как это часто делают на практике, заменить сумму
ряда на частичную сумму нескольких его первых членов, то для этого
ряд должен не просто сходиться, а быстро сходиться, чтобы, взяв небольшое число членов, мы почти исчерпали полную сумму, получив ее
с хорошей точностью. Для медленно сходящихся рядов (ими, в частности, обычно оказываются неабсолютно сходящиеся ряды) приходится остаток ряда не отбрасывать, а оценивать по методам § I.2.
Как для сходящихся, так и для расходящихся рядов бывает существенно найти асимптотический закон изменения частичной суммы
в процессе увеличения ее номера. Это можно сделать с помощью методов § I.2, т.е. с помощью применения формул (I.9), (I.11), (I.14) или
(I.15), хотя при этом получается определенная ошибка. Ограничимся
для простоты рядами с положительными членами. Обычно частичная
сумма ряда имеет вид
f ( a ) + f ( a + h ) + f ( a + 2 h ) + ... + f ( a + nh ),

где число членов возрастает за счет увеличения n, а величина h оста1 1
ется неизменной. Так, например, из суммы S 3 = 1 + + получается
2 3
сумма
S5 = 1 +

1 1 1 1
+ + +
2 3 4 5

88

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

или
S8 = 1 +

1. S n = 1 +

22

+

1

1 1 1 1 1 1 1
+ + + + + + .
2 3 4 5 6 7 8

32

+ ... +

1
n2

n+

. Согласно (I.11) получим S n ≈

∫1

1
2

dx
x2

1
n+

1

. По формуле (I.9) находим

2
n

Sn ≈ ∫
1

dx 1
1
1
1
2n − 1
.
+ +
= 15
, − + 2 = 15
, −
n 2n
x 2 2 2n2
2n2

Известно, что при неограниченном увеличении n значение S n не7
π2
ограниченно приближается к числу S =
≈ 1645
, . (Здесь мы не дока7
6
зываем этого факта.) Для весьма больших n формула (I.11) дает
, (ошибка 10%).
S n = 2 (ошибка 20%), формула (I.9) дает S n = 15
Отметим, что в этом случае легко уточнить расчет. Причина доволь7
но значительной ошибки заключается в том, что первые члены суммы
изменяются быстро, следовательно, на промежутке интегрирования,
соответствующем расстоянию между двумя последовательными чле7
нами суммы, функция f(x) изменяется слишком неравномерно, а поэ7
тому формула трапеций, на которой был основан вывод формул (I.9) и
(I.11), дает плохой результат.
Поэтому можно найти сумму нескольких первых членов непосред7
ственным сложением, а к оставшейся сумме применить приближенные
формулы. В нашем примере найдем сначала сумму первых трех членов
непосредственно:
S3 = 1 +

1
1
+
= 1 + 0,25 + 0,111 = 1361
, .
22 32

Пусть
S n′ − 3 =

1
1
1
+
+ ... + 2 .
n
42 52

По формуле (I.11) находим S n′ − 3 ≈ 0286
,


1
n+

1
2

, по формуле (I.9) нахо7

89

2n − 1
. Поэтому
2n2
S n ≈ 1647
,


1
n+

1
2

по (I.11) и
,
S n′ ≈ 1642


=

2

= 2−

ЧИСЛОВЫЕ РЯДЫ

дим S n′ − 3 ≈ 0281
,


В таком случае, как правило, абсолютная величина ошибки не умень7
шается с увеличением числа членов суммы.
Рассмотрим примеры.
1

§ 5]

2n − 1
2n2

по (I.9). При неограниченном увеличении n формула (I.11) дает
S ≈ 1647
, , формула (I.9) дает S ≈ 1642
, . В каждом случае ошибка меньше
0,2%.
2. Рассмотрим сумму убывающей геометрической прогрессии
Sn = 1 +

1 1
1
+
+ ... + n −1 ,
z z2
z

где z > 1. Точная формула, как известно, такова:
1
1
z − n −1
n
z
z
,
Sn =
=
1
z −1
1−
z
1−

откуда при неограниченном росте n находим S =

z
. По формуле
z −1

(I.11) получаем
n−

Sn ≈

1
2

∫1



n−

dx
=
zx

2

1
2

∫1



e − x ln z dx =

2

1
1  2
e
ln z 


ln z

−e

1

−  n −  ln z

2


z
=
 ln z


1

1 − n  .

z 

z
. Из приведенной
ln z
ниже таблицы видно, что при z, близком к единице, обе формулы дают
близкие результаты:
При неограниченном росте n находим S ≈

z
z
z −1
z
ln z

1,2

1,5

2,0

3,0

6,0

20,0

6,00

3,00

2,00

1,5

1,20

1,05

6,00

3,01

2,04

1,57

1,36

1,49

Если же z 1, то соседние члены прогрессии сильно отличаются и поэ7
тому приближенная формула дает плохие результаты.
В некоторых случаях сумма может неограниченно возрастать при
увеличении числа членов, несмотря на то, что члены суммы неограни7

88

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

или
S8 = 1 +

1. S n = 1 +

22

+

1

1 1 1 1 1 1 1
+ + + + + + .
2 3 4 5 6 7 8

32

+ ... +

1
n2

n+

. Согласно (I.11) получим S n ≈

∫1

1
2

dx
x2

1
n+

1

. По формуле (I.9) находим

2
n

Sn ≈ ∫
1

dx 1
1
1
1
2n − 1
.
+ +
= 15
, − + 2 = 15
, −
n 2n
x 2 2 2n2
2n2

Известно, что при неограниченном увеличении n значение S n не7
π2
ограниченно приближается к числу S =
≈ 1645
, . (Здесь мы не дока7
6
зываем этого факта.) Для весьма больших n формула (I.11) дает
, (ошибка 10%).
S n = 2 (ошибка 20%), формула (I.9) дает S n = 15
Отметим, что в этом случае легко уточнить расчет. Причина доволь7
но значительной ошибки заключается в том, что первые члены суммы
изменяются быстро, следовательно, на промежутке интегрирования,
соответствующем расстоянию между двумя последовательными чле7
нами суммы, функция f(x) изменяется слишком неравномерно, а поэ7
тому формула трапеций, на которой был основан вывод формул (I.9) и
(I.11), дает плохой результат.
Поэтому можно найти сумму нескольких первых членов непосред7
ственным сложением, а к оставшейся сумме применить приближенные
формулы. В нашем примере найдем сначала сумму первых трех членов
непосредственно:
S3 = 1 +

1
1
+
= 1 + 0,25 + 0,111 = 1361
, .
22 32

Пусть
S n′ − 3 =

1
1
1
+
+ ... + 2 .
n
42 52

По формуле (I.11) находим S n′ − 3 ≈ 0286
,


1
n+

1
2

, по формуле (I.9) нахо7

89

2n − 1
. Поэтому
2n2
S n ≈ 1647
,


1
n+

1
2

по (I.11) и
,
S n′ ≈ 1642


=

2

= 2−

ЧИСЛОВЫЕ РЯДЫ

дим S n′ − 3 ≈ 0281
,


В таком случае, как правило, абсолютная величина ошибки не умень7
шается с увеличением числа членов суммы.
Рассмотрим примеры.
1

§ 5]

2n − 1
2n2

по (I.9). При неограниченном увеличении n формула (I.11) дает
S ≈ 1647
, , формула (I.9) дает S ≈ 1642
, . В каждом случае ошибка меньше
0,2%.
2. Рассмотрим сумму убывающей геометрической прогрессии
Sn = 1 +

1 1
1
+
+ ... + n −1 ,
z z2
z

где z > 1. Точная формула, как известно, такова:
1
1
z − n −1
n
z
z
,
Sn =
=
1
z −1
1−
z
1−

откуда при неограниченном росте n находим S =

z
. По формуле
z −1

(I.11) получаем
n−

Sn ≈

1
2

∫1



n−

dx
=
zx

2

1
2

∫1



e − x ln z dx =

2

1
1  2
e
ln z 


ln z

−e

1

−  n −  ln z

2


z
=
 ln z


1

1 − n  .

z 

z
. Из приведенной
ln z
ниже таблицы видно, что при z, близком к единице, обе формулы дают
близкие результаты:
При неограниченном росте n находим S ≈

z
z
z −1
z
ln z

1,2

1,5

2,0

3,0

6,0

20,0

6,00

3,00

2,00

1,5

1,20

1,05

6,00

3,01

2,04

1,57

1,36

1,49

Если же z 1, то соседние члены прогрессии сильно отличаются и поэ7
тому приближенная формула дает плохие результаты.
В некоторых случаях сумма может неограниченно возрастать при
увеличении числа членов, несмотря на то, что члены суммы неограни7

90

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

ченно уменьшаются (это случаи расходимости соответствующих бес7
конечных рядов).
Рассмотрим примеры.
1
1
1
.
1. S n = 1 +
+
+ ... +
2
3
n
По формуле (I.11) получаем
n+

∫1

Sn ≈

1
2

dx
=2 x
x

2

n+

1
2

1
2

=2 n +

1
−2
2

1
.
2

По формуле (I.9) получаем
n

Sn ≈ ∫
1

dx 1
1
1
.
+ +
= 2 n − 15
, +
x 2 2 n
2 n

При больших n получаем из (I.11)

§ 5]

ональный

1

n



2

冢При этом мы отбрасываем член, пропорци7

n2

Sn
Sn
2n

.

n
Более точная формула (она получается непосредственным сложе7
нием нескольких первых членов) такова:
S n ≈ 2 n − 1466
, .

При больших n, пользуясь формулой (I.11), находим S n ≈ ln n +
, Предел раз7
+ ln 2 = ln n + 069
, , а пользуясь (I.9), находим S n ≈ ln n + 050.
ности S n − ln n при неограниченном увеличении n обозначается
буквой С и называется постоянной Эйлера. Таким образом, можно на7
писать формулу S n ≈ ln n + C + α n , где α n → 0 при n → ∞. Поэтому
асимптотически точная формула имеет вид S n ≈ ln n + C. Мы получили
весьма грубые приближенные значения для постоянной Эйлера, однако
при помощи формул (I.9) и (I.11) можно получить более точное значе7
ние С, суммируя непосредственно несколько первых членов. Оказыва7
ется, что С = 0,5772.
Теперь рассмотрим суммы, члены которых растут с увеличением n.
Величина такой суммы неограниченно возрастает с увеличением чис7
ла членов, т.е. с ростом n. При увеличении n возможны два случая.

2

1

2

3

4

5

2

16

512

65 536

33 500 000

2

18

530

66 066

33 600 000

1

1,12

1,03

1,01

1,003

Из таблицы видно, что при больших n величина всей суммы прак7
тически определяется величиной одного последнего члена.
Аналогичная картина имеет место и для возрастающей геометри7
ческой прогрессии.
Действительно, в формуле

2. Во многих вопросах встречается сумма
1 1
1
S n = 1 + + + ... + .
2 3
n

91

1. Ошибка приближенных формул (I.9) и (I.11) с увеличением
n уменьшается (по абсолютной величине) или хотя и увеличивается,
но медленнее, чем сама сумма, так что относительная ошибка уменьша7
ется. Этот случай получается, если члены суммы возрастают медленнее
геометрической прогрессии, например, как степени.
2. Относительная ошибка (а тем более и абсолютная) с увеличением
n не уменьшается.
Второй случай получается тогда, когда члены суммы возрастают
в геометрической прогрессии, т.е. когда сумма имеет вид S n = a + ay +
+ ay 2 + ay 3 + ... + ay n −1 , где y > 1, a также если члены суммы растут
2
быстрее прогрессии, например S n = y + y 4 + y 9 + ... + y n . В этом случае
последний член составляет основную часть всей суммы. Например, для
2
случая суммы S n = y + y 4 + y 9 + ... + y n мы приводим таблицу значе7
Sn
ний величины
при y = 2:
2
yn

S n ≈ 2 n − 141
, ,

а из (I.9) S n ≈ 2 n − 150
, .

ЧИСЛОВЫЕ РЯДЫ

S n = 1 + z + ... + z n −1 =

z n −1
z −1

( z > 1)

n

пренебрежем единицей по сравнению с z , тогда получим
Sn ≈

zn
.
z −1

Поэтому
Sn
zn
z

=
= const
n −1
n −1
z
z ( z − 1) z − 1

(при достаточно больших n). Значит, в этом случае доля вклада по7
следнего члена приближается к постоянному числу, а при больших z
эта доля близка к 1. Ясно, что в этом случае нет надобности в формулах
суммирования. Действительно, для того чтобы получить величину
суммы с хорошей степенью точности, достаточно найти сумму не7
скольких последних членов.

90

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

ченно уменьшаются (это случаи расходимости соответствующих бес7
конечных рядов).
Рассмотрим примеры.
1
1
1
.
1. S n = 1 +
+
+ ... +
2
3
n
По формуле (I.11) получаем
n+

∫1

Sn ≈

1
2

dx
=2 x
x

2

n+

1
2

1
2

=2 n +

1
−2
2

1
.
2

По формуле (I.9) получаем
n

Sn ≈ ∫
1

dx 1
1
1
.
+ +
= 2 n − 15
, +
x 2 2 n
2 n

При больших n получаем из (I.11)

§ 5]

ональный

1

n



2

冢При этом мы отбрасываем член, пропорци7

n2

Sn
Sn
2n

.

n
Более точная формула (она получается непосредственным сложе7
нием нескольких первых членов) такова:
S n ≈ 2 n − 1466
, .

При больших n, пользуясь формулой (I.11), находим S n ≈ ln n +
, Предел раз7
+ ln 2 = ln n + 069
, , а пользуясь (I.9), находим S n ≈ ln n + 050.
ности S n − ln n при неограниченном увеличении n обозначается
буквой С и называется постоянной Эйлера. Таким образом, можно на7
писать формулу S n ≈ ln n + C + α n , где α n → 0 при n → ∞. Поэтому
асимптотически точная формула имеет вид S n ≈ ln n + C. Мы получили
весьма грубые приближенные значения для постоянной Эйлера, однако
при помощи формул (I.9) и (I.11) можно получить более точное значе7
ние С, суммируя непосредственно несколько первых членов. Оказыва7
ется, что С = 0,5772.
Теперь рассмотрим суммы, члены которых растут с увеличением n.
Величина такой суммы неограниченно возрастает с увеличением чис7
ла членов, т.е. с ростом n. При увеличении n возможны два случая.

2

1

2

3

4

5

2

16

512

65 536

33 500 000

2

18

530

66 066

33 600 000

1

1,12

1,03

1,01

1,003

Из таблицы видно, что при больших n величина всей суммы прак7
тически определяется величиной одного последнего члена.
Аналогичная картина имеет место и для возрастающей геометри7
ческой прогрессии.
Действительно, в формуле

2. Во многих вопросах встречается сумма
1 1
1
S n = 1 + + + ... + .
2 3
n

91

1. Ошибка приближенных формул (I.9) и (I.11) с увеличением
n уменьшается (по абсолютной величине) или хотя и увеличивается,
но медленнее, чем сама сумма, так что относительная ошибка уменьша7
ется. Этот случай получается, если члены суммы возрастают медленнее
геометрической прогрессии, например, как степени.
2. Относительная ошибка (а тем более и абсолютная) с увеличением
n не уменьшается.
Второй случай получается тогда, когда члены суммы возрастают
в геометрической прогрессии, т.е. когда сумма имеет вид S n = a + ay +
+ ay 2 + ay 3 + ... + ay n −1 , где y > 1, a также если члены суммы растут
2
быстрее прогрессии, например S n = y + y 4 + y 9 + ... + y n . В этом случае
последний член составляет основную часть всей суммы. Например, для
2
случая суммы S n = y + y 4 + y 9 + ... + y n мы приводим таблицу значе7
Sn
ний величины
при y = 2:
2
yn

S n ≈ 2 n − 141
, ,

а из (I.9) S n ≈ 2 n − 150
, .

ЧИСЛОВЫЕ РЯДЫ

S n = 1 + z + ... + z n −1 =

z n −1
z −1

( z > 1)

n

пренебрежем единицей по сравнению с z , тогда получим
Sn ≈

zn
.
z −1

Поэтому
Sn
zn
z

=
= const
n −1
n −1
z
z ( z − 1) z − 1

(при достаточно больших n). Значит, в этом случае доля вклада по7
следнего члена приближается к постоянному числу, а при больших z
эта доля близка к 1. Ясно, что в этом случае нет надобности в формулах
суммирования. Действительно, для того чтобы получить величину
суммы с хорошей степенью точности, достаточно найти сумму не7
скольких последних членов.

92

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Формулы суммирования полезны тогда, когда отношение суммы
к последнему члену возрастает с увеличением n. Тогда формула дает
возможность сократить вычисления при больших n. При этом всегда
осуществляется случай 1, т.е. относительная ошибка формул (I.9)
и (I.11) обязательно уменьшается. Приведем пример.
Из элементарной алгебры известна формула
S n = 12 + 2 2 + 3 2 + ...+ n 2 =

1
n+
2

∫1

n+

x3
x dx =
3
2

1
2

1
2

2

Абсолютная ошибка равна S n′ − S n =

=

n3 n2 n
+
+ .
3
2 4

2. Пусть дана сумма
Sn = u 1 + u 2 + ... + u n

такая, что
0 < u 1 < u 2 < u 3 < ... < u n .

Образуем сумму

 n3 n2 n
12 
+
+ 
2 6
 3



1
n
= 2.
3
4n
n
12
3

Она быстро уменьшается с увеличением n.
Рассмотрим сумму
S n( p ) = 1 p + 2 p + 3 p + ... + n p

( p > −1) .

Применив формулу (I.10), мы получим
n

S n( p ) ≈ ∫ x p dx =
1

1
n p+1
.

p+1 p+1

Таким образом, при больших n справедлива простая, хотя и грубая
формула
S n( p ) ≈

σ n =1 +

un − 1
u
u
+ n − 2 + ... + 1 .
un
un
un

Ясно, что члены этой суммы убывают. Как ведет себя σ n с увеличением n,
если Sn есть возрастающая сумма первого типа; второго типа?

§ 6. Интегралы, зависящие от параметра

n
и, следовательно, растет с уве7
12

n

93

Рассмотрим интеграл вида

личением n. Относительная ошибка
S n′ − S n
=
Sn

ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА

n( n + 1)(2 n + 1) n 3 n 2 n
=
+
+ .
6
3
2 6

Применим к сумме Sn приближенную формулу (I.11). Получим
S n ≈ S ′n =

§ 6]

n p +1
*.
p+1

Упражнения
1. Уточните значение постоянной Эйлера С (см. стр. 90), найдя непосред7
ственно сумму пяти первых членов; десяти первых членов.
* В случае, когда р — целое положительное, элементарная алгебра позволяет напи7
( p)
сать точную формулу для Sn (в частности, мы пользовались такой формулой для р = 2).
Однако при больших р формулы становятся громоздкими, поэтому приведенная гру7
бая формула может оказаться полезной и для целых положительных р.

b

I = ∫ f ( x, λ ) dx,

(45)

a

где под знак интеграла, помимо переменной интегрирования х, входит
параметр (произвольная постоянная) λ, т.е. величина, которая в про7
цессе интегрирования считается постоянной, но вообще может прини7
мать различные значения. Тогда и результат интегрирования, вообще
говоря, зависит от λ, т.е. I = I (λ). Такие интегралы часто встречаются
в приложениях, когда интегрируемая функция включает в себя ка7
кие7либо массы, размеры и т. п., которые в процессе интегрирования
являются постоянными. Приведем простые примеры:
1

∫ (x

2

+ λx ) dx =

0

1 λ
+ ;
3 2

1

∫ sin αx dx =
0

1 − cosα
;
α

1

∫ ( s + 1)x

s

dx = 1 ( s > −1).

0

При рассмотрении собственных интегралов имеют место те же сво7
йства, что и при рассмотрении конечных сумм функций. Так, мы знаем,
что производная от суммы функций равна сумме производных. Подоб7
ным образом производная от интеграла (45) по параметру равна интег7
d I b ∂f (x, λ)
ралу от производной по этому параметру:
=
dx; здесь под
d λ ∫a ∂λ
знаком интеграла стоит производная от функции f (x,λ), по λ, взятая
при фиксированном x. Аналогичное правило выполняется при интег7
рировании по параметру:
bβ

I
(
λ
)
d
λ
=

∫  ∫ f ( x, λ ) dλ dx.
α
a α
β

92

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Формулы суммирования полезны тогда, когда отношение суммы
к последнему члену возрастает с увеличением n. Тогда формула дает
возможность сократить вычисления при больших n. При этом всегда
осуществляется случай 1, т.е. относительная ошибка формул (I.9)
и (I.11) обязательно уменьшается. Приведем пример.
Из элементарной алгебры известна формула
S n = 12 + 2 2 + 3 2 + ...+ n 2 =

1
n+
2

∫1

n+

x3
x dx =
3
2

1
2

1
2

2

Абсолютная ошибка равна S n′ − S n =

=

n3 n2 n
+
+ .
3
2 4

2. Пусть дана сумма
Sn = u 1 + u 2 + ... + u n

такая, что
0 < u 1 < u 2 < u 3 < ... < u n .

Образуем сумму

 n3 n2 n
12 
+
+ 
2 6
 3



1
n
= 2.
3
4n
n
12
3

Она быстро уменьшается с увеличением n.
Рассмотрим сумму
S n( p ) = 1 p + 2 p + 3 p + ... + n p

( p > −1) .

Применив формулу (I.10), мы получим
n

S n( p ) ≈ ∫ x p dx =
1

1
n p+1
.

p+1 p+1

Таким образом, при больших n справедлива простая, хотя и грубая
формула
S n( p ) ≈

σ n =1 +

un − 1
u
u
+ n − 2 + ... + 1 .
un
un
un

Ясно, что члены этой суммы убывают. Как ведет себя σ n с увеличением n,
если Sn есть возрастающая сумма первого типа; второго типа?

§ 6. Интегралы, зависящие от параметра

n
и, следовательно, растет с уве7
12

n

93

Рассмотрим интеграл вида

личением n. Относительная ошибка
S n′ − S n
=
Sn

ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА

n( n + 1)(2 n + 1) n 3 n 2 n
=
+
+ .
6
3
2 6

Применим к сумме Sn приближенную формулу (I.11). Получим
S n ≈ S ′n =

§ 6]

n p +1
*.
p+1

Упражнения
1. Уточните значение постоянной Эйлера С (см. стр. 90), найдя непосред7
ственно сумму пяти первых членов; десяти первых членов.
* В случае, когда р — целое положительное, элементарная алгебра позволяет напи7
( p)
сать точную формулу для Sn (в частности, мы пользовались такой формулой для р = 2).
Однако при больших р формулы становятся громоздкими, поэтому приведенная гру7
бая формула может оказаться полезной и для целых положительных р.

b

I = ∫ f ( x, λ ) dx,

(45)

a

где под знак интеграла, помимо переменной интегрирования х, входит
параметр (произвольная постоянная) λ, т.е. величина, которая в про7
цессе интегрирования считается постоянной, но вообще может прини7
мать различные значения. Тогда и результат интегрирования, вообще
говоря, зависит от λ, т.е. I = I (λ). Такие интегралы часто встречаются
в приложениях, когда интегрируемая функция включает в себя ка7
кие7либо массы, размеры и т. п., которые в процессе интегрирования
являются постоянными. Приведем простые примеры:
1

∫ (x

2

+ λx ) dx =

0

1 λ
+ ;
3 2

1

∫ sin αx dx =
0

1 − cosα
;
α

1

∫ ( s + 1)x

s

dx = 1 ( s > −1).

0

При рассмотрении собственных интегралов имеют место те же сво7
йства, что и при рассмотрении конечных сумм функций. Так, мы знаем,
что производная от суммы функций равна сумме производных. Подоб7
ным образом производная от интеграла (45) по параметру равна интег7
d I b ∂f (x, λ)
ралу от производной по этому параметру:
=
dx; здесь под
d λ ∫a ∂λ
знаком интеграла стоит производная от функции f (x,λ), по λ, взятая
при фиксированном x. Аналогичное правило выполняется при интег7
рировании по параметру:
bβ

I
(
λ
)
d
λ
=

∫  ∫ f ( x, λ ) dλ dx.
α
a α
β

94

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Для проверки этих простых правил надо было бы выписать их для ин7
тегральных сумм, а затем перейти в пределе от сумм к интегралам,
однако мы не станем здесь этим подробно заниматься.
Для несобственных интегралов, зависящих от параметров, могут
возникнуть осложнения, связанные прежде всего с возможностью их
расходимости. Наиболее просто обстоят дела для «правильно сходя7
щихся» несобственных интегралов; так, интеграл вида

ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА

(46)

a

где сама функция f конечна, называется правильно сходящимся, если
он мажорируется сходящимся интегралом, не зависящим от парамет7



I( λ ) = ∫

0



∂  1 
dI
1
1
=
dx =

 dx = ∫ −
2
+
λ
dλ ∫0 ∂λ  x + λ 
x
+
λ
(
x
)
0

N

a



1

0

sin λx
dx
x2

1
dx = ln( x + λ)
x+λ

dI N

правильно сходящийся, так как



1

1
dx = 1 < ∞
x2

Свойства правильно сходящихся интегралов такие же, как собствен7
ных интегралов*.
При изучении неправильно сходящихся, а также расходящихся ин7
тегралов вида (40) часто поступают следующим образом: отрезают осо7
бенность, т.е. переходят к собственному интегралу
N



λ

∫ f (x , λ) dx

N

N
→ 0.
→∞

N
x =0

= ln ( N + λ ) − ln λ .

1
1
− .
N +λ λ

dI N


 1
1 
I ( λ1 ) − I ( λ 2 ) = ∫ 

 dx = ln λ 2 − ln λ 1 *.
x
λ
x
λ2 
+
+
1
0 

Поясним еще на примере осложнение, которое может получиться
для неправильно сходящихся интегралов. Рассмотрим интеграл


I ( λ) = ∫

0

sin λx
dx.
x

Можно проверить (см. упражнение 2), что при λ = 1он сходится и равен
π
. Отсюда с помощью подстановки λx = s при λ > 0 сразу следует, что
2


I ( λ) = ∫

0

max

1
=− .
λ

1
→ − , т.е. мы приходим
λ

к полученному выше результату. Аналогичный смысл (проверьте!)
имеет равенство

a

* Здесь требование правильной сходимости можно заменить на несколько менее
ограничительное требование равномерной сходимости, которое означает, что

=

Если теперь N → ∞, то I N (λ ) → ∞, а

I N ( λ ) = ∫ ( x, λ) dx,

после чего рассматривают асимптотическое поведение этого интеграла
при N → ∞. Этим бывает возможно оправдать действия над несоб7
ственными и даже расходящимися интегралами.
Очень важно, что результат выполнения различных действий — вы7
читания, дифференцирования по параметру и т.д. — над расходящими7
ся интегралами может оказаться конечной величиной, в частности,

x =0

Дифференцируя, получим


sin λx
1
 2,
x2
x



Чтобы разобраться в смысле полученного равенства, отрежем особен7
ность, что даст
IN ( λ ) = ∫



1
dx = ∞ ( λ > 0).
x+λ

После дифференцирования по параметру мы приходим к сходящемуся
интегралу



∫ F (x) dx < ∞. Например, интеграл

95

может выражаться через сходящиеся интегралы (может случиться
и обратное). Рассмотрим, например, расходящийся интеграл





I ( λ ) = ∫ f ( x, λ ) dx,

ра, т.е. если f (x, λ )  F (x), где

§ 6]



sin s ds
sin s
π
=
ds = .
s λ ∫ s
2
0
λ

* Начиная с пятидесятых годов XX века физики, развивая квантовую электродина7
мику, широко пользуются несовершенной теорией, которая содержит расходящиеся ин7
тегралы; при этом вычисляют величины типа производных и разностей этих интегралов.
Такие величины оказываются конечными и великолепно согласуются с опытом, который
является высшим критерием истины!

94

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

Для проверки этих простых правил надо было бы выписать их для ин7
тегральных сумм, а затем перейти в пределе от сумм к интегралам,
однако мы не станем здесь этим подробно заниматься.
Для несобственных интегралов, зависящих от параметров, могут
возникнуть осложнения, связанные прежде всего с возможностью их
расходимости. Наиболее просто обстоят дела для «правильно сходя7
щихся» несобственных интегралов; так, интеграл вида

ИНТЕГРАЛЫ, ЗАВИСЯЩИЕ ОТ ПАРАМЕТРА

(46)

a

где сама функция f конечна, называется правильно сходящимся, если
он мажорируется сходящимся интегралом, не зависящим от парамет7



I( λ ) = ∫

0



∂  1 
dI
1
1
=
dx =

 dx = ∫ −
2
+
λ
dλ ∫0 ∂λ  x + λ 
x
+
λ
(
x
)
0

N

a



1

0

sin λx
dx
x2

1
dx = ln( x + λ)
x+λ

dI N

правильно сходящийся, так как



1

1
dx = 1 < ∞
x2

Свойства правильно сходящихся интегралов такие же, как собствен7
ных интегралов*.
При изучении неправильно сходящихся, а также расходящихся ин7
тегралов вида (40) часто поступают следующим образом: отрезают осо7
бенность, т.е. переходят к собственному интегралу
N



λ

∫ f (x , λ) dx

N

N
→ 0.
→∞

N
x =0

= ln ( N + λ ) − ln λ .

1
1
− .
N +λ λ

dI N


 1
1 
I ( λ1 ) − I ( λ 2 ) = ∫ 

 dx = ln λ 2 − ln λ 1 *.
x
λ
x
λ2 
+
+
1
0 

Поясним еще на примере осложнение, которое может получиться
для неправильно сходящихся интегралов. Рассмотрим интеграл


I ( λ) = ∫

0

sin λx
dx.
x

Можно проверить (см. упражнение 2), что при λ = 1он сходится и равен
π
. Отсюда с помощью подстановки λx = s при λ > 0 сразу следует, что
2


I ( λ) = ∫

0

max

1
=− .
λ

1
→ − , т.е. мы приходим
λ

к полученному выше результату. Аналогичный смысл (проверьте!)
имеет равенство

a

* Здесь требование правильной сходимости можно заменить на несколько менее
ограничительное требование равномерной сходимости, которое означает, что

=

Если теперь N → ∞, то I N (λ ) → ∞, а

I N ( λ ) = ∫ ( x, λ) dx,

после чего рассматривают асимптотическое поведение этого интеграла
при N → ∞. Этим бывает возможно оправдать действия над несоб7
ственными и даже расходящимися интегралами.
Очень важно, что результат выполнения различных действий — вы7
читания, дифференцирования по параметру и т.д. — над расходящими7
ся интегралами может оказаться конечной величиной, в частности,

x =0

Дифференцируя, получим


sin λx
1
 2,
x2
x



Чтобы разобраться в смысле полученного равенства, отрежем особен7
ность, что даст
IN ( λ ) = ∫



1
dx = ∞ ( λ > 0).
x+λ

После дифференцирования по параметру мы приходим к сходящемуся
интегралу



∫ F (x) dx < ∞. Например, интеграл

95

может выражаться через сходящиеся интегралы (можетслучиться
и обратное). Рассмотрим, например, расходящийся интеграл





I ( λ ) = ∫ f ( x, λ ) dx,

ра, т.е. если f (x, λ )  F (x), где

§ 6]



sin s ds
sin s
π
=
ds = .
s λ ∫ s
2
0
λ

* Начиная с пятидесятых годов XX века физики, развивая квантовую электродина7
мику, широко пользуются несовершенной теорией, которая содержит расходящиеся ин7
тегралы; при этом вычисляют величины типа производных и разностей этих интегралов.
Такие величины оказываются конечными и великолепно согласуются с опытом, который
является высшим критерием истины!

96

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

В то же время при λ = 0 получается
I = 0, а при λ < 0, вынося –1 за знак
интеграла, получаем, что I = −π / 2.
Итак, в данном примере I(λ ) при
λ = 0 имеет скачок. Это может пока3
заться странным, так как при малом
изменении λ подынтегральная функ3
ция меняется как угодно мало. Однако
малое изменение подынтегральной
Рис. 22.
функции на бесконечном интервале
может привести к немалому измене3
нию интеграла! На рис. 22 показаны разрывный график I(λ ) и графики
N

IN ( λ ) = ∫

0

sin λx
dx
x

при различных N. Хотя эти последние и не имеют разрыва, но при
π
π
большом N переход от − к
совершается на малом интервале λ,
2
2
причем чем больше N, тем этот интервал меньше. В пределе, при
N = ∞, этот переход осуществляется на бесконечно малом интерва3
ле λ, т.е. появляется разрыв.
К функциям


I( λ ) = ∫

0

sin λx
dx
x



и

∫e

− λx

dx ( λ > 0 ), получите с помощью дифферен3

0

цирования по параметру при λ = 1 значение интеграла

∫e

− λx

sin x dx ( λ > 0), интегрируя по параметру

0

в пределах от α до β, a затем полагая β → ∞, получите формулу


∫e

− αx

0

sin x
π
dx = 3 arctg α (α > 0 ).
2
x

(47)

(Значение этого интеграла при α = 0 упоминалось в тексте.)

ОТВЕТЫ И РЕШЕНИЯ
§1
Непосредственно применять способ трапеций или Симпсона нельзя, так
как подынтегральная функция обращается в бесконечность при x = 0. Поэтому
π
π
разобьем промежуток интегрирования на два: от x = 0 до x = и от x = дo
6
6
π
π
x = . При 0  x  справедливо соотношение sin x ≈ x, поэтому
2
6
π
6

I1 = ∫

0

π
2

π
6

3

2

dx
dx 3 3

= x
sin x ∫0 3 x 2

π
6

, ⋅ 0,6496 = 0,974.
= 15

0

dx
подсчитаем по формуле Симпсона. Разбив промежу3
sin x

Интеграл I 2 = ∫

π
6

π
2

Упражнения
1. Исходя из интеграла



2. Исходя из интеграла

97

ток на две части, получим I 2 ≈ 1127
, . Отсюда

dI
= cos λx dx
dλ ∫0

(в других обозначениях) мы еще вернемся в § VI.3 в связи с теорией
разрывных функций и в § XIV.2 в связи с преобразованием Фурье.
При рассмотрении рядов, члены которых зависят от параметра, воз3
никают в точности те же вопросы, что и при рассмотрении несобствен3
ных интегралов, зависящих от параметра. Получающиеся здесь свойства
совершенно аналогичны, и потому мы не будем их здесь приводить.


ОТВЕТЫ И РЕШЕНИЯ



∫x

n −x

e

0

а с помощью интегрирования по параметру — значение интеграла

dx (ср. § 3),





0

e − x − e − λx
dx
x

(отметим, что в последнем примере неопределенный интеграл не выражается
через элементарные функции).



0

3

dx
≈ 0,974 + 1127
= 2,101.
,
sin x

§2
1. Значение первого из этих интегралов было получено (см. задачу 2

x dx
упражнений к § I.1). Найдем ∫ x
. Подынтегральная функция есть f ( x ) =
e
+1
3
e x (1 − x ) + 1
x
. Так как f ′(3 ) ≠ 0, то применяем формулу
, поэтому f ′( x ) =
= x
e +1
( e x + 1)2
(19). Получаем




3

x dx
≈ 0,230
ex + 1



x dx

∫ e x + 1 ≈ 0,628 + 0,230 = 0,858.
0

Отметим для сравнения, что точное значение искомого интеграла (с двумя зна3
ками после запятой) есть 0,82.
2. 0,673; 0,584. (Точнoе значение с тремя знаками после запятой есть 0,612.)

96

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

В то же время при λ = 0 получается
I = 0, а при λ < 0, вынося –1 за знак
интеграла, получаем, что I = −π / 2.
Итак, в данном примере I(λ ) при
λ = 0 имеет скачок. Это может пока3
заться странным, так как при малом
изменении λ подынтегральная функ3
ция меняется как угодно мало. Однако
малое изменение подынтегральной
Рис. 22.
функции на бесконечном интервале
может привести к немалому измене3
нию интеграла! На рис. 22 показаны разрывный график I(λ ) и графики
N

IN ( λ ) = ∫

0

sin λx
dx
x

при различных N. Хотя эти последние и не имеют разрыва, но при
π
π
большом N переход от − к
совершается на малом интервале λ,
2
2
причем чем больше N, тем этот интервал меньше. В пределе, при
N = ∞, этот переход осуществляется на бесконечно малом интерва3
ле λ, т.е. появляется разрыв.
К функциям


I( λ ) = ∫

0

sin λx
dx
x



и

∫e

− λx

dx ( λ > 0 ), получите с помощью дифферен3

0

цирования по параметру при λ = 1 значение интеграла

∫e

− λx

sin x dx ( λ > 0), интегрируя по параметру

0

в пределах от α до β, a затем полагая β → ∞, получите формулу


∫e

− αx

0

sin x
π
dx = 3 arctg α (α > 0 ).
2
x

(47)

(Значение этого интеграла при α = 0 упоминалось в тексте.)

ОТВЕТЫ И РЕШЕНИЯ
§1
Непосредственно применять способ трапеций или Симпсона нельзя, так
как подынтегральная функция обращается в бесконечность при x = 0. Поэтому
π
π
разобьем промежуток интегрирования на два: от x = 0 до x = и от x = дo
6
6
π
π
x = . При 0  x  справедливо соотношение sin x ≈ x, поэтому
2
6
π
6

I1 = ∫

0

π
2

π
6

3

2

dx
dx 3 3

= x
sin x ∫0 3 x 2

π
6

, ⋅ 0,6496 = 0,974.
= 15

0

dx
подсчитаем по формуле Симпсона. Разбив промежу3
sin x

Интеграл I 2 = ∫

π
6

π
2

Упражнения
1. Исходя из интеграла



2. Исходя из интеграла

97

ток на две части, получим I 2 ≈ 1127
, . Отсюда

dI
= cos λx dx
dλ ∫0

(в других обозначениях) мы еще вернемся в § VI.3 в связи с теорией
разрывных функций и в § XIV.2 в связи с преобразованием Фурье.
При рассмотрении рядов, члены которых зависят от параметра, воз3
никают в точности те же вопросы, что и при рассмотрении несобствен3
ных интегралов, зависящих от параметра. Получающиеся здесь свойства
совершенно аналогичны, и потому мы не будем их здесь приводить.


ОТВЕТЫ И РЕШЕНИЯ



∫x

n −x

e

0

а с помощью интегрирования по параметру — значение интеграла

dx (ср. § 3),





0

e − x − e − λx
dx
x

(отметим, что в последнем примере неопределенный интеграл не выражается
через элементарные функции).



0

3

dx
≈ 0,974 + 1127
= 2,101.
,
sin x

§2
1. Значение первого из этих интегралов было получено (см. задачу 2

x dx
упражнений к § I.1). Найдем ∫ x
. Подынтегральная функция есть f ( x ) =
e
+1
3
e x (1 − x ) + 1
x
. Так как f ′(3 ) ≠ 0, то применяем формулу
, поэтому f ′( x ) =
= x
e +1
( e x + 1)2
(19). Получаем




3

x dx
≈ 0,230
ex + 1



x dx

∫ e x + 1 ≈ 0,628 + 0,230 = 0,858.
0

Отметим для сравнения, что точное значение искомого интеграла (с двумя зна3
ками после запятой) есть 0,82.
2. 0,673; 0,584. (Точнoе значение с тремя знаками после запятой есть 0,612.)

98

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

2

2

∫e

−x 2

2

2

dx ≈ ( e − N )2 : 2 Ne − N =

N

1 −N 2
e ,
2N

§6
1. Имеем

как и было указано на стр. 65.



∫e

§3
Рассматриваемая дробь D после указанного преобразования равна

[2 ⋅ 4 ⋅ 5 ...(2 n − 2 )]

2

πn 1 ⋅ 2 ⋅ 3 ⋅ 4 ... (2 n − 3 )(2 n − 2 )

[2
=

n −1

]

⋅ 1 ⋅ 2 ⋅ 3 ...( n − 1)
πn (2 n − 2 )!

2

2 2 n − 2[( n − 1)!]

dx =

πn (2 n − 2 )!

e − λx
−λ


x =0

=

1
λ

( λ > 0 ).

(48)

Этот интеграл правильно сходится на любом промежутке α  λ β,

2

=

− λx

0

.

Применяя формулу Стирлинга, получаем при больших n
2

n −1

⎛ n − 1⎞ ⎤
2 2 n − 2 ⎢ 2 π ( n − 1) ⎜
⎟ ⎥
⎝ e ⎠
⎦ =

D≈
2 n−2
⎛ 2 n − 2⎞
πn 2 π(2 n − 2 ) ⎜

⎝ e ⎠

=

99

2. В первом случае σ n неограниченно увеличивается при неограничен3
ном увеличении n, во втором случае σ n неограниченно приближается к 1.

3. Здесь y = e − x , y′ = −2 xe − x , a = N ; по формуле (19) получаем, что


ОТВЕТЫ И РЕШЕНИЯ

2 2 n − 22 π ( n − 1)( n − 1)2 n − 2 e − ( 2 n − 2 )
n −1
=
≈ 1.
n
2 π n( n − 1) 2 2 n − 2 ( n − 1)2 n − 2 e − ( 2 n − 2 )

0 < α < β < ∞, так как на таком промежутке e

− λx

e

− αx



, a

∫e

− αx

где

dx < ∞.

0

Дифференцируя по параметру λ, получаем последовательно




0

0

− λx
−2
∫ ( −x )e dx = ( −1) λ ;


∫ ( −x )

n

∫ ( −x )

2

e − λx dx = ( −1)( −2 ) λ−3 ; ... ;

e − λx dx = ( −1)( −2 ) ...( − n )λ− ( n + 1 ) .

0

Полагая λ = 1 и сокращая на ( −1)n , получаем


∫x

n −x

e

dx = n !.

0

§4

2 sin ωa
4 a cos ωa
4 a cos ωa
; I ( 29 ) = I ( 28 ) + 2
; I ( 30 ) = I ( 28 ) − 2
.
ω(1 + a 2 )
ω (1 + a 2 )2
ω (1 + a 2 )2

⎤ b
1
1 ⎛ f(x)⎞ ′
.
2. I ≈ I ( 32 ) + 2 ⎢

⎟ sin (ωϕ ( x ) + α )⎥
⎥ x =a
ω ⎢ϕ′( x ) ⎝ ϕ′( x )⎠


3. При ω = 1 точное значение I = si 2ω − si ω = 0,66; приближенные значе3
ния: I ( 28 ) = 0,75, I ( 29 ) = 0,13, I ( 30 ) = 136
, ; как видим, точность совершенно не3
удовлетворительная. При ω = 10 точное значение I = −0,110, приближенные
значения: I ( 28 ) = −0,104, I ( 29 ) = −0,115, I ( 30 ) = −0,112, точность порядка не3
скольких процентов.
1. I ( 28 ) =





0

1. S n = S 5 + S n − 5 , где S n − 5

1 1
1
= + + ... + . Применяя формулу (I.9), полу3
n
6 7

n

dx 1
1
≈∫

+
≈ ln n − ln 6 + 0,083. Так как
x 12 2 n
6
S6 = 1 +

1 1 1 1
+ + + = 2,283,
2 3 4 5

то
S n ≈ ln n − ln 6 + 0,083 + 2,283 = ln n + 0,575,
откуда С = 0,575. Суммируя 10 первых членов, получим С = 0,576.

∞ −x
⎛ λ − λx ⎞
e − e − λx
⎜⎜ ∫ e ⎟⎟ dx = ∫
dx = ln λ .
x
⎝1

0

2. Интеграл


∫e

− λx

sin x dx =

0

1
λ2 + 1

( λ > 0)

вычисляется элементарно с помощью неопределенного интеграла. Как и в за3
даче 1, интеграл правильно сходится на любом интервале α  λ β
(0 < α < β < ∞ ). Интегрируя по λ от α до β, получаем


§5

чим S n − 5

Интегрируя формулу (48) по параметру от 1 до λ, получаем

∫ (e

− αx

− e − βx )

0

sin x
dx = arctg β − arctg α .
x

Переходя к пределу при β → ∞, получаем отсюда формулу (47). При α = 0 эта
формула дает




0

sin x
π
dx = .
2
x

Следует отметить, что формула (47) выведена нами при α > 0 и справедли3
вость ее при α = 0 требует специального обоснования, на котором мы здесь не
будем останавливаться.

98

ДОПОЛНИТЕЛЬНЫЕ СВЕДЕНИЯ ОБ ИНТЕГРАЛАХ И РЯДАХ

[Гл. III

2

2

∫e

−x 2

2

2

dx ≈ ( e − N )2 : 2 Ne − N =

N

1 −N 2
e ,
2N

§6
1. Имеем

как и было указано на стр. 65.



∫e

§3
Рассматриваемая дробь D после указанного преобразования равна

[2 ⋅ 4 ⋅ 5 ...(2 n − 2 )]

2

πn 1 ⋅ 2 ⋅ 3 ⋅ 4 ... (2 n − 3 )(2 n − 2 )

[2
=

n −1

]

⋅ 1 ⋅ 2 ⋅ 3 ...( n − 1)
πn (2 n − 2 )!

2

2 2 n − 2[( n − 1)!]

dx =

πn (2 n − 2 )!

e − λx
−λ


x =0

=

1
λ

( λ > 0 ).

(48)

Этот интеграл правильно сходится на любом промежутке α  λ β,

2

=

− λx

0

.

Применяя формулу Стирлинга, получаем при больших n
2

n −1

⎛ n − 1⎞ ⎤
2 2 n − 2 ⎢ 2 π ( n − 1) ⎜
⎟ ⎥
⎝ e ⎠
⎦ =

D≈
2 n−2
⎛ 2 n − 2⎞
πn 2 π(2 n − 2 ) ⎜

⎝ e ⎠

=

99

2. В первом случае σ n неограниченно увеличивается при неограничен3
ном увеличении n, во втором случае σ n неограниченно приближается к 1.

3. Здесь y = e − x , y′ = −2 xe − x , a = N ; по формуле (19) получаем, что


ОТВЕТЫ И РЕШЕНИЯ

2 2 n − 22 π ( n − 1)( n − 1)2 n − 2 e − ( 2 n − 2 )
n −1
=
≈ 1.
n
2 π n( n − 1) 2 2 n − 2 ( n − 1)2 n − 2 e − ( 2 n − 2 )

0 < α < β < ∞, так как на таком промежутке e

− λx

e

− αx



, a

∫e

− αx

где

dx < ∞.

0

Дифференцируя по параметру λ, получаем последовательно




0

0

− λx
−2
∫ ( −x )e dx = ( −1) λ ;


∫ ( −x )

n

∫ ( −x )

2

e − λx dx = ( −1)( −2 ) λ−3 ; ... ;

e − λx dx = ( −1)( −2 ) ...( − n )λ− ( n + 1 ) .

0

Полагая λ = 1 и сокращая на ( −1)n , получаем


∫x

n −x

e

dx = n !.

0

§4

2 sin ωa
4 a cos ωa
4 a cos ωa
; I ( 29 ) = I ( 28 ) + 2
; I ( 30 ) = I ( 28 ) − 2
.
ω(1 + a 2 )
ω (1 + a 2 )2
ω (1 + a 2 )2

⎤ b
1
1 ⎛ f(x)⎞ ′
.
2. I ≈ I ( 32 ) + 2 ⎢

⎟ sin (ωϕ ( x ) + α )⎥
⎥ x =a
ω ⎢ϕ′( x ) ⎝ ϕ′( x )⎠


3. При ω = 1 точное значение I = si 2ω − si ω = 0,66; приближенные значе3
ния: I ( 28 ) = 0,75, I ( 29 ) = 0,13, I ( 30 ) = 136
, ; как видим, точность совершенно не3
удовлетворительная. При ω = 10 точное значение I = −0,110, приближенные
значения: I ( 28 ) = −0,104, I ( 29 ) = −0,115, I ( 30 ) = −0,112, точность порядка не3
скольких процентов.
1. I ( 28 ) =





0

1. S n = S 5 + S n − 5 , где S n − 5

1 1
1
= + + ... + . Применяя формулу (I.9), полу3
n
6 7

n

dx 1
1
≈∫

+
≈ ln n − ln 6 + 0,083. Так как
x 12 2 n
6
S6 = 1 +

1 1 1 1
+ + + = 2,283,
2 3 4 5

то
S n ≈ ln n − ln 6 + 0,083 + 2,283 = ln n + 0,575,
откуда С = 0,575. Суммируя 10 первых членов, получим С = 0,576.

∞ −x
⎛ λ − λx ⎞
e − e − λx
⎜⎜ ∫ e ⎟⎟ dx = ∫
dx = ln λ .
x
⎝1

0

2. Интеграл


∫e

− λx

sin x dx =

0

1
λ2 + 1

( λ > 0)

вычисляется элементарно с помощью неопределенного интеграла. Как и в за3
даче 1, интеграл правильно сходится на любом интервале α  λ β
(0 < α < β < ∞ ). Интегрируя по λ от α до β, получаем


§5

чим S n − 5

Интегрируя формулу (48) по параметру от 1 до λ, получаем

∫ (e

− αx

− e − βx )

0

sin x
dx = arctg β − arctg α .
x

Переходя к пределу при β → ∞, получаем отсюда формулу (47). При α = 0 эта
формула дает




0

sin x
π
dx = .
2
x

Следует отметить, что формула (47) выведена нами при α > 0 и справедли3
вость ее при α = 0 требует специального обоснования, на котором мы здесь не
будем останавливаться.

§ 1]

ЧАСТНЫЕ ПРОИЗВОДНЫЕ

101

Запишем левую часть (1) так:
f ( x + dx, y + dy ) − f ( x, y ) =
= f ( x + dx, y + dy ) − f ( x + dx, y ) + f ( x + dx, y ) − f ( x, y ).

Рассмотрим разность двух последних членов f (x + dx, y) − f (x, y).
При каждом конкретном, закрепленном у эта разность, с точностью
до членов порядка (dx)2 , есть дифференциал функции, зависящей
только от х:

ГЛАВА IV
ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ
До сих пор мы рассматривали только функции одной независимой
переменной; функции нескольких переменных встречались у нас толь
ко эпизодически (см., например, ВМ, § II.12). Теория функций, завися
щих от нескольких независимых переменных, содержит много новых
моментов. При этом почти все принципиально новые положения про
являются уже на примере функции двух переменных:
z = f ( x, y ).

Для простоты мы будем, как правило, рассматривать именно этот
случай.
Само понятие функции двух переменных достаточно просто: вели
чина z задается какойто формулой или таблицей так, что каждой
паре значений х и у соответствует определенное значение z.
§ 1. Частные производные
В случае функции одной переменной g = g (x) малое изменение
dx переменной х приводило к малому изменению функции g, причем

f ( x + dx, y ) − f ( x, y ) =

f ( x + dx, y + dy ) − f ( x, y ).

Покажем*, что это изменение состоит из двух частей, причем одна
часть пропорциональна dx, а другая пропорциональна dy, т.е.
f (x + dx, y + dy) − f (x, y) = a dx + b dy.

∂f ( x , y )
обозначает производную функции f (x, y), вычислен
∂x
y
ную в предположении, что у постоянно. Такая производная называет
ся частной производной функции f (x, y) по х при постоянном у; ее
можно обозначить и так: f x′ (x, y). Аналогично, с точностью до членов
порядка (dy)2 ,
f ( x + dx, y + dy ) − f ( x + dx, y ) =

* Здесь мы с некоторыми изменениями повторяем рассуждение § II.12 ВМ.

∂f ( x + dx, y )
∂y

dy,
x + dx

∂f (x + dx, y)
есть частная производная по у при постоянном
∂y
x + dx
первом аргументе, равном x + dx. Ясно, что величина
где

∂f ( x + dx, y )
∂y

x + dx



∂f ( x, y )
∂y

x

тем меньше, чем меньше dx, точнее,
∂f ( x + dx, y )
∂y

x + dx



∂f ( x, y )
∂y

= α dx,
x

где величина α ограничена. Левая часть (1) при указанных упрощени
ях равна
∂f ( x, y )
∂x

y

 ∂f ( x, y )
dx + 
 ∂y

(1)

При этом мы пренебрегаем членами порядка (dx)2 , (dy)2 , dx ⋅ dy, так
как dx и dy — весьма малые величины.

dx,
y

где

g( x + dx ) − g( x ) = g′( x ) dx.

В этой формуле, правая часть которой обозначается через dg, мы пре
2
небрегаем членами порядка (dx) , так как dx есть весьма малая вели
чина. В случае функции двух переменных изменение функции
происходит в результате изменения обеих переменных х и у и равно

∂f ( x, y )
∂x

=

x


+ α dx  dy =


∂f ( x, y )
∂x

dx +
y

∂f ( x, y )
∂y

dy + α dx dy.
x

Окончательно, учитывая, что членом α dx dy можно пренебречь, полу
чаем, что с точностью до величин порядка (dx)2 , (dy)2 и dx dy левая

§ 1]

ЧАСТНЫЕ ПРОИЗВОДНЫЕ

101

Запишем левую часть (1) так:
f ( x + dx, y + dy ) − f ( x, y ) =
= f ( x + dx, y + dy ) − f ( x + dx, y ) + f ( x + dx, y ) − f ( x, y ).

Рассмотрим разность двух последних членов f (x + dx, y) − f (x, y).
При каждом конкретном, закрепленном у эта разность, с точностью
до членов порядка (dx)2 , есть дифференциал функции, зависящей
только от х:

ГЛАВА IV
ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ
До сих пор мы рассматривали только функции одной независимой
переменной; функции нескольких переменных встречались у нас толь
ко эпизодически (см., например, ВМ, § II.12). Теория функций, завися
щих от нескольких независимых переменных, содержит много новых
моментов. При этом почти все принципиально новые положения про
являются уже на примере функции двух переменных:
z = f ( x, y ).

Для простоты мы будем, как правило, рассматривать именно этот
случай.
Само понятие функции двух переменных достаточно просто: вели
чина z задается какойто формулой или таблицей так, что каждой
паре значений х и у соответствует определенное значение z.
§ 1. Частные производные
В случае функции одной переменной g = g (x) малое изменение
dx переменной х приводило к малому изменению функции g, причем

f ( x + dx, y ) − f ( x, y ) =

f ( x + dx, y + dy ) − f ( x, y ).

Покажем*, что это изменение состоит из двух частей, причем одна
часть пропорциональна dx, а другая пропорциональна dy, т.е.
f (x + dx, y + dy) − f (x, y) = a dx + b dy.

∂f ( x , y )
обозначает производную функции f (x, y), вычислен
∂x
y
ную в предположении, что у постоянно. Такая производная называет
ся частной производной функции f (x, y) по х при постоянном у; ее
можно обозначить и так: f x′ (x, y). Аналогично, с точностью до членов
порядка (dy)2 ,
f ( x + dx, y + dy ) − f ( x + dx, y ) =

* Здесь мы с некоторыми изменениями повторяем рассуждение § II.12 ВМ.

∂f ( x + dx, y )
∂y

dy,
x + dx

∂f (x + dx, y)
есть частная производная по у при постоянном
∂y
x + dx
первом аргументе, равном x + dx. Ясно, что величина
где

∂f ( x + dx, y )
∂y

x + dx



∂f ( x, y )
∂y

x

тем меньше, чем меньше dx, точнее,
∂f ( x + dx, y )
∂y

x + dx



∂f ( x, y )
∂y

= α dx,
x

где величина α ограничена. Левая часть (1) при указанных упрощени
ях равна
∂f ( x, y )
∂x

y

 ∂f ( x, y )
dx + 
 ∂y

(1)

При этом мы пренебрегаем членами порядка (dx)2 , (dy)2 , dx ⋅ dy, так
как dx и dy — весьма малые величины.

dx,
y

где

g( x + dx ) − g( x ) = g′( x ) dx.

В этой формуле, правая часть которой обозначается через dg, мы пре
2
небрегаем членами порядка (dx) , так как dx есть весьма малая вели
чина. В случае функции двух переменных изменение функции
происходит в результате изменения обеих переменных х и у и равно

∂f ( x, y )
∂x

=

x


+ α dx  dy =


∂f ( x, y )
∂x

dx +
y

∂f ( x, y )
∂y

dy + α dx dy.
x

Окончательно, учитывая, что членом α dx dy можно пренебречь, полу
чаем, что с точностью до величин порядка (dx)2 , (dy)2 и dx dy левая

102

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

§ 1]

ЧАСТНЫЕ ПРОИЗВОДНЫЕ

часть (1) равна сумме, которая обозначается через df и называется
полным дифференциалом функции f:
df =

∂f ( x, y )
∂x

dx +
y

∂f ( x, y )
∂y

dy.

а вне его выписаны значения
функции (с отброшенными ма
лыми второго порядка) в соотве
тствующих вершинах; под f
понимается значение f (x, y).
Формула, аналогичная (2),
справедлива для любого числа не
зависимых переменных, а не только
для двух, например df (x, y, z , u) =
∂f
∂f
∂f
∂f
=
dx +
dy +
dz +
du.
∂x
∂y
∂z
∂u
∂f
При этом
вычисляется
∂x
в предположении, что у, z, u по

(2)

x

Из сравнения с (1) находим
a=

∂f ( x, y )
∂x

y

= fx′ ( x, y ),

b=

∂f ( x, y )
∂y

x

= f y′ ( x, y ).

Если по смыслу ясно, какая величина считается постоянной при вы
∂f
пи
числении частной производной, то ее не указывают и вместо
∂x y
∂f
шут короче:
. Однако поскольку в задаче в целом переменными
∂x
являются и х и у, то производную пишем с круглыми ∂ , чтобы отли
чить ее от обычной производной*. Из сказанного следует, что величину
∂f
следует находить так, как будто бы у в выражении f (x, y) не из
∂x
∂f
меняется. Точно так же
находим, считая, что изменяется
∂y
только у, а х остается постоянной. Например, если
f ( x, y ) = x 2 y 3 + xe y ,

(3)

то
∂f
= 2 xy 3 + e y ,
∂x

∂f
= 3 x 2 y 2 + xe y .
∂y

Чтобы представить формулу (2) более наглядно, рассмотрим «плос
кость независимых переменных», т.е. плоскость х, у. Каждая точка М
на этой плоскости имеет определенные координаты х, у и потому
этой точке отвечает определенное значение функции f (x, y); можно
считать, что функция в каждой точке плоскости принимает определен
ное значение. Если мы дадим малое приращение только переменной х,
или только у, или обеим сразу, то мы получим на плоскости х, у точки
малого прямоугольника MNPQ, изображенного в увеличенном размере
на рис. 23. Внутри прямоугольника обозначены координаты его вершин,
d
(e kx ) = ke kx мы также, по существу, имеем дело с частной производ
dx
ной, вычисленной при постоянном k. Однако здесь нет надобности употреблять знак
частной производной, потому что k оставалось постоянным в ходе всего рассмотрения
задачи.
* В формуле

Рис. 23.

стоянные,

103

∂f
вычисляется в предположении, что x, z, u постоян
∂y

ные, и т. д.
Покажем на примере, что величина частной производной сущест
венно зависит от того, как выбраны другие, закрепленные переменные.
Cϕ 2 q 2
Из физики известно, что энергия конденсатора W =
, где
=
2
2C
q = Cϕ; здесь С — емкость конденсатора, ϕ — разность потенциалов на
его обкладках и q — количество электричества, т.е. заряд. Рассматри
ϕ2 W
∂W
вая зависимость W = W (C,ϕ), получим
=
= . Рассматривая
∂C ϕ 2
C
2
q
∂W
W
зависимость W = W (C, q), получим
= − 2 = − . Поэтому
∂C q
C
2C
∂W
∂W
.
=−
∂C ϕ
∂C q
До сих пор мы считали переменные х и у изменяющимися совер
шенно независимо одна от другой. Пусть теперь они сами зависят от
некоторой переменной t, т.е.
x = x( t ),

y = y( t )

(4)

Эти равенства «параметрически» задают на плоскости х, у некото
рую линию, причем параметром служит t (см., например, ВМ, § IV.8).
Параметр t может иметь различный физический смысл, однако удоб
нее всего его рассматривать как время, т.е. считать, что рассматривается
траектория точки, движущейся в плоскости х, у. Тогда z = f (x, y) =
= f (x(t), y(t)), так что в действительности z есть функция одной пере
менной t, только заданная сложным образом. Найдем ее производ

102

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

§ 1]

ЧАСТНЫЕ ПРОИЗВОДНЫЕ

часть (1) равна сумме, которая обозначается через df и называется
полным дифференциалом функции f:
df =

∂f ( x, y )
∂x

dx +
y

∂f ( x, y )
∂y

dy.

а вне его выписаны значения
функции (с отброшенными ма
лыми второго порядка) в соотве
тствующих вершинах; под f
понимается значение f (x, y).
Формула, аналогичная (2),
справедлива для любого числа не
зависимых переменных, а не только
для двух, например df (x, y, z , u) =
∂f
∂f
∂f
∂f
=
dx +
dy +
dz +
du.
∂x
∂y
∂z
∂u
∂f
При этом
вычисляется
∂x
в предположении, что у, z, u по

(2)

x

Из сравнения с (1) находим
a=

∂f ( x, y )
∂x

y

= fx′ ( x, y ),

b=

∂f ( x, y )
∂y

x

= f y′ ( x, y ).

Если по смыслу ясно, какая величина считается постоянной при вы
∂f
пи
числении частной производной, то ее не указывают и вместо
∂x y
∂f
шут короче:
. Однако поскольку в задаче в целом переменными
∂x
являются и х и у, то производную пишем с круглыми ∂ , чтобы отли
чить ее от обычной производной*. Из сказанного следует, что величину
∂f
следует находить так, как будто бы у в выражении f (x, y) не из
∂x
∂f
меняется. Точно так же
находим, считая, что изменяется
∂y
только у, а х остается постоянной. Например, если
f ( x, y ) = x 2 y 3 + xe y ,

(3)

то
∂f
= 2 xy 3 + e y ,
∂x

∂f
= 3 x 2 y 2 + xe y .
∂y

Чтобы представить формулу (2) более наглядно, рассмотрим «плос
кость независимых переменных», т.е. плоскость х, у. Каждая точка М
на этой плоскости имеет определенные координаты х, у и потому
этой точке отвечает определенное значение функции f (x, y); можно
считать, что функция в каждой точке плоскости принимает определен
ное значение. Если мы дадим малое приращение только переменной х,
или только у, или обеим сразу, то мы получим на плоскости х, у точки
малого прямоугольника MNPQ, изображенного в увеличенном размере
на рис. 23. Внутри прямоугольника обозначены координаты его вершин,
d
(e kx ) = ke kx мы также, по существу, имеем дело с частной производ
dx
ной, вычисленной при постоянном k. Однако здесь нет надобности употреблять знак
частной производной, потому что k оставалось постоянным в ходе всего рассмотрения
задачи.
* В формуле

Рис. 23.

стоянные,

103

∂f
вычисляется в предположении, что x, z, u постоян
∂y

ные, и т. д.
Покажем на примере, что величина частной производной сущест
венно зависит от того, как выбраны другие, закрепленные переменные.
Cϕ 2 q 2
Из физики известно, что энергия конденсатора W =
, где
=
2
2C
q = Cϕ; здесь С — емкость конденсатора, ϕ — разность потенциалов на
его обкладках и q — количество электричества, т.е. заряд. Рассматри
ϕ2 W
∂W
вая зависимость W = W (C,ϕ), получим
=
= . Рассматривая
∂C ϕ 2
C
2
q
∂W
W
зависимость W = W (C, q), получим
= − 2 = − . Поэтому
∂C q
C
2C
∂W
∂W
.
=−
∂C ϕ
∂C q
До сих пор мы считали переменные х и у изменяющимися совер
шенно независимо одна от другой. Пусть теперь они сами зависят от
некоторой переменной t, т.е.
x = x( t ),

y = y( t )

(4)

Эти равенства «параметрически» задают на плоскости х, у некото
рую линию, причем параметром служит t (см., например, ВМ, § IV.8).
Параметр t может иметь различный физический смысл, однако удоб
нее всего его рассматривать как время, т.е. считать, что рассматривается
траектория точки, движущейся в плоскости х, у. Тогда z = f (x, y) =
= f (x(t), y(t)), так что в действительности z есть функция одной пере
менной t, только заданная сложным образом. Найдем ее производ

104

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

dz
(полную производную вдоль линии (4))*. Так как из (2) и (4)
dt
получаем
ную

dz =

 ∂z dx ∂z dy 
∂z
∂z
∂z dx
∂z dy
dx +
dy =
dt +
dt = 
+
 dt,
∂x
∂y
∂x dt
∂y dt
 ∂x dt ∂y dt 

то
dz ∂z dx ∂z dy
.
=
+
dt ∂x dt ∂y dt

В частности, если z = f (x, y), где y = y(x), то

dz ∂z ∂z dy
. Мы ви
=
+
dx ∂x ∂y dx

dz
полной производной вдоль линии при данных
dx
dy
, т.е. от наклона
х, у зависит не только от вида функции f, но и от
dx
линии в данной точке к оси х.
Обе последние формулы легко понять с помощью рис. 23. Если точ
ка за время dt перешла из положения М в Р вдоль пунктирной ли
нии, то скорость изменения функции равна

дим, что значение

§ 1]

ЧАСТНЫЕ ПРОИЗВОДНЫЕ

Если величина u не зависит явно от t (тогда говорят, что «поле u
∂u
стационарное»), то
= 0, и справа остаются только первые три слага
∂t
емых; таким образом, они дают скорость изменения u, полученную
только за счет перехода точки М вдоль траектории от одних значе
ний u к другим (например, если u — температура, то за счет перехо
да из менее нагретой части пространства в более нагретую и т.п.). Эта
скорость называется переносной (конвективной). Последнее слагаемое
дает скорость изменения поля в неподвижной точке, полученную изза
нестационарности поля; эта скорость называется местной (локальной).
В общем случае действуют оба указанных фактора, и скорость измене
ния поля вдоль траектории складывается из переносной и местной ско
ростей изменения поля.
Вернемся к случаю функции z = f (x, y) от двух независимых пере
∂z
∂z
и
этой функции сами
менных. Ясно, что частные производные
∂x
∂y
зависят от х и у. Поэтому можно находить их частные производные.
Эти частные производные называются частными производными второ
го порядка, их частные производные — частными производными треть
его порядка и т.д. Можно образовать следующие частные производные
второго порядка:

∂f
∂f
dx +
dy
df ∂x
∂f dx ∂f dy
∂y
.
=
=
+
dt
dt
∂x dt ∂y dt

∂  ∂z 
 ,
∂x  ∂x 

Для получения второй формулы надо df относить не к dt, а к dx.
Рассмотрим для примера случай, когда некоторая величина u, на
пример давление или температура в потоке газа, определена в каждый
момент времени t в каждой точке (х; у; z) пространства. Тогда эта
величина u будет функцией четырех переменных х, у, z, t, т.е. u =
= u (х, у, z, t). Пусть, далее, задан закон движения x = x(t), y = y(t),
z = z(t) некоторой частицы М. Если рассматривать значение u в М по
мере движения, то это значение будет представлять собой сложную
функцию времени:
u = u( x( t ), y( t ), z( t ), t ).

Скорость изменения этого значения u, т.е. скорость изменения ве
личины u «вдоль траектории», равна, в силу формулы для производ
ной сложной функции,
du ∂u dx ∂u dy ∂u dz ∂u
=
+
+
+ .
dt ∂x dt ∂y dt ∂z dt ∂t

(5)

* Советуем читателю повторить вывод формулы для производной сложной функции
одной переменной (см., например, ВМ, § II.3).

105

∂  ∂z 
 ,
∂y  ∂x 

∂  ∂z 
 ,
∂x  ∂y 

∂  ∂z 
 ,
∂y  ∂y 

или, в других обозначениях,
z′′xx =

∂2 z
,
∂x 2

z′′xy =

∂2 z
,
∂x ∂y

z′′yx =

∂2 z
,
∂y ∂x

z′′yy =

∂2 z
.
∂y 2

∂2 z
∂2 z
и
называются смешанными.
∂x ∂y
∂y ∂x
Так, в примере (3)

Производные

∂2 z ∂
=
2 xy 3 + e y = 2 y 3 ,
∂x 2 ∂x

(

)

∂2 z

=
3 x 2 y 2 + xe y = 6 xy 2 + e y ,
∂y ∂x ∂x

(

)

∂2 z

=
2 xy 3 + e y = 6 xy 2 + e y ,
∂x ∂y ∂y

(

)

∂2 z ∂
=
3 x 2 y 2 + xe y = 6 x 2 y + xe y .
∂y 2 ∂y

(

)

∂2 z
∂2 z
, т.е. смешанные производ
=
∂x ∂y ∂y ∂x
ные не зависят от того, в каком порядке производится дифференциро
вание.
Мы видим, что в этом примере

104

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

dz
(полную производную вдоль линии (4))*. Так как из (2) и (4)
dt
получаем
ную

dz =

 ∂z dx ∂z dy 
∂z
∂z
∂z dx
∂z dy
dx +
dy =
dt +
dt = 
+
 dt,
∂x
∂y
∂x dt
∂y dt
 ∂x dt ∂y dt 

то
dz ∂z dx ∂z dy
.
=
+
dt ∂x dt ∂y dt

В частности, если z = f (x, y), где y = y(x), то

dz ∂z ∂z dy
. Мы ви
=
+
dx ∂x ∂y dx

dz
полной производной вдоль линии при данных
dx
dy
, т.е. от наклона
х, у зависит не только от вида функции f, но и от
dx
линии в данной точке к оси х.
Обе последние формулы легко понять с помощью рис. 23. Если точ
ка за время dt перешла из положения М в Р вдоль пунктирной ли
нии, то скорость изменения функции равна

дим, что значение

§ 1]

ЧАСТНЫЕ ПРОИЗВОДНЫЕ

Если величина u не зависит явно от t (тогда говорят, что «поле u
∂u
стационарное»), то
= 0, и справа остаются только первые три слага
∂t
емых; таким образом, они дают скорость изменения u, полученную
только за счет перехода точки М вдоль траектории от одних значе
ний u к другим (например, если u — температура, то за счет перехо
да из менее нагретой части пространства в более нагретую и т.п.). Эта
скорость называется переносной (конвективной). Последнее слагаемое
дает скорость изменения поля в неподвижной точке, полученную изза
нестационарности поля; эта скорость называется местной (локальной).
В общем случае действуют оба указанных фактора, и скорость измене
ния поля вдоль траектории складывается из переносной и местной ско
ростей изменения поля.
Вернемся к случаю функции z = f (x, y) от двух независимых пере
∂z
∂z
и
этой функции сами
менных. Ясно, что частные производные
∂x
∂y
зависят от х и у. Поэтому можно находить их частные производные.
Эти частные производные называются частными производными второ
го порядка, их частные производные — частными производными треть
его порядка и т.д. Можно образовать следующие частные производные
второго порядка:

∂f
∂f
dx +
dy
df ∂x
∂f dx ∂f dy
∂y
.
=
=
+
dt
dt
∂x dt ∂y dt

∂  ∂z 
 ,
∂x  ∂x 

Для получения второй формулы надо df относить не к dt, а к dx.
Рассмотрим для примера случай, когда некоторая величина u, на
пример давление или температура в потоке газа, определена в каждый
момент времени t в каждой точке (х; у; z) пространства. Тогда эта
величина u будет функцией четырех переменных х, у, z, t, т.е. u =
= u (х, у, z, t). Пусть, далее, задан закон движения x = x(t), y = y(t),
z = z(t) некоторой частицы М. Если рассматривать значение u в М по
мере движения, то это значение будет представлять собой сложную
функцию времени:
u = u( x( t ), y( t ), z( t ), t ).

Скорость изменения этого значения u, т.е. скорость изменения ве
личины u «вдоль траектории», равна, в силу формулы для производ
ной сложной функции,
du ∂u dx ∂u dy ∂u dz ∂u
=
+
+
+ .
dt ∂x dt ∂y dt ∂z dt ∂t

(5)

* Советуем читателю повторить вывод формулы для производной сложной функции
одной переменной (см., например, ВМ, § II.3).

105

∂  ∂z 
 ,
∂y  ∂x 

∂  ∂z 
 ,
∂x  ∂y 

∂  ∂z 
 ,
∂y  ∂y 

или, в других обозначениях,
z′′xx =

∂2 z
,
∂x 2

z′′xy =

∂2 z
,
∂x ∂y

z′′yx =

∂2 z
,
∂y ∂x

z′′yy =

∂2 z
.
∂y 2

∂2 z
∂2 z
и
называются смешанными.
∂x ∂y
∂y ∂x
Так, в примере (3)

Производные

∂2 z ∂
=
2 xy 3 + e y = 2 y 3 ,
∂x 2 ∂x

(

)

∂2 z

=
3 x 2 y 2 + xe y = 6 xy 2 + e y ,
∂y ∂x ∂x

(

)

∂2 z

=
2 xy 3 + e y = 6 xy 2 + e y ,
∂x ∂y ∂y

(

)

∂2 z ∂
=
3 x 2 y 2 + xe y = 6 x 2 y + xe y .
∂y 2 ∂y

(

)

∂2 z
∂2 z
, т.е. смешанные производ
=
∂x ∂y ∂y ∂x
ные не зависят от того, в каком порядке производится дифференциро
вание.
Мы видим, что в этом примере

106

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Покажем, что и в общем случае смешанные производные равны.
Для этого заметим, что согласно определению производной (см. § II.2)
∂2 z
∂x ∂y

x =x0
y = y0

=

∂ ⎛ ∂z ⎞
⎜ ⎟
∂y ⎝ ∂x ⎠

x =x0
y = y0

=

∂z
∂x

x =x0
y = y0 + k



∂z
∂x

x =x0
y = y0 −k

2k

(с любой точностью), если только k достаточно мало*. Точно так же
∂z
∂x

x =x0
y = y0 + k

∂z
∂x

x =x0
y = y0 −k

=

f ( x0 + h, y0 + k ) − f ( x0 − h, y0 + k )
,
2h

=

f ( x0 + h, y0 − k ) − f ( x0 − h, y0 − k )
.
2h

Подставляя эти выражения в формулу для смешанной производной,
получим
∂2 z
∂x ∂y

x =x0
y = y0

=

f ( x0 + h, y0 + k ) − f ( x0 − h, y0 + k )

4 hk


f ( x0 + h, y0 − k ) − f ( x0 − h, y0 − k )
.
4 hk

(6)

Теперь таким же образом получим, что
∂2 z
∂y ∂x

x =x0
y = y0

∂ ⎛ ∂z ⎞
=
⎜ ⎟
∂x ⎝ ∂y ⎠

x =x0
y = y0

=

∂z
∂y

x =x0 + h
y = y0

x =x0 + h
y = y0

∂z
∂y

x =x0 −h
y = y0



∂z
∂y

x =x0 −h
y = y0

2h

=

f ( x0 + h, y0 + k ) − f ( x0 + h, y0 − k )
,
2k

=

f ( x0 − h, y0 + k ) − f ( x0 − h, y0 − k )
.
2k

∂ z
∂y ∂x
=

x =x0
y = y0

,

Сравнивая (6) и (7), видим, что
∂2 z
∂y ∂x

x =x0
y = y0

=

∂2 z
∂x ∂y

x =x0 ,
y = y0

а так как точка (х0; у0) совершенно произвольная, то эти производные
равны при всех значениях х и у.
Подобным образом для производных любого порядка от функции
любого числа переменных существенно только то, сколько раз по какой
переменной производится дифференцирование, но не то, в каком поF
рядке это делается.
Чтобы лучше уяснить смысл смешанной производной, найдите в
плоскости независимых переменных те четыре точки, к которым отноF
сятся значения функции, входящие в правые части формул (6) и (7).
∂2 z
∂2 z
и
.
Сравните (6) и (7) с аналогичными выражениями
∂x 2
∂y 2
Упражнения

z
∂z
1. z = x 2 + y 2 . Найдите
при x = 1, y = 1 и
при x = 2, y = 0,5.
∂x
∂y
Найдите частные производные следующих функций:
2
2
2. z = e − ( x + y ) . 3. z = xe y + ye x . 4. z = x sin y. 5. z = sin( xy ).
x2 + y2 .

∂2 z
∂2 z
.
=
∂x ∂y ∂y ∂x

§ 2. Геометрический смысл функции двух переменных

=

f ( x0 + h, y0 + k ) − f ( x0 + h, y0 − k ) f ( x0 − h, y0 + k ) − f ( x0 − h, y0 − k )
.

4 hk
4 hk

107

Найдите полные производные следующих функций:
1
7. z = x 2 − y 2 , x = t + , y = t + t .
t
8. z = e x − y , x = sin t, y = t 2 .
9. z = x 3 + 3 xy 2 , x = t 2 , y = e − t .
∂z
10. Найдите
, если z = ln( x + e y ), y = x 2 .
∂x
11. Для всех функций задач 2–6 проверьте равенство

Окончательно находим
2

ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ФУНКЦИИ ДВУХ ПЕРЕМЕННЫХ

6. z =

где
∂z
∂y

§ 2]

(7)

* Точная формулировка: производная есть предел, к которому стремится правая
часть при k, стремящемся к нулю. Аналогичные формулировки относятся к следующим
формулам.

Функцию двух переменных z = f (x, y) удобно представлять себе
геометрически как уравнение поверхности z = f (x, y), где z есть выF
сота, а х и у — координаты точки в горизонтальной плоскости
(рис. 24). Однако изображать на плоском рисунке поверхность трудно.
Поэтому для того, чтобы представить функцию двух переменных граF
фически, можно построить серию кривых, представляющих собой сеF
чения поверхности z = f (x, y) плоскостями, параллельными плоскости
xOz. Такие плоскости перпендикулярны оси у; на каждой плоскости

106

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Покажем, что и в общем случае смешанные производные равны.
Для этого заметим, что согласно определению производной (см. § II.2)
∂2 z
∂x ∂y

x =x0
y = y0

=

∂ ⎛ ∂z ⎞
⎜ ⎟
∂y ⎝ ∂x ⎠

x =x0
y = y0

=

∂z
∂x

x =x0
y = y0 + k



∂z
∂x

x =x0
y = y0 −k

2k

(с любой точностью), если только k достаточно мало*. Точно так же
∂z
∂x

x =x0
y = y0 + k

∂z
∂x

x =x0
y = y0 −k

=

f ( x0 + h, y0 + k ) − f ( x0 − h, y0 + k )
,
2h

=

f ( x0 + h, y0 − k ) − f ( x0 − h, y0 − k )
.
2h

Подставляя эти выражения в формулу для смешанной производной,
получим
∂2 z
∂x ∂y

x =x0
y = y0

=

f ( x0 + h, y0 + k ) − f ( x0 − h, y0 + k )

4 hk


f ( x0 + h, y0 − k ) − f ( x0 − h, y0 − k )
.
4 hk

(6)

Теперь таким же образом получим, что
∂2 z
∂y ∂x

x =x0
y = y0

∂ ⎛ ∂z ⎞
=
⎜ ⎟
∂x ⎝ ∂y ⎠

x =x0
y = y0

=

∂z
∂y

x =x0 + h
y = y0

x =x0 + h
y = y0

∂z
∂y

x =x0 −h
y = y0



∂z
∂y

x =x0 −h
y = y0

2h

=

f ( x0 + h, y0 + k ) − f ( x0 + h, y0 − k )
,
2k

=

f ( x0 − h, y0 + k ) − f ( x0 − h, y0 − k )
.
2k

∂ z
∂y ∂x
=

x =x0
y = y0

,

Сравнивая (6) и (7), видим, что
∂2 z
∂y ∂x

x =x0
y = y0

=

∂2 z
∂x ∂y

x =x0 ,
y = y0

а так как точка (х0; у0) совершенно произвольная, то эти производные
равны при всех значениях х и у.
Подобным образом для производных любого порядка от функции
любого числа переменных существенно только то, сколько раз по какой
переменной производится дифференцирование, но не то, в каком поF
рядке это делается.
Чтобы лучше уяснить смысл смешанной производной, найдите в
плоскости независимых переменных те четыре точки, к которым отноF
сятся значения функции, входящие в правые части формул (6) и (7).
∂2 z
∂2 z
и
.
Сравните (6) и (7) с аналогичными выражениями
∂x 2
∂y 2
Упражнения

z
∂z
1. z = x 2 + y 2 . Найдите
при x = 1, y = 1 и
при x = 2, y = 0,5.
∂x
∂y
Найдите частные производные следующих функций:
2
2
2. z = e − ( x + y ) . 3. z = xe y + ye x . 4. z = x sin y. 5. z = sin( xy ).
x2 + y2 .

∂2 z
∂2 z
.
=
∂x ∂y ∂y ∂x

§ 2. Геометрический смысл функции двух переменных

=

f ( x0 + h, y0 + k ) − f ( x0 + h, y0 − k ) f ( x0 − h, y0 + k ) − f ( x0 − h, y0 − k )
.

4 hk
4 hk

107

Найдите полные производные следующих функций:
1
7. z = x 2 − y 2 , x = t + , y = t + t .
t
8. z = e x − y , x = sin t, y = t 2 .
9. z = x 3 + 3 xy 2 , x = t 2 , y = e − t .
∂z
10. Найдите
, если z = ln( x + e y ), y = x 2 .
∂x
11. Для всех функций задач 2–6 проверьте равенство

Окончательно находим
2

ГЕОМЕТРИЧЕСКИЙ СМЫСЛ ФУНКЦИИ ДВУХ ПЕРЕМЕННЫХ

6. z =

где
∂z
∂y

§ 2]

(7)

* Точная формулировка: производная есть предел, к которому стремится правая
часть при k, стремящемся к нулю. Аналогичные формулировки относятся к следующим
формулам.

Функцию двух переменных z = f (x, y) удобно представлять себе
геометрически как уравнение поверхности z = f (x, y), где z есть выF
сота, а х и у — координаты точки в горизонтальной плоскости
(рис. 24). Однако изображать на плоском рисунке поверхность трудно.
Поэтому для того, чтобы представить функцию двух переменных граF
фически, можно построить серию кривых, представляющих собой сеF
чения поверхности z = f (x, y) плоскостями, параллельными плоскости
xOz. Такие плоскости перпендикулярны оси у; на каждой плоскости

108

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

Рис. 24.

[Гл. IV

§ 3]

НЕЯВНЫЕ ФУНКЦИИ

Рис. 25.
Рис. 26.

координата у имеет постоянное значение. Пересечение данной плосF
кости с поверхностью z = f (x, y) дает кривую z = f (x, y = const). Для
наглядности удобно нанести несколько таких кривых на одном чертеF
же в координатах х, z. При этом мы получим семейство кривых. НапF
ример, на рис. 25 построено несколько кривых такого семейства для поF
лусферы z = 16 − x 2 − y 2 . Около каждой кривой должно быть
надписано значение y = y n , которому соответствует эта кривая. Если
дано семейство кривых, соответствующих y = const в плоскости х, z,
∂z
dz
то производная
геометрически означает, так же как
в случае
∂x
dx
одной переменной, тангенс угла наклона касательной к оси х. ПроизF
z (x) − z n (x)
∂z
водную
; при
можно найти, составляя отношение n +1
y n +1 − y n
∂y
этом нужны две соседние кривые.
Понятно, что функцию z = f (x, y) можно изобразить графически
так же, если строить графики зависимости z (y) для x = const в плосF
кости y, z.
Принципиально другой способ описания функции z = f (x, y) поF
лучается, если построить сечения поверхности z = f (x, y) горизонF
тальными плоскостями z = const, а затем нанести полученные кривые
(так называемые линии уровня) на плоскость х, y. Этот способ примеF
няется на географических картах для изображения рельефа местности.
На рис. 26 показан пример такого изображения для функции
z = x 2 − y 2 . Каждая кривая соответствует определенному постоянному
значению z.
Как находитьпроизводные на графике такого типа? Часть графика
показана в увеличенном масштабе на рис. 27. Ясно, что если линии
уровня проведены достаточно густо, то с любой точностью
∂z z n +1 − z n
,
=
∂x
xb − xa

109

∂z z n +1 − z n
.
=
∂y
yc − ya

Рис. 27.

Чем ближе одна к другой расположены линии с различными значеF
ниями z, тем больше частные производные. (Предполагается, что эти
линии проведены через равные промежутки по z.)
Упражнения
Постройте семейство кривых, соответствующих y = const, для следующих
функций:
1. z = xy. 2. z = x 2 − y 2 . 3. z = x 2 + y 2 .
4. Постройте семейство кривых, соответствующих z = const, для функции
z = x2 − y2.

§ 3. Неявные функции
Применение понятий теории функций нескольких переменных часF
то оказывается полезным и при исследовании функций одного переменF
ного. (Это применение было показано уже в ВМ, § II.12, однако сейчас
мы остановимся на нем более подробно.) Такая функция обычно задаF
ется с помощью «явной» формулы, например y = ax 2 или y = be ax и
т.п., в которой непосредственно указано, как надо вычислять значеF
ние у, отвечающее данному х. Такие формулы наиболее приспособлеF
ны к выполнению математических действий.
Другой возможный способ задания зависимости у от х — так наF
зываемое неявное задание, при помощи зависимости
f ( x, y ) = 0,

(8)

c 3 + y 3 + 3 axy = 0

(9)

( x + y )3 − b 2 ( x − y ) = 0

(10)

например

или

и т.д.

108

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

Рис. 24.

[Гл. IV

§ 3]

НЕЯВНЫЕ ФУНКЦИИ

Рис. 25.
Рис. 26.

координата у имеет постоянное значение. Пересечение данной плосF
кости с поверхностью z = f (x, y) дает кривую z = f (x, y = const). Для
наглядности удобно нанести несколько таких кривых на одном чертеF
же в координатах х, z. При этом мы получим семейство кривых. НапF
ример, на рис. 25 построено несколько кривых такого семейства для поF
лусферы z = 16 − x 2 − y 2 . Около каждой кривой должно быть
надписано значение y = y n , которому соответствует эта кривая. Если
дано семейство кривых, соответствующих y = const в плоскости х, z,
∂z
dz
то производная
геометрически означает, так же как
в случае
∂x
dx
одной переменной, тангенс угла наклона касательной к оси х. ПроизF
z (x) − z n (x)
∂z
водную
; при
можно найти, составляя отношение n +1
y n +1 − y n
∂y
этом нужны две соседние кривые.
Понятно, что функцию z = f (x, y) можно изобразить графически
так же, если строить графики зависимости z (y) для x = const в плосF
кости y, z.
Принципиально другой способ описания функции z = f (x, y) поF
лучается, если построить сечения поверхности z = f (x, y) горизонF
тальными плоскостями z = const, а затем нанести полученные кривые
(так называемые линии уровня) на плоскость х, y. Этот способ примеF
няется на географических картах для изображения рельефа местности.
На рис. 26 показан пример такого изображения для функции
z = x 2 − y 2 . Каждая кривая соответствует определенному постоянному
значению z.
Как находить производные на графике такого типа? Часть графика
показана в увеличенном масштабе на рис. 27. Ясно, что если линии
уровня проведены достаточно густо, то с любой точностью
∂z z n +1 − z n
,
=
∂x
xb − xa

109

∂z z n +1 − z n
.
=
∂y
yc − ya

Рис. 27.

Чем ближе одна к другой расположены линии с различными значеF
ниями z, тем больше частные производные. (Предполагается, что эти
линии проведены через равные промежутки по z.)
Упражнения
Постройте семейство кривых, соответствующих y = const, для следующих
функций:
1. z = xy. 2. z = x 2 − y 2 . 3. z = x 2 + y 2 .
4. Постройте семейство кривых, соответствующих z = const, для функции
z = x2 − y2.

§ 3. Неявные функции
Применение понятий теории функций нескольких переменных часF
то оказывается полезным и при исследовании функций одного переменF
ного. (Это применение было показано уже в ВМ, § II.12, однако сейчас
мы остановимся на нем более подробно.) Такая функция обычно задаF
ется с помощью «явной» формулы, например y = ax 2 или y = be ax и
т.п., в которой непосредственно указано, как надо вычислять значеF
ние у, отвечающее данному х. Такие формулы наиболее приспособлеF
ны к выполнению математических действий.
Другой возможный способ задания зависимости у от х — так наF
зываемое неявное задание, при помощи зависимости
f ( x, y ) = 0,

(8)

c 3 + y 3 + 3 axy = 0

(9)

( x + y )3 − b 2 ( x − y ) = 0

(10)

например

или

и т.д.

110

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

В этом случае для нахождения у при данном х необходимо ре
шить относительно у уравнение (8). Решение уравнения иногда имеет
вид гораздо более сложный, чем формула (8). Так, в приведенном при
мере (9)
y=3 −

c3
+
2

c6
c3
+ a 3x3 + 3 −
+
4
2

c6
+ a 3x3 .
4

Часто решение вообще не может быть написано в виде формулы и
уравнение (8) можно решать только численно.
Тем не менее и здесь бывают случаи, когда для исследования рас
сматриваемой функциональной зависимости достаточно привлекать
только функции одного переменного. Именно так будет в случае, когда
уравнение решено или легко решается относительно х, т.е. когда его
можно записать в виде
x = ϕ( y ),

(11)

а также в случае, когда уравнение можно разрешить в «параметричес
кой форме», о которой будет сказано немного позже. Так, в примере (9)
у выражается через х весьма сложно, но легко можно найти
x=−

c3 + y3
.
3 ay

Тогда, задаваясь различными значениями у, легко найти соотве
тствующие значения х. Результат можно записать в виде таблицы и
изобразить на графике в координатах х, у. (Для случая а = 1, с = 1,44
см. таблицу 4 и график рис. 28.) Построив кривую, мы можем найти у
Таблица 4
y

x

y

x

y

x

–4,0
–3,0

–5,08
–2,66

–2,0
–1,5
–1,0

–0,83
–0,084
–0,67

–0,5
–0,25
0,25
0,5

1,91
3,98
–4,02
–2,02

1,5
2,0
2,5
3,0

–1,42
–1,83
–2,48
–3,34

1,0

–1,33

4,0

–5,58

по заданному х. Для этого (рис. 28) проводим вертикаль, соответству
ющую нужному х, и находим интересующее нас значение у*. Если
* Из рис. 28 видно, что некоторым значениям х соответствует одно значение у, не
которым значениям х соответствуют три значения у, а одному значению х соотве
тствуют два значения у. Это объясняется тем, что уравнение третьей степени, может
иметь один, два или три вещественных различных корня (если корней два, то один из них
двойной, он соответствует касанию прямой х = const и кривой).

§ 3]

НЕЯВНЫЕ ФУНКЦИИ

111

имеется таблица значений х для не
которых значений у, то величину у,
соответствующую значению х, не
имеющемуся в таблице, можно най
ти хотя бы с помощью линейной ин
терполяции (ср. § II. 1).
Для этого по таблице отыскиваем
две пары чисел (y 1 , x 1 ) и (y 2 , x 2 ) та
кие, что x 1 < x < x 2 . Будем считать, что
при изменении х от х1 до х2 график
Рис. 28.
функции мало отличается от прямой
линии y = kx + b. Числа k и b легко
определить, пользуясь тем, что y = y 1 при x = x 1 и y = y 2 при x = x 2 .
y − y1
Действительно, y 1 = kx 1 + b, y 2 = kx 2 + b. Отсюда
, b=
k= 2
x2 − x1
x y − x 1 y2
. Поэтому
= 2 1
x2 − x1
y=

y2 − y1
x y − x1 y2
.
x + 2 1
x2 − x1
x2 − x1

Значения у для всех х, расположенных между x 1 и x 2 , можно под
считать по полученной формуле. Эта формула для у тем точнее, чем
ближе числа x 1 и x 2 , а также y 1 и y 2 , т.е. чем ближе одна к другой
расположены точки в таблице.
dy
? Для этого нет надоб
Как в таком случае найти производную
dx
ности решать уравнение и находить y = f (x). Если функция задана в

виде x = ϕ(y), то dx =
dy, откуда
dy
1
1
dy
.
=
=
dx dϕ ϕ′( y )
dy

Единственный недостаток этого выражения заключается в том, что
производная получается заданной как функция у. Поэтому если нуж
dy
при данном х, то нам сперва придется находить у, соот
но найти
dx
ветствующее данному х, а уже после этого подставлять найденное у
в выражение
1
dy
.
=
dx ϕ′( y )

110

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

В этом случае для нахождения у при данном х необходимо ре
шить относительно у уравнение (8). Решение уравнения иногда имеет
вид гораздо более сложный, чем формула (8). Так, в приведенном при
мере (9)
y=3 −

c3
+
2

c6
c3
+ a 3x3 + 3 −
+
4
2

c6
+ a 3x3 .
4

Часто решение вообще не может быть написано в виде формулы и
уравнение (8) можно решать только численно.
Тем не менее и здесь бывают случаи, когда для исследования рас
сматриваемой функциональной зависимости достаточно привлекать
только функции одного переменного. Именно так будет в случае, когда
уравнение решено или легко решается относительно х, т.е. когда его
можно записать в виде
x = ϕ( y ),

(11)

а также в случае, когда уравнение можно разрешить в «параметричес
кой форме», о которой будет сказано немного позже. Так, в примере (9)
у выражается через х весьма сложно, но легко можно найти
x=−

c3 + y3
.
3 ay

Тогда, задаваясь различными значениями у, легко найти соотве
тствующие значения х. Результат можно записать в виде таблицы и
изобразить на графике в координатах х, у. (Для случая а = 1, с = 1,44
см. таблицу 4 и график рис. 28.) Построив кривую, мы можем найти у
Таблица 4
y

x

y

x

y

x

–4,0
–3,0

–5,08
–2,66

–2,0
–1,5
–1,0

–0,83
–0,084
–0,67

–0,5
–0,25
0,25
0,5

1,91
3,98
–4,02
–2,02

1,5
2,0
2,5
3,0

–1,42
–1,83
–2,48
–3,34

1,0

–1,33

4,0

–5,58

по заданному х. Для этого (рис. 28) проводим вертикаль, соответству
ющую нужному х, и находим интересующее нас значение у*. Если
* Из рис. 28 видно, что некоторым значениям х соответствует одно значение у, не
которым значениям х соответствуют три значения у, а одному значению х соотве
тствуют два значения у. Это объясняется тем, что уравнение третьей степени, может
иметь один, два или три вещественных различных корня (если корней два, то один из них
двойной, он соответствует касанию прямой х = const и кривой).

§ 3]

НЕЯВНЫЕ ФУНКЦИИ

111

имеется таблица значений х для не
которых значений у, то величину у,
соответствующую значению х, не
имеющемуся в таблице, можно най
ти хотя бы с помощью линейной ин
терполяции (ср. § II. 1).
Для этого по таблице отыскиваем
две пары чисел (y 1 , x 1 ) и (y 2 , x 2 ) та
кие, что x 1 < x < x 2 . Будем считать, что
при изменении х от х1 до х2 график
Рис. 28.
функции мало отличается от прямой
линии y = kx + b. Числа k и b легко
определить, пользуясь тем, что y = y 1 при x = x 1 и y = y 2 при x = x 2 .
y − y1
Действительно, y 1 = kx 1 + b, y 2 = kx 2 + b. Отсюда
, b=
k= 2
x2 − x1
x y − x 1 y2
. Поэтому
= 2 1
x2 − x1
y=

y2 − y1
x y − x1 y2
.
x + 2 1
x2 − x1
x2 − x1

Значения у для всех х, расположенных между x 1 и x 2 , можно под
считать по полученной формуле. Эта формула для у тем точнее, чем
ближе числа x 1 и x 2 , а также y 1 и y 2 , т.е. чем ближе одна к другой
расположены точки в таблице.
dy
? Для этого нет надоб
Как в таком случае найти производную
dx
ности решать уравнение и находить y = f (x). Если функция задана в

виде x = ϕ(y), то dx =
dy, откуда
dy
1
1
dy
.
=
=
dx dϕ ϕ′( y )
dy

Единственный недостаток этого выражения заключается в том, что
производная получается заданной как функция у. Поэтому если нуж
dy
при данном х, то нам сперва придется находить у, соот
но найти
dx
ветствующее данному х, а уже после этого подставлять найденное у
в выражение
1
dy
.
=
dx ϕ′( y )

112

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

На первый взгляд может показаться, что проще определять произ
водную численно, как в § II.2. Действительно, если мы умеем опреде
лять у при данном х, то мы можем найти еще и y(x + ∆x),
соответствующее величине x + ∆x, после чего приближенное значение
производной определяем хотя бы по формуле

§ 3]

НЕЯВНЫЕ ФУНКЦИИ

113

и у оказывается возможным выразить в виде функции одной и той же
вспомогательной переменной t, т.е.
x = x( t ), 

y = y( t ). 

Так, если в примере (10) обозначить

y( x + ∆x ) − y( x )
.
∆x

x + y = t,

В действительности такой способ гораздо хуже: в этом случае нам
пришлось бы находить у для двух различных значений х, т.е. два раза
решать уравнение (11). При этом величину у надо определять с высо
кой степенью точности, потому что нам нужна разность близких значе
ний у и малая ошибка в каждом из у дает большую относительную
ошибку в их разности. В выражении для производной в знаменателе
стоит малая величина ∆x и поэтому даже малая ошибка в числителе
может привести к большой ошибке в производной. Следовательно,
лучше пользоваться формулой
dy
1
.
=
dx ϕ′( y )

Отметим, что формула для второй производной имеет более слож
ный вид. Не следует думать, что
d 2y
1
1
.
=
=
dx 2 d 2 x d 2ϕ
dy 2
dy 2

В самом деле, эта формула неправильна даже по размерности: d 2 y / dx 2
d 2ϕ
имеет размерность y / x 2 , a 1
имеет размерность y 2 / x. Пра
dy 2
вильная формула получается так:
d 2x
dy 2

d 2 y d  dy  dy d  dy 
1
d  1 
ϕ′′( y )
.
=−
=
 =−

 =
 =
2
3
3




dx dx
dx dy dx
ϕ′( y ) dy  ϕ′( y )
dx
 dx 
[ϕ′( y )]
 
 dy 

Легко проверить размерность этого выражения: она такая же, как
x y2
y
размерность отношения
= 2 , что и должно быть.
3
x
(x y)
При рассмотрении неявной функциональной зависимости (8) мо
жет представиться более общий случай, когда обе переменные х

(12)

то из (10) получаем x − y = t 3 b2 , откуда, привлекая (12), находим
t
t3
+ 2,
2 2b
t
t3
y= − 2.
2 2b

x=







Такой способ задания функции называется параметрическим, а пе
ременная t называется параметром. Этот способ может получиться и
без связи с зависимостями вида (8); он рассматривается в началах кур
са высшей математики (см., например, ВМ, §§ II.3, IV.8, VI.14). Там же
показывается, как находить производную от такой функции: запишем
dy
dx
dt = x ′(t) dt, аналогично dy =
dt = y ′(t) dt, отку
dx в виде dx =
dt
dt
dy y ′(t)
да
.
=
dx x ′(t)
d2y
.
Найдем вторую производную
dx 2
Для этого воспользуемся соотношением
dz dz dt dz 1
.
= ⋅
= ⋅
dx dt dx dt dx
dt

Поэтому
d 2 y d  dy  d  y′( t ) d  y′( t ) dt
,
=
=



 =
dx 2 dx  dx  dx  x′( t ) dt  x′( t ) dx

откуда
d 2y
1 d  y′( t )
y′′( t )
y′( t ) x′′( t )
,
=
⋅ 

=
2
3
x′( t ) dt  x′( t ) [ x′( t )]2
dx
[x′( t )]

где штрихи обозначают производные по t.
В общем случае неявного задания функция f (x, y) может быть та
кой, что уравнение (8) не разрешимо ни в форме (11), ни в параметри

112

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

На первый взгляд может показаться, что проще определять произ
водную численно, как в § II.2. Действительно, если мы умеем опреде
лять у при данном х, то мы можем найти еще и y(x + ∆x),
соответствующее величине x + ∆x, после чего приближенное значение
производной определяем хотя бы по формуле

§ 3]

НЕЯВНЫЕ ФУНКЦИИ

113

и у оказывается возможным выразить в виде функции одной и той же
вспомогательной переменной t, т.е.
x = x( t ), 

y = y( t ). 

Так, если в примере (10) обозначить

y( x + ∆x ) − y( x )
.
∆x

x + y = t,

В действительности такой способ гораздо хуже: в этом случае нам
пришлось бы находить у для двух различных значений х, т.е. два раза
решать уравнение (11). При этом величину у надо определять с высо
кой степенью точности, потому что нам нужна разность близких значе
ний у и малая ошибка в каждом из у дает большую относительную
ошибку в их разности. В выражении для производной в знаменателе
стоит малая величина ∆x и поэтому даже малая ошибка в числителе
может привести к большой ошибке в производной. Следовательно,
лучше пользоваться формулой
dy
1
.
=
dx ϕ′( y )

Отметим, что формула для второй производной имеет более слож
ный вид. Не следует думать, что
d 2y
1
1
.
=
=
dx 2 d 2 x d 2ϕ
dy 2
dy 2

В самом деле, эта формула неправильна даже по размерности: d 2 y / dx 2
d 2ϕ
имеет размерность y / x 2 , a 1
имеет размерность y 2 / x. Пра
dy 2
вильная формула получается так:
d 2x
dy 2

d 2 y d  dy  dy d  dy 
1
d  1 
ϕ′′( y )
.
=−
=
 =−

 =
 =
2
3
3




dx dx
dx dy dx
ϕ′( y ) dy  ϕ′( y )
dx
 dx 
[ϕ′( y )]
 
 dy 

Легко проверить размерность этого выражения: она такая же, как
x y2
y
размерность отношения
= 2 , что и должно быть.
3
x
(x y)
При рассмотрении неявной функциональной зависимости (8) мо
жет представиться более общий случай, когда обе переменные х

(12)

то из (10) получаем x − y = t 3 b2 , откуда, привлекая (12), находим
t
t3
+ 2,
2 2b
t
t3
y= − 2.
2 2b

x=







Такой способ задания функции называется параметрическим, а пе
ременная t называется параметром. Этот способ может получиться и
без связи с зависимостями вида (8); он рассматривается в началах кур
са высшей математики (см., например, ВМ, §§ II.3, IV.8, VI.14). Там же
показывается, как находить производную от такой функции: запишем
dy
dx
dt = x ′(t) dt, аналогично dy =
dt = y ′(t) dt, отку
dx в виде dx =
dt
dt
dy y ′(t)
да
.
=
dx x ′(t)
d2y
.
Найдем вторую производную
dx 2
Для этого воспользуемся соотношением
dz dz dt dz 1
.
= ⋅
= ⋅
dx dt dx dt dx
dt

Поэтому
d 2 y d  dy  d  y′( t ) d  y′( t ) dt
,
=
=



 =
dx 2 dx  dx  dx  x′( t ) dt  x′( t ) dx

откуда
d 2y
1 d  y′( t )
y′′( t )
y′( t ) x′′( t )
,
=
⋅ 

=
2
3
x′( t ) dt  x′( t ) [ x′( t )]2
dx
[x′( t )]

где штрихи обозначают производные по t.
В общем случае неявного задания функция f (x, y) может быть та
кой, что уравнение (8) не разрешимо ни в форме (11), ни в параметри

114

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

ческой форме. Рассмотрим, например, зависимость у от х, заданную
при помощи формулы
y 5 + xy + x 5 − 7 = 0.

4

5 y y′ + (1 ⋅ y + x ⋅ y′ ) + 5 x = 0.

Отсюда находим
y′ =

dy
y + 5x 4
.
=− 4
dx
5y + x

(14)

Подчеркнем, что в правой части х и у не являются независимыми,
а связаны друг с другом соотношением (13), так что независимая пере
менная только одна. Для того чтобы найти y ′ при данном х надо, чис
ленно решая (13), найти у при данном х и подставить это у в (14).
Перейдем теперь к общему случаю неявной функции нескольких,
например двух, переменных.
Если z задано как функция от х и у, то, решая уравнение
z = f (x, y) относительно х, можно получить зависимость х от у и z:
x = ϕ(y, z ), а решая уравнение z = f (x, y) относительно у, можно най
ти y = ψ(x, z ). Однако независимо от того, решили мы или нет уравне
ние z = f (x, y) относительно х, это уравнение дает зависимость
величины х от величин у и z, т.е. определяет х как функцию у и z.
Такое задание функции х называется неявным.
∂x
∂x
и
можно найти, и не выражая х в явном виде.
Производные
∂y
∂z
Покажем, как это сделать. Из соотношения z = f (x, y) находим
∂z
∂z
dz =
dx +
dy, откуда
∂x
∂y
 ∂z 
dx =  
 ∂x 

−1

 ∂z   ∂z 
dz −    
 ∂y   ∂x 

−1

dy.

(15)

С другой стороны, если x = ϕ(y, z ), то
dx =

∂x
∂x
dz +
dy.
∂z
∂y

НЕЯВНЫЕ ФУНКЦИИ

(16)

115

Сравнивая выражения (15) и (16), находим
∂x
∂z

(13)

(Геометрически эта формула задает кривую в плоскости х, у.) Полу
чить отсюда выражение y = f (x) невозможно. Чтобы найти производ
dy
, приравняем производные от обеих частей равенства (13),
ную
dx
считая в нем у функцией от х, y = y(x), определенной из этого раве
нства. При таком истолковании оно является тождеством и потому до
пускает дифференцирование:
4

§ 3]

1

=

∂z
∂x

y

∂x
∂y

=−
z

,

(17)

y

∂z
∂y

x

∂z
∂x

y

.

(18)

Формула (17) представляется вполне естественной. В формуле (18)
есть удивительный знак минус. Убедимся в справедливости этой фор
мулы еще из геометрических соображений.
Рассмотрим рис. 26 и 27. На этих рисунках нанесены кривые
∂x
есть взятая обычным образом производ
z = const, так что
∂y z
dx
ная
вдоль этих кривых. Поэтому
dy
∂x
∂y

=
z

dx xb − xc
.
=
dy yb − yc

Замечая, что y b = y a , x c = x a , находим
∂x
∂y

Вспоминая значения

=
z

xb − xa
.
ya − yc

∂z
∂z
и
, находим, что
∂x
∂y
∂z
∂y

∂z x b − x a
∂x
.
=
=−
∂x y c − y a
∂y z

Формулу (18) можно записать так:
∂x
∂y


z

∂z
∂x

=−
y

∂z
.
∂y x

∂y
∂y
∂z
∂x
∂z
, получаем
=1


= −1. Последняя
∂y x
∂z x
∂y z ∂z x ∂x y
формула, как и формула (18), показывает, что в отличие от случая
сложной функции одного переменного здесь нельзя сокращать ∂x, ∂y,
∂z в числителе и знаменателе. Дело заключается в том, что три частные
производные в этой формуле вычисляются в различных условиях (при
постоянном z первая, при постоянном х вторая и при постоян
ном у третья).
Замечая, что

114

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

ческой форме. Рассмотрим, например, зависимость у от х, заданную
при помощи формулы
y 5 + xy + x 5 − 7 = 0.

4

5 y y′ + (1 ⋅ y + x ⋅ y′ ) + 5 x = 0.

Отсюда находим
y′ =

dy
y + 5x 4
.
=− 4
dx
5y + x

(14)

Подчеркнем, что в правой части х и у не являются независимыми,
а связаны друг с другом соотношением (13), так что независимая пере
менная только одна. Для того чтобы найти y ′ при данном х надо, чис
ленно решая (13), найти у при данном х и подставить это у в (14).
Перейдем теперь к общему случаю неявной функции нескольких,
например двух, переменных.
Если z задано как функция от х и у, то, решая уравнение
z = f (x, y) относительно х, можно получить зависимость х от у и z:
x = ϕ(y, z ), а решая уравнение z = f (x, y) относительно у, можно най
ти y = ψ(x, z ). Однако независимо от того, решили мы или нет уравне
ние z = f (x, y) относительно х, это уравнение дает зависимость
величины х от величин у и z, т.е. определяет х как функцию у и z.
Такое задание функции х называется неявным.
∂x
∂x
и
можно найти, и не выражая х в явном виде.
Производные
∂y
∂z
Покажем, как это сделать. Из соотношения z = f (x, y) находим
∂z
∂z
dz =
dx +
dy, откуда
∂x
∂y
 ∂z 
dx =  
 ∂x 

−1

 ∂z   ∂z 
dz −    
 ∂y   ∂x 

−1

dy.

(15)

С другой стороны, если x = ϕ(y, z ), то
dx =

∂x
∂x
dz +
dy.
∂z
∂y

НЕЯВНЫЕ ФУНКЦИИ

(16)

115

Сравнивая выражения (15) и (16), находим
∂x
∂z

(13)

(Геометрически эта формула задает кривую в плоскости х, у.) Полу
чить отсюда выражение y = f (x) невозможно. Чтобы найти производ
dy
, приравняем производные от обеих частей равенства (13),
ную
dx
считая в нем у функцией от х, y = y(x), определенной из этого раве
нства. При таком истолковании оно является тождеством и потому до
пускает дифференцирование:
4

§ 3]

1

=

∂z
∂x

y

∂x
∂y

=−
z

,

(17)

y

∂z
∂y

x

∂z
∂x

y

.

(18)

Формула (17) представляется вполне естественной. В формуле (18)
есть удивительный знак минус. Убедимся в справедливости этой фор
мулы еще из геометрических соображений.
Рассмотрим рис. 26 и 27. На этих рисунках нанесены кривые
∂x
есть взятая обычным образом производ
z = const, так что
∂y z
dx
ная
вдоль этих кривых. Поэтому
dy
∂x
∂y

=
z

dx xb − xc
.
=
dy yb − yc

Замечая, что y b = y a , x c = x a , находим
∂x
∂y

Вспоминая значения

=
z

xb − xa
.
ya − yc

∂z
∂z
и
, находим, что
∂x
∂y
∂z
∂y

∂z x b − x a
∂x
.
=
=−
∂x y c − y a
∂y z

Формулу (18) можно записать так:
∂x
∂y


z

∂z
∂x

=−
y

∂z
.
∂y x

∂y
∂y
∂z
∂x
∂z
, получаем
=1


= −1. Последняя
∂y x
∂z x
∂y z ∂z x ∂x y
формула, как и формула (18), показывает, что в отличие от случая
сложной функции одного переменного здесь нельзя сокращать ∂x, ∂y,
∂z в числителе и знаменателе. Дело заключается в том, что три частные
производные в этой формуле вычисляются в различных условиях (при
постоянном z первая, при постоянном х вторая и при постоян
ном у третья).
Замечая, что

116

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

∂W
зависит от
∂C
того, какой аргумент считается постоянным при ее вычислении. Уже
это показывает, что с ∂W и ∂C нельзя обращаться как с числами и со
кращать их с ∂W и ∂C в других формулах, не глядя на то, при каких
условиях вычисляются соответствующие частные производные.
Покажем вычисление производных от неявных функций на примере.
Пусть z = x 2 + px + y 2 + qy + kxy.
∂x
∂x
Найдем производные
и
. Для того чтобы выразить х через
∂z
∂y
у и z, нужно решить квадратное уравнение. В этом нет принципиаль
ных трудностей, однако получится громоздкое выражение с корнями.
∂z
∂z
Так как
= 2x + p + ky,
= 2y + q + kx, то по формулам (17) и
∂x
∂y
(18) находим
В § 1 мы видели, что значение частной производной

∂x
1
,
=
∂z 2 x + p + ky

∂x
2 y + q + kx
.
=−
∂y
2 x + p + ky

∂x
∂x
и
при конкретных дан
∂z
∂y
ных у и z, надо знать численное значение х при этих у и z, но мож
но не иметь аналитического выражения x = ψ(y, z ). Ясно, что найти
численно решение уравнения z = f (x, y) относительно х при опреде
ленных значениях у и z гораздо проще, чем построить общую фор
мулу x = ψ(y, z ). Кроме того, в случае уравнения выше четвертой
степени, а также в случае, когда в уравнение входят трансцендентные
функции, построение общей формулы зачастую оказывается невоз
можным.
Наиболее общим способом неявного задания функции двух перемен
ных является задание ее с помощью соотношения вида F (x, y, z ) = 0. Мы
представляем читателю, дифференцируя это соотношение, получить
∂z ∂y
и т.д. и применить ре
,
выражения для частных производных
∂x ∂x
зультат к рассмотренному выше соотношению z = f (x, y), переписав
его в виде z − f (x, y) = 0.
Изложенные приемы удобно применять и в случае функции одного
переменного, заданной неявно, с помощью уравнения вида (8). Для
этого надо рассмотреть функцию двух переменных z = f (x, y), други
ми словами, рассмотреть соотношение (8) как уравнение нулевой, т.е.
отвечающей значению f = 0, линии уровня функции z = f (x, y). Тем
Для того чтобы определить значения

§ 4]

РАДИОЛАМПА

dy
сводится к только что разобранной за
dx

самым задача о вычислении
даче о вычислении

∂y
∂x

117

. Так, в примере (13) надо обозначить
z = const

z = y 5 + xy + x 5 .

Тогда по формуле (18)
dy ∂y
=
dx ∂x

=−
z

∂z
∂x

y

∂z
∂y

=−
x

y + 5x 4
5 y4 + x

,

т.е. мы вновь приходим к формуле (14).
Упражнения
2

1. Найти

dy
d y
для следующих функций, заданных параметрически:
и
dx
dx 2

1
а ) x = t, y = t 2 + t; б ) x = 2 sin 3 t, y = 2 cos3 t; в ) x = cos t + t sin t, y =
2
= sin t − t cos t.
1
dy
при x = .
2. x = sin t y = sin 2 t. Найти
dx
2
∂x ∂x
,
при y = 0, z = 1.
3. z = x 3 + y 3 + xy. Найти
∂z ∂y
∂x ∂x
4. z = x 5 + xy 2 + y 5 . Найти
,
.
∂z ∂y
dy
.
5. x 2 + y 2 − 4 x − 10 y = −4. Найти
dx
dy
6. x 4 y + xy 4 − x 2 y 2 − 1 = 0. Найти
.
dx

§ 4. Радиолампа
Интересным примером функции двух переменных является сила
тока j, проходящего через анод лампы с тремя электродами (рис. 29).
На поток электронов, попадающих на
анод, влияют потенциал сетки uC и по
тенциал самого анода (катод заземлен,
так что его потенциал равен нулю). Таким
образом, мы имеем дело с функцией двух
графике
переменных j = j(uC , u A ). На
принято изображать семейство кривых
в координатах uC , j с постоянными зна
Рис. 29.
чениями u A на каждой кривой. На рис.
30 приведен пример такого семейства кривых для лампы 6С1Ж.
Ток j дан в миллиамперах, напряжения uC и u A — в вольтах.

116

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

∂W
зависит от
∂C
того, какой аргумент считается постоянным при ее вычислении. Уже
это показывает, что с ∂W и ∂C нельзя обращаться как с числами и со
кращать их с ∂W и ∂C в других формулах, не глядя на то, при каких
условиях вычисляются соответствующие частные производные.
Покажем вычисление производных от неявных функций на примере.
Пусть z = x 2 + px + y 2 + qy + kxy.
∂x
∂x
Найдем производные
и
. Для того чтобы выразить х через
∂z
∂y
у и z, нужно решить квадратное уравнение. В этом нет принципиаль
ных трудностей, однако получится громоздкое выражение с корнями.
∂z
∂z
Так как
= 2x + p + ky,
= 2y + q + kx, то по формулам (17) и
∂x
∂y
(18) находим
В § 1 мы видели, что значение частной производной

∂x
1
,
=
∂z 2 x + p + ky

∂x
2 y + q + kx
.
=−
∂y
2 x + p + ky

∂x
∂x
и
при конкретных дан
∂z
∂y
ных у и z, надо знать численное значение х при этих у и z, но мож
но не иметь аналитического выражения x = ψ(y, z ). Ясно, что найти
численно решение уравнения z = f (x, y) относительно х при опреде
ленных значениях у и z гораздо проще, чем построить общую фор
мулу x = ψ(y, z ). Кроме того, в случае уравнения выше четвертой
степени, а также в случае, когда в уравнение входят трансцендентные
функции, построение общей формулы зачастую оказывается невоз
можным.
Наиболее общим способом неявного задания функции двух перемен
ных является задание ее с помощью соотношения вида F (x, y, z ) = 0. Мы
представляем читателю, дифференцируя это соотношение, получить
∂z ∂y
и т.д. и применить ре
,
выражения для частных производных
∂x ∂x
зультат к рассмотренному выше соотношению z = f (x, y), переписав
его в виде z − f (x, y) = 0.
Изложенные приемы удобно применять и в случае функции одного
переменного, заданной неявно, с помощью уравнения вида (8). Для
этого надо рассмотреть функцию двух переменных z = f (x, y), други
ми словами, рассмотреть соотношение (8) как уравнение нулевой, т.е.
отвечающей значению f = 0, линии уровня функции z = f (x, y). Тем
Для того чтобы определить значения

§ 4]

РАДИОЛАМПА

dy
сводится к только что разобранной за
dx

самым задача о вычислении
даче о вычислении

∂y
∂x

117

. Так, в примере (13) надо обозначить
z = const

z = y 5 + xy + x 5 .

Тогда по формуле (18)
dy ∂y
=
dx ∂x

=−
z

∂z
∂x

y

∂z
∂y

=−
x

y + 5x 4
5 y4 + x

,

т.е. мы вновь приходим к формуле (14).
Упражнения
2

1. Найти

dy
d y
для следующих функций, заданных параметрически:
и
dx
dx 2

1
а ) x = t, y = t 2 + t; б ) x = 2 sin 3 t, y = 2 cos3 t; в ) x = cos t + t sin t, y =
2
= sin t − t cos t.
1
dy
при x = .
2. x = sin t y = sin 2 t. Найти
dx
2
∂x ∂x
,
при y = 0, z = 1.
3. z = x 3 + y 3 + xy. Найти
∂z ∂y
∂x ∂x
4. z = x 5 + xy 2 + y 5 . Найти
,
.
∂z ∂y
dy
.
5. x 2 + y 2 − 4 x − 10 y = −4. Найти
dx
dy
6. x 4 y + xy 4 − x 2 y 2 − 1 = 0. Найти
.
dx

§ 4. Радиолампа
Интересным примером функции двух переменных является сила
тока j, проходящего через анод лампы с тремя электродами (рис. 29).
На поток электронов, попадающих на
анод, влияют потенциал сетки uC и по
тенциал самого анода (катод заземлен,
так что его потенциал равен нулю). Таким
образом, мы имеем дело с функцией двух
графике
переменных j = j(uC , u A ). На
принято изображать семейство кривых
в координатах uC , j с постоянными зна
Рис. 29.
чениями u A на каждой кривой. На рис.
30 приведен пример такого семейства кривых для лампы 6С1Ж.
Ток j дан в миллиамперах, напряжения uC и u A — в вольтах.

118

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

Производная

∂j
∂u C

[Гл. IV

пропорцио
uA

нальна тангенсу угла наклона каса
тельных к кривым рис. 30.
Фактически в довольно большом
промежутке изменения uC эти кри
вые мало отличаются от прямых.
Наклон их в этом промежутке назы
вается крутизной характеристики
лампы и обозначается через S, так
∂j
. Величину S выражают
что S =
∂u C
в миллиамперах на вольт.
∂j
. Обратная ей
Образуем
∂u A u C

Рис. 30.

величина, т.е.
R=

1
∂j
∂uA

=

∂uA
∂j

,
uC

§ 4]

РАДИОЛАМПА

119

Найдем соотношение между изменением потенциала на сетке и из
менением потенциала анода. Рассматривая u A как функцию перемен
ных uC и j, находим
duA =

∂uA
∂j

dj +
uC

∂uA
∂uC

j

∂uC , откуда duA = Rdj − µ duC .

Если поддерживать все время анодный ток постоянным, то dj = 0 и,
следовательно, du A = −µ duC . Таким образом, изменение потенциала
на аноде в µ раз больше изменения потенциала на сетке. Поэтому
можно сказать, что лампа в µ раз увеличивает, усиливает изменение
напряжения на сетке. Отсюда и название для µ — коэффициент уси
ления.
du A
Соотношение
= −µ относится к идеальному случаю, когда
duC
ток j не изменяется. В действительности изменение uC , как правило,
вызывает некоторое изменение тока; при этом изменение u A оказыва
ется меньше, чем в случае j = const. Рассмотрим схему рис. 29, где
в цепь анода последовательно включено сопротивление r и подано по
стоянное напряжение u0. Тогда по закону Ома

uC

j=

u0 − uA
= j ( uA , uC ),
r

носит название внутреннего сопротивления лампы. Смысл этого назва
ния легко понять: если бы в схеме вместо лампы стояло постоянное со
u
противление R1 , то по закону Ома j = A , откуда
R1

где в правой части стоит функция, рассмотренная в начале параграфа.
Возьмем полный дифференциал от правой и от левой частей этого ра
венства (считая u0, r постоянными)

1
∂j
= ,
∂uA R1

1
∂j
∂j
− duA =
duA +
duC ,
r
∂uA
∂uC

или
R1 =

или

1
.
∂j
∂uA

1
1
− duA = duA + S duC ,
r
R

Когда ток выражен в миллиамперах, а потенциал — в вольтах, то R
получается в килоомах. Наконец, для характеристики лампы важней
∂u A
шее значение имеет величина
. Это — безразмерная отрицатель
∂u C j
∂u
ная величина. Число µ = − A
называется коэффициентом
∂u C j
усиления лампы. Согласно формуле (18)
∂j
µ=
∂uC

 ∂j

u A  ∂uA



uC 

−1

= S ⋅ R.

откуда
duA = −

S ⋅ Rr
r
duC = −µ
duC .
r +R
r +R

Из этой формулы видно, что в схеме рис. 29 абсолютная величина отно
du A
r
шения
меньше µ, так как
< 1. Если r R, то ток j почти
r +R
duC
du A
постоянен и
весьма близко к µ. Однако для того чтобы пропус
duC
кать данный ток через большое сопротивление r, необходимо высокое

118

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

Производная

∂j
∂u C

[Гл. IV

пропорцио
uA

нальна тангенсу угла наклона каса
тельных к кривым рис. 30.
Фактически в довольно большом
промежутке изменения uC эти кри
вые мало отличаются от прямых.
Наклон их в этом промежутке назы
вается крутизной характеристики
лампы и обозначается через S, так
∂j
. Величину S выражают
что S =
∂u C
в миллиамперах на вольт.
∂j
. Обратная ей
Образуем
∂u A u C

Рис. 30.

величина, т.е.
R=

1
∂j
∂uA

=

∂uA
∂j

,
uC

§ 4]

РАДИОЛАМПА

119

Найдем соотношение между изменением потенциала на сетке и из
менением потенциала анода. Рассматривая u A как функцию перемен
ных uC и j, находим
duA =

∂uA
∂j

dj +
uC

∂uA
∂uC

j

∂uC , откуда duA = Rdj − µ duC .

Если поддерживать все время анодный ток постоянным, то dj = 0 и,
следовательно, du A = −µ duC . Таким образом, изменение потенциала
на аноде в µ раз больше изменения потенциала на сетке. Поэтому
можно сказать, что лампа в µ раз увеличивает, усиливает изменение
напряжения на сетке. Отсюда и название для µ — коэффициент уси
ления.
du A
Соотношение
= −µ относится к идеальному случаю, когда
duC
ток j не изменяется. В действительности изменение uC , как правило,
вызывает некоторое изменение тока; при этом изменение u A оказыва
ется меньше, чем в случае j = const. Рассмотрим схему рис. 29, где
в цепь анода последовательно включено сопротивление r и подано по
стоянное напряжение u0. Тогда по закону Ома

uC

j=

u0 − uA
= j ( uA , uC ),
r

носит название внутреннего сопротивления лампы. Смысл этого назва
ния легко понять: если бы в схеме вместо лампы стояло постоянное со
u
противление R1 , то по закону Ома j = A , откуда
R1

где в правой части стоит функция, рассмотренная в начале параграфа.
Возьмем полный дифференциал от правой и от левой частей этого ра
венства (считая u0, r постоянными)

1
∂j
= ,
∂uA R1

1
∂j
∂j
− duA =
duA +
duC ,
r
∂uA
∂uC

или
R1 =

или

1
.
∂j
∂uA

1
1
− duA = duA + S duC ,
r
R

Когда ток выражен в миллиамперах, а потенциал — в вольтах, то R
получается в килоомах. Наконец, для характеристики лампы важней
∂u A
шее значение имеет величина
. Это — безразмерная отрицатель
∂u C j
∂u
ная величина. Число µ = − A
называется коэффициентом
∂u C j
усиления лампы. Согласно формуле (18)
∂j
µ=
∂uC

 ∂j

u A  ∂uA



uC 

−1

= S ⋅ R.

откуда
duA = −

S ⋅ Rr
r
duC = −µ
duC .
r +R
r +R

Из этой формулы видно, что в схеме рис. 29 абсолютная величина отно
du A
r
шения
меньше µ, так как
< 1. Если r R, то ток j почти
r +R
duC
du A
постоянен и
весьма близко к µ. Однако для того чтобы пропус
duC
кать данный ток через большое сопротивление r, необходимо высокое

120

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

напряжение u 0 . При этом на сопротивлении r бесполезно превраща&
ется в тепло значительная электрическая мощность. Оказывается, что
во всех случаях, кроме задачи усиления постоянного или медленно ме&
няющегося напряжения, выгоднее вместо сопротивления r ставить
катушку индуктивности.
Факты, изложенные в этом параграфе, показывают, что точная ма&
тематическая формулировка законов работы лампы связана с функци&
ями двух переменных, а основные величины, характеризующие
лампу, — это частные производные.
Упражнение
С помощью рис. 30 найти значения S, R и μ для лампы 6С1Ж.

§ 5. Огибающая семейства линий
В качестве другого примера применения частных производных рас&
смотрим задачу о разыскании огибающей однопараметрического семе&
йства линий. Разберем эту задачу на типичном примере.
Рассмотрим совокупность траекторий снарядов, выпущенных из
одной точки (из начала координат) с одной и той же начальной скорос&
тью v 0 , но под различными углами ϕ, которые могут принимать значе&
ния от 0 до 180° (рис. 31).

Рис. 31.

Каждая траектория представляет собой кривую в плоскости x, у,
т.е. характеризуется определенной зависимостью у(х). Выписав зави&
симости x = x(t) и y = y(t), без учета сопротивления воздуха, и ис&
ключая из них t, легко найти (см., например, ВМ, § VI.14) зависимость
у от х:
y = x tg ϕ −

g
x2.
2 v 02 cos2 ϕ

(19)

При каждом конкретном значении ϕ получается определенная кривая.
Рассматривая различные значения параметра ϕ, мы получим семейство
кривых. Мы можем считать, что высота траектории снаряда у есть

§ 5]

ОГИБАЮЩАЯ СЕМЕЙСТВА ЛИНИЙ

121

функция двух переменных: горизонтального расстояния х и угла бро&
сания ϕ, т.е. y = y(x, ϕ). Тогда отдельные траектории дают зависи&
мость у от х при постоянном ϕ. (Семейство траекторий изображено
на рис. 31.) Рассматривая семейство траекторий, легко заметить, что
траектории заполняют одну часть плоскости x, у, а в другую часть
плоскости они не попадают. Таким образом, есть непоражаемая зона, в
которую при данной начальной скорости снаряда нельзя попасть ни
при каком угле бросания.
Постараемся определить границу зоны поражения. (Эта граница на&
несена пунктиром на рис. 31.) Каждая точка границы является одно&
временно точкой на какой&то траектории, потому что иначе границы
нельзя было бы достичь. Отметим, что на части границы, которая изо&
бражена на рис. 31, каждая точка является точкой траектории, соотве&
тствующей углу бросания ϕ 45°. (Можно показать, что при ϕ= 45°
достигается наибольшая дальность бросания. Траектории, которые со&
ответствуют ϕ< 45°, соприкасаются, — как это будет видно из даль&
нейшего, — с границей зоны поражения ниже оси х. Эта часть границы
представляет практический интерес, если стрельба ведется по цели,
расположенной ниже орудия.) Вместе с тем траектория не может пере&
секать границу, а должна касаться ее. Если бы траектория пересекла
границу, то она вышла бы за пределы границы, а это противоречит тому,
что граница отделяет поражаемую зону от непоражаемой.
Граница области, заполненной семейством кривых, касающихся
этой границы, носит название огибающей семейства кривых. Найдем
уравнение огибающей семейства траекторий. Для этого проведем вер&
тикальную линию АА1 и найдем ту точку В, в которой эта вертикаль&
ная линия пересекается огибающей. Проводя вертикальную линию,
мы взяли определенное значение х. Точка В соответствует наиболь&
шей высоте у, на которой может находиться снаряд, пролетая горизон&
тальное расстояние х при каком бы то ни было угле бросания ϕ.
Поэтому надо найти максимум y(ϕ) при данном закрепленном х. Мы
получаем условие
∂y( x,ϕ )
∂ϕ

= 0.

(20)

x

Условие (20) дает нам уравнение, связывающее между собой х и ϕ.
Для каждого значения х eсть свое значение ϕ, определяемое из уравне&
ния (20), так что получаем ϕ = ϕ(x). Подставляя ϕ = ϕ(x) в уравнение
семейства (19), найдем уравнение огибающей.
Проделаем необходимые выкладки. Для удобства введем вместо пе&
ременной ϕ переменную θ = tg ϕ. Замечая, что по известной формуле

120

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

напряжение u 0 . При этом на сопротивлении r бесполезно превраща&
ется в тепло значительная электрическая мощность. Оказывается, что
во всех случаях, кроме задачи усиления постоянного или медленно ме&
няющегося напряжения, выгоднее вместо сопротивления r ставить
катушку индуктивности.
Факты, изложенные в этом параграфе, показывают, что точная ма&
тематическая формулировка законов работы лампы связана с функци&
ями двух переменных, а основные величины, характеризующие
лампу, — это частные производные.
Упражнение
С помощью рис. 30 найти значения S, R и μ для лампы 6С1Ж.

§ 5. Огибающая семейства линий
В качестве другого примера применения частных производных рас&
смотрим задачу о разыскании огибающей однопараметрического семе&
йства линий. Разберем эту задачу на типичном примере.
Рассмотрим совокупность траекторий снарядов, выпущенных из
одной точки (из начала координат) с одной и той же начальной скорос&
тью v 0 , но под различными углами ϕ, которые могут принимать значе&
ния от 0 до 180° (рис. 31).

Рис. 31.

Каждая траектория представляет собой кривую в плоскости x, у,
т.е. характеризуется определенной зависимостью у(х). Выписав зави&
симости x = x(t) и y = y(t), без учета сопротивления воздуха, и ис&
ключая из них t, легко найти (см., например, ВМ, § VI.14) зависимость
у от х:
y = x tg ϕ −

g
x2.
2 v 02 cos2 ϕ

(19)

При каждом конкретном значении ϕ получается определенная кривая.
Рассматривая различные значения параметра ϕ, мы получим семейство
кривых. Мы можем считать, что высота траектории снаряда у есть

§ 5]

ОГИБАЮЩАЯ СЕМЕЙСТВА ЛИНИЙ

121

функция двух переменных: горизонтального расстояния х иугла бро&
сания ϕ, т.е. y = y(x, ϕ). Тогда отдельные траектории дают зависи&
мость у от х при постоянном ϕ. (Семейство траекторий изображено
на рис. 31.) Рассматривая семейство траекторий, легко заметить, что
траектории заполняют одну часть плоскости x, у, а в другую часть
плоскости они не попадают. Таким образом, есть непоражаемая зона, в
которую при данной начальной скорости снаряда нельзя попасть ни
при каком угле бросания.
Постараемся определить границу зоны поражения. (Эта граница на&
несена пунктиром на рис. 31.) Каждая точка границы является одно&
временно точкой на какой&то траектории, потому что иначе границы
нельзя было бы достичь. Отметим, что на части границы, которая изо&
бражена на рис. 31, каждая точка является точкой траектории, соотве&
тствующей углу бросания ϕ 45°. (Можно показать, что при ϕ= 45°
достигается наибольшая дальность бросания. Траектории, которые со&
ответствуют ϕ< 45°, соприкасаются, — как это будет видно из даль&
нейшего, — с границей зоны поражения ниже оси х. Эта часть границы
представляет практический интерес, если стрельба ведется по цели,
расположенной ниже орудия.) Вместе с тем траектория не может пере&
секать границу, а должна касаться ее. Если бы траектория пересекла
границу, то она вышла бы за пределы границы, а это противоречит тому,
что граница отделяет поражаемую зону от непоражаемой.
Граница области, заполненной семейством кривых, касающихся
этой границы, носит название огибающей семейства кривых. Найдем
уравнение огибающей семейства траекторий. Для этого проведем вер&
тикальную линию АА1 и найдем ту точку В, в которой эта вертикаль&
ная линия пересекается огибающей. Проводя вертикальную линию,
мы взяли определенное значение х. Точка В соответствует наиболь&
шей высоте у, на которой может находиться снаряд, пролетая горизон&
тальное расстояние х при каком бы то ни было угле бросания ϕ.
Поэтому надо найти максимум y(ϕ) при данном закрепленном х. Мы
получаем условие
∂y( x,ϕ )
∂ϕ

= 0.

(20)

x

Условие (20) дает нам уравнение, связывающее между собой х и ϕ.
Для каждого значения х eсть свое значение ϕ, определяемое из уравне&
ния (20), так что получаем ϕ = ϕ(x). Подставляя ϕ = ϕ(x) в уравнение
семейства (19), найдем уравнение огибающей.
Проделаем необходимые выкладки. Для удобства введем вместо пе&
ременной ϕ переменную θ = tg ϕ. Замечая, что по известной формуле

122

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

тригонометрии

1
2

cos ϕ

[Гл. IV

= tg 2 ϕ + 1 = θ2 + 1, перепишем уравнение (19)

§ 6]

РЯД ТЕЙЛОРА И ЗАДАЧИ НА ЭКСТРЕМУМ

123

Тогда наиболее грубая приближенная формула, формула «нулевого
приближения», не учитывающая изменения х и у, имеет вид

в виде

f ( x, y ) = f ( a , b ).

(

)

g
y = θx − 2 θ 2 + 1 x 2 .
2v0

Более точная формула «первого приближения», учитывающая члены
первого порядка малости, такова:

v 20
= l (величина l, как будет видно из
g
(22), есть максимальная горизонтальная дальность стрельбы), получим

f ( x, y ) = f ( a , b ) + A( x − a ) + B( y − b ).

Наконец, вводя обозначение

y = θx −

x2 2
(θ + 1),
2l

где А и В — некоторые числовые коэффициенты. Чтобы их найти,
возьмем частные производные от обеих частей равенства (24) по х:
fx′ ( x, y ) = A

(21)

откуда
∂y
x2
= x − θ.
∂θ
l

l
Условие (20)* дает θ = . Подставляя это значение в (21), получим
x
уравнение огибающей
l x2
y= − .
2 2l

(22)

Советуем читателю проделать весь вывод, не переходя к переменной θ.

(первое и третье слагаемые в правой части (24) не зависят от х, и потому
их частные производные по х равны нулю). Так как коэффициент А
должен быть постоянным, то отсюда получаем A = f x′(a, b). Подобным
образом, дифференцируя (24) по у, находим B = f y′ (a, b), т.е. (24) на
самом деле имеет вид
f ( x, y ) = f ( a , b ) + fx′ ( a , b )( x − a ) + f y′ ( a , b )( y − b ).

f ( x, y ) = f ( a , b ) + [A( x − a ) + B( y − b )] +

[

Степенной ряд Тейлора, хорошо известный для функций одного пе
ременного, оказывается полезным и для функций нескольких перемен
ных. Напомним (см., например, ВМ, § II.17), что для функций одного
переменного этот ряд имеет вид
f ′( a )
f ′′( a )
f ′′′( a )
(x − a ) +
( x − a )2 +
( x − a )3 + ...
1!
2!
3!

(26)

где А, В, С, D, Е — некоторые числовые коэффициенты. Чтобы их
найти, вычислим частные производные первого и второго порядков:
fx′ ( x, y ) = A + 2C ( x − a ) + D( y − b ),

§ 6. Ряд Тейлора и задачи на экстремум

(23)

Рассмотрим теперь функцию f (x, y) двух переменных. Пусть х
близок к постоянному значению а, а у — к постоянному значению b.

∂y ∂y
∂y
∂y
. Однако условие

= 0 совпадает с условием
= 0.
∂θ ∂ϕ
∂θ
∂ϕ

]

+ C ( x − a )2 + D( x − a )( y − b ) + E ( y − b )2 ,

Снаряд вылетает из орудия со скоростью v0 = 100 м/сек. Можно ли из этого
орудия поразить цель, находящуюся на горизонтальном удалении 500 м от ору
дия на высоте 300 м; на высоте 500 м?

* При замене переменной по формуле ϕ = ϕ (θ) получаем

(25)

(Выведите эту формулу непосредственно из результатов § 1.)
Еще более точная формула «второго приближения», учитывающая
также и члены второго порядка малости, имеет вид

Упражнение

f(x) = f(a ) +

(24)

∂y ∂y ∂ϕ
=
⋅ , так что,
∂θ ∂ϕ ∂θ

f y′ ( x, y ) = B + D( x − a ) + 2 E ( y − b ),
fxx
′′ ( x, y ) = 2C ,

fxy
′′ ( x, y ) = f yx
′′ ( x, y ) = D,

f yy
′′ ( x, y ) = 2 E .

Полагая в этих равенствах x = a, y = b, получим
A = fx′( a , b ),

B = f y′ ( a , b ),

C=

1
fxx
′′ ( a , b ),
2

D = fxy
′′ ( a , b ),

E=

1
f yy
′′ ( a , b ).
2

Подставляя эти значения в (26), получаем окончательно формулу вто
рого приближения

[

]

f ( x, y ) = f ( a , b ) + fx′ ( a , b )( x − a ) + f y′ ( a , b )( y − b ) +
+

[

]

1
2
2
fxx
′′ ( a , b )( x − a ) + 2 fxy
′′ ( a , b )( x − a )( y − b ) + f yy
′′ ( a , b )( y − b ) . (27)
2

122

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

тригонометрии

1
2

cos ϕ

[Гл. IV

= tg 2 ϕ + 1 = θ2 + 1, перепишем уравнение (19)

§ 6]

РЯД ТЕЙЛОРА И ЗАДАЧИ НА ЭКСТРЕМУМ

123

Тогда наиболее грубая приближенная формула, формула «нулевого
приближения», не учитывающая изменения х и у, имеет вид

в виде

f ( x, y ) = f ( a , b ).

(

)

g
y = θx − 2 θ 2 + 1 x 2 .
2v0

Более точная формула «первого приближения», учитывающая члены
первого порядка малости, такова:

v 20
= l (величина l, как будет видно из
g
(22), есть максимальная горизонтальная дальность стрельбы), получим

f ( x, y ) = f ( a , b ) + A( x − a ) + B( y − b ).

Наконец, вводя обозначение

y = θx −

x2 2
(θ + 1),
2l

где А и В — некоторые числовые коэффициенты. Чтобы их найти,
возьмем частные производные от обеих частей равенства (24) по х:
fx′ ( x, y ) = A

(21)

откуда
∂y
x2
= x − θ.
∂θ
l

l
Условие (20)* дает θ = . Подставляя это значение в (21), получим
x
уравнение огибающей
l x2
y= − .
2 2l

(22)

Советуем читателю проделать весь вывод, не переходя к переменной θ.

(первое и третье слагаемые в правой части (24) не зависят от х, и потому
их частные производные по х равны нулю). Так как коэффициент А
должен быть постоянным, то отсюда получаем A = f x′(a, b). Подобным
образом, дифференцируя (24) по у, находим B = f y′ (a, b), т.е. (24) на
самом деле имеет вид
f ( x, y ) = f ( a , b ) + fx′ ( a , b )( x − a ) + f y′ ( a , b )( y − b ).

f ( x, y ) = f ( a , b ) + [A( x − a ) + B( y − b )] +

[

Степенной ряд Тейлора, хорошо известный для функций одного пе
ременного, оказывается полезным и для функций нескольких перемен
ных. Напомним (см., например, ВМ, § II.17), что для функций одного
переменного этот ряд имеет вид
f ′( a )
f ′′( a )
f ′′′( a )
(x − a ) +
( x − a )2 +
( x − a )3 + ...
1!
2!
3!

(26)

где А, В, С, D, Е — некоторые числовые коэффициенты. Чтобы их
найти, вычислим частные производные первого и второго порядков:
fx′ ( x, y ) = A + 2C ( x − a ) + D( y − b ),

§ 6. Ряд Тейлора и задачи на экстремум

(23)

Рассмотрим теперь функцию f (x, y) двух переменных. Пусть х
близок к постоянному значению а, а у — к постоянному значению b.

∂y ∂y
∂y
∂y
. Однако условие

= 0 совпадает с условием
= 0.
∂θ ∂ϕ
∂θ
∂ϕ

]

+ C ( x − a )2 + D( x − a )( y − b ) + E ( y − b )2 ,

Снаряд вылетает из орудия со скоростью v0 = 100 м/сек. Можно ли из этого
орудия поразить цель, находящуюся на горизонтальном удалении 500 м от ору
дия на высоте 300 м; на высоте 500 м?

* При замене переменной по формуле ϕ = ϕ (θ) получаем

(25)

(Выведите эту формулу непосредственно из результатов § 1.)
Еще более точная формула «второго приближения», учитывающая
также и члены второго порядка малости, имеет вид

Упражнение

f(x) = f(a ) +

(24)

∂y ∂y ∂ϕ
=
⋅ , так что,
∂θ ∂ϕ ∂θ

f y′ ( x, y ) = B + D( x − a ) + 2 E ( y − b ),
fxx
′′ ( x, y ) = 2C ,

fxy
′′ ( x, y ) = f yx
′′ ( x, y ) = D,

f yy
′′ ( x, y ) = 2 E .

Полагая в этих равенствах x = a, y = b, получим
A = fx′( a , b ),

B = f y′ ( a , b ),

C=

1
fxx
′′ ( a , b ),
2

D = fxy
′′ ( a , b ),

E=

1
f yy
′′ ( a , b ).
2

Подставляя эти значения в (26), получаем окончательно формулу вто
рого приближения

[

]

f ( x, y ) = f ( a , b ) + fx′ ( a , b )( x − a ) + f y′ ( a , b )( y − b ) +
+

[

]

1
2
2
fxx
′′ ( a , b )( x − a ) + 2 fxy
′′ ( a , b )( x − a )( y − b ) + f yy
′′ ( a , b )( y − b ) . (27)
2

124

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Хотя мы выводили эту формулу независимо от (25), но мы видим,
что в правой части получилась та же линейная часть, что в (25), и, кро
ме того, появились поправки второго порядка малости. Мы предостав
ляем читателю вывести аналогичным образом формулу третьего
приближения (впрочем, эта формула применяется редко); в ней к пра
вой части (27) добавятся еще поправки третьего порядка малости.
(Для контроля примем, что функция f не зависит от у; тогда в пра
вых частях (25) и (27) все частные производные, в которых участвует
дифференцирование по у, отпадут, и мы получим частичные суммы
ряда (23) для функции одного переменного.)
Как и для функций одного переменного, формулами (25) и (27) наи
более удобно пользоваться, если x − a и y − b очень малы; если же
эти разности велики, то формулы перестают быть справедливыми и
могут привести к ошибочным выводам. Соответствующие формулы
для функций от более чем двух независимых переменных имеют анало
гичный вид, и мы не станем на них останавливаться.
Полученные формулы можно применить, в частности, для исследо
вания точек экстремума функции f (x, y). Допустим, что эта функция
имеет экстремум (максимум или минимум) при x = a, y = b. Пример
ное расположение линий уровня
функции f в плоскости аргумен
тов вблизи точки М экстремума
показано на рис. 32. Тогда ясно,
что если положить y = b, а изме
нять только х, то получающаяся
функция f (x, b) от одного пере
менного х имеет при x = a экс
тремум.
Геометрически
это
означает, что если следовать вдоль
прямой, изображенной на рис. 32
штрихами, то в точке М мы будем
Рис. 32.
иметь экстремум. Но тогда, как из
вестно из дифференциального исчисления функций одного переменно
го, производная в точке экстремума должна равняться нулю
d

 dx f ( x,b )



x =a

= 0.

Здесь в квадратных скобках стоит производная по х при зафиксиро
ванном значении y = b, т.е. это — частная производная по х.
Аналогично рассматривается случай зафиксированного x = a и из
меняющегося у. Мы приходим к необходимым условиям экстремума
функции двух переменных:
fx′ ( a ,b ) = 0,

f y′ ( a ,b ) = 0.

(28)

§ 6]

РЯД ТЕЙЛОРА И ЗАДАЧИ НА ЭКСТРЕМУМ

125

(Аналогичным рассуждением мы пользовались в § II.3 при рассмотре
нии метода наименьших квадратов.)
Как известно, для функции f(x) одного переменного необходимое
условие f ′(a) = 0 экстремума является «почти достаточным»: напри
мер, если f ′′(a) ≠ 0, то в точке х = а обязательно будет экстремум —
максимум при f ′′(a) < 0, минимум при f ′′(a) > 0. Можно было бы
ожидать, что и для функции двух переменных при выполнении усло
вия (28) экстремум в точке (a; b) обязательно будет, если в ней час
тные производные второго порядка отличны от нуля. Но это не так:
достаточное условие оказывается более сложным.
Рассмотрим сначала примеры. Пусть
z = f ( x, y ) = x 2 + y 2 .

Условие (28) дает 2x = 0, 2y = 0, т.е. точкой, «подозреваемой» на экс
тремум, служит начало координат. И в самом деле, здесь в начале коор
динат будет минимум, так как там z = 0, а в остальных точках z > 0.
Что касается частных производных второго порядка, то в данном при
мере они постоянны, причем f xx′′ = 2, f xy′′ = 0, f yy
′′ = 2. Подобным обра
зом легко проверить, что функция
z = Ax 2 + Cy 2

(29)

имеет при A > 0, C > 0 в начале координат минимум, а при A < 0,
C < 0 — максимум.
Совершенно новая картина будет, если в выражении (29) А и С
разных знаков, например, если рассматривается функция
z = x2 − y2.

Соответствующие линии уровня по
казаны на рис. 33, причем часть плос
кости, где z > 0, на рисунке заштрихо
вана; маленькие стрелочки указывают
направление понижения уровня, т.е.
для географической карты — направ
ление стока воды. При y = 0 полу
чаем z = x 2 , т.е. от начала координат
вдоль оси х функция в обе стороны
возрастает, а в самом начале имеет
минимум. Если же x = 0, то z = − y 2 ,
т.е. вдоль оси y функция в обе сто
Рис. 33.
роны убывает, а в самом начале имеет
максимум. Если рассмотреть другие прямые, проходящие через начало
координат, то вдоль одних из них функция имеет в начале максимум,
а вдоль других — минимум. Такой случай называется минимакс, и здесь

124

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Хотя мы выводили эту формулу независимо от (25), но мы видим,
что в правой части получилась та же линейная часть, что в (25), и, кро
ме того, появились поправки второго порядка малости. Мы предостав
ляем читателю вывести аналогичным образом формулу третьего
приближения (впрочем, эта формула применяется редко); в ней к пра
вой части (27) добавятся еще поправки третьего порядка малости.
(Для контроля примем, что функция f не зависит от у; тогда в пра
вых частях (25) и (27) все частные производные, в которых участвует
дифференцирование по у, отпадут, и мы получим частичные суммы
ряда (23) для функции одного переменного.)
Как и для функций одного переменного, формулами (25) и (27) наи
более удобно пользоваться, если x − a и y − b очень малы; если же
эти разности велики, то формулы перестают быть справедливыми и
могут привести к ошибочным выводам. Соответствующие формулы
для функций от более чем двух независимых переменных имеют анало
гичный вид, и мы не станем на них останавливаться.
Полученные формулы можно применить, в частности, для исследо
вания точек экстремума функции f (x, y). Допустим, что эта функция
имеет экстремум (максимум или минимум) при x = a, y = b. Пример
ное расположение линий уровня
функции f в плоскости аргумен
тов вблизи точки М экстремума
показано на рис. 32. Тогда ясно,
что если положить y = b, а изме
нять только х, то получающаяся
функция f (x, b) от одного пере
менного х имеет при x = a экс
тремум.
Геометрически
это
означает, что если следовать вдоль
прямой, изображенной на рис. 32
штрихами, то в точке М мы будем
Рис. 32.
иметь экстремум. Но тогда, как из
вестно из дифференциального исчисления функций одного переменно
го, производная в точке экстремума должна равняться нулю
d

 dx f ( x,b )



x =a

= 0.

Здесь в квадратных скобках стоит производная по х при зафиксиро
ванном значении y = b, т.е. это — частная производная по х.
Аналогично рассматривается случай зафиксированного x = a и из
меняющегося у. Мы приходим к необходимым условиям экстремума
функции двух переменных:
fx′ ( a ,b ) = 0,

f y′ ( a ,b ) = 0.

(28)

§ 6]

РЯД ТЕЙЛОРА И ЗАДАЧИ НА ЭКСТРЕМУМ

125

(Аналогичным рассуждением мы пользовались в § II.3 при рассмотре
нии метода наименьших квадратов.)
Как известно, для функции f(x) одного переменного необходимое
условие f ′(a) = 0 экстремума является «почти достаточным»: напри
мер, если f ′′(a) ≠ 0, то в точке х = а обязательно будет экстремум —
максимум при f ′′(a) < 0, минимум при f ′′(a) > 0. Можно было бы
ожидать, что и для функции двух переменных при выполнении усло
вия (28) экстремум в точке (a; b) обязательно будет, если в ней час
тные производные второго порядка отличны от нуля. Но это не так:
достаточное условие оказывается более сложным.
Рассмотрим сначала примеры. Пусть
z = f ( x, y ) = x 2 + y 2 .

Условие (28) дает 2x = 0, 2y = 0, т.е. точкой, «подозреваемой» на экс
тремум, служит начало координат. И в самом деле, здесь в начале коор
динат будет минимум, так как там z = 0, а в остальных точках z > 0.
Что касается частных производных второго порядка, то в данном при
мере они постоянны, причем f xx′′ = 2, f xy′′ = 0, f yy
′′ = 2. Подобным обра
зом легко проверить, что функция
z = Ax 2 + Cy 2

(29)

имеет при A > 0, C > 0 в начале координат минимум, а при A < 0,
C < 0 — максимум.
Совершенно новая картина будет, если в выражении (29) А и С
разных знаков, например, если рассматривается функция
z = x2 − y2.

Соответствующие линии уровня по
казаны на рис. 33, причем часть плос
кости, где z > 0, на рисунке заштрихо
вана; маленькие стрелочки указывают
направление понижения уровня, т.е.
для географической карты — направ
ление стока воды. При y = 0 полу
чаем z = x 2 , т.е. от начала координат
вдоль оси х функция в обе стороны
возрастает, а в самом начале имеет
минимум. Если же x = 0, то z = − y 2 ,
т.е. вдоль оси y функция в обе сто
Рис. 33.
роны убывает, а в самом начале имеет
максимум. Если рассмотреть другие прямые, проходящие через начало
координат, то вдоль одних из них функция имеет в начале максимум,
а вдоль других — минимум. Такой случай называется минимакс, и здесь

126

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

экстремума в начале координат не будет, хотя необходимые условия
(28) выполняются и частные производные второго порядка не все рав
ны нулю. В географии минимакс — это седловина, которая наблюдает
ся, например, в точке перевала через горный хребет; другой пример —
это просто седло. Так, на седло, отвечающее рис. 33, можно сесть, све
сив ноги вдоль оси у и глядя вдоль оси х; при этом спереди и сзади,
вдоль оси х, седло поднимается.
Аналогичный минимакс имеет место для функции z = xy в начале
координат; соответствующая картина линий уровня изображена на
рис. 26. (Где на рис. 26 z > 0 и где z < 0?)
Рассмотрим теперь общий случай. Если выполнены необходимые
условия (28), то формула (27) приобретает вид
f ( x, y ) = f ( a , b ) +

[

1
2
fxx
′′ ( a , b )( x − a ) +
2

]

2
+2 fxy
′′ ( a , b )( x − a )( y − b )+ f yy
′′ ( a , b )( y − b ) .

(30)

Конечно, при выводе этой формулы мы пренебрегаем членами третьего
порядка малости, но при исследовании экстремума нужно находиться
вблизи значений x = a, y = b, а там эти члены менее существенны, чем
выписанные члены второго порядка малости. Обозначим для краткости
fxx
′′ ( a , b ) = A,

fxy
′′ ( a , b ) = B,

f yy
′′ ( a , b ) = C ,

x − a = ξ,

y − b = η.

Тогда формула (30) показывает, что все зависит от поведения квадра
тичной формы (т.е. однородного многочлена второй степени)
P(ξ, η) = Aξ 2 + 2Bξη + Cη2 , так как приближенно, вблизи значений
1
x = a, y = b, f (x, y) = f (a, b) + P(ξ, η). Если она положительна при
2
всех ξ, η (например, имеет вид ξ 2 + η2 ), то f (x, y) > f (a, b) вблизи
точки (a; b) и тем самым в этой точке функция f имеет минимум.
Если эта форма отрицательна, то функция f в точке (a; b) имеет мак
симум. Если же эта форма может принимать значения обоих знаков
(например, имеет вид ξ 2 − η2 ), то в точке (a; b) будет минимакс, т.е.
экстремума не будет.
Как же узнать по коэффициентам А, В, С, какой из этих случаев
имеет место? Для этого напишем

  ξ 2
ξ
P ( ξ, η) = η2 A   + 2 B + C  = η2 ( At 2 + 2 Bt + C ),


η

 η

(31)

где через t мы обозначили ξ η. Из элементарной математики извес
тно, что если дискриминант
B2 − AC > 0,

(32)

§ 6]

РЯД ТЕЙЛОРА И ЗАДАЧИ НА ЭКСТРЕМУМ

127

то многочлен, стоящий в скобках, имеет два вещественных нуля, при
переходе через которые он меняет знак. Значит, это — случай минимак
са. Если же
B2 − AC < 0,

(33)

то указанный многочлен имеет мнимые нули и потому знака не меняет
(многочлен может изменить знак, только пройдя через нуль). Значит,
это — случай экстремума. Чтобы узнать, какой именно знак имеет пра
вая часть (31), положим t = 0. Мы видим, что если дополнительно
к (33) будет C > 0, то правая часть (31) положительна при всех t и по
тому в силу предыдущего абзаца функция f имеет в точке (a; b) ми
нимум. Если же дополнительно к (33) будет C < 0, то функция f имеет
максимум. (Проверьте выполнение всех этих условий на разобранных
выше примерах.)
Точки минимакса имеют большое значение при решении важного
класса задач, который мы продемонстрируем на наглядном примере.
Пусть в холмистой мес
тности, линии уровня ко
торой показаны на рис. 34,
расположены две де
ревни А и В, и пусть тре
буется соединить их доро
гой. Зто можно сделать
многими способами, и не
сколько вариантов пока
зано на рис. 34 пунктиром.
(Там же в нескольких точ
ках указано направление
стока воды, чтобы нагляд
Рис. 34.
ней представить рельеф.)
Следуя по любой дороге (l ) из А в В, нам приходится сначала наби
рать высоту до точки, показанной на рис. 34, после чего начинается
спуск. Если такой набор высоты вызывает трудности, то естественно
потребовать, чтобы он был минимально возможным. Для более точной
формулировки этого требования обозначим через z (M ) высоту мес
тности в любой точке М плана. Тогда упомянутый набор высоты
вдоль линии (l ) равен max z (M ) − z (A), где под max z (M ) пони
M на ( l )

M на ( l )

мается наибольшее значение высоты z вдоль линии (l ). Но значение
z (A) для всех сравниваемых линий одинаково; таким образом, требу
ется среди всех линий (l ), соединяющих А с В, найти линию, вдоль
т.е.
линию,
реализующую
которой max z (M ) минимален,
M на ( l )
min max z (M ). Ясно, что искомая линия должна пройти через точку
( l ) M на ( l )

126

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

экстремума в начале координат не будет, хотя необходимые условия
(28) выполняются и частные производные второго порядка не все рав
ны нулю. В географии минимакс — это седловина, которая наблюдает
ся, например, в точке перевала через горный хребет; другой пример —
это просто седло. Так, на седло, отвечающее рис. 33, можно сесть, све
сив ноги вдоль оси у и глядя вдоль оси х; при этом спереди и сзади,
вдоль оси х, седло поднимается.
Аналогичный минимакс имеет место для функции z = xy в начале
координат; соответствующая картина линий уровня изображена на
рис. 26. (Где на рис. 26 z > 0 и где z < 0?)
Рассмотрим теперь общий случай. Если выполнены необходимые
условия (28), то формула (27) приобретает вид
f ( x, y ) = f ( a , b ) +

[

1
2
fxx
′′ ( a , b )( x − a ) +
2

]

2
+2 fxy
′′ ( a , b )( x − a )( y − b )+ f yy
′′ ( a , b )( y − b ) .

(30)

Конечно, при выводе этой формулы мы пренебрегаем членами третьего
порядка малости, но при исследовании экстремума нужно находиться
вблизи значений x = a, y = b, а там эти члены менее существенны, чем
выписанные члены второго порядка малости. Обозначим для краткости
fxx
′′ ( a , b ) = A,

fxy
′′ ( a , b ) = B,

f yy
′′ ( a , b ) = C ,

x − a = ξ,

y − b = η.

Тогда формула (30) показывает, что все зависит от поведения квадра
тичной формы (т.е. однородного многочлена второй степени)
P(ξ, η) = Aξ 2 + 2Bξη + Cη2 , так как приближенно, вблизи значений
1
x = a, y = b, f (x, y) = f (a, b) + P(ξ, η). Если она положительна при
2
всех ξ, η (например, имеет вид ξ 2 + η2 ), то f (x, y) > f (a, b) вблизи
точки (a; b) и тем самым в этой точке функция f имеет минимум.
Если эта форма отрицательна, то функция f в точке (a; b) имеет мак
симум. Если же эта форма может принимать значения обоих знаков
(например, имеет вид ξ 2 − η2 ), то в точке (a; b) будет минимакс, т.е.
экстремума не будет.
Как же узнать по коэффициентам А, В, С, какой из этих случаев
имеет место? Для этого напишем

  ξ 2
ξ
P ( ξ, η) = η2 A   + 2 B + C  = η2 ( At 2 + 2 Bt + C ),


η

 η

(31)

где через t мы обозначили ξ η. Из элементарной математики извес
тно, что если дискриминант
B2 − AC > 0,

(32)

§ 6]

РЯД ТЕЙЛОРА И ЗАДАЧИ НА ЭКСТРЕМУМ

127

то многочлен, стоящий в скобках, имеет два вещественных нуля, при
переходе через которые он меняет знак. Значит, это — случай минимак
са. Если же
B2 − AC < 0,

(33)

то указанный многочлен имеет мнимые нули и потому знака не меняет
(многочлен может изменить знак, только пройдя через нуль). Значит,
это — случай экстремума. Чтобы узнать, какой именно знак имеет пра
вая часть (31), положим t = 0. Мы видим, что если дополнительно
к (33) будет C > 0, то правая часть (31) положительна при всех t и по
тому в силу предыдущего абзаца функция f имеет в точке (a; b) ми
нимум. Если же дополнительно к (33) будет C < 0, то функция f имеет
максимум. (Проверьте выполнение всех этих условий на разобранных
выше примерах.)
Точки минимакса имеют большое значение при решении важного
класса задач, который мы продемонстрируем на наглядном примере.
Пусть в холмистой мес
тности, линии уровня ко
торой показаны на рис. 34,
расположены две де
ревни А и В, и пусть тре
буется соединить их доро
гой. Зто можно сделать
многими способами, и не
сколько вариантов пока
зано на рис. 34 пунктиром.
(Там же в нескольких точ
ках указано направление
стока воды, чтобы нагляд
Рис. 34.
ней представить рельеф.)
Следуя по любой дороге (l ) из А в В, нам приходится сначала наби
рать высоту до точки, показанной на рис. 34, после чего начинается
спуск. Если такой набор высоты вызывает трудности, то естественно
потребовать, чтобы он был минимально возможным. Для более точной
формулировки этого требования обозначим через z (M ) высоту мес
тности в любой точке М плана. Тогда упомянутый набор высоты
вдоль линии (l ) равен max z (M ) − z (A), где под max z (M ) пони
M на ( l )

M на ( l )

мается наибольшее значение высоты z вдоль линии (l ). Но значение
z (A) для всех сравниваемых линий одинаково; таким образом, требу
ется среди всех линий (l ), соединяющих А с В, найти линию, вдоль
т.е.
линию,
реализующую
которой max z (M ) минимален,
M на ( l )
min max z (M ). Ясно, что искомая линия должна пройти через точку
( l ) M на ( l )

128

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

перевала С, которая как раз и является точкой минимакса для функ
ции z(M). Правда, имеется еще одна точка перевала D, но она лежит
выше и поэтому менее выгодна. (Проверьте, что если линии уровня на
рис. 34 проведены через 100 м, то промежуточный набор высоты вдоль
изображенных дорог соответственно равен 500, 600, 300, 200 и 400 м.)
На различии между случаями (32) и (33) основана классификация
точек произвольной поверхности в пространстве. Пусть задана некото
рая поверхность (S ) и N — любая ее точка. Выберем систему коорди
нат так, чтобы оси х и у были параллельны касательной плоскости
(P) к (S ) в точке N . Тогда вблизи N поверхность (S ) можно
представить уравнением z = f (x, y), причем в точке N в силу выбора
осей выполняются равенства (28), где а, b — значения коорди
нат х, у в точке N , так что N = (a; b; f (a, b)). При этом в зависимости
от того, выполняется ли неравенство (33) или (32), точка N называется
эллиптической или гиперболической точкой поверхности (S ). В первом
случае поверхность (S ) вблизи N выпукла и расположена по одну
сторону от (P). Во втором случае поверхность (S ) вблизи N имеет
седлообразный характер и расположена по обе стороны от (P); каса
тельная плоскость (P) пересекает (S ) по двум линиям, пересекаю
щимся в точке N .
Можно доказать, что условия (32) и (33) не нарушаются при пово
роте осей координат в пространстве. Поэтому если уравнение повер
хности (S ) задано в виде z = f (x, y), то для выяснения типа
какойнибудь точки этой поверхности нет надобности выбирать новые
оси координат, чтобы удовлетворить условию (28). Надо просто прове
рить выполнение условия (32) или (33) в исходной системе коорди
нат х, у, z.
Бывают поверхности, например сфера, эллипсоид, параболоид вра
щения и т.д., у которых все точки эллиптические; такие поверхности
выпуклы в целом. Бывают поверхности, например поверхность с урав
нением z = x 2 − y 2 , отвечающая рис. 33, у которых все точки гипербо
лические. Однако бывают и поверхности, обладающие точками обоих
типов; такой является, например, поверхность тора, т.е. бублика иде
альной формы. В этом случае куски, заполненные эллиптическими
точками, от кусков, заполненных гиперболическими точками, отделя
ются линиями, в точках которых B2 − AC = 0; такие точки называются
параболическими. На торе это точки, в которых касательная плоскость
перпендикулярна оси тора, они заполняют две окружности. (Подумай
те, где находятся линии параболических точек на поверхности Вашего
тела.) Впрочем бывают и поверхности, например цилиндрические или
конические, сплошь заполненные параболическими точками.
Ясно, что тип точки поверхности не меняется при любом перемеще
нии этой поверхности в пространстве, т.е. указанная классификация

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

129

точек поверхности является геометрически инвариантной. В отличие
от этого понятие самой высокой или самой низкой точки поверхности,
существенное при изучении экстремумов, не является инвариантно
связанным с самой поверхностью, так как при повороте поверхности ее
самая высокая точка перестает быть таковой.
Аналогичным образом точки графика ( L) функции y = ϕ(x), отве
чающие ее экстремальным значениям, не связаны с линией инвариан
тно (в отличие, например, от точек перегиба этой линии). Не инвариан
тны в этом смысле также точки линии с уравнением f (x, y) = 0,
dy
dy
в которых
= 0 или
= ∞.
dx
dx
Наши рассмотрения можно применить к исследованию строения ли
нии ( L) с уравнением f (x, y) = 0 на плоскости х, у в окрестности
некоторой точки N (a; b) этой линии. Для этого полезно рассмотреть
вспомогательную поверхность (S ) с уравнением z = f (x, y), так что
( L) получается в результате пересечения (S ) с плоскостью (P): z = 0.
При этом линия ( L) оказывается включенной в семейство линий с
уравнением f (x, y) = C при различных значениях С, т.е. линий уровня
функции f, получающихся в результате пересечения (S ) плоскостями
z = C, параллельными (P). Если f x′ (a, b) ≠ 0 или f y′ (a, b) ≠ 0 — тог
да N называется обыкновенной точкой линии ( L), — то (P) не касается
(S ) в точке (a; b; 0), а потому ( L) вблизи N имеет вид гладкой дуги.
Если же f x′ (a, b) = f y′ (a, b) = 0, то N называется особой точкой линии
( L) и тогда ( L) состоит из точек, общих для поверхности (S ) и плос
кости (Р), касательной к (S ). Из предыдущего вытекает, что если выпол
нено неравенство (33), то N является изолированной точкой линии ( L),
т.е. в некоторой окрестности N нет других точек линии ( L). Если выпол
нено неравенство (32), то N является точкой самопересечения линии ( L),
т.е. в некоторой окрестности N линия ( L) состоит из двух дуг, пересека
ющихся в N. Если же B2 − AC = 0, то строение линии ( L) в окрестности
N может быть существенно сложнее. (В качестве примера постройте с по
мощью перехода к полярным координатам линии x 2 − y 2 = (x 2 + y 2 )2 и
x 2 + y 2 = (x 2 + y 2 )2 ; чем является начало координат для каждой из них?)
Упражнение
Исследуйте на экстремум функции:
a) f ( x, y ) = x 2 − xy + y 2 − 2 x + 4 y − 1; б) f ( x, y ) = x 2 + 3 xy − 2 y + 2;
в) f ( x, y, z ) = x 2 + y 2 − z 2 + 2 z.

§ 7. Кратные интегралы
3

Начнем с примера. Рассмотрим тело (Ω), плотность ρ г/см которо
го известна, но неоднородна, т.е. в разных точках различна, и предполо
жим, что нам требуется подсчитать массу m этого тела. Аналогичная
задача для линейного распределения массы, как известно, решается

128

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

перевала С, которая как раз и является точкой минимакса для функ
ции z(M). Правда, имеется еще одна точка перевала D, но она лежит
выше и поэтому менее выгодна. (Проверьте, что если линии уровня на
рис. 34 проведены через 100 м, то промежуточный набор высоты вдоль
изображенных дорог соответственно равен 500, 600, 300, 200 и 400 м.)
На различии между случаями (32) и (33) основана классификация
точек произвольной поверхности в пространстве. Пусть задана некото
рая поверхность (S ) и N — любая ее точка. Выберем систему коорди
нат так, чтобы оси х и у были параллельны касательной плоскости
(P) к (S ) в точке N . Тогда вблизи N поверхность (S ) можно
представить уравнением z = f (x, y), причем в точке N в силу выбора
осей выполняются равенства (28), где а, b — значения коорди
нат х, у в точке N , так что N = (a; b; f (a, b)). При этом в зависимости
от того, выполняется ли неравенство (33) или (32), точка N называется
эллиптической или гиперболической точкой поверхности (S ). В первом
случае поверхность (S ) вблизи N выпукла и расположена по одну
сторону от (P). Во втором случае поверхность (S ) вблизи N имеет
седлообразный характер и расположена по обе стороны от (P); каса
тельная плоскость (P) пересекает (S ) по двум линиям, пересекаю
щимся в точке N .
Можно доказать, что условия (32) и (33) не нарушаются при пово
роте осей координат в пространстве. Поэтому если уравнение повер
хности (S ) задано в виде z = f (x, y), то для выяснения типа
какойнибудь точки этой поверхности нет надобности выбирать новые
оси координат, чтобы удовлетворить условию (28). Надо просто прове
рить выполнение условия (32) или (33) в исходной системе коорди
нат х, у, z.
Бывают поверхности, например сфера, эллипсоид, параболоид вра
щения и т.д., у которых все точки эллиптические; такие поверхности
выпуклы в целом. Бывают поверхности, например поверхность с урав
нением z = x 2 − y 2 , отвечающая рис. 33, у которых все точки гипербо
лические. Однако бывают и поверхности, обладающие точками обоих
типов; такой является, например, поверхность тора, т.е. бублика иде
альной формы. В этом случае куски, заполненные эллиптическими
точками, от кусков, заполненных гиперболическими точками, отделя
ются линиями, в точках которых B2 − AC = 0; такие точки называются
параболическими. На торе это точки, в которых касательная плоскость
перпендикулярна оси тора, они заполняют две окружности. (Подумай
те, где находятся линии параболических точек на поверхности Вашего
тела.) Впрочем бывают и поверхности, например цилиндрические или
конические, сплошь заполненные параболическими точками.
Ясно, что тип точки поверхности не меняется при любом перемеще
нии этой поверхности в пространстве, т.е. указанная классификация

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

129

точек поверхности является геометрически инвариантной. В отличие
от этого понятие самой высокой или самой низкой точки поверхности,
существенное при изучении экстремумов, не является инвариантно
связанным с самой поверхностью, так как при повороте поверхности ее
самая высокая точка перестает быть таковой.
Аналогичным образом точки графика ( L) функции y = ϕ(x), отве
чающие ее экстремальным значениям, не связаны с линией инвариан
тно (в отличие, например, от точек перегиба этой линии). Не инвариан
тны в этом смысле также точки линии с уравнением f (x, y) = 0,
dy
dy
в которых
= 0 или
= ∞.
dx
dx
Наши рассмотрения можно применить к исследованию строения ли
нии ( L) с уравнением f (x, y) = 0 на плоскости х, у в окрестности
некоторой точки N (a; b) этой линии. Для этого полезно рассмотреть
вспомогательную поверхность (S ) с уравнением z = f (x, y), так что
( L) получается в результате пересечения (S ) с плоскостью (P): z = 0.
При этом линия ( L) оказывается включенной в семейство линий с
уравнением f (x, y) = C при различных значениях С, т.е. линий уровня
функции f, получающихся в результате пересечения (S ) плоскостями
z = C, параллельными (P). Если f x′ (a, b) ≠ 0 или f y′ (a, b) ≠ 0 — тог
да N называется обыкновенной точкой линии ( L), — то (P) не касается
(S ) в точке (a; b; 0), а потому ( L) вблизи N имеет вид гладкой дуги.
Если же f x′ (a, b) = f y′ (a, b) = 0, то N называется особой точкой линии
( L) и тогда ( L) состоит из точек, общих для поверхности (S ) и плос
кости (Р), касательной к (S ). Из предыдущего вытекает, что если выпол
нено неравенство (33), то N является изолированной точкой линии ( L),
т.е. в некоторой окрестности N нет других точек линии ( L). Если выпол
нено неравенство (32), то N является точкой самопересечения линии ( L),
т.е. в некоторой окрестности N линия ( L) состоит из двух дуг, пересека
ющихся в N. Если же B2 − AC = 0, то строение линии ( L) в окрестности
N может быть существенно сложнее. (В качестве примера постройте с по
мощью перехода к полярным координатам линии x 2 − y 2 = (x 2 + y 2 )2 и
x 2 + y 2 = (x 2 + y 2 )2 ; чем является начало координат для каждой из них?)
Упражнение
Исследуйте на экстремум функции:
a) f ( x, y ) = x 2 − xy + y 2 − 2 x + 4 y − 1; б) f ( x, y ) = x 2 + 3 xy − 2 y + 2;
в) f ( x, y, z ) = x 2 + y 2 − z 2 + 2 z.

§ 7. Кратные интегралы
3

Начнем с примера. Рассмотрим тело (Ω), плотность ρ г/см которо
го известна, но неоднородна, т.е. в разных точках различна, и предполо
жим, что нам требуется подсчитать массу m этого тела. Аналогичная
задача для линейного распределения массы, как известно, решается

130

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

с помощью обычных интегралов: если масса распределена вдоль отрез
ка а, b с линейной плотностью α г/см, то
b

m = ∫ α( x ) dx.
a

Пространственный случай исследуется совершенно аналогично ли
нейному. Для этого разобьем мысленно (Ω) на объемчики (∆Ω 1 ),
(∆Ω 2 ), ...,(∆Ω n ) и выберем в каждом по одной точке, соответственно
M 1 , M 2 , ..., M n (рис. 35, где картину надо представлять себе простра
нственной; нумерация объемчиков производится в произвольном
порядке). Если объемчики достаточно малые, то в каждом из них плот
ность можно считать постоянной. Тогда массу m( ∆Ω 1) первого объем
чика можно подсчитать как произведение плотности на численное
значение объема, т.е. ρ( M 1 ) ∆Ω 1 , масса
второго объемчика находится аналогично
и т.д. В целом получаем
m( Ω ) ≈ ρ ( M1 ) ∆Ω1 + ρ ( M 2 ) ∆Ω 2 + ... +

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

вом примере областью служило тело (Ω), а функцией — его плотность,
которая в каждой точке принимает свое значение.) Тогда для составле
ния интегральной суммы область (Ω) разбивается на объемчики
(∆Ω 1 ), (∆Ω 2 ), ...,(∆Ω n ) и в каждом произвольно выбирается точка со
ответственно M 1 , M 2 , ..., M n . Затем составляется сумма

+ ρ ( M n ) ∆Ω n = ∑ ρ ( M k ) ∆Ω k ,
k =1

где под ∆Ω k понимается численное зна
3
чение объема (∆Ω k ) (в см ).
Это равенство — приближенное, так
как
плотность внутри объемчиков все же
Рис. 35.
не постоянная; однако оно тем точнее,
чем мельче разбиение, и в пределе, при безграничном измельчении рас
сматриваемого разбиения, получаем точное равенство

n

k =1

k =1

(36)

где под ∆Ω k понимается численное значение объемчика (∆Ω k ). Эта
интегральная сумма обладает высокой степенью произвола: ее значе
ние зависит как от способа разбиения области (Ω) на объемчики
(∆Ω k ), так и от выбора точек M k внутри каждого объемчика. Однако
при измельчении разбиения области (Ω) произвол в составлении
суммы почти не влияет на значение этой суммы и в пределе совсем не
сказывается. Предел интегральной суммы при бесконечном измельче
нии разбиения области (Ω) называется интегралом (объемным) от
функции f по области (Ω):

∫ u d Ω = ∫ f ( M ) d Ω = lim k∑=1 f ( M k ) ∆Ω k .

(Ω )

Таким образом, формулы (34) и (35) можно записать так:
m( Ω ) =

Рассуждая аналогичным образом, можно заключить, что если в теле
(Ω) распределен заряд с плотностью σ, то сам заряд q можно подсчи
тать по формуле
n

q( Ω ) =

∫ σ d Ω.

(Ω )

Произведение ρ dΩ, отвечающее бесконечно малому объему («эле
менту объема») (dΩ), называется элементом (дифференциалом) массы
и обозначается
dm = ρ dΩ,

(38)

где ρ — это плотность в какойлибо из точек (dΩ). При составлении
этого выражения можно отбрасывать малые высшего порядка (получа
ющиеся изза того, что плотность даже в малом объеме переменна), так
что оно оказывается прямо пропорциональным объему dΩ. Суммируя
все элементы (38) по объему (Ω), получаем полную массу

(35)

m( Ω ) =

k =1

при таком же смысле обозначений.
Единообразие формул (34) и (35) дает основание для общего опре
деления понятия объемного интеграла.
Пусть задана конечная часть пространства или, как говорят иначе,
конечная область (Ω) и на ней (т.е. в каждой ее точке М) задана
функция u = f (M ), принимающая конечные значения. (В нашем пер

∫ ρ d Ω,

(Ω )

(34)

k =1

(37)

(Ω )

n

q( Ω ) = lim ∑ σ ( M k ) ∆Ω k

n

∑ uk ∆Ω k = ∑ f ( M k ) ∆Ω k ,

n

n

m( Ω ) = lim ∑ ρ ( M k ) ∆Ω k .

131



dm =

(Ω )

∫ ρ dΩ.

(Ω )

Основные свойства объемных интегралов аналогичны соответству
ющим свойствам «простых» интегралов:
Интеграл от суммы равен сумме интегралов, т.е.

∫ ( u1 ± u2 ) dΩ = ∫ u1 dΩ ± ∫ u2 dΩ.

(Ω )

(Ω )

(Ω )

130

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

с помощью обычных интегралов: если масса распределена вдоль отрез
ка а, b с линейной плотностью α г/см, то
b

m = ∫ α( x ) dx.
a

Пространственный случай исследуется совершенно аналогично ли
нейному. Для этого разобьем мысленно (Ω) на объемчики (∆Ω 1 ),
(∆Ω 2 ), ...,(∆Ω n ) и выберем в каждом по одной точке, соответственно
M 1 , M 2 , ..., M n (рис. 35, где картину надо представлять себе простра
нственной; нумерация объемчиков производится в произвольном
порядке). Если объемчики достаточно малые, то в каждом из них плот
ность можно считать постоянной. Тогда массу m( ∆Ω 1) первого объем
чика можно подсчитать как произведение плотности на численное
значение объема, т.е. ρ( M 1 ) ∆Ω 1 , масса
второго объемчика находится аналогично
и т.д. В целом получаем
m( Ω ) ≈ ρ ( M1 ) ∆Ω1 + ρ ( M 2 ) ∆Ω 2 + ... +

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

вом примере областью служило тело (Ω), а функцией — его плотность,
которая в каждой точке принимает свое значение.) Тогда для составле
ния интегральной суммы область (Ω) разбивается на объемчики
(∆Ω 1 ), (∆Ω 2 ), ...,(∆Ω n ) и в каждом произвольно выбирается точка со
ответственно M 1 , M 2 , ..., M n . Затем составляется сумма

+ ρ ( M n ) ∆Ω n = ∑ ρ ( M k ) ∆Ω k ,
k =1

где под ∆Ω k понимается численное зна
3
чение объема (∆Ω k ) (в см ).
Это равенство — приближенное, так
как
плотность внутри объемчиков все же
Рис. 35.
не постоянная; однако оно тем точнее,
чем мельче разбиение, и в пределе, при безграничном измельчении рас
сматриваемого разбиения, получаем точное равенство

n

k =1

k =1

(36)

где под ∆Ω k понимается численное значение объемчика (∆Ω k ). Эта
интегральная сумма обладает высокой степенью произвола: ее значе
ние зависит как от способа разбиения области (Ω) на объемчики
(∆Ω k ), так и от выбора точек M k внутри каждого объемчика. Однако
приизмельчении разбиения области (Ω) произвол в составлении
суммы почти не влияет на значение этой суммы и в пределе совсем не
сказывается. Предел интегральной суммы при бесконечном измельче
нии разбиения области (Ω) называется интегралом (объемным) от
функции f по области (Ω):

∫ u d Ω = ∫ f ( M ) d Ω = lim k∑=1 f ( M k ) ∆Ω k .

(Ω )

Таким образом, формулы (34) и (35) можно записать так:
m( Ω ) =

Рассуждая аналогичным образом, можно заключить, что если в теле
(Ω) распределен заряд с плотностью σ, то сам заряд q можно подсчи
тать по формуле
n

q( Ω ) =

∫ σ d Ω.

(Ω )

Произведение ρ dΩ, отвечающее бесконечно малому объему («эле
менту объема») (dΩ), называется элементом (дифференциалом) массы
и обозначается
dm = ρ dΩ,

(38)

где ρ — это плотность в какойлибо из точек (dΩ). При составлении
этого выражения можно отбрасывать малые высшего порядка (получа
ющиеся изза того, что плотность даже в малом объеме переменна), так
что оно оказывается прямо пропорциональным объему dΩ. Суммируя
все элементы (38) по объему (Ω), получаем полную массу

(35)

m( Ω ) =

k =1

при таком же смысле обозначений.
Единообразие формул (34) и (35) дает основание для общего опре
деления понятия объемного интеграла.
Пусть задана конечная часть пространства или, как говорят иначе,
конечная область (Ω) и на ней (т.е. в каждой ее точке М) задана
функция u = f (M ), принимающая конечные значения. (В нашем пер

∫ ρ d Ω,

(Ω )

(34)

k =1

(37)

(Ω )

n

q( Ω ) = lim ∑ σ ( M k ) ∆Ω k

n

∑ uk ∆Ω k = ∑ f ( M k ) ∆Ω k ,

n

n

m( Ω ) = lim ∑ ρ ( M k ) ∆Ω k .

131



dm =

(Ω )

∫ ρ dΩ.

(Ω )

Основные свойства объемных интегралов аналогичны соответству
ющим свойствам «простых» интегралов:
Интеграл от суммы равен сумме интегралов, т.е.

∫ ( u1 ± u2 ) dΩ = ∫ u1 dΩ ± ∫ u2 dΩ.

(Ω )

(Ω )

(Ω )

132

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Постоянный множитель можно выносить за знак интеграла, т.е.

∫ Cu dΩ = C ∫ u dΩ

(Ω )

(C = const ).

(Ω )

При любом разбиении области (Ω) на части, скажем,
(Ω 2 ), будет

∫ u dΩ = ∫

(Ω )

u dΩ +

(Ω 1 )

(Ω 1 ) и

∫ u dΩ.

(Ω 2 )

Интеграл от единицы равен объему области интегрирования, т.е.



dΩ = Ω.

(Ω )



 ∫ u dΩ  = [ u]⋅[ Ω],

( Ω )

где квадратными скобками обозначена размерность величины.
Пример: [ρ] = г ⋅ см −3 ; ∫ ρ dΩ = г ⋅ см −3 ⋅ см 3 = г = [m] *.

]

Среднее значение («среднее интегральное», «среднее арифметичес
кое») функции u(M ) по области (Ω) вводится как постоянная u, ин
теграл от которой по области (Ω) равен интегралу от функции u по
этой области. Таким образом,

∫ u dΩ = ∫ u dΩ,

(Ω )

(Ω )

откуда

∫ u dΩ = u Ω

КРАТНЫЕ ИНТЕГРАЛЫ

и

u=

(Ω )

1
u dΩ.
Ω ( ∫Ω )

Как и для «простых» интегралов, выводится, что min u u  max u .
(Ω)
(Ω)
В начале этого параграфа мы рассматривали понятие плотности как
непосредственно ясное и выразили через плотность массу с помощью
интегрирования. Обратно, можно исходить из массы и выразить через
нее плотность. Для этого надо составить отношение
ρ ср =

m( ∆Ω )
∆Ω

* Взамен размерностей взяты единицы измерения, что несущественно.

133

массы, отвечающей малой области (∆Ω), к объему этой области. Это
отношение есть средняя плотность в области (∆Ω); чтобы получить
плотность в некоторой точке М, надо заставить (∆Ω) безгранично
стягиваться к этой точке и взять предел указанного отношения
ρ( M ) =

lim

m( ∆Ω )

( ∆Ω ) → M

∆Ω

=

dm
.
dΩ

(39)

Этот процесс аналогичен дифференцированию.
Если учитывать дискретное, молекулярное строение вещества, то в
формуле (39) объем (∆Ω) нельзя даже мысленно безгранично стяги
вать в точку. Взамен этой формулы надо написать
ρ( M ) =

Если рассматриваемые переменные размерны, то размерность ин
теграла равна произведению размерности интегрируемой величины на
размерность объема:

[

§ 7]

m( ∆Ω )
∆Ω

,

где (∆Ω) — «практически бесконечно малая область», содержащая
точку М, т.е. область, достаточно малая по сравнению с размерами
макроскопических тел и в то же время достаточно большая по сравне
нию с молекулярными размерами. Здесь мы как бы переходим от дис
кретной картины материального тела к его непрерывной модели,
плотность которой получается в результате осреднения, т. е. вычисле
ния средней плотности исходной картины по объемам указанных
«практически бесконечно малых» размеров.
Впредь при рассмотрении сплошной среды мы будем, отвлекаясь от
дискретного строения материи, считать, что такой переход к непрерыв
ной модели среды и ее плотности уже совершен.
Может оказаться, что одно из измерений части пространства, заня
той массой или зарядом, значительно меньше двух других измерений
(например, толщина значительно меньше длины и ширины); тогда
можно принять, что масса или заряд распределены по поверхности.
Аналогично, если два из измерений этой части значительно меньше
третьего, то можно принять, что масса или заряд распределены по ли
нии. В этом случае формулы (34) и (35) остаются в силе, если под плот
ностью понимать поверхностную (т. е. отнесенную к единице площади)
или линейную (т.е. отнесенную к единице длины) плотность, а под
∆Ω k понимать соответственно площадь или длину частички (∆Ω k ).
В общем случае говорят, что ∆Ω k есть мера области (∆Ω k ), понимая
под этим объем, площадь или длину в зависимости от того, рассматри
ваются объемные, поверхностные или линейные области.
Определение интеграла по поверхности (плоской или кривой), а
также интеграла по линии дается совершенно аналогично интегралу по
объему, т.е. по формуле (37); конечно, при этом взамен объема частич
ки надо взять ее площадь или длину. Объемные и поверхностные ин
тегралы называются кратными по причинам, которые будут ясны

132

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Постоянный множитель можно выносить за знак интеграла, т.е.

∫ Cu dΩ = C ∫ u dΩ

(Ω )

(C = const ).

(Ω )

При любом разбиении области (Ω) на части, скажем,
(Ω 2 ), будет

∫ u dΩ = ∫

(Ω )

u dΩ +

(Ω 1 )

(Ω 1 ) и

∫ u dΩ.

(Ω 2 )

Интеграл от единицы равен объему области интегрирования, т.е.



dΩ = Ω.

(Ω )



 ∫ u dΩ  = [ u]⋅[ Ω],

( Ω )

где квадратными скобками обозначена размерность величины.
Пример: [ρ] = г ⋅ см −3 ; ∫ ρ dΩ = г ⋅ см −3 ⋅ см 3 = г = [m] *.

]

Среднее значение («среднее интегральное», «среднее арифметичес
кое») функции u(M ) по области (Ω) вводится как постоянная u, ин
теграл от которой по области (Ω) равен интегралу от функции u по
этой области. Таким образом,

∫ u dΩ = ∫ u dΩ,

(Ω )

(Ω )

откуда

∫ u dΩ = u Ω

КРАТНЫЕ ИНТЕГРАЛЫ

и

u=

(Ω )

1
u dΩ.
Ω ( ∫Ω )

Как и для «простых» интегралов, выводится, что min u u  max u .
(Ω)
(Ω)
В начале этого параграфа мы рассматривали понятие плотности как
непосредственно ясное и выразили через плотность массу с помощью
интегрирования. Обратно, можно исходить из массы и выразить через
нее плотность. Для этого надо составить отношение
ρ ср =

m( ∆Ω )
∆Ω

* Взамен размерностей взяты единицы измерения, что несущественно.

133

массы, отвечающей малой области (∆Ω), к объему этой области. Это
отношение есть средняя плотность в области (∆Ω); чтобы получить
плотность в некоторой точке М, надо заставить (∆Ω) безгранично
стягиваться к этой точке и взять предел указанного отношения
ρ( M ) =

lim

m( ∆Ω )

( ∆Ω ) → M

∆Ω

=

dm
.
dΩ

(39)

Этот процесс аналогичен дифференцированию.
Если учитывать дискретное, молекулярное строение вещества, то в
формуле (39) объем (∆Ω) нельзя даже мысленно безгранично стяги
вать в точку. Взамен этой формулы надо написать
ρ( M ) =

Если рассматриваемые переменные размерны, то размерность ин
теграла равна произведению размерности интегрируемой величины на
размерность объема:

[

§ 7]

m( ∆Ω )
∆Ω

,

где (∆Ω) — «практически бесконечно малая область», содержащая
точку М, т.е. область, достаточно малая по сравнению с размерами
макроскопических тел и в то же время достаточно большая по сравне
нию с молекулярными размерами. Здесь мы как бы переходим от дис
кретной картины материального тела к его непрерывной модели,
плотность которой получается в результате осреднения, т. е. вычисле
ния средней плотности исходной картины по объемам указанных
«практически бесконечно малых» размеров.
Впредь при рассмотрении сплошной среды мы будем, отвлекаясь от
дискретного строения материи, считать, что такой переход к непрерыв
ной модели среды и ее плотности уже совершен.
Может оказаться, что одно из измерений части пространства, заня
той массой или зарядом, значительно меньше двух других измерений
(например, толщина значительно меньше длины и ширины); тогда
можно принять, что масса или заряд распределены по поверхности.
Аналогично, если два из измерений этой части значительно меньше
третьего, то можно принять, что масса или заряд распределены по ли
нии. В этом случае формулы (34) и (35) остаются в силе, если под плот
ностью понимать поверхностную (т. е. отнесенную к единице площади)
или линейную (т.е. отнесенную к единице длины) плотность, а под
∆Ω k понимать соответственно площадь или длину частички (∆Ω k ).
В общем случае говорят, что ∆Ω k есть мера области (∆Ω k ), понимая
под этим объем, площадь или длину в зависимости от того, рассматри
ваются объемные, поверхностные или линейные области.
Определение интеграла по поверхности (плоской или кривой), а
также интеграла по линии дается совершенно аналогично интегралу по
объему, т.е. по формуле (37); конечно, при этом взамен объема частич
ки надо взять ее площадь или длину. Объемные и поверхностные ин
тегралы называются кратными по причинам, которые будут ясны

134

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

позже, причем поверхностные интегралы называются двойными, а объ
емные — тройными. Интеграл по линии называется криволинейным
интегралом. Свойства у всех этих интегралов также совершенно анало
гичные; они будут широко применяться в нашем курсе при изложении
теории векторного поля (гл. Х и XI).
Кратные интегралы вычисляются с помощью обычных интегралов.
Рассмотрим, например, двойной интеграл
I=

∫ u dΩ,

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

или, как чаще пишут,
b

I = ∫ dx
a

I=



∫∫ u ( x, y ) dx dy.

(Ω )

Здесь написаны два знака интеграла, так как суммирование естествен
но проводить в два этапа: например, сначала провести суммирование
по всем прямоугольникам из какоголибо столбца, отвечающего неко
торому фиксированному х, а затем просуммировать результаты по
всем х. Первое суммирование даст
 y2 (x )

u( x, y ) dx dy =  ∫ u ( x, y ) dy dx,


 y1 (x )


где y = y 1 (x) и y = y 2 (x) (см. рис. 36) — координаты нижней и верх
ней точек области (Ω) при данном х. После второго суммирования
получим окончательно
 y2 (x )

I = ∫  ∫ u ( x, y ) dy dx



a  y1 (x )
b

(40)

u ( x, y ) dy.

После интегрирования и подстановки пределов получится результат, во
обще говоря, зависящий от х (так как х в процессе этого интегрирова
ния считается постоянным), т.е. получится некоторая функция f(x). Ее
надо проинтегрировать по х, что даст окончательный результат:
b

I = ∫ f ( x ) dx.

∫ u ( x, y ) dΩ.

Так как при определении интеграла
разбиение области (Ω) можно вы
бирать произвольно, то возьмем
Рис. 36.
разбиение прямыми x = const и
y = const, которое и отвечает интегрированию в декартовых координа
тах. Тогда все частички (∆Ω) будут представлять собой прямоуголь
ники со сторонами dx и dy, так что dΩ = dx dy, т.е.



u ( x, y ) dy.

y1 (x )

a

(Ω )

y1 (x )



y1 (x )

y2 (x )

распространенный по области (∆Ω) в плоскости. Чтобы перейти
к обычным интегралам, надо на этой плоскости ввести координаты,
например декартовы координа
ты x, у (рис. 36). Тогда функ
цию u можно рассматривать как
функцию от x, у , т.е. получим

y2 (x )

y2 (x )

Итак, вычисление двойного интеграла сводится к двукратному об
ычному интегрированию.
Сначала надо вычислить внутренний интеграл

(Ω )

I=

135

Можно было производить интегрирование в другом порядке: пер
вое (внутреннее) по х, а второе (внешнее) по y. Результат получится
тот же, хотя при практическом вычислении один способ может оказать
ся более трудным, а другой — более легким.
Наиболее просто расставлять пределы интегрирования, если об
ласть (Ω) представляет собой прямоугольник со сторонами, парал
лельными осям координат: тогда не только пределы внешнего
интеграла, но и пределы внутреннего интеграла будут постоянными.
Если же, кроме того, подынтегральная функция представляет собой
произведение функции, зависящей только от х, на функцию, завися
щую только от y, то и весь двойной интеграл можно разложить в про
изведение двух обычных («однократных») интегралов
b



a

d

dx

∫ [ f ( x ) ϕ ( y )] dy =
c

b
b
d
 d
= ∫ f ( x ) dx  ∫ ϕ ( y ) dy = ∫ ϕ ( y ) dy ⋅ ∫ f ( x ) dx .


 c
 c
a
a

(41)

Вычислим с помощью формулы (40) массу плоской пластинки, изо
браженной на рис. 37, поверхностная плотность которой изменяется по
закону
σ = ρ 0 ( h + αx + βy ),

(42)

где α, β — некоторые постоянные коэффициенты. Такой закон полу
чится, если пластинка однородная, но снизу ограничена координатной

134

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

позже, причем поверхностные интегралы называются двойными, а объ
емные — тройными. Интеграл по линии называется криволинейным
интегралом. Свойства у всех этих интегралов также совершенно анало
гичные; они будут широко применяться в нашем курсе при изложении
теории векторного поля (гл. Х и XI).
Кратные интегралы вычисляются с помощью обычных интегралов.
Рассмотрим, например, двойной интеграл
I=

∫ u dΩ,

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

или, как чаще пишут,
b

I = ∫ dx
a

I=



∫∫ u ( x, y ) dx dy.

(Ω )

Здесь написаны два знака интеграла, так как суммирование естествен
но проводить в два этапа: например, сначала провести суммирование
по всем прямоугольникам из какоголибо столбца, отвечающего неко
торому фиксированному х, а затем просуммировать результаты по
всем х. Первое суммирование даст
 y2 (x )

u( x, y ) dx dy =  ∫ u ( x, y ) dy dx,


 y1 (x )


где y = y 1 (x) и y = y 2 (x) (см. рис. 36) — координаты нижней и верх
ней точек области (Ω) при данном х. После второго суммирования
получим окончательно
 y2 (x )

I = ∫  ∫ u ( x, y ) dy dx



a  y1 (x )
b

(40)

u ( x, y ) dy.

После интегрирования и подстановки пределов получится результат, во
обще говоря, зависящий от х (так как х в процессе этого интегрирова
ния считается постоянным), т.е. получится некоторая функция f(x). Ее
надо проинтегрировать по х, что даст окончательный результат:
b

I = ∫ f ( x ) dx.

∫ u ( x, y ) dΩ.

Так как при определении интеграла
разбиение области (Ω) можно вы
бирать произвольно, то возьмем
Рис. 36.
разбиение прямыми x = const и
y = const, которое и отвечает интегрированию в декартовых координа
тах. Тогда все частички (∆Ω) будут представлять собой прямоуголь
ники со сторонами dx и dy, так что dΩ = dx dy, т.е.



u ( x, y ) dy.

y1 (x )

a

(Ω )

y1 (x )



y1 (x )

y2 (x )

распространенный по области (∆Ω) в плоскости. Чтобы перейти
к обычным интегралам, надо на этой плоскости ввести координаты,
например декартовы координа
ты x, у (рис. 36). Тогда функ
цию u можно рассматривать как
функцию от x, у , т.е. получим

y2 (x )

y2 (x )

Итак, вычисление двойного интеграла сводится к двукратному об
ычному интегрированию.
Сначала надо вычислить внутренний интеграл

(Ω )

I=

135

Можно было производить интегрирование в другом порядке: пер
вое (внутреннее) по х, а второе (внешнее) по y. Результат получится
тот же, хотя при практическом вычислении один способ может оказать
ся более трудным, а другой — более легким.
Наиболее просто расставлять пределы интегрирования, если об
ласть (Ω) представляет собой прямоугольник со сторонами, парал
лельными осям координат: тогда не только пределы внешнего
интеграла, но и пределы внутреннего интеграла будут постоянными.
Если же, кроме того, подынтегральная функция представляет собой
произведение функции, зависящей только от х, на функцию, завися
щую только от y, то и весь двойной интеграл можно разложить в про
изведение двух обычных («однократных») интегралов
b



a

d

dx

∫ [ f ( x ) ϕ ( y )] dy =
c

b
b
d
 d
= ∫ f ( x ) dx  ∫ ϕ ( y ) dy = ∫ ϕ ( y ) dy ⋅ ∫ f ( x ) dx .


 c
 c
a
a

(41)

Вычислим с помощью формулы (40) массу плоской пластинки, изо
браженной на рис. 37, поверхностная плотность которой изменяется по
закону
σ = ρ 0 ( h + αx + βy ),

(42)

где α, β — некоторые постоянные коэффициенты. Такой закон полу
чится, если пластинка однородная, но снизу ограничена координатной

136

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

плоскостью х, у, а сверху — другой плоскостью
с уравнением z = h + αx + βy, скошенной отно
сительно первой. Тогда поверхностная плот
ность в любой точке (х; у) получится в
результате умножения плотности материала
пластинки ρ 0 на высоту z пластинки в дан
ной точке, т.е. мы приходим к формуле (42). (За
Рис. 37.
одно мы видим, что массу, распределенную по
плоскости, можно получить просто в результате
проецирования на эту плоскость массы, распределенной по объему.)
Согласно формуле (40) получим
a

m=

∫ σ dΩ =

(Ω )

b

∫∫ σ ( x, y ) dx dy = ∫ dx ∫ ρ0 (h + αx + βy ) dy.

(Ω )

0

0

Внутреннее интегрирование производится по у при зафиксирован
ных х, т.е. вдоль параллельных отрезков, показанных на рис. 37. Вы
числим внутренний интеграл:
b

b



βy 2 
βb 2 
τ = ∫ ρ 0 (h + αx + βy ) dy = ρ 0 ( h + αx ) y +
= ρ 0 ( h + αx )b +

.
2  y =0
2 


0

Теперь остается этот результат, зависящий от х, проинтегрировать по х:
b
a

βb 2 
m = ∫ τ ( x ) dx = ∫ ρ 0 ( h + αx )b +
 dx =
2 

0
0


x 2 βb 2 
x
= ρ 0  hbx + αb
+
2
2 


a
x =0


αa 2b + βab 2 
= ρ 0  abh +
.
2



Физический смысл проведенных вычислений состоит в том, что мы
как бы проецируем пластинку на ось х, в результате чего получается
масса, распределенная по линии, именно материальный отрезок с ли
нейной плотностью
b

τ( x ) = ∫ σ ( x, y ) dy
a

(это — внутренний интеграл). При этом хорошо виден смысл линейной
плотности: это — масса пластинки, приходящаяся на единицу длины,
так что на интервал от х до x + dx приходится масса пластинки
dm = τ(x) dx. Интегрируя этот результат по отрезку оси х, получаем
массу пластинки. (Проверьте найденное выражение для массы, произ
ведя интегрирование в противоположном порядке — сначала по х, за
тем по y, а также разложив выражение (42) на три слагаемых
и применив к каждому из соответствующих интегралов формулу (41).)

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

Рис. 38.

137

Рис. 39.

Допустим теперь, что пластинка имеет треугольный вид, изобра
женный на рис. 38, а поверхностная плотность ее изменяется по тому
же закону (42). При этом внутреннее интегрирование производится
при фиксированном х по у от у = 0 до у = bх/а (см. рис. 38). Поэто
му вычисления идут так:
a

bx a

m = ∫ dx



0

ρ 0 ( h + αx + β y ) dy =

0

a
 ab
 b
b
b2 x2 
a 2b
ab 2 

= ∫ ρ0  h x + α x 2 + β 2
.
 dx = ρ 0  h + α
3
6 
a
a 2
 2
 a
0

Для контроля произведем интегрирование в другом порядке. Если
внутреннее интегрирование проводить по х при фиксированном у,
то пределами интегрирования будут служить (рис. 39) x = ay b и
х = а, откуда
b

a

m = ∫ dy



0

ρ 0 ( h + αx + β y ) dx =

ay b

b
 
a
= ∫ ρ0 h  a −

b

0

 α
y +
 2

 2 a 2 2
 a − 2 y  + βy
b



a

a −

b


y  dy =




αa 2
αa 2 b 3
a b2
b 2 βa b 3 
h+
b− 2
= ρ 0  abh −
+ βa

=
b 2
2
2
b 3
2b 3

 ab
αa 2b βab 2 
= ρ0  h +
+
.
3
6 
 2

Получился тот же результат.
Аналогично вычисляются интегралы и другого вида. Всегда нужно
выразить dΩ через дифференциалы координат, расставить пределы в
соответствии с этими координатами, а затем вычислять получающиеся
интегралы по обычным правилам интегрального исчисления. При этом
интегралы по площади получаются двукратными, а интегралы по объе
му — трехкратными, с тремя знаками интеграла.

136

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

плоскостью х, у, а сверху — другой плоскостью
с уравнением z = h + αx + βy, скошенной отно
сительно первой. Тогда поверхностная плот
ность в любой точке (х; у) получится в
результате умножения плотности материала
пластинки ρ 0 на высоту z пластинки в дан
ной точке, т.е. мы приходим к формуле (42). (За
Рис. 37.
одно мы видим, что массу, распределенную по
плоскости, можно получить просто в результате
проецирования на эту плоскость массы, распределенной по объему.)
Согласно формуле (40) получим
a

m=

∫ σ dΩ =

(Ω )

b

∫∫ σ ( x, y ) dx dy = ∫ dx ∫ ρ0 (h + αx + βy ) dy.

(Ω )

0

0

Внутреннее интегрирование производится по у при зафиксирован
ных х, т.е. вдоль параллельных отрезков, показанных на рис. 37. Вы
числим внутренний интеграл:
b

b



βy 2 
βb 2 
τ = ∫ ρ 0 (h + αx + βy ) dy = ρ 0 ( h + αx ) y +
= ρ 0 ( h + αx )b +

.
2  y =0
2 


0

Теперь остается этот результат, зависящий от х, проинтегрировать по х:
b
a

βb 2 
m = ∫ τ ( x ) dx = ∫ ρ 0 ( h + αx )b +
 dx =
2 

0
0


x 2 βb 2 
x
= ρ 0  hbx + αb
+
2
2 


a
x =0


αa 2b + βab 2 
= ρ 0  abh +
.
2



Физический смысл проведенных вычислений состоит в том, что мы
как бы проецируем пластинку на ось х, в результате чего получается
масса, распределенная по линии, именно материальный отрезок с ли
нейной плотностью
b

τ( x ) = ∫ σ ( x, y ) dy
a

(это — внутренний интеграл). При этом хорошо виден смысл линейной
плотности: это — масса пластинки, приходящаяся на единицу длины,
так что на интервал от х до x + dx приходится масса пластинки
dm = τ(x) dx. Интегрируя этот результат по отрезку оси х, получаем
массу пластинки. (Проверьте найденное выражение для массы, произ
ведя интегрирование в противоположном порядке — сначала по х, за
тем по y, а также разложив выражение (42) на три слагаемых
и применив к каждому из соответствующих интегралов формулу (41).)

§ 7]

КРАТНЫЕ ИНТЕГРАЛЫ

Рис. 38.

137

Рис. 39.

Допустим теперь, что пластинка имеет треугольный вид, изобра
женный на рис. 38, а поверхностная плотность ее изменяется по тому
же закону (42). При этом внутреннее интегрирование производится
при фиксированном х по у от у = 0 до у = bх/а (см. рис. 38). Поэто
му вычисления идут так:
a

bx a

m = ∫ dx



0

ρ 0 ( h + αx + β y ) dy =

0

a
 ab
 b
b
b2 x2 
a 2b
ab 2 

= ∫ ρ0  h x + α x 2 + β 2
.
 dx = ρ 0  h + α
3
6 
a
a 2
 2
 a
0

Для контроля произведем интегрирование в другом порядке. Если
внутреннее интегрирование проводить по х при фиксированном у,
то пределами интегрирования будут служить (рис. 39) x = ay b и
х = а, откуда
b

a

m = ∫ dy



0

ρ 0 ( h + αx + β y ) dx =

ay b

b
 
a
= ∫ ρ0 h  a −

b

0

 α
y +
 2

 2 a 2 2
 a − 2 y  + βy
b



a

a −

b


y  dy =




αa 2
αa 2 b 3
a b2
b 2 βa b 3 
h+
b− 2
= ρ 0  abh −
+ βa

=
b 2
2
2
b 3
2b 3

 ab
αa 2b βab 2 
= ρ0  h +
+
.
3
6 
 2

Получился тот же результат.
Аналогично вычисляются интегралы и другого вида. Всегда нужно
выразить dΩ через дифференциалы координат, расставить пределы в
соответствии с этими координатами, а затем вычислять получающиеся
интегралы по обычным правилам интегрального исчисления. При этом
интегралы по площади получаются двукратными, а интегралы по объе
му — трехкратными, с тремя знаками интеграла.

138

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Если после перехода к координатам подынтегральная функция ока
жется не зависящей от одной из координат, то интегрирование по этой ко
ординате выполняется тривиально, и мы сразу переходим от двойного
интеграла к однократному, а от тройного — к двойному или даже к одно
кратному. Например, площадь фигуры (Ω), изображенной на рис. 36,
можно найти как двойной интеграл от единицы (см. свойства интеграла):

§ 8]

МНОГОМЕРНОЕ ПРОСТРАНСТВО И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

из них) равна, как это видно из рис. 40, dΩ = ρ dϕ dρ. Так как
x 2 + y 2 = ρ 2 , то получаем (продумайте расстановку пределов)
I=

∫∫ e

(Ω )

−ρ2





0

0

2

( Ω)

Ω = ∫ dx
a

y2 (x )



a

I=

∫e

−x 2 − y 2

dΩ,

где (Ω) — полная плоскость х, у. Расставляя пределы в координатах
х, у, когда dΩ = dx dy, получим, учитывая формулу (41),

−∞

−∞





−∞

−∞

0

1
= 2 π ⋅ = π.
2

−x2

dx =

π.

2

2

−y
−x
∫ dx ∫ e e dy =


=

∫e

−∞

−x 2



dx

∫e

− y2

1

1

2

3. Вычислите интеграл I = ∫ dx ∫ e y dy.
x

У к а з а н и е. Измените порядок интегрирования.

§ 8. Многомерное пространство и число степеней свободы

(Ω )

dy =



1. Вычислите интеграл от функции x sin xy по прямоугольнику 0  x 1,
0  y  π.
2. Вычислите среднее значение функции u = e xy в квадрате 0  x 1,
0  y  π.
У к а з а н и е. Для второго интегрирования проведите разложение подын
тегральной функции в ряд Тейлора.
0

2

−x
∫ e dx,

Рис. 40.

− y2

2

e−ρ
−2



Упражнения

о котором говорилось в § III.2. Для этого
надо рассмотреть вспомогательный ин
теграл

2

∫e

π , т.е.

dy = ∫ [ y2 ( x ) − y1 ( x )] dx.

y1 (x )



−∞

−∞





K=

b



−x
∫ dx ∫ e

0

Приравнивая найденные результаты, получаем, что

K=



0

2

0

( Ω)

Мы пришли к формуле очевидной, если вспомнить геометрический
смысл определенного интеграла. Подобным образом при вычислении
объема мы можем от тройного интеграла немедленно перейти к двой
ному. Мы, в сущности, это и делали, ког
да вычисляли массу пластинки.
В качестве примера приложения
двойных интегралов вычислим интеграл

I=





Для перехода к однократному интегралу расставим пределы
b



ρ dϕ dρ = ∫ dϕ ∫ e − ρ ρ dρ = ∫ dϕ ⋅ ∫ e − ρ ρ dρ =

∫ dΩ = ∫∫ dx dy.

Ω=

139

dy = K 2 .

−∞

С другой стороны, тот же интеграл I можно вычислить с помощью
полярных координат ρ, ϕ . Тогда плоскость (Ω) более естественно
разбивать на частички с помощью окружностей ρ = const и лучей
ϕ = const. Площадь полученных частичек (на рис. 40 изображена одна

Подобно тому как для функции двух переменных мы в § 2 рассмат
ривали «плоскость аргументов», так и для функции трех переменных
можно рассматривать «пространство аргументов». Эти понятия очень
наглядны, поэтому желательно сохранить представление о простра
нстве аргументов и для случая функций любого числа независимых пе
ременных, даже большего трех. Это делается следующим образом.
Пусть, например, рассматривается функция четырех переменных
u = f (x, y, z , t). Тогда условно говорят, что каждый набор значе
ний х, у, z, t определяет «точку» в «четырехмерном пространстве ар
гументов» х, у, z, t. Такой точке и такому пространству не дается на
глядного геометрического истолкования. Строго говоря, точка — это не
что иное, как набор значений х, у, z, t, а пространство — совокуп
ность всевозможных таких наборов. Так, набор (–3; 0; 2; 1,3) — это одна
такая точка, набор (0; 0; 0; 0) — другая точка («начало координат») и т.п.
Теперь можно говорить, что функция f определена во всем четы
рехмерном пространстве х, у, z, t или в его части («области»).
Для функции z = f (x, y) двух переменных «пространство аргумен
тов» представляет собой плоскость х, у, а пространство аргументов и
функции, в котором расположен график функции, — обычное трехмерное

138

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

Если после перехода к координатам подынтегральная функция ока
жется не зависящей от одной из координат, то интегрирование по этой ко
ординате выполняется тривиально, и мы сразу переходим от двойного
интеграла к однократному, а от тройного — к двойному или даже к одно
кратному. Например, площадь фигуры (Ω), изображенной на рис. 36,
можно найти как двойной интеграл от единицы (см. свойства интеграла):

§ 8]

МНОГОМЕРНОЕ ПРОСТРАНСТВО И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

из них) равна, как это видно из рис. 40, dΩ = ρ dϕ dρ. Так как
x 2 + y 2 = ρ 2 , то получаем (продумайте расстановку пределов)
I=

∫∫ e

(Ω )

−ρ2





0

0

2

( Ω)

Ω = ∫ dx
a

y2 (x )



a

I=

∫e

−x 2 − y 2

dΩ,

где (Ω) — полная плоскость х, у. Расставляя пределы в координатах
х, у, когда dΩ = dx dy, получим, учитывая формулу (41),

−∞

−∞





−∞

−∞

0

1
= 2 π ⋅ = π.
2

−x2

dx =

π.

2

2

−y
−x
∫ dx ∫ e e dy =


=

∫e

−∞

−x 2



dx

∫e

− y2

1

1

2

3. Вычислите интеграл I = ∫ dx ∫ e y dy.
x

У к а з а н и е. Измените порядок интегрирования.

§ 8. Многомерное пространство и число степеней свободы

(Ω )

dy =



1. Вычислите интеграл от функции x sin xy по прямоугольнику 0  x 1,
0  y  π.
2. Вычислите среднее значение функции u = e xy в квадрате 0  x 1,
0  y  π.
У к а з а н и е. Для второго интегрирования проведите разложение подын
тегральной функции в ряд Тейлора.
0

2

−x
∫ e dx,

Рис. 40.

− y2

2

e−ρ
−2



Упражнения

о котором говорилось в § III.2. Для этого
надо рассмотреть вспомогательный ин
теграл

2

∫e

π , т.е.

dy = ∫ [ y2 ( x ) − y1 ( x )] dx.

y1 (x )



−∞

−∞





K=

b



−x
∫ dx ∫ e

0

Приравнивая найденные результаты, получаем, что

K=



0

2

0

( Ω)

Мы пришли к формуле очевидной, если вспомнить геометрический
смысл определенного интеграла. Подобным образом при вычислении
объема мы можем от тройного интеграла немедленно перейти к двой
ному. Мы, в сущности, это и делали, ког
да вычисляли массу пластинки.
В качестве примера приложения
двойных интегралов вычислим интеграл

I=





Для перехода к однократному интегралу расставим пределы
b



ρ dϕ dρ = ∫ dϕ ∫ e − ρ ρ dρ = ∫ dϕ ⋅ ∫ e − ρ ρ dρ =

∫ dΩ = ∫∫ dx dy.

Ω=

139

dy = K 2 .

−∞

С другой стороны, тот же интеграл I можно вычислить с помощью
полярных координат ρ, ϕ . Тогда плоскость (Ω) более естественно
разбивать на частички с помощью окружностей ρ = const и лучей
ϕ = const. Площадь полученных частичек (на рис. 40 изображена одна

Подобно тому как для функции двух переменных мы в § 2 рассмат
ривали «плоскость аргументов», так и для функции трех переменных
можно рассматривать «пространство аргументов». Эти понятия очень
наглядны, поэтому желательно сохранить представление о простра
нстве аргументов и для случая функций любого числа независимых пе
ременных, даже большего трех. Это делается следующим образом.
Пусть, например, рассматривается функция четырех переменных
u = f (x, y, z , t). Тогда условно говорят, что каждый набор значе
ний х, у, z, t определяет «точку» в «четырехмерном пространстве ар
гументов» х, у, z, t. Такой точке и такому пространству не дается на
глядного геометрического истолкования. Строго говоря, точка — это не
что иное, как набор значений х, у, z, t, а пространство — совокуп
ность всевозможных таких наборов. Так, набор (–3; 0; 2; 1,3) — это одна
такая точка, набор (0; 0; 0; 0) — другая точка («начало координат») и т.п.
Теперь можно говорить, что функция f определена во всем четы
рехмерном пространстве х, у, z, t или в его части («области»).
Для функции z = f (x, y) двух переменных «пространство аргумен
тов» представляет собой плоскость х, у, а пространство аргументов и
функции, в котором расположен график функции, — обычное трехмерное

140

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

пространство х, у, z; в этом случае графиком служит двумерная
поверхность в трехмерном пространстве. Подобно этому «график»
функции u = f (x, y, z , t) уже требует пятимерного пространства аргу
ментов и функции х, у, z, t, u: для нахождения точек этого графика
надо придавать х, у, z, t произвольные значения и находить соотве
тствующие значения u. Например, проверьте, что график функции
u = xz − 2y 2 t проходит через точки (1; 1; 2; 0; 2), (–1; 2; 0; –2; 16) и т.д.
Таким образом, зависимость u = f (x, y, z , t) определяет четырехмер
ную поверхность в пятимерном пространстве.
С этой терминологией непосредственно связано понятие числа сте
пеней свободы. Известно, что положение точки в (обычном) простра
нстве можно охарактеризовать декартовыми координатами х, у, z.
Имеются и другие системы координат, но для всех них общим является
то, что положение точки в пространстве определяется тремя координа
тами (тогда как положение точки на плоскости определяется двумя ко
ординатами, а на линии — одной). Этот факт выражают словами: при
выборе точки в физическом пространстве или, что то же, при движении
точки в пространстве имеется три степени свободы. При выборе точки
на плоскости, а также на любой поверхности, имеется две степени сво
боды, а на линии — одна. Другими словами, пространство трехмерно,
тогда как поверхности двумерны, а линии одномерны.
В общем случае понятие о числе степеней свободы вводится так.
Пусть имеется некоторая совокупность объектов (в предыдущем при
мере — совокупность всех точек в пространстве), каждый из которых
может быть охарактеризован указанием численных значений некото
рых непрерывных параметров (в предыдущем примере — координат).
Пусть эти параметры являются:
1) независимыми, т.е. могут принимать произвольные значения: на
пример, если зафиксировать все параметры, кроме одного, то этот один
можно еще произвольно менять, быть может, в некоторых пределах;
2) существенными, т.е. при любом изменении параметров рассмат
риваемый объект фактически меняется. Тогда, если таких параметров
k, то говорят, что при выборе объекта из рассматриваемой совокупнос
ти имеется k степеней свободы, а сама совокупность называется (об
общенным) kмерным пространством или kмерным многообразием.
Сами параметры называются (обобщенными) координатами в этом
пространстве; как и в случае обычных координат в обычном простра
нстве, их можно выбирать различными способами, как это окажется
удобнее в том или ином исследовании. Таким образом, многомерное
пространство получает конкретное истолкование.
Например, в физике систематически рассматривается совокуп
ность «событий», каждое из которых характеризуется ответами на воп
росы «где»? и «когда»? На первый вопрос можно ответить указанием

§ 8]

МНОГОМЕРНОЕ ПРОСТРАНСТВО И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

141

декартовых координат х, у, z, а на второй — указанием момента вре
мени t. Эти параметры независимы (их можно произвольно менять) и
существенны (при их изменении событие заменяется на другое собы
тие). Таким образом, пространство событий—четырехмерное, и обоб
щенными координатами в нем могут служить х, у, z, t.
В качестве другого примера рассмотрим последовательность (сис
тему) зубчатых колес, из которых каждое последующее зацеплено с
предыдущим. Здесь имеется всего лишь одна степень свободы, причем
за обобщенную координату можно принять угол поворота первого ко
леса, так как задание этого угла полностью определяет положение и
остальных колес. (Сколько степеней свободы было бы, если бы колеса
не были зацеплены?)
Подсчитаем, сколько степеней свободы имеет отрезок данной дли
ны l при движении на плоскости. Каждый такой отрезок полностью
определяется координатами (x 1 ; y 1 ) и (x 2 ; y 2 ) его концов; эти коор
динаты можно принять за параметры, определяющие положение отрез
ка. Эти параметры, очевидно, существенные, однако они не являются
независимыми, а связаны соотношением
( x2 − x1 )2 + ( y2 − y1 )2 = l

(почему?). Таким образом, только три параметра можно считать неза
висимыми, а четвертый выражается через них из этого соотношения.
Значит, отрезок данной длины при движении на плоскости имеет три
степени свободы.
В общем случае, если параметров n и они существенные, но связа
ны m независимыми уравнениями (т.е. такими уравнениями, из кото
рых ни одно не вытекает из остальных), то n − m параметров можно
принять за независимые, а остальные m будут через них выражаться,
т.е. будет n − m степеней свободы.
Подсчитаем, наконец, число степеней свободы при выборе бесконеч
ной прямой на плоскости. Можно рассуждать так: выберем произвольно
две точки A и В на плоскости (каждая имеет по две координаты) и
проведем через них прямую Р, которая будет определяться, таким об
разом, четырьмя параметрами. Так как эти параметры независимые, то,
казалось бы, получается четыре степени свободы. Однако такое рас
суждение неверно, так как при изменении этих параметров (коорди
нат) точки A и В будут, правда, меняться, но прямая Р может при
этом оставаться неизменной; значит, требование существенности пара
метров не выполняется. Так как прямая Р не меняется, если точка А
скользит по ней (одна степень свободы) или точка В скользит по ней
(еще одна степень свободы), то при нашем подсчете получилось две
лишних степени свободы и на самом деле число степеней свободы рав
но 4 – 2 = 2. За независимые и существенные параметры можно взять,

140

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

пространство х, у, z; в этом случае графиком служит двумерная
поверхность в трехмерном пространстве. Подобно этому «график»
функции u = f (x, y, z , t) уже требует пятимерного пространства аргу
ментов и функции х, у, z, t, u: для нахождения точек этого графика
надо придавать х, у, z, t произвольные значения и находить соотве
тствующие значения u. Например, проверьте, что график функции
u = xz − 2y 2 t проходит через точки (1; 1; 2; 0; 2), (–1; 2; 0; –2; 16) и т.д.
Таким образом, зависимость u = f (x, y, z , t) определяет четырехмер
ную поверхность в пятимерном пространстве.
С этой терминологией непосредственно связано понятие числа сте
пеней свободы. Известно, что положение точки в (обычном) простра
нстве можно охарактеризовать декартовыми координатами х, у, z.
Имеются и другие системы координат, но для всех них общим является
то, что положение точки в пространстве определяется тремя координа
тами (тогда как положение точки на плоскости определяется двумя ко
ординатами, а на линии — одной). Этот факт выражают словами: при
выборе точки в физическом пространстве или, что то же, при движении
точки в пространстве имеется три степени свободы. При выборе точки
на плоскости, а также на любой поверхности, имеется две степени сво
боды, а на линии — одна. Другими словами, пространство трехмерно,
тогда как поверхности двумерны, а линии одномерны.
В общем случае понятие о числе степеней свободы вводится так.
Пусть имеется некоторая совокупность объектов (в предыдущем при
мере — совокупность всех точек в пространстве), каждый из которых
может быть охарактеризован указанием численных значений некото
рых непрерывных параметров (в предыдущем примере — координат).
Пусть эти параметры являются:
1) независимыми, т.е. могут принимать произвольные значения: на
пример, если зафиксировать все параметры, кроме одного, то этот один
можно еще произвольно менять, быть может, в некоторых пределах;
2) существенными, т.е. при любом изменении параметров рассмат
риваемый объект фактически меняется. Тогда, если таких параметров
k, то говорят, что при выборе объекта из рассматриваемой совокупнос
ти имеется k степеней свободы, а сама совокупность называется (об
общенным) kмерным пространством или kмерным многообразием.
Сами параметры называются (обобщенными) координатами в этом
пространстве; как и в случае обычных координат в обычном простра
нстве, их можно выбирать различными способами, как это окажется
удобнее в том или ином исследовании. Таким образом, многомерное
пространство получает конкретное истолкование.
Например, в физике систематически рассматривается совокуп
ность «событий», каждое из которых характеризуется ответами на воп
росы «где»? и «когда»? На первый вопрос можно ответить указанием

§ 8]

МНОГОМЕРНОЕ ПРОСТРАНСТВО И ЧИСЛО СТЕПЕНЕЙ СВОБОДЫ

141

декартовых координат х, у, z, а на второй — указанием момента вре
мени t. Эти параметры независимы (их можно произвольно менять) и
существенны (при их изменении событие заменяется на другое собы
тие). Таким образом, пространство событий—четырехмерное, и обоб
щенными координатами в нем могут служить х, у, z, t.
В качестве другого примера рассмотрим последовательность (сис
тему) зубчатых колес, из которых каждое последующее зацеплено с
предыдущим. Здесь имеется всего лишь одна степень свободы, причем
за обобщенную координату можно принять угол поворота первого ко
леса, так как задание этого угла полностью определяет положение и
остальных колес. (Сколько степеней свободы было бы, если бы колеса
не были зацеплены?)
Подсчитаем, сколько степеней свободы имеет отрезок данной дли
ны l при движении на плоскости. Каждый такой отрезок полностью
определяется координатами (x 1 ; y 1 ) и (x 2 ; y 2 ) его концов; эти коор
динаты можно принять за параметры, определяющие положение отрез
ка. Эти параметры, очевидно, существенные, однако они не являются
независимыми, а связаны соотношением
( x2 − x1 )2 + ( y2 − y1 )2 = l

(почему?). Таким образом, только три параметра можно считать неза
висимыми, а четвертый выражается через них из этого соотношения.
Значит, отрезок данной длины при движении на плоскости имеет три
степени свободы.
В общем случае, если параметров n и они существенные, но связа
ны m независимыми уравнениями (т.е. такими уравнениями, из кото
рых ни одно не вытекает из остальных), то n − mпараметров можно
принять за независимые, а остальные m будут через них выражаться,
т.е. будет n − m степеней свободы.
Подсчитаем, наконец, число степеней свободы при выборе бесконеч
ной прямой на плоскости. Можно рассуждать так: выберем произвольно
две точки A и В на плоскости (каждая имеет по две координаты) и
проведем через них прямую Р, которая будет определяться, таким об
разом, четырьмя параметрами. Так как эти параметры независимые, то,
казалось бы, получается четыре степени свободы. Однако такое рас
суждение неверно, так как при изменении этих параметров (коорди
нат) точки A и В будут, правда, меняться, но прямая Р может при
этом оставаться неизменной; значит, требование существенности пара
метров не выполняется. Так как прямая Р не меняется, если точка А
скользит по ней (одна степень свободы) или точка В скользит по ней
(еще одна степень свободы), то при нашем подсчете получилось две
лишних степени свободы и на самом деле число степеней свободы рав
но 4 – 2 = 2. За независимые и существенные параметры можно взять,

142

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

например, коэффициенты k и b в уравнении y = kx + b; правда, пря
мые, параллельные оси у, не описываются такими уравнениями, но эти
особые случаи не могут сказаться при подсчете числа степеней свободы.
Число степеней свободы бесконечной прямой в плоскости оказа
лось равным числу степеней свободы точки на плоскости. Таким обра
зом, прямые на плоскости можно сопоставить точкам на этой или
другой плоскости. Наиболее удобно это сделать так: последнее уравне
ние разделить на b и записать его в виде
αx + βy = 1,

ОТВЕТЫ И РЕШЕНИЯ

[Гл. IV

плоскости, после чего указанное соответствие уже не имеет исключе
ний. Мы не будем здесь останавливаться на этом.
Упражнение
Сколько степеней свободы имеет при движении в пространстве:
а) отрезок данной длины?
б) треугольник с заданными сторонами, т.е. «жесткий» треугольник?
в) абсолютно твердое тело с закрепленной точкой?
г) свободное абсолютно твердое тело?

(43)

после чего прямой с этим уравнением сопоставить точку с координата
ми (α; β). При этом естественно рассмотреть две плоскости: с координа
тами х, у и с координатами α, β (рис. 41). Так, прямой (l )y = 2x + 1,

Рис. 41.

т.е. −2x + y = 1, отвечает точка L ′ плоскости α, β с координатами
(–2; 1). Эта же формула (43) сопоставляет точке (х; у) первой плоскос
ти прямую с уравнением (43) второй плоскости; например, точке
М(2; –1) отвечает прямая (m ′) с уравнением 2α − β = 1, точке N(1; 3) —
прямая (n ′) с уравнением α + 3β = 1 (см. рис. 41). Нетрудно доказать
и в общем виде, что если в первой плоскости некоторая прямая (l ) про
ходит через какуюто точку N, то во второй плоскости прямая (n ′), со
ответствующая точке N, пройдет через точку L ′, отвечающую прямой
(l ). Тем самым из любого утверждения, относящегося к произвольной
комбинации точек и прямых на плоскости, вытекает «двойственное»
утверждение, в котором прямые заменены точками, а точки—прямыми.
Имеется специальная область геометрии — так называемая «проектив
ная» геометрия, в которой детально изучаются подобные утверждения,
а также и соотношение двойственности. Следует заметить, что уравне
ния прямых, проходящих через начало координат, нельзя записать
в виде (43), т.е. таким прямым не соответствуют при указанном способе
соответствия никакие точки, а самому началу координат не соотве
тствует никакая прямая. Поэтому в проективной геометрии вводятся
«бесконечно удаленные точки» и «бесконечно удаленная прямая»

143

ОТВЕТЫ И РЕШЕНИЯ
§ 1
∂z
1.
∂x
∂z
2.
∂x
∂z
3.
∂x
∂z
4.
∂x
∂z
5.
∂x
∂z
6.
∂x

∂z
∂z
= 1.
x =1 = 2;
x =1
∂x y =1
∂y y = 0 , 5
2
2
2
2
∂z
= −2 xe − ( x + y ) ,
= −2 ye − ( x + y ) .
∂y
∂z
= e y + ye x ,
= xe y + e x .
∂y
∂z
= sin y,
= x cos y.
∂y
∂z
= y cos ( xy ),
= x cos ( xy ).
∂y
x
∂z
y
,
.
=
=
2
2
2
x + y ∂y
x + y2
= 2 x, поэтому

dz ∂z dx ∂z dy
dx
dy
dx
1 dy
=

+

= 2x
− 2 y . Замечая, что
=1+
=1− 2 ,
dt ∂x dt ∂y dt
dt
dt
dt
dt
t
1
dz
1 
1
1 

2


, находим
+
= 2  t +  1 − 2  − 2( t + t ) 1 +
 = −  3 + 3 t + 1 .
t







dt
t
t
2 t
2 t
dz
8.
= e x − y ⋅ (cos t − 2 t ).
dt
dz
9.
= 6( x 2 + y 2 )t − 6 xye − t .
dt
dz 1 + 2 xe y
10.
.
=
dx
x + ey
7.

§2
1. Семейство прямых, проходящих через начало координат.
2. z = x 2 − c 2 , семейство парабол (рис. 42).
3. Семейство гипербол, расположенных в верхней полуплоскости
(рис. 43).
4. Семейство гипербол (рис. 33).

142

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

например, коэффициенты k и b в уравнении y = kx + b; правда, пря
мые, параллельные оси у, не описываются такими уравнениями, но эти
особые случаи не могут сказаться при подсчете числа степеней свободы.
Число степеней свободы бесконечной прямой в плоскости оказа
лось равным числу степеней свободы точки на плоскости. Таким обра
зом, прямые на плоскости можно сопоставить точкам на этой или
другой плоскости. Наиболее удобно это сделать так: последнее уравне
ние разделить на b и записать его в виде
αx + βy = 1,

ОТВЕТЫ И РЕШЕНИЯ

[Гл. IV

плоскости, после чего указанное соответствие уже не имеет исключе
ний. Мы не будем здесь останавливаться на этом.
Упражнение
Сколько степеней свободы имеет при движении в пространстве:
а) отрезок данной длины?
б) треугольник с заданными сторонами, т.е. «жесткий» треугольник?
в) абсолютно твердое тело с закрепленной точкой?
г) свободное абсолютно твердое тело?

(43)

после чего прямой с этим уравнением сопоставить точку с координата
ми (α; β). При этом естественно рассмотреть две плоскости: с координа
тами х, у и с координатами α, β (рис. 41). Так, прямой (l )y = 2x + 1,

Рис. 41.

т.е. −2x + y = 1, отвечает точка L ′ плоскости α, β с координатами
(–2; 1). Эта же формула (43) сопоставляет точке (х; у) первой плоскос
ти прямую с уравнением (43) второй плоскости; например, точке
М(2; –1) отвечает прямая (m ′) с уравнением 2α − β = 1, точке N(1; 3) —
прямая (n ′) с уравнением α + 3β = 1 (см. рис. 41). Нетрудно доказать
и в общем виде, что если в первой плоскости некоторая прямая (l ) про
ходит через какуюто точку N, то во второй плоскости прямая (n ′), со
ответствующая точке N, пройдет через точку L ′, отвечающую прямой
(l ). Тем самым из любого утверждения, относящегося к произвольной
комбинации точек и прямых на плоскости, вытекает «двойственное»
утверждение, в котором прямые заменены точками, а точки—прямыми.
Имеется специальная область геометрии — так называемая «проектив
ная» геометрия, в которой детально изучаются подобные утверждения,
а также и соотношение двойственности. Следует заметить, что уравне
ния прямых, проходящих через начало координат, нельзя записать
в виде (43), т.е. таким прямым не соответствуют при указанном способе
соответствия никакие точки, а самому началу координат не соотве
тствует никакая прямая. Поэтому в проективной геометрии вводятся
«бесконечно удаленные точки» и «бесконечно удаленная прямая»

143

ОТВЕТЫ И РЕШЕНИЯ
§ 1
∂z
1.
∂x
∂z
2.
∂x
∂z
3.
∂x
∂z
4.
∂x
∂z
5.
∂x
∂z
6.
∂x

∂z
∂z
= 1.
x =1 = 2;
x =1
∂x y =1
∂y y = 0 , 5
2
2
2
2
∂z
= −2 xe − ( x + y ) ,
= −2 ye − ( x + y ) .
∂y
∂z
= e y + ye x ,
= xe y + e x .
∂y
∂z
= sin y,
= x cos y.
∂y
∂z
= y cos ( xy ),
= x cos ( xy ).
∂y
x
∂z
y
,
.
=
=
2
2
2
x + y ∂y
x + y2
= 2 x, поэтому

dz ∂z dx ∂z dy
dx
dy
dx
1 dy
=

+

= 2x
− 2 y . Замечая, что
=1+
=1− 2 ,
dt ∂x dt ∂y dt
dt
dt
dt
dt
t
1
dz
1 
1
1 

2


, находим
+
= 2  t +  1 − 2  − 2( t + t ) 1 +
 = −  3 + 3 t + 1 .
t







dt
t
t
2 t
2 t
dz
8.
= e x − y ⋅ (cos t − 2 t ).
dt
dz
9.
= 6( x 2 + y 2 )t − 6 xye − t .
dt
dz 1 + 2 xe y
10.
.
=
dx
x + ey
7.

§2
1. Семейство прямых, проходящих через начало координат.
2. z = x 2 − c 2 , семейство парабол (рис. 42).
3. Семейство гипербол, расположенных в верхней полуплоскости
(рис. 43).
4. Семейство гипербол (рис. 33).

144

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

ОТВЕТЫ И РЕШЕНИЯ

145

§5
v 02
, то в интересующем нас случае l = 1020 м. Уравнение огибаюC
g
x2
щей имеет вид y = 510 −
(все величины выражены в метрах). При x = 500 м
2040
находим у = 390 м. Следовательно, цель на высоте 300 м поразить можно, а на
высоте 500 м нельзя.
Так как l =

Рис. 43.

Рис. 42.
§ 3
1. а)

dy (2 t + 1) dt
=
= 4 t + 2,
1
dx
dt
2

d 2 y d ⎛ dy ⎞ d (4 t + 2 )
=
=
⎜ ⎟=
dx
dx 2 dx ⎝ dx ⎠

§6
Функция имеет: а) минимум в точке х = 0, у = –2; б) минимакс в точке
2
4
x = , y = − ; в) минимакс в точке х = 0, у = 0, z = 1.
3
9
§7
1

d (4 t + 2 ) dt
dt
=

=4 .
dt
dx
dx

dx 1
dt
d 2y
= , поэтому
= 2, так что
= 8.
dt 2
dx
dx 2
dy
d 2y
1
.
б)
= −ctg t,
=
dx
dx 2 6 sin 4 t cos t

1.



0

π

1

0

0

dx ∫ x sin xy dx = ∫ dx ( − cos xy )

dy
d 2y
1
.
= tg t,
=
dx
dx 2 t cos3 t
1
dy 2 cos 2 t
; значение t, соответствующее значению x = , получается
2.
=
cos t
dx
2
1
2⋅
π dy
1
2 = 2 . Другое значение
из уравнения = sin t. Отсюда t = ;
1 =
6 dx x = 2
2
3 2
3
2
π
dy
дает
=− .
t =π −
dx
6
3
∂x
1
∂x
3 y2 + x
3.
,
. Полагая у = 0, z = 1 в формуле
= 2
=− 2
∂y
∂z 3 x + y
3x + y
y = x 3 + y 3 + xy, получим x 3 = 1, откуда x = 1. Поэтому
∂x
∂z

y =0
z =1

1
= ,
3

∂x
∂y

y =0
z =1

1
=− .
3

6.

∂x
2 xy + 5 y 4
.
=−
∂y
5x 4 + y2

dy 2 xy 2 − y 4 − 4 x 3 y
.
=
dx x 4 + 4 xy 3 − 2 x 2 y

§4
S = 4,5 мА/в; R = 6,7 кОм; μ = 30.

=

1

1

0

0

= 1.

Отметим, что при интегрировании в другом порядке (сначала по х, потом
по у) пришлось бы применить интегрирование по частям.
2. Так как площадь квадрата равна 1, то
1
1
1
⎛ e xy ⎞
u = ∫ dx ∫ e xy dy = ∫ dx ⎜

⎝ x ⎠
0
0
0

1
y =0

1

=∫

0

ex − 1
dx =
x

1

⎛ 1 x x2 x3

1⎛
x4
x x
x
x
x5
= ∫ ⎜1 + +
+
+
+
+ ... − 1⎟ dx = ∫ ⎜ + +
+
+
+ ... ⎟ dx =
1
x
1
2
6
24
120
2
6
24
120




0
0
1
1
1
1
=1+
+
+
+
+ ... = 1318
, .
2 ⋅ 2 3 ⋅ 6 4 ⋅ 24 5 ⋅ 120
3. Во внутреннем интеграле интегрирование по у проводится от у = х до
у = 1; поэтому весь двойной интеграл распространен по треугольнику, показанC
ному на рис. 44. Меняя порядок интегрирования, получим
1

2

1

I = ∫ dy
0

3

4

y

∫e

y2

dx =

0

1

∂x
1
4.
,
=
∂z 5 x 4 + y 2
dy 2 − x
.
5.
=
dx y − 5

y =0

sin πx ⎞

= ∫ (1 − cos πx ) dx = ⎜ x −


π ⎠

Заметим, что

в)

π

2

= ∫ e y y dy =
0

ey
2

2

1
0

=

e −1
= 0,859.
2

Интересно, что в данном примере интегрирование
в исходном порядке нельзя было выполнить с поC
мощью элементарных функций, а после перемены
порядка интегрирование совершенно элементарно.
§8
а) 5; б) 6; в) 3; г) 6.

Рис. 44.

144

ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ

[Гл. IV

ОТВЕТЫ И РЕШЕНИЯ

145

§5
v 02
, то в интересующем нас случае l = 1020 м. Уравнение огибаюC
g
x2
щей имеет вид y = 510 −
(все величины выражены в метрах). При x = 500 м
2040
находим у = 390 м. Следовательно, цель на высоте 300 м поразить можно, а на
высоте 500 м нельзя.
Так как l =

Рис. 43.

Рис. 42.
§ 3
1. а)

dy (2 t + 1) dt
=
= 4 t + 2,
1
dx
dt
2

d 2 y d ⎛ dy ⎞ d (4 t + 2 )
=
=
⎜ ⎟=
dx
dx 2 dx ⎝ dx ⎠

§6
Функция имеет: а) минимум в точке х = 0, у = –2; б) минимакс в точке
2
4
x = , y = − ; в) минимакс в точке х = 0, у = 0, z = 1.
3
9
§7
1

d (4 t + 2 ) dt
dt
=

=4 .
dt
dx
dx

dx 1
dt
d 2y
= , поэтому
= 2, так что
= 8.
dt 2
dx
dx 2
dy
d 2y
1
.
б)
= −ctg t,
=
dx
dx 2 6 sin 4 t cos t

1.



0

π

1

0

0

dx ∫ x sin xy dx = ∫ dx ( − cos xy )

dy
d 2y
1
.
= tg t,
=
dx
dx 2 t cos3 t
1
dy 2 cos 2 t
; значение t, соответствующее значению x = , получается
2.
=
cos t
dx
2
1
2⋅
π dy
1
2 = 2 . Другое значение
из уравнения = sin t. Отсюда t = ;
1 =
6 dx x = 2
2
3 2
3
2
π
dy
дает
=− .
t =π −
dx
6
3
∂x
1
∂x
3 y2 + x
3.
,
. Полагая у = 0, z = 1 в формуле
= 2
=− 2
∂y
∂z 3 x + y
3x + y
y = x 3 + y 3 + xy, получим x 3 = 1, откуда x = 1. Поэтому
∂x
∂z

y =0
z =1

1
= ,
3

∂x
∂y

y =0
z =1

1
=− .
3

6.

∂x
2 xy + 5 y 4
.
=−
∂y
5x 4 + y2

dy 2 xy 2 − y 4 − 4 x 3 y
.
=
dx x 4 + 4 xy 3 − 2 x 2 y

§4
S = 4,5 мА/в; R = 6,7 кОм; μ = 30.

=

1

1

0

0

= 1.

Отметим, что при интегрировании в другом порядке (сначала по х, потом
по у) пришлось бы применить интегрирование по частям.
2. Так как площадь квадрата равна 1, то
1
1
1
⎛ e xy ⎞
u = ∫ dx ∫ e xy dy = ∫ dx ⎜

⎝ x ⎠
0
0
0

1
y =0

1

=∫

0

ex − 1
dx =
x

1

⎛ 1 x x2 x3

1⎛
x4
x x
x
x
x5
= ∫ ⎜1 + +
+
+
+
+ ... − 1⎟ dx = ∫ ⎜ + +
+
+
+ ... ⎟ dx =
1
x
1
2
6
24
120
2
6
24
120




0
0
1
1
1
1
=1+
+
+
+
+ ... = 1318
, .
2 ⋅ 2 3 ⋅ 6 4 ⋅ 24 5 ⋅ 120
3. Во внутреннем интеграле интегрирование по у проводится от у = х до
у = 1; поэтому весь двойной интеграл распространен по треугольнику, показанC
ному на рис. 44. Меняя порядок интегрирования, получим
1

2

1

I = ∫ dy
0

3

4

y

∫e

y2

dx =

0

1

∂x
1
4.
,
=
∂z 5 x 4 + y 2
dy 2 − x
.
5.
=
dx y − 5

y =0

sin πx ⎞

= ∫ (1 − cos πx ) dx = ⎜ x −


π ⎠

Заметим, что

в)

π

2

= ∫ e y y dy =
0

ey
2

2

1
0

=

e −1
= 0,859.
2

Интересно, что в данном примере интегрирование
в исходном порядке нельзя было выполнить с поC
мощью элементарных функций, а после перемены
порядка интегрирование совершенно элементарно.
§8
а) 5; б) 6; в) 3; г) 6.

Рис. 44.

§ 1]

ГЛАВА V
ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
§ 1. Простейшие свойства комплексных чисел
В курсе алгебры вводится мнимая единица, которая обозначается
через i. Эта величина определяется условием i2 = −1.
Величины вида x + iy (где х и у вещественные числа) называют
ся комплексными числами. Они получаются прежде всего при решении
алгебраических уравнений: уже сама мнимая единица, очевидно, есть
корень квадратного уравнения x 2 = −1.
Если говорить только о вещественных корнях, то квадратное урав
нение в зависимости от его коэффициентов либо имеет два корня, либо
не имеет ни одного. Если же рассматривать все корни, вещественные
и мнимые, то квадратное уравнение имеет всегда два корня. Точно так
же уравнение третьей степени имеет всегда три корня и т.д. Таким об
разом, рассмотрение комплексных чисел позволяет установить общую
теорему о числе корней алгебраического уравнения. При этом мы про
изводим алгебраические действия с комплексными величинами. Рас
сматривая более сложные функции комплексных величин (например,
возведение в комплексную степень), удается получить много важных
и красивых результатов. Целый ряд соотношений между вещественны
ми величинами удобно получать, используя по пути комплексные ве
личины*. Именно поэтому комплексные величины так важны для
физики и других естественных наук, несмотря на то, что любое измере
ние, результат любого опыта выражаются вещественным числом.
Напомним некоторые свойства комплексных чисел, известные из
курса алгебры.
Комплексное число z = x + iy можно изображать точкой на плос
кости (рис. 45). При этом по оси абсцисс откладывают величи
ну х (т.е. вещественную часть), а по оси ординат — величину у (она
называется мнимой частью числа z; иногда мнимой частью числа z на
зывают все произведение iy, что может показаться более естествен
ным, однако оказывается, что удобнее придерживаться именно данного
* Знаменитый французский математик Ж. Адамар (1865–1963) сказал: «Наиболее
короткий и наилучший путь между двумя истинами в вещественной области часто про
ходит через мнимую область».

ПРОСТЕЙШИЕ СВОЙСТВА КОМПЛЕКСНЫХ ЧИСЕЛ

147

выше определения.) Каждому z отвечает
определенная точка плоскости. Вместо того
чтобы говорить о точке z, можно говорить о
векторе* z, т.е. о направленном отрезке, нача
ло которого совпадает с началом координат,
а конец — с точкой z. Положение точки на
плоскости можно характеризовать ее расстоя
Рис. 45.
нием от начала координат r и углом ϕ между
вектором z и осью х, т.е. можно говорить о
длине вектора z (она называется модулем комплексного числа и об
означается z ) и о направлении вектора z, которое характеризуется
углом ϕ. Угол ϕ называется аргументом комплексного числа. Он от
считывается от положительной части оси х против часовой стрелки.
Для вещественного положительного числа ϕ = 0, для чисто мнимого
π

(например, для чис
числа ϕ = (например, для числа 2i) или ϕ =
2
2
ла –2i).
Как видно из рис. 45, x = r cosϕ, y = r sinϕ, так что можно выразить
z через r и ϕ:
z = x + iy = r (cos ϕ + i sin ϕ ).

Запись z = r (cos ϕ + i sin ϕ) называется тригонометрической формой
комплексного числа. Отметим еще, что, зная х и у, нетрудно (см.
рис. 45) найти r и ϕ по формулам
r=

x2 + y2 ,

sin ϕ =

y
2

x +y

2

,

cos ϕ =

x
2

x + y2

.

Алгебраические действия с комплексными числами производятся
по обычным правилам алгебры с учетом соотношения i2 = −1. Полезно
остановиться на геометрической картине алгебраических действий.
При сложении двух чисел z 1 = x 1 + iy 1 и z 2 = x 2 + iy 2 :
z = z1 + z 2 == ( x1 + x2 ) + i ( y1 + y2 ).

Легко убедиться, что на плоскости число z изображается векто
ром, который получается из векторов z1 и z2 путем сложения по пра
вилу параллелограмма, т.е. так же, как получается, например,
равнодействующая двух сил (рис. 46).
Произведение комплексного числа z на положительное вещест
венное число k, z 1 = kz , представляет собой вектор, направленный
туда же, куда направлен вектор z, но его модуль (длина) равен kr,
* Подробно теория векторов будет излагаться в гл. IX. Здесь нам достаточны про
стейшие сведения о них, известные из школьного курса физики.

§ 1]

ГЛАВА V
ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО
§ 1. Простейшие свойства комплексных чисел
В курсе алгебры вводится мнимая единица, которая обозначается
через i. Эта величина определяется условием i2 = −1.
Величины вида x + iy (где х и у вещественные числа) называют
ся комплексными числами. Они получаются прежде всего при решении
алгебраических уравнений: уже сама мнимая единица, очевидно, есть
корень квадратного уравнения x 2 = −1.
Если говорить только о вещественных корнях, то квадратное урав
нение в зависимости от его коэффициентов либо имеет два корня, либо
не имеет ни одного. Если же рассматривать все корни, вещественные
и мнимые, то квадратное уравнение имеет всегда два корня. Точно так
же уравнение третьей степени имеет всегда три корня и т.д. Таким об
разом, рассмотрение комплексных чисел позволяет установить общую
теорему о числе корней алгебраического уравнения. При этом мы про
изводим алгебраические действия с комплексными величинами. Рас
сматривая более сложные функции комплексных величин (например,
возведение в комплексную степень), удается получить много важных
и красивых результатов. Целый ряд соотношений между вещественны
ми величинами удобно получать, используя по пути комплексные ве
личины*. Именно поэтому комплексные величины так важны для
физики и других естественных наук, несмотря на то, что любое измере
ние, результат любого опыта выражаются вещественным числом.
Напомним некоторые свойства комплексных чисел, известные из
курса алгебры.
Комплексное число z = x + iy можно изображать точкой на плос
кости (рис. 45). При этом по оси абсцисс откладывают величи
ну х (т.е. вещественную часть), а по оси ординат — величину у (она
называется мнимой частью числа z; иногда мнимой частью числа z на
зывают все произведение iy, что может показаться более естествен
ным, однако оказывается, что удобнее придерживаться именно данного
* Знаменитый французский математик Ж. Адамар (1865–1963) сказал: «Наиболее
короткий и наилучший путь между двумя истинами в вещественной области часто про
ходит через мнимую область».

ПРОСТЕЙШИЕ СВОЙСТВА КОМПЛЕКСНЫХ ЧИСЕЛ

147

выше определения.) Каждому z отвечает
определенная точка плоскости. Вместо того
чтобы говорить о точке z, можно говорить о
векторе* z, т.е. о направленном отрезке, нача
ло которого совпадает с началом координат,
а конец — с точкой z. Положение точки на
плоскости можно характеризовать ее расстоя
Рис. 45.
нием от начала координат r и углом ϕ между
вектором z и осью х, т.е. можно говорить о
длине вектора z (она называется модулем комплексного числа и об
означается z ) и о направлении вектора z, которое характеризуется
углом ϕ. Угол ϕ называется аргументом комплексного числа. Он от
считывается от положительной части оси х против часовой стрелки.
Для вещественного положительного числа ϕ = 0, для чисто мнимого
π

(например, для чис
числа ϕ = (например, для числа 2i) или ϕ =
2
2
ла –2i).
Как видно из рис. 45, x = r cosϕ, y = r sinϕ, так что можно выразить
z через r и ϕ:
z = x + iy = r (cos ϕ + i sin ϕ ).

Запись z = r (cos ϕ + i sin ϕ) называется тригонометрической формой
комплексного числа. Отметим еще, что, зная х и у, нетрудно (см.
рис. 45) найти r и ϕ по формулам
r=

x2 + y2 ,

sin ϕ =

y
2

x +y

2

,

cos ϕ =

x
2

x + y2

.

Алгебраические действия с комплексными числами производятся
по обычным правилам алгебры с учетом соотношения i2 = −1. Полезно
остановиться на геометрической картине алгебраических действий.
При сложении двух чисел z 1 = x 1 + iy 1 и z 2 = x 2 + iy 2 :
z = z1 + z 2 == ( x1 + x2 ) + i ( y1 + y2 ).

Легко убедиться, что на плоскости число z изображается векто
ром, который получается из векторов z1 и z2 путем сложения по пра
вилу параллелограмма, т.е. так же, как получается, например,
равнодействующая двух сил (рис. 46).
Произведение комплексного числа z на положительное вещест
венное число k, z 1 = kz , представляет собой вектор, направленный
туда же, куда направлен вектор z, но его модуль (длина) равен kr,
* Подробно теория векторов будет излагаться в гл. IX. Здесь нам достаточны про
стейшие сведения о них, известные из школьного курса физики.

148

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 2]

СОПРЯЖЕННЫЕ КОМПЛЕКСНЫЕ ЧИСЛА

149

§ 2. Сопряженные комплексные числа

Рис. 47.

Рис. 46.

Два комплексных числа, отличающихся только знаком мнимой час
ти, называются сопряженными. Будем число, сопряженное к комплек
сному числу z, обозначать через z*. Тогда если z = x + iy, то z * = x − iy.
В частности, для вещественных чисел и только для них справедливо со
отношение A* = A, так как в этом случае мнимая часть равна нулю. Для
чисто мнимых чисел (т.е. чисел с равной нулю вещественной частью)
и только для них справедливо соотношение A* = − A.
Пусть даны два комплексных числа z 1 = x 1 + iy 1 и z 2 = x 2 + iy 2 .
Сложив их, мы получим
z1 + z 2 == ( x1 + x2 ) + i ( y1 + y2 ).

где r — модуль числа z. Если же k — отрицательное вещественное чис
ло, то вектор kz имеет модуль k r, но направлен противоположно век
тору z. Легко построить также произведение z1 комплексного числа
z = x 1 + iy на мнимую единицу i. Именно, z 1 = i (x + iy) = − y + ix. Из
чертежа (рис. 47, где мы для наглядности вместо х, у употребили соот
ветственно буквы а, b) легко убедиться, что вектор z1 перпендикуля
рен вектору z. Он повернут относительно вектора z на прямой угол
в направлении против часовой стрелки. Модуль z1 равен модулю z.
Произведение комплексных чисел находится по простой формуле
( x1 + iy1 )( x2 + iy2 ) = x1 x2 + x1iy2 + iy1 x2 + i 2 y1 y2 =

Образуем теперь сумму сопряженных чисел
z1* + z*2 == ( x1 + x2 ) − i ( y1 + y2 ).

Мы получили комплексное число, являющееся сопряженным по отно
шению к сумме z 1 + z 2 .
Таким образом, если z 1 + z 2 = w, то z 1* + z 2* == w *, т.е. если слагае
мые в сумме заменить на сопряженные, то и сумма заменится на сопря
женную.
Покажем, что аналогичное свойство справедливо и для произведе
ния комплексных чисел, т.е.

= ( x1 x2 − y1 y2 ) + i ( x1 y2 + y1 x2 ).

В алгебре очень просто доказывают (проделайте это!), используя фор
мулы для синуса и косинуса суммы, что если
z1 = r1 (cos ϕ1 + i sin ϕ1 ),

z 2 = r2 (cos ϕ 2 + i sin ϕ 2 ),

то
z = z1 z 2 = r1 r2 [cos (ϕ1 + ϕ 2 ) + i sin (ϕ1 + ϕ 2 )],

так что при перемножении комплексных чисел их модули перемножа
ются, а аргументы складываются. Мы получим этот результат другим
путем в § 3.
Отметим в заключение, что комплексные числа нельзя соединять
друг с другом знаком неравенства: одно комплексное число не может
быть больше или меньше другого. Могло бы показаться естественным
считать z 1 > z 2 , если z 1 > z 2 , т.е. сравнивать комплексные числа по
их модулям. Но тогда бы пришлось считать, например, −3 > −1, т.е. мы
вступили бы в противоречие со сравнением вещественных чисел.
Упражнение
Запишите в тригонометрической форме числа I − i; 3 + 4i; −2i; −3; 1; 0.

если

z 1 z 2 = w,

то

z 1* z 2* = w *.

(1)

Действительно,
z1 z 2 = ( x1 + iy1 )( x2 + iy2 ) = ( x1 x2 − y1 y2 ) + i( x1 y2 + x2 y1 ),
z1* z*2 = ( x1 − iy1 )( x2 − iy2 ) = ( x1 x2 − y1 y2 ) − i( x1 y2 + x2 y1 ),

Сравнивая два последних равенства, мы убеждаемся в справедли
вости (1).
Полагая в (1) z 1 = z 2 , получим, что если z 12 = w, то ( z 1* )2 = w *, т.е.
при возведении в квадрат сопряженных чисел результаты также полу
чаются сопряженными. Ясно, что это справедливо для любых целых
положительных степеней. В самом деле, пусть, например, z 3 = w. За
пишем это так: z 2 z = w. Согласно (1) отсюда следует, что
( z 2 )* z * = w *, но ( z 2 )* = ( z *)2 , так что ( z *) 3 = w *. Итак, из равенства
z 3 = w следует ( z *) 3 = w *.
z
z*
Нетрудно установить, что если 1 = w, то 1 = w * (см. упражне
z2
z*
2

ние 1). Объединяя все эти результаты, мы получаем следующее общее
положение.

148

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 2]

СОПРЯЖЕННЫЕ КОМПЛЕКСНЫЕ ЧИСЛА

149

§ 2. Сопряженные комплексные числа

Рис. 47.

Рис. 46.

Два комплексных числа, отличающихся только знаком мнимой час
ти, называются сопряженными. Будем число, сопряженное к комплек
сному числу z, обозначать через z*. Тогда если z = x + iy, то z * = x − iy.
В частности, для вещественных чисел и только для них справедливо со
отношение A* = A, так как в этом случае мнимая часть равна нулю. Для
чисто мнимых чисел (т.е. чисел с равной нулю вещественной частью)
и только для них справедливо соотношение A* = − A.
Пусть даны два комплексных числа z 1 = x 1 + iy 1 и z 2 = x 2 + iy 2 .
Сложив их, мы получим
z1 + z 2 == ( x1 + x2 ) + i ( y1 + y2 ).

где r — модуль числа z. Если же k — отрицательное вещественное чис
ло, то вектор kz имеет модуль k r, но направлен противоположно век
тору z. Легко построить также произведение z1 комплексного числа
z = x 1 + iy на мнимую единицу i. Именно, z 1 = i (x + iy) = − y + ix. Из
чертежа (рис. 47, где мы для наглядности вместо х, у употребили соот
ветственно буквы а, b) легко убедиться, что вектор z1 перпендикуля
рен вектору z. Он повернут относительно вектора z на прямой угол
в направлении против часовой стрелки. Модуль z1 равен модулю z.
Произведение комплексных чисел находится по простой формуле
( x1 + iy1 )( x2 + iy2 ) = x1 x2 + x1iy2 + iy1 x2 + i 2 y1 y2 =

Образуем теперь сумму сопряженных чисел
z1* + z*2 == ( x1 + x2 ) − i ( y1 + y2 ).

Мы получили комплексное число, являющееся сопряженным по отно
шению к сумме z 1 + z 2 .
Таким образом, если z 1 + z 2 = w, то z 1* + z 2* == w *, т.е. если слагае
мые в сумме заменить на сопряженные, то и сумма заменится на сопря
женную.
Покажем, что аналогичное свойство справедливо и для произведе
ния комплексных чисел, т.е.

= ( x1 x2 − y1 y2 ) + i ( x1 y2 + y1 x2 ).

В алгебре очень просто доказывают (проделайте это!), используя фор
мулы для синуса и косинуса суммы, что если
z1 = r1 (cos ϕ1 + i sin ϕ1 ),

z 2 = r2 (cos ϕ 2 + i sin ϕ 2 ),

то
z = z1 z 2 = r1 r2 [cos (ϕ1 + ϕ 2 ) + i sin (ϕ1 + ϕ 2 )],

так что при перемножении комплексных чисел их модули перемножа
ются, а аргументы складываются. Мы получим этот результат другим
путем в § 3.
Отметим в заключение, что комплексные числа нельзя соединять
друг с другом знаком неравенства: одно комплексное число не может
быть больше или меньше другого. Могло бы показаться естественным
считать z 1 > z 2 , если z 1 > z 2 , т.е. сравнивать комплексные числа по
их модулям. Но тогда бы пришлось считать, например, −3 > −1, т.е. мы
вступили бы в противоречие со сравнением вещественных чисел.
Упражнение
Запишите в тригонометрической форме числа I − i; 3 + 4i; −2i; −3; 1; 0.

если

z 1 z 2 = w,

то

z 1* z 2* = w *.

(1)

Действительно,
z1 z 2 = ( x1 + iy1 )( x2 + iy2 ) = ( x1 x2 − y1 y2 ) + i( x1 y2 + x2 y1 ),
z1* z*2 = ( x1 − iy1 )( x2 − iy2 ) = ( x1 x2 − y1 y2 ) − i( x1 y2 + x2 y1 ),

Сравнивая два последних равенства, мы убеждаемся в справедли
вости (1).
Полагая в (1) z 1 = z 2 , получим, что если z 12 = w, то ( z 1* )2 = w *, т.е.
при возведении в квадрат сопряженных чисел результаты также полу
чаются сопряженными. Ясно, что это справедливо для любых целых
положительных степеней. В самом деле, пусть, например, z 3 = w. За
пишем это так: z 2 z = w. Согласно (1) отсюда следует, что
( z 2 )* z * = w *, но ( z 2 )* = ( z *)2 , так что ( z *) 3 = w *. Итак, из равенства
z 3 = w следует ( z *) 3 = w *.
z
z*
Нетрудно установить, что если 1 = w, то 1 = w * (см. упражне
z2
z*
2

ние 1). Объединяя все эти результаты, мы получаем следующее общее
положение.

150

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

Пусть над комплексными числами z1, z2, ..., zn произведено неко
торое число арифметических действий (сложений, умножений, деле
ний, возведений в целую степень), пðичем результат оказался равным
w. Тогда если эти же действия (и в этом же порядке) произвести над
числами z 1* , z 2* , ..., z *n , то результат будет равен w *. Другими слова
ми, если в равенстве, содержащем комплексные числа, все комплек
сные числа заменить сопряженными, то опять получим верное
равенство. Можно показать, что это правило остается справедливым и
для неарифметических действий (извлечение корня, логарифмирова
ние и т.д.). Отсюда следует, что любое соотношение между комплек
сными числами остается справедливым, если мы всюду в нем заменим i
на −i, так как при этом мы просто переходим от равенства комплексных
чисел к равенству сопряженных комплексных чисел. Таким образом,
числа i и −i, по существу, неразличимы*. (Впрочем, сказанное, ко
нечно, не означает, что 2 + 3i = 2 − 3i!)
Рассмотрим квадратное уравнение с вещественными коэффициентами
az 2 + bz + c = 0.

(2)

Пусть z 0 = x 0 + iy 0 — корень этого уравнения. Тогда
az 02 + bz 0 + c = 0.

Заменяя в этом равенстве все числа на сопряженные и вспоминая, что
а* = а, b* = b, с* = с, так как а, b, с — вещественные числа, получим
2
a ( z*)
+ bz*0 + c = 0* = 0,
0

т.е. z *0 также есть корень этого квадратного уравнения. Следовательно,
если квадратное уравнение с вещественными коэффициентами имеет
мнимые (т.е. невещественные**) корни, то эти корни — сопряженные
комплексные числа. Этот факт, впрочем, сразу же следует из формулы
для корней квадратного уравнения. Уравнение (2) имеет корни
z1 ,2 =

−b ± b 2 − 4 ac
.
2a

Корни получаются мнимые, если b2 − 4ac < 0, причем
z1 = −

4 ac − b 2
b
,
+i
2a
2a

z2 = −

4 ac − b 2
b
,
−i
2a
2a

т.е. это — сопряженные комплексные числа.
* К этому результату можно придти прямо, если заметить, что (− i ) 2 = −1, как и
i 2 = −1: отсюда и следует, что − i и i имеют одинаковые свойства.
** Не следует путать понятия мнимый (т.е. невещественный) и чисто мнимый (т.е.
с равной нулю вещественной частью).

§ 2]

СОПРЯЖЕННЫЕ КОМПЛЕКСНЫЕ ЧИСЛА

151

Ценность изложенного здесь приема состоит в том, что он годится
не только для квадратного уравнения, но и для уравнения любой степе
ни. Действительно, пусть уравнение
a 0 z n + a1 z n −1 + ... + a n −1 z + a n = 0

(3)

с вещественными коэффициентами a 0 , a1 , ..., a n имеет мнимый ко
рень z 0 = x 0 + iy 0 . Тогда
a 0 z 0n + a1 z 0n −1 + ... + a n −1 z 0 + a n = 0.

Заменяя в этом равенстве все числа на сопряженные и учитывая,
что a *0 = a 0 , a1* = a1 , ..., a *n = a n , получим
n
n −1
a 0 ( z*)
+ a1 ( z*)
+ ... + a n −1 z*0 + a n = 0* = 0.
0
0

Поэтому z *0 = x 0 − iy 0 также есть корень уравнения (3). Следовательно,
у вещественного многочлена (т.е. многочлена с вещественными коэффи
циентами) мнимые корни могут встречаться только сопряженными пара
ми: если есть корень x 0 + iy 0 , то есть и корень x 0 − iy 0 .
Из сказанного, в частности, вытекает, что вещественный многочлен
может иметь лишь четное число мнимых корней. В высшей алгебре до
казывается, что многочлен степени n имеет ровно n корней. Поэто
му вещественный многочлен нечетной степени обязательно имеет хотя
бы один вещественный корень. (Докажите это иначе, рассмотрев пове
дение графика многочлена P(x) нечетной степени при больших x .)
Многочлен четной степени может и не иметь вещественных корней.
Из курса алгебры известно, что если уравнение (3) имеет кор
ни z 1 , z 2 , ..., z n , то многочлен, стоящий слева в (3), разлагается на
множители следующим образом:
a 0 z n + a1 z n −1 + ... + a n −1 z + a n = a 0 ( z − z1 )( z − z 2 ) ... ( z − z n ).

(4)

Поэтому если x 0 + iy 0 есть корень многочлена, то в разложение этого
многочлена на множители входит комплексный множитель
( z − x 0 − iy 0 ). Так как в этом случае многочлен также имеет корень
x 0 − iy 0 , то в его разложение входит множитель ( z − x 0 + iy 0 ). Чтобы
в записи (4) не иметь дела с мнимыми числами, эти два множителя
удобно объединить в один
( z − x0 − iy0 )( z − x0 + iy0 ) = z 2 − 2 x0 z + x02 + y02 .

Вместо двух множителей с мнимыми коэффициентами мы получаем один
множитель с вещественными коэффициентами, но со второй степенью пе
ременного z. Таким образом, из основной теоремы алгебры (правда, мы ее
не доказали, а приняли на веру) следует, что любой вещественный многоч
лен раскладывается на вещественные множители, содержащие перемен
ную z в первой и второй степенях — но не в более высокой степени.

150

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

Пусть над комплексными числами z1, z2, ..., zn произведено неко
торое число арифметических действий (сложений, умножений, деле
ний, возведений в целую степень), пðичем результат оказался равным
w. Тогда если эти же действия (и в этом же порядке) произвести над
числами z 1* , z 2* , ..., z *n , то результат будет равен w *. Другими слова
ми, если в равенстве, содержащем комплексные числа, все комплек
сные числа заменить сопряженными, то опять получим верное
равенство. Можно показать, что это правило остается справедливым и
для неарифметических действий (извлечение корня, логарифмирова
ние и т.д.). Отсюда следует, что любое соотношение между комплек
сными числами остается справедливым, если мы всюду в нем заменим i
на −i, так как при этом мы просто переходим от равенства комплексных
чисел к равенству сопряженных комплексных чисел. Таким образом,
числа i и −i, по существу, неразличимы*. (Впрочем, сказанное, ко
нечно, не означает, что 2 + 3i = 2 − 3i!)
Рассмотрим квадратное уравнение с вещественными коэффициентами
az 2 + bz + c = 0.

(2)

Пусть z 0 = x 0 + iy 0 — корень этого уравнения. Тогда
az 02 + bz 0 + c = 0.

Заменяя в этом равенстве все числа на сопряженные и вспоминая, что
а* = а, b* = b, с* = с, так как а, b, с — вещественные числа, получим
2
a ( z*)
+ bz*0 + c = 0* = 0,
0

т.е. z *0 также есть корень этого квадратного уравнения. Следовательно,
если квадратное уравнение с вещественными коэффициентами имеет
мнимые (т.е. невещественные**) корни, то эти корни — сопряженные
комплексные числа. Этот факт, впрочем, сразу же следует из формулы
для корней квадратного уравнения. Уравнение (2) имеет корни
z1 ,2 =

−b ± b 2 − 4 ac
.
2a

Корни получаются мнимые, если b2 − 4ac < 0, причем
z1 = −

4 ac − b 2
b
,
+i
2a
2a

z2 = −

4 ac − b 2
b
,
−i
2a
2a

т.е. это — сопряженные комплексные числа.
* К этому результату можно придти прямо, если заметить, что (− i ) 2 = −1, как и
i 2 = −1: отсюда и следует, что − i и i имеют одинаковые свойства.
** Не следует путать понятия мнимый (т.е. невещественный) и чисто мнимый (т.е.
с равной нулю вещественной частью).

§ 2]

СОПРЯЖЕННЫЕ КОМПЛЕКСНЫЕ ЧИСЛА

151

Ценность изложенного здесь приема состоит в том, что он годится
не только для квадратного уравнения, но и для уравнения любой степе
ни. Действительно, пусть уравнение
a 0 z n + a1 z n −1 + ... + a n −1 z + a n = 0

(3)

с вещественными коэффициентами a 0 , a1 , ..., a n имеет мнимый ко
рень z 0 = x 0 + iy 0 . Тогда
a 0 z 0n + a1 z 0n −1 + ... + a n −1 z 0 + a n = 0.

Заменяя в этом равенстве все числа на сопряженные и учитывая,
что a *0 = a 0 , a1* = a1 , ..., a *n = a n , получим
n
n −1
a 0 ( z*)
+ a1 ( z*)
+ ... + a n −1 z*0 + a n = 0* = 0.
0
0

Поэтому z *0 = x 0 − iy 0 также есть корень уравнения (3). Следовательно,
у вещественного многочлена (т.е. многочлена с вещественными коэффи
циентами) мнимые корни могут встречаться только сопряженными пара
ми: если есть корень x 0 + iy 0 , то есть и корень x 0 − iy 0 .
Из сказанного, в частности, вытекает, что вещественный многочлен
может иметь лишь четное число мнимых корней. В высшей алгебре до
казывается, что многочлен степени n имеет ровно n корней. Поэто
му вещественный многочлен нечетной степени обязательно имеет хотя
бы один вещественный корень. (Докажите это иначе, рассмотрев пове
дение графика многочлена P(x) нечетной степени при больших x .)
Многочлен четной степени может и не иметь вещественных корней.
Из курса алгебры известно, что если уравнение (3) имеет кор
ни z 1 , z 2 , ..., z n , то многочлен, стоящий слева в (3), разлагается на
множители следующим образом:
a 0 z n + a1 z n −1 + ... + a n −1 z + a n = a 0 ( z − z1 )( z − z 2 ) ... ( z − z n ).

(4)

Поэтому если x 0 + iy 0 есть корень многочлена, то в разложение этого
многочлена на множители входит комплексный множитель
( z − x 0 − iy 0 ). Так как в этом случае многочлен также имеет корень
x 0 − iy 0 , то в его разложение входит множитель ( z − x 0 + iy 0 ). Чтобы
в записи (4) не иметь дела с мнимыми числами, эти два множителя
удобно объединить в один
( z − x0 − iy0 )( z − x0 + iy0 ) = z 2 − 2 x0 z + x02 + y02 .

Вместо двух множителей с мнимыми коэффициентами мы получаем один
множитель с вещественными коэффициентами, но со второй степенью пе
ременного z. Таким образом, из основной теоремы алгебры (правда, мы ее
не доказали, а приняли на веру) следует, что любой вещественный многоч
лен раскладывается на вещественные множители, содержащие перемен
ную z в первой и второй степенях — но не в более высокой степени.

152

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

1. Покажите, что если

z1
= w, то
z2

= w *.
4

3

§ 3. Возведение в мнимую степень. Формула Эйлера
Перейдем к важнейшему вопросу о том, что означает возведение
в мнимую степень.
Как подойти к этому вопросу? Проследим, как в алгебре решался
более простой вопрос об отрицательных и дробных степенях. Непосре
дственно и наглядно дается только определение целых положительных
степеней:
a 2 = a ⋅ a,

153

de it
= ie it .
dt

2

2. Найдите все корни многочлена z − 6 z + 11 z − 2 z − 10, если известно,
что один из его корней равен 2 − i.
3. Покажите, что z ** = z.
4. Пусть z = x + iy. Найдите z ⋅ z *.

a1 = a,

ВОЗВЕДЕНИЕ В МНИМУЮ СТЕПЕНЬ. ФОРМУЛА ЭЙЛЕРА

Эти формулы и являются исходными для определения возведения
в мнимую степень:

Упражнения
z1*
z 2*

§ 3]

a 3 = a ⋅ a ⋅ a , ...,

dz
= iz . Соотношение между z и dz пока
dt
зано на рис. 48. Так как dz = iz dt, то, при вещественных t и dt, dz
перпендикулярно z. Значит, изменение z = e it при увеличении t на
величину dt геометрически сводится к повороту вектора z на угол
dϕ. Из рисунка видно, что так как dz перпендикулярно z, то dϕ рав
но отношению длины отрезка dz (равной r dt) к длине отрезка z
(равной r). Поэтому dϕ = dt. Конечно, при этом углы (ϕ, dϕ и т.д.)
должны быть выражены в естественных единицах, т. е. радианах, а не
градусах.
Положим e it = z (t), тогда

an = a ⋅ a ... a.
1424
3
n раз

На примере целых положительных степеней устанавливаются правила:
an
= a n − m (если n > m),
am

(a )
n

m

= a nm .

Далее считают, что эти правила остаются справедливыми для лю
бых показателей степени, а не только для целых и положительных.
Отсюда следует определение того, что собой представляют дробные и
n
1
 1
⋅ n
n
отрицательные степени. Например, из формулы  a  = a n
= a1 = a
 
 
следует, что

1
an

есть число, которое, будучи возведено в степень n,
1
есть n a . Точно так же получается a 0 = 1, a − n = n .
дает а, т.е.
a
Определить таким путем, что представляет собой a i , не удается.
Попробуем это сделать с помощью того, что мы знаем о производной
показательной функции, т.е. с помощью средств высшей математики.
Наиболее просто и удобно, без лишних коэффициентов, выглядят фор
мулы дифференцирования для e t , e kt :
1
an

de t
= et ,
dt

de kt
= ke kt *.
dt

* Именно условие, чтобы формулы имели такой простой вид, и определяет число е
(см., например, BM, § II.8).

Рис. 49.

Рис. 48.

При t = 0 будет e it

t=0

= e 0 = 1, т.е. z(0) есть горизонтальный век

тор, длина которого равна единице. Поскольку изменению t на dt
соответствует поворот вектора z на dϕ = dt, то изменению t от 0 до
данного значения t1 соответствует поворот на угол ϕ = t.
Таким образом, z = e iϕ есть вектор, получающийся из z(0) = 1 по
воротом на угол ϕ. Положим z = e iϕ = x + iy. Из рис. 49 ясно, что
x = 1⋅ cos ϕ = cos ϕ, y = 1⋅ sin ϕ = sin ϕ. Поэтому
e iϕ = cos ϕ + i sin ϕ.

Это — формула Эйлера. Легко проверить, что при этом

(5)

d
(e iϕ ) = ie iϕ .


Действительно,
d
d
d
( e iϕ ) =
(cos ϕ ) + i (sin ϕ ) = − sin ϕ + i cos ϕ =



= ii sin ϕ + i cos ϕ = i ( cos ϕ + i sin ϕ) = ie iϕ .

152

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

1. Покажите, что если

z1
= w, то
z2

= w *.
4

3

§ 3. Возведение в мнимую степень. Формула Эйлера
Перейдем к важнейшему вопросу о том, что означает возведение
в мнимую степень.
Как подойти к этому вопросу? Проследим, как в алгебре решался
более простой вопрос об отрицательных и дробных степенях. Непосре
дственно и наглядно дается только определение целых положительных
степеней:
a 2 = a ⋅ a,

153

de it
= ie it .
dt

2

2. Найдите все корни многочлена z − 6 z + 11 z − 2 z − 10, если известно,
что один из его корней равен 2 − i.
3. Покажите, что z ** = z.
4. Пусть z = x + iy. Найдите z ⋅ z *.

a1 = a,

ВОЗВЕДЕНИЕ В МНИМУЮ СТЕПЕНЬ. ФОРМУЛА ЭЙЛЕРА

Эти формулы и являются исходными для определения возведения
в мнимую степень:

Упражнения
z1*
z 2*

§ 3]

a 3 = a ⋅ a ⋅ a , ...,

dz
= iz . Соотношение между z и dz пока
dt
зано на рис. 48. Так как dz = iz dt, то, при вещественных t и dt, dz
перпендикулярно z. Значит, изменение z = e it при увеличении t на
величину dt геометрически сводится к повороту вектора z на угол
dϕ. Из рисунка видно, что так как dz перпендикулярно z, то dϕ рав
но отношению длины отрезка dz (равной r dt) к длине отрезка z
(равной r). Поэтому dϕ = dt. Конечно, при этом углы (ϕ, dϕ и т.д.)
должны быть выражены в естественных единицах, т. е. радианах, а не
градусах.
Положим e it = z (t), тогда

an = a ⋅ a ... a.
1424
3
n раз

На примере целых положительных степеней устанавливаются правила:
an
= a n − m (если n > m),
am

(a )
n

m

= a nm .

Далее считают, что эти правила остаются справедливыми для лю
быхпоказателей степени, а не только для целых и положительных.
Отсюда следует определение того, что собой представляют дробные и
n
1
 1
⋅ n
n
отрицательные степени. Например, из формулы  a  = a n
= a1 = a
 
 
следует, что

1
an

есть число, которое, будучи возведено в степень n,
1
есть n a . Точно так же получается a 0 = 1, a − n = n .
дает а, т.е.
a
Определить таким путем, что представляет собой a i , не удается.
Попробуем это сделать с помощью того, что мы знаем о производной
показательной функции, т.е. с помощью средств высшей математики.
Наиболее просто и удобно, без лишних коэффициентов, выглядят фор
мулы дифференцирования для e t , e kt :
1
an

de t
= et ,
dt

de kt
= ke kt *.
dt

* Именно условие, чтобы формулы имели такой простой вид, и определяет число е
(см., например, BM, § II.8).

Рис. 49.

Рис. 48.

При t = 0 будет e it

t=0

= e 0 = 1, т.е. z(0) есть горизонтальный век

тор, длина которого равна единице. Поскольку изменению t на dt
соответствует поворот вектора z на dϕ = dt, то изменению t от 0 до
данного значения t1 соответствует поворот на угол ϕ = t.
Таким образом, z = e iϕ есть вектор, получающийся из z(0) = 1 по
воротом на угол ϕ. Положим z = e iϕ = x + iy. Из рис. 49 ясно, что
x = 1⋅ cos ϕ = cos ϕ, y = 1⋅ sin ϕ = sin ϕ. Поэтому
e iϕ = cos ϕ + i sin ϕ.

Это — формула Эйлера. Легко проверить, что при этом

(5)

d
(e iϕ ) = ie iϕ .


Действительно,
d
d
d
( e iϕ ) =
(cos ϕ ) + i (sin ϕ ) = − sin ϕ + i cos ϕ =



= ii sin ϕ + i cos ϕ = i ( cos ϕ + i sin ϕ) = ie iϕ .

154

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

Формула Эйлера была получена другим способом в ВМ, § II.18, на
основе разложения ее левой и правой частей в ряд Тейлора. Но само
определение функций e t , e kt в ВМ было основано на выражении
производной от экспоненциальной функции; значит в принципе оба
доказательства имеют одну и ту же основу.
С помощью формулы Эйлера произвольное комплексное чис
ло z с модулем r и аргументом ϕ можно записать так:
z = r (cos ϕ + i sin ϕ) = re iϕ .

Запись z = re iϕ называется показательной формой комплексного числа.
При этом правило сложения аргументов при умножении комплексных
чисел становится простым следствием сложения показателей при умно
жении степеней. В самом деле, пусть z 1 = r1 e iϕ 1 , z 2 = r2 e iϕ 2 . Тогда

§ 3]

ВОЗВЕДЕНИЕ В МНИМУЮ СТЕПЕНЬ. ФОРМУЛА ЭЙЛЕРА

(Мы выполнили возведение в степень по формуле бинома Ньютона.)
Сравнивая вещественные и мнимые части, находим
cos 5ϕ = cos5ϕ − 10 cos3ϕ sin 2 ϕ + 5 cosϕ sin 4 ϕ,
sin 5ϕ = sin 5 ϕ − 10 sin 3 ϕ cos2ϕ + 5 sin ϕ cos4ϕ.

Приведем еще один пример применения формулы Эйлера. Пусть
требуется найти ∫ e ax cos bx dx. Рассмотрим равенство

∫e
∫e

Конечно, в этом простом случае мы получили хорошо известные фор
мулы, которые легко доказываются в тригонометрии без применения
комплексных чисел. Однако если нужно выразить, например, cos 5ϕ и
sin 5ϕ через cos ϕ и sin ϕ, то применение формулы Эйлера практичес
ки удобнее обычных тригонометрических преобразований.
Делается это так:
(e ) = e

i5ϕ

= cos 5ϕ + i sin 5ϕ.

С другой стороны,
e iϕ = cosϕ + i sin ϕ,
5

5

4

3

2

( e ) = (cos ϕ + i sin ϕ ) = cos ϕ + i5cos ϕ sin ϕ − 10 cos ϕ sin ϕ −
−i10 cos2ϕ sin 3 ϕ + 5 cos ϕ sin 4 ϕ + i sin 5 ϕ *.
* Заменив в этом рассуждении показатель 5 на любое целое число n, мы придем
к тождеству (cos ϕ + i sin ϕ) n = cos nϕ + i sin nϕ, называемому формулой Муавра.

(6)

dx = ∫ e ax cos bx dx + i ∫ e ax sin bx dx.

a − ib
a
b
1
.
=
=
−i 2
a + ib ( a + ib )( a − ib ) a 2 + b 2
a + b2

Перемножая, получаем, что частное в правой части (6) равно
e ax
e ax
( a cos bx + b sin bx ) + i 2
( a sin bx − b cos bx ).
2
a +b
a + b2
2

∫e

ax

=

cos bx dx + i ∫ e ax sin bx dx =
e ax
e ax
( a cos bx + b sin bx ) + i 2
( a sin bx − b cos bx ) + C.
2
a +b
a + b2
2

Сравнивая вещественные и мнимые части, находим

∫e

ax

cos bx dx =

e ax ( a cos bx + b sin bx )
+ C1 ,
a 2 + b2

∫e

ax

sin bx dx =

e ax ( a sin bx − b cos bx )
+ C2.
a 2 + b2

Упражнения

поэтому
iϕ 5

( a + ib ) x

Равенство (6) принимает вид

sin (ϕ + ψ) = sin ϕ cos ψ + sin ψ cos ϕ.

iϕ 5

e ( a + ib ) x
+ C,
a + ib

e ( a + ib ) x = e ax e ibx = e ax (cos bx + i sin bx ),

Сравнивая вещественные и мнимые части в двух выражениях для
e i( ϕ + ψ ) , получаем
cos(ϕ + ψ) = cos ϕ cos ψ − sin ϕ sin ψ ,

dx =

Чтобы отделить в правой части (6) вещественную часть от мнимой,
проделаем следующие преобразования:

e i ( ϕ + ψ ) = e iϕ e iψ = (cos ϕ + i sin ϕ)(cos ψ + i sin ψ) =
= cos ϕ cos ψ − sin ϕ sin ψ + i(sin ϕ cos ψ + cos ϕ sin ψ).

( a + ib ) x

где C = C1 + iC2 . Заметим, что по формуле Эйлера

z = z1 z 2 = r1 e iϕ 1 ⋅ r2 e iϕ 2 = r1 r2 ⋅ e i ( ϕ 1 + ϕ 2 ) = re iϕ ,

где r = r1 r2 , ϕ = ϕ 1 + ϕ 2 .
Из формулы Эйлера легко получить формулы для синуса и косину
са суммы. Действительно, e i( ϕ + ψ ) = cos(ϕ + ψ) + i sin(ϕ + ψ). С другой
стороны,

155

1. Запишите в показательной форме следующие числа:
a) 1 + i; б) 1 − i; в) –1; г) 3i.
2. Пользуясь формулой Эйлера, найдите:
9
1
3
 .
a) (1 + i )16 ; б)  + i
2 
2

154

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

Формула Эйлера была получена другим способом в ВМ, § II.18, на
основе разложения ее левой и правой частей в ряд Тейлора. Но само
определение функций e t , e kt в ВМ было основано на выражении
производной от экспоненциальной функции; значит в принципе оба
доказательства имеют одну и ту же основу.
С помощью формулы Эйлера произвольное комплексное чис
ло z с модулем r и аргументом ϕ можно записать так:
z = r (cos ϕ + i sin ϕ) = re iϕ .

Запись z = re iϕ называется показательной формой комплексного числа.
При этом правило сложения аргументов при умножении комплексных
чисел становится простым следствием сложения показателей при умно
жении степеней. В самом деле, пусть z 1 = r1 e iϕ 1 , z 2 = r2 e iϕ 2 . Тогда

§ 3]

ВОЗВЕДЕНИЕ В МНИМУЮ СТЕПЕНЬ. ФОРМУЛА ЭЙЛЕРА

(Мы выполнили возведение в степень по формуле бинома Ньютона.)
Сравнивая вещественные и мнимые части, находим
cos 5ϕ = cos5ϕ − 10 cos3ϕ sin 2 ϕ + 5 cosϕ sin 4 ϕ,
sin 5ϕ = sin 5 ϕ − 10 sin 3 ϕ cos2ϕ + 5 sin ϕ cos4ϕ.

Приведем еще один пример применения формулы Эйлера. Пусть
требуется найти ∫ e ax cos bx dx. Рассмотрим равенство

∫e
∫e

Конечно, в этом простом случае мы получили хорошо известные фор
мулы, которые легко доказываются в тригонометрии без применения
комплексных чисел. Однако если нужно выразить, например, cos 5ϕ и
sin 5ϕ через cos ϕ и sin ϕ, то применение формулы Эйлера практичес
ки удобнее обычных тригонометрических преобразований.
Делается это так:
(e ) = e

i5ϕ

= cos 5ϕ + i sin 5ϕ.

С другой стороны,
e iϕ = cosϕ + i sin ϕ,
5

5

4

3

2

( e ) = (cos ϕ + i sin ϕ ) = cos ϕ + i5cos ϕ sin ϕ − 10 cos ϕ sin ϕ −
−i10 cos2ϕ sin 3 ϕ + 5 cos ϕ sin 4 ϕ + i sin 5 ϕ *.
* Заменив в этом рассуждении показатель 5 на любое целое число n, мы придем
к тождеству (cos ϕ + i sin ϕ) n = cos nϕ + i sin nϕ, называемому формулой Муавра.

(6)

dx = ∫ e ax cos bx dx + i ∫ e ax sin bx dx.

a − ib
a
b
1
.
=
=
−i 2
a + ib ( a + ib )( a − ib ) a 2 + b 2
a + b2

Перемножая, получаем, что частное в правой части (6) равно
e ax
e ax
( a cos bx + b sin bx ) + i 2
( a sin bx − b cos bx ).
2
a +b
a + b2
2

∫e

ax

=

cos bx dx + i ∫ e ax sin bx dx =
e ax
e ax
( a cos bx + b sin bx ) + i 2
( a sin bx − b cos bx ) + C.
2
a +b
a + b2
2

Сравнивая вещественные и мнимые части, находим

∫e

ax

cos bx dx =

e ax ( a cos bx + b sin bx )
+ C1 ,
a 2 + b2

∫e

ax

sin bx dx =

e ax ( a sin bx − b cos bx )
+ C2.
a 2 + b2

Упражнения

поэтому
iϕ 5

( a + ib ) x

Равенство (6) принимает вид

sin (ϕ + ψ) = sin ϕ cos ψ + sin ψ cos ϕ.

iϕ 5

e ( a + ib ) x
+ C,
a + ib

e ( a + ib ) x = e ax e ibx = e ax (cos bx + i sin bx ),

Сравнивая вещественные и мнимые части в двух выражениях для
e i( ϕ + ψ ) , получаем
cos(ϕ + ψ) = cos ϕ cos ψ − sin ϕ sin ψ ,

dx =

Чтобы отделить в правой части (6) вещественную часть от мнимой,
проделаем следующие преобразования:

e i ( ϕ + ψ ) = e iϕ e iψ = (cos ϕ + i sin ϕ)(cos ψ + i sin ψ) =
= cos ϕ cos ψ − sin ϕ sin ψ + i(sin ϕ cos ψ + cos ϕ sin ψ).

( a + ib ) x

где C = C1 + iC2 . Заметим, что по формуле Эйлера

z = z1 z 2 = r1 e iϕ 1 ⋅ r2 e iϕ 2 = r1 r2 ⋅ e i ( ϕ 1 + ϕ 2 ) = re iϕ ,

где r = r1 r2 , ϕ = ϕ 1 + ϕ 2 .
Из формулы Эйлера легко получить формулы для синуса и косину
са суммы. Действительно, e i( ϕ + ψ ) = cos(ϕ + ψ) + i sin(ϕ + ψ). С другой
стороны,

155

1. Запишите в показательной форме следующие числа:
a) 1 + i; б) 1 − i; в) –1; г) 3i.
2. Пользуясь формулой Эйлера, найдите:
9
1
3
 .
a) (1 + i )16 ; б)  + i
2 
2

156

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

n

§ 4. Логарифмы и корни
Замечательно, что при мнимых показателях показательная функ
ция становится периодической. В самом деле, из формулы Эйлера сле
дует, что e 2 πi = cos 2π + i sin 2π = 1, поэтому e i( t +2 π ) = e it e 2 πi = e it , т.е.
функция z (t) = e it имеет период 2π.
Периодические свойства степени проступают уже на следующих
простых примерах:
1. (−1) 0 = 1; (−1)1 = −1; (−1)2 = 1; (−1) 3 = −1; ...; (−1)2 n + g = (−1) g .
2. i 0 = 1; i1 = i; i2 = −1; i 3 = −i; i4 = 1; i 5 = i; i 6 = −1; i4 n + s = i s .
Из этих примеров мы заключаем, что (−1) g как функция g имеет пе
риод 2, a i s как функция s имеет период 4.
Покажем, что периодичность этих функций есть следствие перио
дичности функции e it . Действительно, пользуясь формулой Эйлера,
запишем –1 в показательной форме; получим −1 = e πi . Поэтому
(−1) g = e iπg , где g — любое число. Определим период функции e iπg
при вещественном g. Если G — ее период, то e iπ ( g +G ) = e iπg . Для этого
πs
i
e 2

πs
i
e 2

i

π
2

, поэ

тому i s =
. Период функции
равен 4.
Периодичность показательной функции приводит к интересным
следствиям для логарифма. Логарифмом комплексного числа z назы
вается такое комплексное число w, что e w = z .
Пусть z = re iϕ . Запишем число r в виде r = e ρ , где ρ есть лога
рифм (натуральный) положительного числа r. Тогда z = e ρ + iϕ , поэтому
w = ln z = ρ + iϕ = ln r + iϕ.
2 πki

157

z n = r n e ( iϕ + 2 πki ) n = r n e inϕ e 2 πkin = ce 2 πkni ,

e iϕ − e − iϕ
.
sin ϕ =
2i

должно быть e iπG = 1, откуда πG = 2π, G = 2. Аналогично i = e

ЛОГАРИФМЫ И КОРНИ

Пусть z = re iϕ ; как мы видели, можно написать z = re iϕ +2 πki . Тогда

3. Выразите cos 3ϕ, sin 4ϕ через sin ϕ и cos ϕ.
4. Докажите формулы
e iϕ + e − iϕ
,
cos ϕ =
2

§ 4]

Но мы уже знаем, что e
= 1, если k — целое число; поэтому мы мо
жем написать z = e ρ + iϕ +2 πki , откуда ln z = ln r + i (ϕ + 2kπ).
Таким образом, логарифм комплексного числа имеет бесчисленное
множество значений. Это положение похоже на соотношение между
тригонометрическими и обратными тригонометрическими функциями.
Например, так как tgϕ имеет период, равный π, т.е. tg (ϕ + kπ) = tg ϕ,
если k — целое, то Arctg x имеет бесчисленное множество значений.
Действительно, если ϕ = arctg x — одно из значений арктангенса, то и
ϕ + kπ также есть значение арктангенса (k — целое).
Периодичность показательной функции приводит к важным след
ствиям и при извлечении корня, т.е. при возведении в дробную степень.

(7)
2 πkni

inϕ

где через с обозначено r e . Если n целое, то e
= 1, поэтому
получается лишь одно значение z n , именно число с. Таким образом,
возведение в целую степень есть действие однозначное. Положение ме
p
няется, если n дробное, n = , где p и q > 0 — взаимно простые (не
q
имеющие общих делителей, кроме единицы) целые числа. Тогда
e 2 πkni может быть отличным от 1 и по формуле (7) мы получаем новые
n
значения z , отличные от с. При этом можно доказать, что общее число
n
различных значений z равно q.
Рассмотрим пример. Найдем все значения 11 3 = 3 1 . Так как
2 πki

1 = e 2 πki , то 11 3 = e 3 . Положив в последнем равенстве k = 0, получим
11 3 = 1, положив k = 1, получим
11 3 = e

2 πi
3

= cos

3


1
,
+ i sin
=− +i
3
3
2
2

= cos

3


1
.
+ i sin
= − −i
3
3
2
2

положив k = 2, получим
11 3 = e

4 πi
3

Таким образом, мы получили три значения

3

1 . (Проверьте с помощью
3

 1
3
 = 1.) Легко
непосредственного возведения в степень, что  − ± i
2 
 2
убедиться, что, полагая k = 3, 4, ... или k = –1, –2, ..., мы не получим
новых значений корня.
Если n — целое число, то корни уравнения x n = 1 суть n чисел
вида
xk = cos

2 kπ
2 kπ
,
+ i sin
n
n

где k = 0, 1, 2, ..., n–1.

При этом, подставляя k = 0, получим x 0 = cos 0 + i sin 0 = 1, т.е. общеиз
вестное значение. На плоскости числа x k изображаются точками, рас
положенными в вершинах правильного nугольника, вписанного
в круг радиуса 1. Действительно, модуль любого из чисел x k равен
2kπ
2kπ
rk = cos 2
+ sin 2
= 1, аргумент числа x 0 равен нулю, а при
n
n

. На рис. 50
увеличении k на единицу аргумент увеличивается на
n
показаны корни уравнения x 5 = 1.

156

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

n

§ 4. Логарифмы и корни
Замечательно, что при мнимых показателях показательная функ
ция становится периодической. В самом деле, из формулы Эйлера сле
дует, что e 2 πi = cos 2π + i sin 2π = 1, поэтому e i( t +2 π ) = e it e 2 πi = e it , т.е.
функция z (t) = e it имеет период 2π.
Периодические свойства степени проступают уже на следующих
простых примерах:
1. (−1) 0 = 1; (−1)1 = −1; (−1)2 = 1; (−1) 3 = −1; ...; (−1)2 n + g = (−1) g .
2. i 0 = 1; i1 = i; i2 = −1; i 3 = −i; i4 = 1; i 5 = i; i 6 = −1; i4 n + s = i s .
Из этих примеров мы заключаем, что (−1) g как функция g имеет пе
риод 2, a i s как функция s имеет период 4.
Покажем, что периодичность этих функций есть следствие перио
дичности функции e it . Действительно, пользуясь формулой Эйлера,
запишем –1 в показательной форме; получим −1 = e πi . Поэтому
(−1) g = e iπg , где g — любое число. Определим период функции e iπg
при вещественном g. Если G — ее период, то e iπ ( g +G ) = e iπg . Для этого
πs
i
e 2

πs
i
e 2

i

π
2

, поэ

тому i s =
. Период функции
равен 4.
Периодичность показательной функции приводит к интересным
следствиям для логарифма. Логарифмом комплексного числа z назы
вается такое комплексное число w, что e w = z .
Пусть z = re iϕ . Запишем число r в виде r = e ρ , где ρ есть лога
рифм (натуральный) положительного числа r. Тогда z = e ρ + iϕ , поэтому
w = ln z = ρ + iϕ = ln r + iϕ.
2 πki

157

z n = r n e ( iϕ + 2 πki ) n = r n e inϕ e 2 πkin = ce 2 πkni ,

e iϕ − e − iϕ
.
sin ϕ =
2i

должно быть e iπG = 1, откуда πG = 2π, G = 2. Аналогично i = e

ЛОГАРИФМЫ И КОРНИ

Пусть z = re iϕ ; как мы видели, можно написать z = re iϕ +2 πki . Тогда

3. Выразите cos 3ϕ, sin 4ϕ через sin ϕ и cos ϕ.
4. Докажите формулы
e iϕ + e − iϕ
,
cos ϕ =
2

§ 4]

Но мы уже знаем, что e
= 1, если k — целое число; поэтому мы мо
жем написать z = e ρ + iϕ +2 πki , откуда ln z = ln r + i (ϕ + 2kπ).
Таким образом, логарифм комплексного числа имеет бесчисленное
множество значений. Это положение похоже на соотношение между
тригонометрическими и обратными тригонометрическими функциями.
Например, так как tgϕ имеет период, равный π, т.е. tg (ϕ + kπ) = tg ϕ,
если k — целое, то Arctg x имеет бесчисленное множество значений.
Действительно, если ϕ = arctg x — одно из значений арктангенса, то и
ϕ + kπ также есть значение арктангенса (k — целое).
Периодичность показательной функции приводит к важным след
ствиям и при извлечении корня, т.е. при возведении в дробную степень.

(7)
2 πkni

inϕ

где через с обозначено r e . Если n целое, то e
= 1, поэтому
получается лишь одно значение z n , именно число с. Таким образом,
возведение в целую степень есть действие однозначное. Положение ме
p
няется, если n дробное, n = , где p и q > 0 — взаимно простые (не
q
имеющие общих делителей, кроме единицы) целые числа. Тогда
e 2 πkni может быть отличным от 1 и по формуле (7) мы получаем новые
n
значения z , отличные от с. При этом можно доказать, что общее число
n
различных значений z равно q.
Рассмотрим пример. Найдем все значения 11 3 = 3 1 . Так как
2 πki

1 = e 2 πki , то 11 3 = e 3 . Положив в последнем равенстве k = 0, получим
11 3 = 1, положив k = 1, получим
11 3 = e

2 πi
3

= cos

3


1
,
+ i sin
=− +i
3
3
2
2

= cos

3


1
.
+ i sin
= − −i
3
3
2
2

положив k = 2, получим
11 3 = e

4 πi
3

Таким образом, мы получили три значения

3

1 . (Проверьте с помощью
3

 1
3
 = 1.) Легко
непосредственного возведения в степень, что  − ± i
2 
 2
убедиться, что, полагая k = 3, 4, ... или k = –1, –2, ..., мы не получим
новых значений корня.
Если n — целое число, то корни уравнения x n = 1 суть n чисел
вида
xk = cos

2 kπ
2 kπ
,
+ i sin
n
n

где k = 0, 1, 2, ..., n–1.

При этом, подставляя k = 0, получим x 0 = cos 0 + i sin 0 = 1, т.е. общеиз
вестное значение. На плоскости числа x k изображаются точками, рас
положенными в вершинах правильного nугольника, вписанного
в круг радиуса 1. Действительно, модуль любого из чисел x k равен
2kπ
2kπ
rk = cos 2
+ sin 2
= 1, аргумент числа x 0 равен нулю, а при
n
n

. На рис. 50
увеличении k на единицу аргумент увеличивается на
n
показаны корни уравнения x 5 = 1.

158

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

На примере простейшего уравнения
степени n (n — целое положительное)
x n = 1 мы убедились, что общее число
вещественных и мнимых корней равно n.
В действительности (здесь мы не смо
жем дать доказательства этой теоремы)
любое алгебраическое уравнение степени
n имеет n комплексных корней, причем
некоторые из них могут быть веществен
ными, так как всегда считается, что ве
щественные числа — это частный случай
Рис. 50.
комплексных. Число различных корней
может оказаться меньшим n, так как копни могут совпадать друг с дру
гом («кратные корни»). Например, уравнение четвертой степени
( x − 1)3 ( x + 1) = 0

имеет трехкратный корень x 1, 2 , 3 = 1 и простой корень x 4 = −1, а всего
четыре корня.
В заключение этого параграфа проследим, как в процессе усложне
ния математических действий развивается понятие числа. Исходным
является класс (совокупность) целых положительных (натуральных)
чисел. Если пользоваться только такими числами, то всегда выполни
мо сложение, так как результат сложения двух натуральных чисел есть
снова натуральное число, но не всегда выполнимо вычитание. Для того
чтобы вычитание было всегда возможным, приходится рассматривать
целые отрицательные числа и нуль.
Рассмотрим следующую пару действий — умножение и деление. Ре
зультат умножения двух целых чисел есть целое число, однако дей
ствие деления целых чисел не всегда выполнимо в целых числах. Для
того чтобы всегда было выполнимо деление, нужно ввести новые чис
ла — дроби. Целые и дробные числа вместе составляют класс рацио
нальных чисел. Но хорошо известно, что пределом последовательности
рациональных чисел может служить число не рациональное, т.е. ирра
циональное (они подразделяются на «алгебраические» и «трансцен
дентные», на чем мы здесь не будем останавливаться). Рациональные
и иррациональные числа вместе образуют класс вещественных чисел,
в котором операция предельного перехода всегда выполнима. Однако
в последнем классе не всегда выполнимы алгебраические действия:
например, можно извлекать корни любой степени из положительных
чисел, но нельзя извлекать корни четных степеней (в частности, квад
ратные) из отрицательных чисел.
Извлечение квадратного корня из отрицательного числа становится
возможным только с введением комплексных чисел. Замечательно, что
введение комплексных чисел является п о с л е д н и м расширением

§ 5]

ОПИСАНИЕ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ

159

числовой системы. Действительно, если мы располагаем комплексны
ми числами, то мы можем извлекать корни любой степени не только из
отрицательных, но и из любых комплексных чисел. Результатами яв
ляются некоторые комплексные числа. Однако в математике имеются
и другие действия, выполнить которые невозможно, если ограничи
ваться лишь вещественными числами. Так, при возведении положи
тельного числа в любую вещественную степень получается всегда
положительное число, так что нет логарифмов отрицательных чисел.
Еще одна невыполнимая операция — не существует вещественного
числа ϕ такого, например, что cos ϕ = 2. Возникает вопрос: может
быть, для того чтобы находить логарифмы отрицательных чисел, по
требуется введение какойто новой «мнимой единицы», отличной от i,
которую мы ввели, чтобы иметь возможность извлекать корни четной
степени из отрицательных чисел? Не потребуется ли для решения
уравнения cos ϕ = 2 еще какойто, третьей «мнимой единицы»? Ока
зывается, что это не так: с введедением комплексных чисел мы получаем
возможность находить логарифмы как отрицательных, так и комплек
сных чисел (см. выше), решать уравнения вида cos ϕ = k, где k — любое
число (см. ниже, упражнение 4), и т.д. Таким образом, любые действия
над комплексными числами выполнимы, в результате этих действий
опять получаются комплексные числа, так что введения какихто но
вых чисел больше не требуется.
Упражнения
1. Найдите логарифмы следующих чисел:
а) –1; б) i; в) –i; г) 1 + i.
2. Найдите все значения 3 − 1 . 3. Найдите все значения

6

1.

В задачах 2 и 3 получите значения корней и в тригонометрической и в ал
гебраической формах. Проверьте найденные значения корней возведением
в соответствующую степень по формуле бинома Ньютона.
4. Решите уравнение cos ϕ = 2. Укажите все решения.
5. Укажите все решения уравнения sin ϕ = 2.
У к а з а н и е. В задачах 4–5 воспользуйтесь формулами, выражающими си
нус и косинус через показательную функцию. (См. упражнение 4 к § 3.)

§ 5. Описание гармонических колебаний с помощью
показательной функции от мнимого аргумента
Зная, что показательная функция периодична для мнимых показа
телей, можно пользоваться ею при решении задач на колебания из ме
ханики и теории электрических цепей.
Рассмотрим, например, гармонические колебания (т.е. колебания,
происходящие по синусоидальному закону) электрического тока в це
пи, при которых сила тока изменяется по закону
j = j0 sin(ωt + α );

(8)

158

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

На примере простейшего уравнения
степени n (n — целое положительное)
x n = 1 мы убедились, что общее число
вещественных и мнимых корней равно n.
В действительности (здесь мы не смо
жем дать доказательства этой теоремы)
любое алгебраическое уравнение степени
n имеет n комплексных корней, причем
некоторые из них могут быть веществен
ными, так как всегда считается, что ве
щественные числа — это частный случай
Рис. 50.
комплексных. Число различных корней
может оказаться меньшим n, так как копни могут совпадать друг с дру
гом («кратные корни»). Например, уравнение четвертой степени
( x − 1)3 ( x + 1) = 0

имеет трехкратный корень x 1, 2 , 3 = 1 и простой корень x 4 = −1, а всего
четыре корня.
В заключение этого параграфа проследим, как в процессе усложне
ния математических действий развивается понятие числа. Исходным
является класс (совокупность) целых положительных (натуральных)
чисел. Если пользоваться только такими числами, то всегда выполни
мо сложение, так как результат сложения двух натуральных чисел есть
снова натуральное число, но не всегда выполнимо вычитание. Для того
чтобы вычитание было всегда возможным, приходится рассматривать
целые отрицательные числа и нуль.
Рассмотрим следующую пару действий — умножение и деление. Ре
зультат умножения двух целых чисел есть целое число, однако дей
ствие деления целых чисел не всегда выполнимо в целых числах. Для
того чтобы всегда было выполнимо деление, нужно ввести новые чис
ла — дроби. Целые и дробные числа вместе составляют класс рацио
нальных чисел. Но хорошо известно, что пределом последовательности
рациональных чисел может служить число не рациональное, т.е. ирра
циональное (они подразделяются на «алгебраические» и «трансцен
дентные», на чем мы здесь не будем останавливаться). Рациональные
и иррациональные числа вместе образуют класс вещественных чисел,
в котором операция предельного перехода всегда выполнима. Однако
в последнем классе не всегда выполнимы алгебраические действия:
например, можно извлекать корни любой степени из положительных
чисел, но нельзя извлекать корни четных степеней (в частности, квад
ратные) из отрицательных чисел.
Извлечение квадратного корня из отрицательного числа становится
возможным только с введением комплексных чисел. Замечательно, что
введение комплексных чисел является п о с л е д н и м расширением

§ 5]

ОПИСАНИЕ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ

159

числовой системы. Действительно, если мы располагаем комплексны
ми числами, то мы можем извлекать корни любой степени не только из
отрицательных, но и из любых комплексных чисел. Результатами яв
ляются некоторые комплексные числа. Однако в математике имеются
и другие действия, выполнить которые невозможно, если ограничи
ваться лишь вещественными числами. Так, при возведении положи
тельного числа в любую вещественную степень получается всегда
положительное число, так что нет логарифмов отрицательных чисел.
Еще одна невыполнимая операция — не существует вещественного
числа ϕ такого, например, что cos ϕ = 2. Возникает вопрос: может
быть, для того чтобы находить логарифмы отрицательных чисел, по
требуется введение какойто новой «мнимой единицы», отличной от i,
которую мы ввели, чтобы иметь возможность извлекать корни четной
степени из отрицательных чисел? Не потребуется ли для решения
уравнения cos ϕ = 2 еще какойто, третьей «мнимой единицы»? Ока
зывается, что это не так: с введедением комплексных чисел мы получаем
возможность находить логарифмы как отрицательных, так и комплек
сных чисел (см. выше), решать уравнения вида cos ϕ = k, где k — любое
число (см. ниже, упражнение 4), и т.д. Таким образом, любые действия
над комплексными числами выполнимы, в результате этих действий
опять получаются комплексные числа, так что введения какихто но
вых чисел больше не требуется.
Упражнения
1. Найдите логарифмы следующих чисел:
а) –1; б) i; в) –i; г) 1 + i.
2. Найдите все значения 3 − 1 . 3. Найдите все значения

6

1.

В задачах 2 и 3 получите значения корней и в тригонометрической и в ал
гебраической формах. Проверьте найденные значения корней возведением
в соответствующую степень по формуле бинома Ньютона.
4. Решите уравнение cos ϕ = 2. Укажите все решения.
5. Укажите все решения уравнения sin ϕ = 2.
У к а з а н и е. В задачах 4–5 воспользуйтесь формулами, выражающими си
нус и косинус через показательную функцию. (См. упражнение 4 к § 3.)

§ 5. Описание гармонических колебаний с помощью
показательной функции от мнимого аргумента
Зная, что показательная функция периодична для мнимых показа
телей, можно пользоваться ею при решении задач на колебания из ме
ханики и теории электрических цепей.
Рассмотрим, например, гармонические колебания (т.е. колебания,
происходящие по синусоидальному закону) электрического тока в це
пи, при которых сила тока изменяется по закону
j = j0 sin(ωt + α );

(8)

160

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

здесь j 0 — амплитуда колебаний (наибольшая сила тока), ω — часто%
та и α — начальная фаза (значение фазы, т.е. ωt + α, при t = 0). Оказы%
вается удобным наряду с (8) ввести понятие комплексной силы тока:
J = j0 e i ( ωt + α ) ,

(9)

для которой «настоящая» сила тока (8) служит мнимой частью, так как
в силу формулы Эйлера (5)
j0 e

i ( ωt + α )

= j0 cos (ωt + α ) + i j0 sin (ωt + α ).

Комплексная сила тока (9) изображается в комплексной плоскости
вектором (рис. 51) длины j 0 , образующим с положительным направле%
нием вещественной оси угол ωt + α; таким образом, этот вектор при
t = 0 имеет наклон α, а при увеличе%
нии t равномерно вращается с угловой
скоростью ω. Сила тока (8) получается
в результате проецирования конца век%
тора J на мнимую ось. (Если бы сила
тока изменялась, взамен (8), по закону
j = j 0 cos(ωt + α), то она была бы вещес%
твенной частью комплексной силы тока
(9) и получалась в результате проециро%
Рис. 51.
вания J на вещественную ось.)
Выражение (9) представляет собой пример комплексной функции
от вещественной независимой переменной. В общем случае любую та%
кую функцию можно записать в форме
f ( t ) = g ( t ) + ih ( t ),

где g (t) и h(t) — обычные вещественные функции от вещественной
независимой переменной. Такие комплексные функции обладают сле%
дующими очевидными свойствами:
если комплексные функции складываются, то их вещественные
и мнимые части также складываются;
если комплексная функция умножается на вещественную постоян%
ную или вещественную функцию, то вещественная и мнимая части по%
лучают тот же множитель;
если комплексную функцию продифференцировать или проинтег%
рировать, то над ее вещественной и мнимой частями произведутся те
же действия.
Эти свойства дают возможность, вместо того чтобы производить
указанные действия над вещественной или мнимой частью, осущест%
вить эти действия над всей комплексной функцией, а от результата
взять вещественную или соответственно мнимую часть. Замечательно,
что такой переход к комплексным величинам с обратным переходом
к требуемым вещественным величинам может оказаться проще

§ 4]

ЛОГАРИФМЫ И КОРНИ

161

и нагляднее, чем непосредственные действия над вещественными ве%
личинами.
Рассмотрим, например, наложение колебаний, происходящих
с одинаковой частотой. Пусть надо сложить токи
j = j1 sin (ωt + α 1 ) + j2 sin (ωt + α 2 ).

Мы видели, что соответствующие комплексные токи J 1 и J 2 изобра%
жаются в плоскости комплексного переменного векторами, равномерно
вращающимися с угловой скоростью ω.
А в § 1 мы показали, что такие векторы
складываются по правилу параллелограм%
ма. Значит, и суммарный комплексный
ток J будет равномерно вращаться с угло%
вой скоростью ω, т.е. его можно записать
в виде (9), где j 0 и α легко получить гео%
метрически. На рис. 52 показано положе%
ние
вращающегося
параллелограмма
в момент t = 0, которое только и нужно для
Рис. 52.
определения j 0 и α. Эти параметры мож%
но получить с помощью геометрического построения, как на рис. 52, но
можно найти и аналитически. Для нахождения j 0 можно применить
теорему косинусов к треугольнику ОАВ, что дает
j02 = OB2 = AO 2 + AB2 − 2 AO ⋅ AB cos( AO, AB) =

[

]

= j12 + j22 − 2 j1 j2 cos 180 o − (α 2 − α 1 ) = j12 + j22 + 2 j1 j2 cos (α 2 − α 1 ).

Для нахождения α заметим, что проекции вектора J

на оси коор%
t=0

динат равны соответственно
j1 cos α 1 + j2 cos α 2

и

j1 sin α 1 + j2 sin α 2 ,

откуда
tg α =

j1 sin α 1 + j2 sin α 2
.
j1 cos α 1 + j2 cos α 2

Аналогичные результаты получаются при наложении любого числа
колебаний, происходящих с одинаковой частотой. В то же время ясно,
что при наложении колебаний, происходящих с разной частотой, сум%
марный ток будет иметь сложный вид и уже не будет изменяться по
гармоническому закону.
Еще более наглядным является дифференцирование комплексного
тока. Из (9) получаем
dJ
= j0 e i( ωt + α ) iω = iωJ .
dt

(10)

160

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

здесь j 0 — амплитуда колебаний (наибольшая сила тока), ω — часто%
та и α — начальная фаза (значение фазы, т.е. ωt + α, при t = 0). Оказы%
вается удобным наряду с (8) ввести понятие комплексной силы тока:
J = j0 e i ( ωt + α ) ,

(9)

для которой «настоящая» сила тока (8) служит мнимой частью, так как
в силу формулы Эйлера (5)
j0 e

i ( ωt + α )

= j0 cos (ωt + α ) + i j0 sin (ωt + α ).

Комплексная сила тока (9) изображается в комплексной плоскости
вектором (рис. 51) длины j 0 , образующим с положительным направле%
нием вещественной оси угол ωt + α; таким образом, этот вектор при
t = 0 имеет наклон α, а при увеличе%
нии t равномерно вращается с угловой
скоростью ω. Сила тока (8) получается
в результате проецирования конца век%
тора J на мнимую ось. (Если бы сила
тока изменялась, взамен (8), по закону
j = j 0 cos(ωt + α), то она была бы вещес%
твенной частью комплексной силы тока
(9) и получалась в результате проециро%
Рис. 51.
вания J на вещественную ось.)
Выражение (9) представляет собой пример комплексной функции
от вещественной независимой переменной. В общем случае любую та%
кую функцию можно записать в форме
f ( t ) = g ( t ) + ih ( t ),

где g (t) и h(t) — обычные вещественные функции от вещественной
независимой переменной. Такие комплексные функции обладают сле%
дующими очевидными свойствами:
если комплексные функции складываются, то их вещественные
и мнимые части также складываются;
если комплексная функция умножается на вещественную постоян%
ную или вещественную функцию, то вещественная и мнимая части по%
лучают тот же множитель;
если комплексную функцию продифференцировать или проинтег%
рировать, то над ее вещественной и мнимой частями произведутся те
же действия.
Эти свойства дают возможность, вместо того чтобы производить
указанные действия над вещественной или мнимой частью, осущест%
вить эти действия над всей комплексной функцией, а от результата
взять вещественную или соответственно мнимую часть. Замечательно,
что такой переход к комплексным величинам с обратным переходом
к требуемым вещественным величинам может оказаться проще

§ 4]

ЛОГАРИФМЫ И КОРНИ

161

и нагляднее, чем непосредственные действия над вещественными ве%
личинами.
Рассмотрим, например, наложение колебаний, происходящих
с одинаковой частотой. Пусть надо сложить токи
j = j1 sin (ωt + α 1 ) + j2 sin (ωt + α 2 ).

Мы видели, что соответствующие комплексные токи J 1 и J 2 изобра%
жаются в плоскости комплексного переменного векторами, равномерно
вращающимися с угловой скоростью ω.
А в § 1 мы показали, что такие векторы
складываются по правилу параллелограм%
ма. Значит, и суммарный комплексный
ток J будет равномерно вращаться с угло%
вой скоростью ω, т.е. его можно записать
в виде (9), где j 0 и α легко получить гео%
метрически. На рис. 52 показано положе%
ние
вращающегося
параллелограмма
в момент t = 0, которое только и нужно для
Рис. 52.
определения j 0 и α. Эти параметры мож%
но получить с помощью геометрического построения, как на рис. 52, но
можно найти и аналитически. Для нахождения j 0 можно применить
теорему косинусов к треугольнику ОАВ, что дает
j02 = OB2 = AO 2 + AB2 − 2 AO ⋅ AB cos( AO, AB) =

[

]

= j12 + j22 − 2 j1 j2 cos 180 o − (α 2 − α 1 ) = j12 + j22 + 2 j1 j2 cos (α 2 − α 1 ).

Для нахождения α заметим, что проекции вектора J

на оси коор%
t=0

динат равны соответственно
j1 cos α 1 + j2 cos α 2

и

j1 sin α 1 + j2 sin α 2 ,

откуда
tg α =

j1 sin α 1 + j2 sin α 2
.
j1 cos α 1 + j2 cos α 2

Аналогичные результаты получаются при наложении любого числа
колебаний, происходящих с одинаковой частотой. В то же время ясно,
что при наложении колебаний, происходящих с разной частотой, сум%
марный ток будет иметь сложный вид и уже не будет изменяться по
гармоническому закону.
Еще более наглядным является дифференцирование комплексного
тока. Из (9) получаем
dJ
= j0 e i( ωt + α ) iω = iωJ .
dt

(10)

162

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

В силу § 1 такое умножение сводится к растяжению вектора J в ω раз
dJ
и повороту его на 90° против часовой стрелки. Значит, вектор
так)
dt
же равномерно вращается со скоростью ω. Аналогично, отбрасывая
произвольную постоянную, получаем



J dt = j0

e i ( ωt + α )
J
J
= = −i ,
ω



§ 5]

ОПИСАНИЕ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ

дений напряжений на R и L на основе формул рис. 54, получаем
(здесь мы в неявной форме пользуемся обоими законами Кирхгофа)
Rj + L

Ф= ϕ 0 e i ( ωt + β ) ,

получаем

(12)

Рис. 55.

При этом в цепи возникает ток, меняющийся по гармоническому закону
(8), однако j 0 и α нам заранее не известны. Приравнивая ϕ сумме па)

(13)

RJ + iωLJ = Ф,

(14)

или, пользуясь (10),

откуда
J=

Ф
ϕ e iβ iωt
= 0
e .
R+iωL R + iωL

Мы видим, что индуктивность L можно истолковать как некое сопро)
тивление, численно равное iωL; это значение называется кажущимся
сопротивлением, или импедансом, элемента L. Теперь остается от по)
следнего выражения взять мнимую часть, чтобы получить искомую
ϕ 0 e iβ
в показа)
силу тока. Однако еще проще записать коэффициент
R + i ωL
тельной форме j 0 e iα , что сразу даст искомые значения j 0 и α. Отсю)
да видим, что

Рис. 54.

ϕ = ϕ 0 sin (ωt + β ).

dJ

dt

RJ + L

j0 =

алгебраическая сумма падений напряжений на любой последователь)
ности элементов, образующих замкнутую цепь, равна нулю. Об этих за)
конах приходится вспоминать для сложных разветвленных цепей, так
как для простых цепей они ничего не дают
сверх очевидных исходных соотношений.
Рассмотрим, например, R, L)цепь, по)
казанную на рис. 55, к которой подключен
источник напряжения, изменяющегося по
гармоническому закону

dj
= ϕ.
dt

Переходя к комплексному току (9) и комплексному напряжению

(11)

т.е. этот вектор получается из J сжатием в ω раз и поворотом его на
90° в отрицательном направлении. Положение этих векторов в момент
t = 0 показано на рис. 53 (на так назы)
ваемой фазовой диаграмме).
Эти результаты можно применить
к расчету колебаний в электрическом
контуре, содержащем любые комбина)
ции сопротивлений, индуктивностей
и емкостей. При этом используется
показанная на рис. 54 связь между па)
дением напряжения на элементе цепи
и силой тока в нем. (Соответствующие
Рис. 53.
формулы выводятся в курсах теории
электричества; см. также ВМ, § VIII.1.)
Кроме того применяются законы Кирхгофа, согласно которым алгебраи)
ческая сумма всех токов, подходящих к любой точке цепи, равна нулю;

163

α = arg

ϕ 0 e iβ
ϕ0
,
=
2
R + i ωL
R + ω 2 L2

ϕ 0 e iβ
1
R − i ωL
= β + arg
= β + arg 2
= β + arg (R − iωL )
R + i ωL
R + i ωL
R + ω 2 L2

(здесь мы пользуемся тем, что аргумент arg комплексного числа не ме)
няется при умножении этого числа на вещественное положительное
число). Следовательно, фаза тока в R, L)цепи запаздывает по сравне)
нию с фазой источника напряжения, что, конечно, объясняется нали)
чием индуктивности.
Искомую силу тока можно получить и с помощью геометрического
построения, показанного на рис. 56. Допустим на минуту, что нам был
задан ток (8), тогда как напряжение (12) является искомым. Тогда не)
трудно построить вектор J
t=0

= j 0 e iα , a с ним и взаимно перпендику)

162

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

В силу § 1 такое умножение сводится к растяжению вектора J в ω раз
dJ
и повороту его на 90° против часовой стрелки. Значит, вектор
так)
dt
же равномерно вращается со скоростью ω. Аналогично, отбрасывая
произвольную постоянную, получаем



J dt = j0

e i ( ωt + α )
J
J
= = −i ,
ω



§ 5]

ОПИСАНИЕ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ

дений напряжений на R и L на основе формул рис. 54, получаем
(здесь мы в неявной форме пользуемся обоими законами Кирхгофа)
Rj + L

Ф= ϕ 0 e i ( ωt + β ) ,

получаем

(12)

Рис. 55.

При этом в цепи возникает ток, меняющийся по гармоническому закону
(8), однако j 0 и α нам заранее не известны. Приравнивая ϕ сумме па)

(13)

RJ + iωLJ = Ф,

(14)

или, пользуясь (10),

откуда
J=

Ф
ϕ e iβ iωt
= 0
e .
R+iωL R + iωL

Мы видим, что индуктивность L можно истолковать как некое сопро)
тивление, численно равное iωL; это значение называется кажущимся
сопротивлением, или импедансом, элемента L. Теперь остается от по)
следнего выражения взять мнимую часть, чтобы получить искомую
ϕ 0 e iβ
в показа)
силу тока. Однако еще проще записать коэффициент
R + i ωL
тельной форме j 0 e iα , что сразу даст искомые значения j 0 и α. Отсю)
да видим, что

Рис. 54.

ϕ = ϕ 0 sin (ωt + β ).

dJ

dt

RJ + L

j0 =

алгебраическая сумма падений напряжений на любой последователь)
ности элементов, образующих замкнутую цепь, равна нулю. Об этих за)
конах приходится вспоминать для сложных разветвленных цепей, так
как для простых цепей они ничего не дают
сверх очевидных исходных соотношений.
Рассмотрим, например, R, L)цепь, по)
казанную на рис. 55, к которой подключен
источник напряжения, изменяющегося по
гармоническому закону

dj
= ϕ.
dt

Переходя к комплексному току (9) и комплексному напряжению

(11)

т.е. этот вектор получается из J сжатием в ω раз и поворотом его на
90° в отрицательном направлении. Положение этих векторов в момент
t = 0 показано на рис. 53 (на так назы)
ваемой фазовой диаграмме).
Эти результаты можно применить
к расчету колебаний в электрическом
контуре, содержащем любые комбина)
ции сопротивлений, индуктивностей
и емкостей. При этом используется
показанная на рис. 54 связь между па)
дением напряжения на элементе цепи
и силой тока в нем. (Соответствующие
Рис. 53.
формулы выводятся в курсах теории
электричества; см. также ВМ, § VIII.1.)
Кроме того применяются законы Кирхгофа, согласно которым алгебраи)
ческая сумма всех токов, подходящих к любой точке цепи, равна нулю;

163

α = arg

ϕ 0 e iβ
ϕ0
,
=
2
R + i ωL
R + ω 2 L2

ϕ 0 e iβ
1
R − i ωL
= β + arg
= β + arg 2
= β + arg (R − iωL )
R + i ωL
R + i ωL
R + ω 2 L2

(здесь мы пользуемся тем, что аргумент arg комплексного числа не ме)
няется при умножении этого числа на вещественное положительное
число). Следовательно, фаза тока в R, L)цепи запаздывает по сравне)
нию с фазой источника напряжения, что, конечно, объясняется нали)
чием индуктивности.
Искомую силу тока можно получить и с помощью геометрического
построения, показанного на рис. 56. Допустим на минуту, что нам был
задан ток (8), тогда как напряжение (12) является искомым. Тогда не)
трудно построить вектор J
t=0

= j 0 e iα , a с ним и взаимно перпендику)

164

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 5]

ОПИСАНИЕ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ

165

т.е.
J=

Рис. 56.

Рис. 57.

лярные векторы RJ
t=0

Ф
t=0

и i ωL J

. Но в силу равенства (14) вектор
t=0

= ϕ 0 e iβ служит диагональю прямоугольника, построенного на

Ф
ωϕ 0
e iβ e iωt .
= −i
1 
1 

 2
i  ωL −
L ω −




ωC 
LC 

(Таким образом, кажущимся сопротивлением, или импедансом, емкос
i
. ) Здесь возможны различные случаи. Если
ти служит величина −
ωC
частота ω внешнего источника напряжения достаточно велика, более
1
точно, если ω 2 >
, то скобка, стоящая в знаменателе, положительна.
LC
Представив −i = e

−i

π
2

t=0

= ϕ 0 e iβ внешнего комплексного напря

t=0

и i ωL J

, однако вектор J
t=0

является искомым. Но этот прямоугольник подобен прямоугольнику,
построенному на векторах R и iωL (меньший прямоугольник на рис.
56). Значит, нужно проделать следующее: построить этот последний
прямоугольник; затем подобно увеличить или уменьшить его так, что
бы его диагональ стала равной ϕ 0 ; затем повернуть его так, чтобы его
t=0

разделить

шого прямоугольника рис. 56; наконец, сторону RJ
.
t=0

Рассмотрим еще L, Сцепь, показанную на рис. 57. Здесь взамен
(13) получаем
L

dJ 1
+
dt C

∫ J dt = Ф,

откуда, пользуясь (10) и (11), находим, что
iωLJ − i

J
= Ф,
ωC

π

i  β− 

2

e iωt .

ωϕ 0
1 
 2
L ω −


LC 

ω2 =

1
,
LC

ω=

1
LC

т.е.

t=0

на R, что даст J

e

и фазой, запаздывающей на 90° по сравнению с источником напряже
1
ния.Если частота ω мала, т.е. ω 2 <
, то аналогично проверяется,
LC
что фаза устанавливающегося тока на 90° опережает фазу внешнего на
пряжения. Особый интерес представляет промежуточный случай, когда

, тогда он примет положение боль

диагональ совпала с вектором Ф

1 

L ω 2 −


LC 

j0 =

нам не дан и
t=0

ωϕ 0

Таким образом, в цепи устанавливается ток с амплитудой

жения в момент t = 0 (его модуль ϕ 0 и аргумент β нам заданы).
Этот вектор должен служить диагональю прямоугольника, построен
ного на векторах RJ

, мы можем записать
J=

двух последних векторах, т.е. и последний вектор легко построить.
Вернемся теперь к исходной задаче об отыскании тока по напряже
нию. Изобразим вектор Ф

(15)

(16)

и решение (15) непригодно, так как в правой части появляется нуль
в знаменателе. В этом случае при любых j 0 и α выражение (9) удов
летворяет соотношению
L

dJ 1
+
dt C

J

iL  2
1 
ω −
 J = 0,

LC 

∫ J dt = iωLJ − i ωC = ω

т.е. в цепи без внешнего источника напряжений (накоротко замкнутой)
возможны незатухающие гармонические колебания по закону (8). Такие
колебания, происходящие при отсутствии внешнего воздействия, назы
ваются собственными, или свободными. Таким образом, если частота

164

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 5]

ОПИСАНИЕ ГАРМОНИЧЕСКИХ КОЛЕБАНИЙ

165

т.е.
J=

Рис. 56.

Рис. 57.

лярные векторы RJ
t=0

Ф
t=0

и i ωL J

. Но в силу равенства (14) вектор
t=0

= ϕ 0 e iβ служит диагональю прямоугольника, построенного на

Ф
ωϕ 0
e iβ e iωt .
= −i
1 
1 

 2
i  ωL −
L ω −




ωC 
LC 

(Таким образом, кажущимся сопротивлением, или импедансом, емкос
i
. ) Здесь возможны различные случаи. Если
ти служит величина −
ωC
частота ω внешнего источника напряжения достаточно велика, более
1
точно, если ω 2 >
, то скобка, стоящая в знаменателе, положительна.
LC
Представив −i = e

−i

π
2

t=0

= ϕ 0 e iβ внешнего комплексного напря

t=0

и i ωL J

, однако вектор J
t=0

является искомым. Но этот прямоугольник подобен прямоугольнику,
построенному на векторах R и iωL (меньший прямоугольник на рис.
56). Значит, нужно проделать следующее: построить этот последний
прямоугольник; затем подобно увеличить или уменьшить его так, что
бы его диагональ стала равной ϕ 0 ; затем повернуть его так, чтобы его
t=0

разделить

шого прямоугольника рис. 56; наконец, сторону RJ
.
t=0

Рассмотрим еще L, Сцепь, показанную на рис. 57. Здесь взамен
(13) получаем
L

dJ 1
+
dt C

∫ J dt = Ф,

откуда, пользуясь (10) и (11), находим, что
iωLJ − i

J
= Ф,
ωC

π

i  β− 

2

e iωt .

ωϕ 0
1 
 2
L ω −


LC 

ω2 =

1
,
LC

ω=

1
LC

т.е.

t=0

на R, что даст J

e

и фазой, запаздывающей на 90° по сравнению с источником напряже
1
ния. Если частота ω мала, т.е. ω 2 <
, то аналогично проверяется,
LC
что фаза устанавливающегося тока на 90° опережает фазу внешнего на
пряжения. Особый интерес представляет промежуточный случай, когда

, тогда он примет положение боль

диагональ совпала с вектором Ф

1 

L ω 2 −


LC 

j0 =

нам не дан и
t=0

ωϕ 0

Таким образом, в цепи устанавливается ток с амплитудой

жения в момент t = 0 (его модуль ϕ 0 и аргумент β нам заданы).
Этот вектор должен служить диагональю прямоугольника, построен
ного на векторах RJ

, мы можем записать
J=

двух последних векторах, т.е. и последний вектор легко построить.
Вернемся теперь к исходной задаче об отыскании тока по напряже
нию. Изобразим вектор Ф

(15)

(16)

и решение (15) непригодно, так как в правой части появляется нуль
в знаменателе. В этом случае при любых j 0 и α выражение (9) удов
летворяет соотношению
L

dJ 1
+
dt C

J

iL  2
1 
ω −
 J = 0,

LC 

∫ J dt = iωLJ − i ωC = ω

т.е. в цепи без внешнего источника напряжений (накоротко замкнутой)
возможны незатухающие гармонические колебания по закону (8). Такие
колебания, происходящие при отсутствии внешнего воздействия, назы
ваются собственными, или свободными. Таким образом, если частота

166

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

внешнего напряжения удовлетворяет соотношению (16), то она равна
частоте собственных незатухающих колебаний в цепи. Из физики из
вестно, что при этих условиях возникает резонанс и взамен периоди
ческих, гармонических колебаний, которые мы здесь только и
рассматриваем, возникают колебания с возрастающей амплитудой.
Случай резонанса будет разобран в гл. VII.
Следует отметить, что с помощью описанного метода можно полу
чить только ток, который устанавливается в цепи по прошествии неко
торого «переходного периода». Переходный процесс описывается
также по методам гл. VII.
Упражнения
1. Рассмотрите цепь, в которой последовательно включены сопротивление
1
?
R, индуктивность L и емкость С. Что будет в частном случае, когда ω 2 =
LC
2. Рассмотрите цепь, в которой сопротивление R и индуктивность L
включены параллельно.

§ 6. Производная функции комплексного переменного
Переменная w = f ( z ) называется функцией комплексного чис
ла z, если каждому значению z отвечает определенное значение f ( z ).
Так как z = x + iy, где х — вещественная часть, у — мнимая часть, то
задание z означает задание двух вещественных чисел х и у. При
этом f ( z ) = u (x, y) + iv (x, y), где u (x, y) и v (x, y) — вещественные
функции. Каждому z соответствуют определенные х и у, а значит,
определенные u и v и, следовательно, определенная величина f ( z ).
Однако мы будем теперь рассматривать как функцию f ( z ) не всякое
выражение u (x, y) + iv (x, y), а лишь такую величину, которая зависит
от z по таким формулам, как, например, f ( z ) = 1 + z 2 , f ( z ) = z ,
f ( z ) = e z , f ( z ) = sin z и т.д. Эти формулы могут содержать алгебраи
ческие действия над z или неалгебраические, но такие, которые мож
но выразить с помощью степенных рядов Тейлора от z, например, e z ,
sin z и т.д.
Таким образом, мы рассматриваем формулы, в которые входит
именно z, но не его вещественная или мнимая часть в отдельности.
(С этой точки зрения, например, z * = x − iy или z не рассматрива
ются здесь как функции z, хотя, зная z, легко найти z* и z .) При та
ком определении f ( z ) у всех функций f ( z ) есть одно общее
свойство: по обычным правилам дифференцирования функций можно
найти производную
f ′( z ) =

df
.
dz

§ 6]

ПРОИЗВОДНАЯ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

167

Функция f ( z ), имеющая производную, называется аналитической
функцией. Мы, следовательно, рассматриваем только аналитические
функции.
Для функций, заданных простыми формулами, вычисление произ
водных ничуть не сложнее, чем для функций от вещественного пере
менного. Рассмотрим, например, функцию w = z 2 . Придавая z
приращение ∆z, получим приращение функции
∆w = ( z + ∆z )2 − z 2 = 2 z ∆z + ( ∆z )2 ,

откуда, переходя к дифференциалам и отбрасывая малые высшего по
рядка (по модулю), получаем
dw = 2 z dz,

dw
= 2 z,
dz

т.е.

d( z2 )
= 2 z.
dz

Как видим, при этих вычислениях несущественно, принимает незави
симая переменная комплексные или только вещественные значения.
Однако в общем случае комплексной переменной существование
производной совсем не так очевидно и просто, как в случае веществен
ной переменной. В самом деле, z = x + iy и можно дать прираще
ние dz, меняя х и у одновременно: dz = dx + i dy; можно дать прира
щение dz, меняя только х: dz = dx; а можно, меняя только у: dz = i dy.
Если производная f ′( z ) существует, то это означает, что при различ
ных способах изменения z соответствующие изменения f таковы,
df
при этом одинаковы.
что
dz
Запишем f ( z ) в виде f ( z ) = u (x, y) + iv (x, y). Пусть изменяется
только х, тогда dz = dx и
∂f
dx
∂u
∂v
df ∂x
=
=
+i .
∂x
∂x
dx
dz

Если же изменяется только у, то dz = i dy, поэтому
 ∂u
∂v 
∂f
+ i  dy
dy 
∂y 
 ∂y
df ∂y
1 ∂u ∂v
i ∂u ∂v
=
+
=−
=
=
+ .
dz
i dy
i dy
i ∂y ∂y
∂y ∂y

Приравнивая два выражения для производной, полученных раз
личными способами, находим
∂u
∂v
i ∂u ∂v
+i
=−
+ ,
∂x
∂x
∂y ∂y

166

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

внешнего напряжения удовлетворяет соотношению (16), то она равна
частоте собственных незатухающих колебаний в цепи. Из физики из
вестно, что при этих условиях возникает резонанс и взамен периоди
ческих, гармонических колебаний, которые мы здесь только и
рассматриваем, возникают колебания с возрастающей амплитудой.
Случай резонанса будет разобран в гл. VII.
Следует отметить, что с помощью описанного метода можно полу
чить только ток, который устанавливается в цепи по прошествии неко
торого «переходного периода». Переходный процесс описывается
также по методам гл. VII.
Упражнения
1. Рассмотрите цепь, в которой последовательно включены сопротивление
1
?
R, индуктивность L и емкость С. Что будет в частном случае, когда ω 2 =
LC
2. Рассмотрите цепь, в которой сопротивление R и индуктивность L
включены параллельно.

§ 6. Производная функции комплексного переменного
Переменная w = f ( z ) называется функцией комплексного чис
ла z, если каждому значению z отвечает определенное значение f ( z ).
Так как z = x + iy, где х — вещественная часть, у — мнимая часть, то
задание z означает задание двух вещественных чисел х и у. При
этом f ( z ) = u (x, y) + iv (x, y), где u (x, y) и v (x, y) — вещественные
функции. Каждому z соответствуют определенные х и у, а значит,
определенные u и v и, следовательно, определенная величина f ( z ).
Однако мы будем теперь рассматривать как функцию f ( z ) не всякое
выражение u (x, y) + iv (x, y), а лишь такую величину, которая зависит
от z по таким формулам, как, например, f ( z ) = 1 + z 2 , f ( z ) = z ,
f ( z ) = e z , f ( z ) = sin z и т.д. Эти формулы могут содержать алгебраи
ческие действия над z или неалгебраические, но такие, которые мож
но выразить с помощью степенных рядов Тейлора от z, например, e z ,
sin z и т.д.
Таким образом, мы рассматриваем формулы, в которые входит
именно z, но не его вещественная или мнимая часть в отдельности.
(С этой точки зрения, например, z * = x − iy или z не рассматрива
ются здесь как функции z, хотя, зная z, легко найти z* и z .) При та
ком определении f ( z ) у всех функций f ( z ) есть одно общее
свойство: по обычным правилам дифференцирования функций можно
найти производную
f ′( z ) =

df
.
dz

§ 6]

ПРОИЗВОДНАЯ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

167

Функция f ( z ), имеющая производную, называется аналитической
функцией. Мы, следовательно, рассматриваем только аналитические
функции.
Для функций, заданных простыми формулами, вычисление произ
водных ничуть не сложнее, чем для функций от вещественного пере
менного. Рассмотрим, например, функцию w = z 2 . Придавая z
приращение ∆z, получим приращение функции
∆w = ( z + ∆z )2 − z 2 = 2 z ∆z + ( ∆z )2 ,

откуда, переходя к дифференциалам и отбрасывая малые высшего по
рядка (по модулю), получаем
dw = 2 z dz,

dw
= 2 z,
dz

т.е.

d( z2 )
= 2 z.
dz

Как видим, при этих вычислениях несущественно, принимает незави
симая переменная комплексные или только вещественные значения.
Однако в общем случае комплексной переменной существование
производной совсем не так очевидно и просто, как в случае веществен
ной переменной. В самом деле, z = x + iy и можно дать прираще
ние dz, меняя х и у одновременно: dz = dx + i dy; можно дать прира
щение dz, меняя только х: dz = dx; а можно, меняя только у: dz = i dy.
Если производная f ′( z ) существует, то это означает, что при различ
ных способах изменения z соответствующие изменения f таковы,
df
при этом одинаковы.
что
dz
Запишем f ( z ) в виде f ( z ) = u (x, y) + iv (x, y). Пусть изменяется
только х, тогда dz = dx и
∂f
dx
∂u
∂v
df ∂x
=
=
+i .
∂x
∂x
dx
dz

Если же изменяется только у, то dz = i dy, поэтому
 ∂u
∂v 
∂f
+ i  dy
dy 
∂y 
 ∂y
df ∂y
1 ∂u ∂v
i ∂u ∂v
=
+
=−
=
=
+ .
dz
i dy
i dy
i ∂y ∂y
∂y ∂y

Приравнивая два выражения для производной, полученных раз
личными способами, находим
∂u
∂v
i ∂u ∂v
+i
=−
+ ,
∂x
∂x
∂y ∂y

168

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

а значит,
∂u ∂v
= ,
∂x ∂y

∂v
∂u
=− .
∂x
∂y

(17)

Эти формулы называются условиями Коши%Римана. Итак, у аналити
ческой функции f ( z ) вещественная и мнимая части связаны опреде
ленными соотношениями.
Рассмотрим пример. Пусть
f ( z ) = z 2 = ( x + iy )2 = x 2 − y 2 + i ⋅ 2 xy.

Здесь u = x 2 − y 2 , v = 2xy,
∂u ∂v
=
= 2 x,
∂x ∂y

∂v
∂u
=−
= 2 y.
∂x
∂y

Таким образом, условия Коши–Римана (17) выполняются.
Рассмотрим пример противоположного характера. Пусть f ( z ) =
= z * = x − iy, где z = x + iy. Выше мы отмечали, что хотя та
кая f ( z ) и может быть в какомто смысле названа функцией от z
(каждому z отвечает вполне определенное z*), но это не аналитичес
кая функция. Действительно, в этом случае u = x, v = − y, поэтому
∂u
= 1,
∂x

∂v
= 0,
∂x

∂u
= 0,
∂y

∂v
= −1;
∂y

первое из условий Коши–Римана не выполнено.
Упражнение
Проверьте условие Коши–Римана для функции f ( z ) = z 3 .

§ 7. Гармонические функции
Вернемся к аналитическим функциям. Возьмем производные по х
от первого равенства (17) и по у от второго равенства (17). Получим
∂2u
∂2v
,
=
2
∂x ∂y
∂x

∂2v
∂2u
=− 2,
∂x ∂y
∂y

§ 7]

ГАРМОНИЧЕСКИЕ ФУНКЦИИ

шения этого уравнения, которые называются также гармоническими
функциями.
Итак, в качестве вещественной и мнимой частей аналитической
функции могут быть взяты не какие угодно функции u (x, y) и v (x, y),
а только гармонические функции. Кроме того, эти функции должны
быть связаны друг с другом соотношениями (17); такие функции назы
ваются сопряженными гармоническими функциями. Можно проверить,
что если одна из двух сопряженных функций уже выбрана, то в силу
этих соотношений вторая определена полностью, с точностью до про
извольного постоянного слагаемого. В самом деле, пусть функция v
выбрана и соотношениям (17) удовлетворяют две функции: u = u1 и
∂u 1 ∂u 2
∂v
. Поэ
, так как обе эти производные равны
=
u = u2 . Тогда
∂x
∂x
∂y
∂ (u1 − u2 )
тому
= 0, т.е. u1 − u2 не зависит от х. Аналогично получа
∂x
∂ (u1 − u2 )
ем, что
= 0, т.е. разность u1 − u2 не зависит и от у, а потому
∂y
является постоянной.
Уравнение Лапласа имеет большое значение в математической фи
зике. Например, электростатический потенциал в пространстве между
длинными проводниками, вытянутыми перпендикулярно плоскос
ти х, у, является функцией только х, у и удовлетворяет уравнению
(18). В тех точках плоскости х, у, где она протыкается проводниками,
уравнение Лапласа для потенциала нарушается. В частности, там, где
плоскость пересекает проводник, сечение которого имеет бесконечно
малый диаметр, потенциал имеет особенность (обращается в бесконеч
ность). Таким образом, более точно надо сказать, что потенциал явля
ется гармонической функцией в той части плоскости, где нет зарядов.
Подробнее об этом будет сказано в § Х.5.
Связь между u и v имеет простой геометрический смысл. Дейст
∂u
∂u
вительно, построим линию u (x, y) = const. Так как
dx +
dy = 0,
∂x
∂y
то тангенс угла наклона этой линии к оси х равен
tg α 1 =

откуда
∂2u ∂2u
+
= 0.
∂x 2 ∂y 2

(18)

Аналогично, дифференцируя первое равенство (17) по у, а второе
∂2 v ∂2 v
по х, получим
+
= 0. Уравнение (18) называется уравнением
∂x 2 ∂y 2
Лапласа. Задаваясь различными f ( z ), можно получить различные ре

169

dy
dx

u = const

=−

∂u
∂x

∂u
.
∂y

Подобным образом тангенс угла наклона линии v (x, y) = const к
оси х равен
tg α 2 =

dy
dx

v = const

=−

∂v
∂x

∂v
.
∂y

168

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

а значит,
∂u ∂v
= ,
∂x ∂y

∂v
∂u
=− .
∂x
∂y

(17)

Эти формулы называются условиями Коши%Римана. Итак, у аналити
ческой функции f ( z ) вещественная и мнимая части связаны опреде
ленными соотношениями.
Рассмотрим пример. Пусть
f ( z ) = z 2 = ( x + iy )2 = x 2 − y 2 + i ⋅ 2 xy.

Здесь u = x 2 − y 2 , v = 2xy,
∂u ∂v
=
= 2 x,
∂x ∂y

∂v
∂u
=−
= 2 y.
∂x
∂y

Таким образом, условия Коши–Римана (17) выполняются.
Рассмотрим пример противоположного характера. Пусть f ( z ) =
= z * = x − iy, где z = x + iy. Выше мы отмечали, что хотя та
кая f ( z ) и может быть в какомто смысле названа функцией от z
(каждому z отвечает вполне определенное z*), но это не аналитичес
кая функция. Действительно, в этом случае u = x, v = − y, поэтому
∂u
= 1,
∂x

∂v
= 0,
∂x

∂u
= 0,
∂y

∂v
= −1;
∂y

первое из условий Коши–Римана не выполнено.
Упражнение
Проверьте условие Коши–Римана для функции f ( z ) = z 3 .

§ 7. Гармонические функции
Вернемся к аналитическим функциям. Возьмем производные по х
от первого равенства (17) и по у от второго равенства (17). Получим
∂2u
∂2v
,
=
2
∂x ∂y
∂x

∂2v
∂2u
=− 2,
∂x ∂y
∂y

§ 7]

ГАРМОНИЧЕСКИЕ ФУНКЦИИ

шения этого уравнения, которые называются также гармоническими
функциями.
Итак, в качестве вещественной и мнимой частей аналитической
функции могут быть взяты не какие угодно функции u (x, y) и v (x, y),
а только гармонические функции. Кроме того, эти функции должны
быть связаны друг с другом соотношениями (17); такие функции назы
ваются сопряженными гармоническими функциями. Можно проверить,
что если одна из двух сопряженных функций уже выбрана, то в силу
этих соотношений вторая определена полностью, с точностью до про
извольного постоянного слагаемого. В самом деле, пусть функция v
выбрана и соотношениям (17) удовлетворяют две функции: u = u1 и
∂u 1 ∂u 2
∂v
. Поэ
, так как обе эти производные равны
=
u = u2 . Тогда
∂x
∂x
∂y
∂ (u1 − u2 )
тому
= 0, т.е. u1 − u2 не зависит от х. Аналогично получа
∂x
∂ (u1 − u2 )
ем, что
= 0, т.е. разность u1 − u2 не зависит и от у, а потому
∂y
является постоянной.
Уравнение Лапласа имеет большое значение в математической фи
зике. Например, электростатический потенциал в пространстве между
длинными проводниками, вытянутыми перпендикулярно плоскос
ти х, у, является функцией только х, у и удовлетворяет уравнению
(18). В тех точках плоскости х, у, где она протыкается проводниками,
уравнение Лапласа для потенциала нарушается. В частности, там, где
плоскость пересекает проводник, сечение которого имеет бесконечно
малый диаметр, потенциал имеет особенность (обращается в бесконеч
ность). Таким образом, более точно надо сказать, что потенциал явля
ется гармонической функцией в той части плоскости, где нет зарядов.
Подробнее об этом будет сказано в § Х.5.
Связь между u и v имеет простой геометрический смысл. Дейст
∂u
∂u
вительно, построим линию u (x, y) = const. Так как
dx +
dy = 0,
∂x
∂y
то тангенс угла наклона этой линии к оси х равен
tg α 1 =

откуда
∂2u ∂2u
+
= 0.
∂x 2 ∂y 2

(18)

Аналогично, дифференцируя первое равенство (17) по у, а второе
∂2 v ∂2 v
по х, получим
+
= 0. Уравнение (18) называется уравнением
∂x 2 ∂y 2
Лапласа. Задаваясь различными f ( z ), можно получить различные ре

169

dy
dx

u = const

=−

∂u
∂x

∂u
.
∂y

Подобным образом тангенс угла наклона линии v (x, y) = const к
оси х равен
tg α 2 =

dy
dx

v = const

=−

∂v
∂x

∂v
.
∂y

170

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 8]

ИНТЕГРАЛ ОТ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

171

Пользуясь условиями Коши–Римана, получаем
tg α 2 =

∂u
∂y

∂u
1
.
=−
∂x
tg α 1

(19)

Мы получили условие перпендикулярности касательных к линиям
u (x , y) = const и v (x , y) = const*.
Таким образом, взяв любую аналитическую функцию
f (z) = u(x , y) + iv (x , y), мы получим два семейства кривых, пересекаю5
щихся в каждой точке под
прямым углом. Для приве5
денного
выше
примера
f (z) = z 2 эти кривые показа5
ны на рис. 58.
Если u — электростати5
ческий
потенциал,
то
u (x , y) = const — это линии по5
стоянного потенциала, a
линии
v (x , y) = const —
напряженности («силовые
линии») поля; в каждой точке
линия напряженности на5
пpавлена по нормали к линии
u (x , y) = const, проходящей
Рис. 58.
через эту точку.
Упражнения
1. Пусть f ( z) = u (x , y) + iv (x , y). Зная, что u (x , y) = x + x 2 − y2 , определите
v (x , y), если известно, что f (0) = 0.
2. Известно, что v (x , y) = −2xy, f (0) = 1. Определите u (x , y).

§ 8. Интеграл от функции комплексного переменного
Дадим определение интеграла от комплексной функции f (z). Возь5
мем две точки — начальную z íà и конечную z êîí — на плоскости и
соединим их какой5нибудь линией (l) (рис. 59). Разобьем эту линию
на р малых участков и граничные точки занумеруем так:
zíà = z 0 ; z1; ...; zêîí = z p .

Составим сумму
p

S = ∑ f (ξ j ) ⋅( z j − z j −1),

(20)

Рис. 59.

Рис. 60.

где точка ξ j произвольно выбрана на участке линии (l) между z j −1
и z j . Обращаем внимание читателя на то, что значения функции f (ξ j )
и величины z j − z j −1 — это комплексные числа, поэтому при состав5
лении суммы (20) мы производим действия с комплексными числами,
и результат, т.е. величина S, — также комплексное число.
Интегралом мы будем называть сумму S при условии, что линия
(l) разбита на столь мелкие участки, что дальнейшее их размельчение
практически не изменяет величину суммы S (более точно, берется
предел суммы при бесконечном размельчении этой линии). Интеграл
будем обозначать так:
zêîí

I=

∫ f ( z) dz,

zíà

Из определения следует, что интеграл множится на –1 при изменении
направления интегрирования. Действительно, при перемене направле5
ния все разности z j − z j −1 , а потому и сумма (20) множатся на –1.
Возникает следующий вопрос. Ясно, что точки z íà и z êîí можно
соединить различными способами (рис. 60). При этом, составляя сум5
му (20) для различных линий, соединяющих точки z íà и z êîí , мы бу5
дем иметь дело с различными значениями f (ξ j ) и z j − z j −1 . Зависит
ли интеграл I от выбора пути или он зависит только от начальной
(z íà ) и конечной (z êîí ) точек?
Оказывается, что если f (z) — аналитическая функция и если в об5
ласти, ограниченной различными путями, f (z) нигде не обращается
в бесконечность, то интеграл не зависит от выбора пути*.
Для доказательства обозначим замкнутый контур z íà Az êîí Bz íà
буквой (L), а интеграл ∫ f (z) dz буквой I (символом ∫ обозначается
( L)

j =1

* Для перпендикулярности должно быть α2 = α1 ± 90 , т.е.
1
.
tg α2 = tg (α1 ± 90 ) = −ctg α1 = −
tg α1
Это и есть условие (19).

* Кроме условия, чтобы f ( z ) не обращалось в бесконечность, нужно еще, чтобы
f ( z ) была однозначной функцией, или, во всяком случае, чтобы при переходе от одного
пути к другому мы все время пользовались одной ветвью функции f ( z ) (см. конец этого
параграфа).

170

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 8]

ИНТЕГРАЛ ОТ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

171

Пользуясь условиями Коши–Римана, получаем
tg α 2 =

∂u
∂y

∂u
1
.
=−
∂x
tg α 1

(19)

Мы получили условие перпендикулярности касательных к линиям
u (x , y) = const и v (x , y) = const*.
Таким образом, взяв любую аналитическую функцию
f (z) = u(x , y) + iv (x , y), мы получим два семейства кривых, пересекаю5
щихся в каждой точке под
прямым углом. Для приве5
денного
выше
примера
f (z) = z 2 эти кривые показа5
ны на рис. 58.
Если u — электростати5
ческий
потенциал,
то
u (x , y) = const — это линии по5
стоянного потенциала, a
линии
v (x , y) = const —
напряженности («силовые
линии») поля; в каждой точке
линия напряженности на5
пpавлена по нормали к линии
u (x , y) = const, проходящей
Рис. 58.
через эту точку.
Упражнения
1. Пусть f ( z) = u (x , y) + iv (x , y). Зная, что u (x , y) = x + x 2 − y2 , определите
v (x , y), если известно, что f (0) = 0.
2. Известно, что v (x , y) = −2xy, f (0) = 1. Определите u (x , y).

§ 8. Интеграл от функции комплексного переменного
Дадим определение интеграла от комплексной функции f (z). Возь5
мем две точки — начальную z íà и конечную z êîí — на плоскости и
соединим их какой5нибудь линией (l) (рис. 59). Разобьем эту линию
на р малых участков и граничные точки занумеруем так:
zíà = z 0 ; z1; ...; zêîí = z p .

Составим сумму
p

S = ∑ f (ξ j ) ⋅( z j − z j −1),

(20)

Рис. 59.

Рис. 60.

где точка ξ j произвольно выбрана на участке линии (l) между z j −1
и z j . Обращаем внимание читателя на то, что значения функции f (ξ j )
и величины z j − z j −1 — это комплексные числа, поэтому при состав5
лении суммы (20) мы производим действия с комплексными числами,
и результат, т.е. величина S, — также комплексное число.
Интегралом мы будем называть сумму S при условии, что линия
(l) разбита на столь мелкие участки, что дальнейшее их размельчение
практически не изменяет величину суммы S (более точно, берется
предел суммы при бесконечном размельчении этой линии). Интеграл
будем обозначать так:
zêîí

I=

∫ f ( z) dz,

zíà

Из определения следует, что интеграл множится на –1 при изменении
направления интегрирования. Действительно, при перемене направле5
ния все разности z j − z j −1 , а потому и сумма (20) множатся на –1.
Возникает следующий вопрос. Ясно, что точки z íà и z êîí можно
соединить различными способами (рис. 60). При этом, составляя сум5
му (20) для различных линий, соединяющих точки z íà и z êîí , мы бу5
дем иметь дело с различными значениями f (ξ j ) и z j − z j −1 . Зависит
ли интеграл I от выбора пути или он зависит только от начальной
(z íà ) и конечной (z êîí ) точек?
Оказывается, что если f (z) — аналитическая функция и если в об5
ласти, ограниченной различными путями, f (z) нигде не обращается
в бесконечность, то интеграл не зависит от выбора пути*.
Для доказательства обозначим замкнутый контур z íà Az êîí Bz íà
буквой (L), а интеграл ∫ f (z) dz буквой I (символом ∫ обозначается
( L)

j =1

* Для перпендикулярности должно быть α2 = α1 ± 90 , т.е.
1
.
tg α2 = tg (α1 ± 90 ) = −ctg α1 = −
tg α1
Это и есть условие (19).

* Кроме условия, чтобы f ( z ) не обращалось в бесконечность, нужно еще, чтобы
f ( z ) была однозначной функцией, или, во всяком случае, чтобы при переходе от одного
пути к другому мы все время пользовались одной ветвью функции f ( z ) (см. конец этого
параграфа).

172

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

интеграл по замкнутому контуру). Так как
I=





f ( z ) dz +

z íà ÷Az êîí

f ( z ) dz =



f ( z ) dz −

z íà ÷Az êîí



Таким образом, величина

z íà ÷Bz êîí

∫ f ( z ) dz = ∑k ∫ f ( z ) dz,

(21)

(L k )

так как в правой части все интегралы, взятые
по внутренним сторонам частичек, взаимно
уничтожаются. Если внутри ( Lk ) выбрать какуюлибо точку z k , то
на ( Lk ) будет
Рис. 61.

f ( z ) − f ( z k ) ∆f
f ( z ) − f ( zk )
=
≈ f ′( z k ), то есть
= f ′( z k ) + α,
z − zk
∆z
z − zk

где α —бесконечно малая, имеющая порядок длины h стороны
частички . Отсюда



f ( z ) dz =

(L k )

173

z

f ( z ) dz,

то достаточно проверить, что I = 0. Обратно, если интегралы от f ( z )
по контурам z íà÷ Az êîí и z íà÷ Bz êîí равны, то I = 0. Значит, независи
мость интеграла аналитической функции от пути интегрирования рав
носильна следующему утверждению, известному под названием
теоремы Коши: интеграл, взятый по замкнутому контуру от функции,
аналитической всюду внутри этого контура и на нем, равен нулю.
Для доказательства теоремы Коши разобьем часть плоскости,
ограниченную замкнутым контуром (L), на маленькие частички
с контуpами ( Lk ) и будем каждый из этих
контуров проходить против стрелки часов,
т.е. в том же направлении, в котором обхо
дится (L). (На рис. 61 показан один из кон
туров.) Тогда
(L )

ИНТЕГРАЛ ОТ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

правая часть стремится к нулю; но она должна равняться постоянной ле
вой части, т.е. эта постоянная равна нулю, что и требовалось доказать.
Позже мы сможем с помощью методов векторного анализа дать дру
гое доказательство этой важной теоремы (см. упражнение 2 к § XI.7).

z êîí Bz íà ÷

=

§ 8]

∫ [ f ( z k ) + f ′( z k )( z − z k ) + α( z − z k )] dz.

(L k )

∫ f ( z ) dz

при закрепленном z íà÷ зави

z íà ÷

сит только от конечной точки z пути, т.е. является функцией от z.
z

∫ f ( z ) dz = Φ( z ).

Обозначим эту функцию через Φ( z ), тогда

z íà ÷

Найдем производную этой функции
z + dz

dΦ ( z ) Φ ( z + dz ) − Φ ( z )
=
=
dz
dz



z íà ÷





dz

f ( z ) dz . Так как числа z



f ( z ) dz

z íà ÷

z + dz

Рассмотрим

z + dz

z

f ( z ) dz −

=

f ( z ) dz

z

dz

.

и z + dz весьма близки,

z

а f ( z ) — непрерывная функция, то при изменении z в этих пределах
не
успевает
заметно
измениться.
Поэтому
f ( z)
z + dz



f ( z ) dz ≈ f ( z )( z + dz − z ) = = f ( z ) dz , причем это равенство можно

z

сделать сколь угодно точным за счет уменьшения dz. Следовательно,
dΦ( z ) f ( z ) dz
=
= f ( z ).
dz
dz

(22)

Формула (22) показывает, что зависимость между подынтегральной
функцией f ( z ) и интегралом Φ( z ) остается такой же, как и в случае
функции вещественного переменного.
Покажем еще, что сохраняется обычная формула для вычисления
интеграла
z êîí

∫ f ( z ) dz = Φ ( zêîí ) − Φ ( zíà ÷ ),

(23)

z íà ÷

Интеграл от первых двух слагаемых берется легко и, так как интегриро
вание производится по замкнутому контуру, равен нулю. Значит, оста
ется лишь интеграл от третьего слагаемого, который имеет порядок h 3 ,
так как длина контура интегрирования имеет порядок h и множитель
z − z k имеет тот же порядок. Но в правой части выражения (21) число
1
слагаемых в сумме имеет порядок 2 , и тем самым вся сумма имеет по
h
рядок h. Значит, при бесконечном измельчении частичек, когда h → 0,

где Φ( z ) — любая функция, удовлетворяющая соотношению (22).
z

Действительно, теперь уже

∫ f ( z ) dz = Φ( z ) + С, где С — постоянная.

z íà ÷

Полагая в этом равенстве z = z íà÷ , получим 0 = Φ( z íà÷ ) + С, откуда
z

C = −Φ( z íà÷ ). Поэтому

∫ f ( z ) dz = Φ( z ) − Φ( z íà÷ ).

Положив здесь

z íà ÷

z = z êîí , мы получим (23). Формулы (22) и (23) показывают, что все

172

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

интеграл по замкнутому контуру). Так как
I=





f ( z ) dz +

z íà ÷Az êîí

f ( z ) dz =



f ( z ) dz −

z íà ÷Az êîí



Таким образом, величина

z íà ÷Bz êîí

∫ f ( z ) dz = ∑k ∫ f ( z ) dz,

(21)

(L k )

так как в правой части все интегралы, взятые
по внутренним сторонам частичек, взаимно
уничтожаются. Если внутри ( Lk ) выбрать какуюлибо точку z k , то
на ( Lk ) будет
Рис. 61.

f ( z ) − f ( z k ) ∆f
f ( z ) − f ( zk )
=
≈ f ′( z k ), то есть
= f ′( z k ) + α,
z − zk
∆z
z − zk

где α —бесконечно малая, имеющая порядок длины h стороны
частички . Отсюда



f ( z ) dz =

(L k )

173

z

f ( z ) dz,

то достаточно проверить, что I = 0. Обратно, если интегралы от f ( z )
по контурам z íà÷ Az êîí и z íà÷ Bz êîí равны, то I = 0. Значит, независи
мость интеграла аналитической функции от пути интегрирования рав
носильна следующему утверждению, известному под названием
теоремы Коши: интеграл, взятый по замкнутому контуру от функции,
аналитической всюду внутри этого контура и на нем, равен нулю.
Для доказательства теоремы Коши разобьем часть плоскости,
ограниченную замкнутым контуром (L), на маленькие частички
с контуpами ( Lk ) и будем каждый из этих
контуров проходить против стрелки часов,
т.е. в том же направлении, в котором обхо
дится (L). (На рис. 61 показан один из кон
туров.) Тогда
(L )

ИНТЕГРАЛ ОТ ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

правая часть стремится к нулю; но она должна равняться постоянной ле
вой части, т.е. эта постоянная равна нулю, что и требовалось доказать.
Позже мы сможем с помощью методов векторного анализа дать дру
гое доказательство этой важной теоремы (см. упражнение 2 к § XI.7).

z êîí Bz íà ÷

=

§ 8]

∫ [ f ( z k ) + f ′( z k )( z − z k ) + α( z − z k )] dz.

(L k )

∫ f ( z ) dz

при закрепленном z íà÷ зави

z íà ÷

сит только от конечной точки z пути, т.е. является функцией от z.
z

∫ f ( z ) dz = Φ( z ).

Обозначим эту функцию через Φ( z ), тогда

z íà ÷

Найдем производную этой функции
z + dz

dΦ ( z ) Φ ( z + dz ) − Φ ( z )
=
=
dz
dz



z íà ÷





dz

f ( z ) dz . Так как числа z



f ( z ) dz

z íà ÷

z + dz

Рассмотрим

z + dz

z

f ( z ) dz −

=

f ( z ) dz

z

dz

.

и z + dz весьма близки,

z

а f ( z ) — непрерывная функция, то при изменении z в этих пределах
не
успевает
заметно
измениться.
Поэтому
f ( z)
z + dz



f ( z ) dz ≈ f ( z )( z + dz − z ) = = f ( z ) dz , причем это равенство можно

z

сделать сколь угодно точным за счет уменьшения dz. Следовательно,
dΦ( z ) f ( z ) dz
=
= f ( z ).
dz
dz

(22)

Формула (22) показывает, что зависимость между подынтегральной
функцией f ( z ) и интегралом Φ( z ) остается такой же, как и в случае
функции вещественного переменного.
Покажем еще, что сохраняется обычная формула для вычисления
интеграла
z êîí

∫ f ( z ) dz = Φ ( zêîí ) − Φ ( zíà ÷ ),

(23)

z íà ÷

Интеграл от первых двух слагаемых берется легко и, так как интегриро
вание производится по замкнутому контуру, равен нулю. Значит, оста
ется лишь интеграл от третьего слагаемого, который имеет порядок h 3 ,
так как длина контура интегрирования имеет порядок h и множитель
z − z k имеет тот же порядок. Но в правой части выражения (21) число
1
слагаемых в сумме имеет порядок 2 , и тем самым вся сумма имеет по
h
рядок h. Значит, при бесконечном измельчении частичек, когда h → 0,

где Φ( z ) — любая функция, удовлетворяющая соотношению (22).
z

Действительно, теперь уже

∫ f ( z ) dz = Φ( z ) + С, где С — постоянная.

z íà ÷

Полагая в этом равенстве z = z íà÷ , получим 0 = Φ( z íà÷ ) + С, откуда
z

C = −Φ( z íà÷ ). Поэтому

∫ f ( z ) dz = Φ( z ) − Φ( z íà÷ ).

Положив здесь

z íà ÷

z = z êîí , мы получим (23). Формулы (22) и (23) показывают, что все

174

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

правила нахождения интегралов, известные для обычных, веществен
ных интегралов (см., например, ВМ, гл. II), применимы и к интегралам
от комплексных функций.
В теории аналитических функций часто встречаются многозначные
функции. Рассмотрим, например, функцию w = z . В § 4 мы показа
ли, что эта функция имеет два значения: если z = re iϕ , то
i

ϕ

w1 = r e 2 ,

w2 = r e

ϕ

i  +π
2


.

Если выбрать какоелибо одно значение, как говорят, одну ветвь
этой функции, то мы столкнемся со следующим интересным свой
ством. Пусть z обойдет точку z = 0 в положительном направлении*
и подойдет к исходному положению. Тогда к ϕ прибавится 2π, а пото
му значение w1 перейдет в
re

i

ϕ + 2π
2

= re

ϕ

i  +π
2


= w2 ;

подобным образом w2 перейдет при этом в
re

 ϕ + 2π

+π
i 
 2


= re

i

ϕ
2

⋅e

2 πi

= re

i

ВЫЧЕТЫ

175

Чтобы можно было рассматривать одну ветвь независимо от другой,
нужно какимто способом запретить точке z обходить точки ветвления
рассматриваемой функции. Обычно для этого в плоскости проводятся
одна или несколько линий, «разрезов», соединяющих точки ветвления,
и эти разрезы запрещается пересекать. Например, при рассмотрении
функции w = z можно провести разрез вдоль вещественной положи
тельной полуоси от точки z = 0 до бесконечности. Если точка z меня
ется произвольно в плоскости вне этого разреза, то она не может обойти
точку ветвления z = 0 и потому одна ветвь не может сменить другую.
После проведения такого разреза каждая ветвь может считаться одно
значной аналитической функцией (хотя вдоль разреза ветвь имеет раз
рыв, она на разных «берегах» разреза принимает различные значения);
в частности, к такой ветви можно применить теорему Коши.
Впредь мы будем в качестве подынтегральных функций рассматри
вать только однозначные аналитические функции. Впрочем, в § 9 мы
увидим, что это не спасет нас от необходимости рассматривать не
однозначные функции, появляющиеся в результате интегрирования.
Упражнение

ϕ
2

§ 9]

⋅ 1 = w1 .

Таким образом, две ветви функции w = z при обходе точки z = 0 не
прерывно переходят одна в другую, а если обойти точку z = 0 два раза,
то мы вернемся к исходной ветви.
Точка z = z 0 , при обходе которой одна ветвь многозначной функ
ции сменяет другую, называется точкой ветвления. Таким образом,
для функции w = z точка z = 0 служит точкой ветвления второго
порядка (так как здесь имеются две ветви). Другой точкой ветвления
для этой функции принято считать «бесконечную точку» z = ∞. В точ
ке ветвления могут чередоваться и более двух ветвей: например, функ
ция w = n z имеет n ветвей, которые непрерывно сменяют одна
другую в круговом порядке при обходе точки ветвления z = 0.
Другой важный пример многозначной функции дает функция
w = ln z . В § 4 мы видели, что эта функция имеет бесконечное число зна
чений: w k = ln r + i(ϕ + 2kπ) (k = 0, ±1, ±2, ...). Если точка z обходит
начало координат и к ϕ прибавляется 2π, то значение w 0 переходит
в w1 , значение w1 — в w2 и т.д. Если опять обходить начало, то мы
будем переходить к новым и новым ветвям и никогда не вернемся к ис
ходной ветви. Такая точка ветвления называется точкой ветвления
бесконечного порядка.
* Мы считаем направление обхода положительным, если точка
все время остается слева.

z = 0 при обходе

Найдите интегралы по верхней и нижней полуокружностям с центром
1
в точке z = 0, идущим из z = −1 в z = 1, от функций: а) z 2 ; б) ; в) z (для
z
ветви, равной i при z = −1). Объясните совпадение результатов в слу
чае а) и несовпадение в случаях б) и в).

§ 9. Вычеты
Итак, если интеграл не зависит от пути, то интеграл по замкнутому
контуру равен нулю. Выше говорилось, что интеграл от однозначной
аналитической функции не зависит от пути, если эта функция не обра
щается в бесконечность. Рассмотрим пример, в котором подынтеграль
ная функция обращается в бесконечность.
dz
1
Пусть I = ∫ . Здесь f ( z ) = обращается в бесконечность при
z
z
z = 0. Вычислим интеграл по замкнутому пути, обходящему в положи
тельном направлении (т.е. против хода стрел
ки часов) точку z = 0, например по окружнос
ти (С) радиуса r с центром в начале
координат (рис. 62). На такой окружности
z = re iϕ , где r — радиус окружности, а пере
менная ϕ изменяется от 0 до 2π.Тогда
re iϕ i dϕ
dz
=∫
= 2πi. Интеграл
dz = re iϕ i dϕ и ∫
z
re iϕ
C
по замкнутому кругу оказался не равным нулю.

Рис. 62.

174

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

правила нахождения интегралов, известные для обычных, веществен
ных интегралов (см., например, ВМ, гл. II), применимы и к интегралам
от комплексных функций.
В теории аналитических функций часто встречаются многозначные
функции. Рассмотрим, например, функцию w = z . В § 4 мы показа
ли, что эта функция имеет два значения: если z = re iϕ , то
i

ϕ

w1 = r e 2 ,

w2 = r e

ϕ

i  +π
2


.

Если выбрать какоелибо одно значение, как говорят, одну ветвь
этой функции, то мы столкнемся со следующим интересным свой
ством. Пусть z обойдет точку z = 0 в положительном направлении*
и подойдет к исходному положению. Тогда к ϕ прибавится 2π, а пото
му значение w1 перейдет в
re

i

ϕ + 2π
2

= re

ϕ

i  +π
2


= w2 ;

подобным образом w2 перейдет при этом в
re

 ϕ + 2π

+π
i 
 2


= re

i

ϕ
2

⋅e

2 πi

= re

i

ВЫЧЕТЫ

175

Чтобы можно было рассматривать одну ветвь независимо от другой,
нужно какимто способом запретить точке z обходить точки ветвления
рассматриваемой функции. Обычно для этого в плоскости проводятся
одна или несколько линий, «разрезов», соединяющих точки ветвления,
и эти разрезы запрещается пересекать. Например, при рассмотрении
функции w = z можно провести разрез вдоль вещественной положи
тельной полуоси от точки z = 0 до бесконечности. Если точка z меня
ется произвольно в плоскости вне этого разреза, то она не может обойти
точку ветвления z = 0 и потому одна ветвь не может сменить другую.
После проведения такого разреза каждая ветвь может считаться одно
значной аналитической функцией (хотя вдоль разреза ветвь имеет раз
рыв, она на разных «берегах» разреза принимает различные значения);
в частности, к такой ветви можно применить теорему Коши.
Впредь мы будем в качестве подынтегральных функций рассматри
вать только однозначные аналитические функции. Впрочем, в § 9 мы
увидим, что это не спасет нас от необходимости рассматривать не
однозначные функции, появляющиеся в результате интегрирования.
Упражнение

ϕ
2

§ 9]

⋅ 1 = w1 .

Таким образом, две ветви функции w = z при обходе точки z = 0 не
прерывно переходят одна в другую, а если обойти точку z = 0 два раза,
то мы вернемся к исходной ветви.
Точка z = z 0 , при обходе которой одна ветвь многозначной функ
ции сменяет другую, называется точкой ветвления. Таким образом,
для функции w = z точка z = 0 служит точкой ветвления второго
порядка (так как здесь имеются две ветви). Другой точкой ветвления
для этой функции принято считать «бесконечную точку» z = ∞. В точ
ке ветвления могут чередоваться и более двух ветвей: например, функ
ция w = n z имеет n ветвей, которые непрерывно сменяют одна
другую в круговом порядке при обходе точки ветвления z = 0.
Другой важный пример многозначной функции дает функция
w = ln z . В § 4 мы видели, что эта функция имеет бесконечное число зна
чений: w k = ln r + i(ϕ + 2kπ) (k = 0, ±1, ±2, ...). Если точка z обходит
начало координат и к ϕ прибавляется 2π, то значение w 0 переходит
в w1 , значение w1 — в w2 и т.д. Если опять обходить начало, то мы
будем переходить к новым и новым ветвям и никогда не вернемся к ис
ходной ветви. Такая точка ветвления называется точкой ветвления
бесконечного порядка.
* Мы считаем направление обхода положительным, если точка
все время остается слева.

z = 0 при обходе

Найдите интегралы по верхней и нижней полуокружностям с центром
1
в точке z = 0, идущим из z = −1 в z = 1, от функций: а) z 2 ; б) ; в) z (для
z
ветви, равной i при z = −1). Объясните совпадение результатов в слу
чае а) и несовпадение в случаях б) и в).

§ 9. Вычеты
Итак, если интеграл не зависит от пути, то интеграл по замкнутому
контуру равен нулю. Выше говорилось, что интеграл от однозначной
аналитической функции не зависит от пути, если эта функция не обра
щается в бесконечность. Рассмотрим пример, в котором подынтеграль
ная функция обращается в бесконечность.
dz
1
Пусть I = ∫ . Здесь f ( z ) = обращается в бесконечность при
z
z
z = 0. Вычислим интеграл по замкнутому пути, обходящему в положи
тельном направлении (т.е. против хода стрел
ки часов)точку z = 0, например по окружнос
ти (С) радиуса r с центром в начале
координат (рис. 62). На такой окружности
z = re iϕ , где r — радиус окружности, а пере
менная ϕ изменяется от 0 до 2π.Тогда
re iϕ i dϕ
dz
=∫
= 2πi. Интеграл
dz = re iϕ i dϕ и ∫
z
re iϕ
C
по замкнутому кругу оказался не равным нулю.

Рис. 62.

176

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 9]

ВЫЧЕТЫ

177

dz
dz
по за
= ln z . Неравенство нулю интеграла ∫
z
z
мкнутому контуру находится в замечательном соответствии с неодноз
2
dz
начностью функции ln z. Рассмотрим пример I = ∫ . Идя от z = 1 к
z
1
Мы знаем, что



z = 2 по кратчайшему пути (рис. 63, а), найдем I = ln 2 − ln 1 =
Выбрав более длинный путь: сначала один круг вокруг
= ln 2 = 069.
,
начала координат, а потом к цели (рис. 63, б), получим I 1 = 2πi + 069
, .
Если сделать n оборотов вокруг начала координат, то получим
, .
I n = 2πi ⋅ n + 069

Рис. 64.

воположном направлению отсчета углов, то соответствующий интег
рал равен −2πi. Поэтому I 0 = 0 = I A − 2πi или I A = 2πi, т.е. величина
I A совпадает с величиной интеграла по окружности любого радиуса.
Аналогичными способами удается сводить интегралы по неудоб
ным для расчета линиям к интегралам по маленьким окружностям вок
руг точек, обращающих подынтегральную функцию в бесконечность.
При этом не следует думать, что интеграл обязательно окажется отлич
ным от нуля. Например, у интеграла


Рис. 63.

В § 4 мы выяснили, что, действительно, величины 2πi ⋅ n + 069
, при
всех целых n служат логарифмами числа 2, так как e 2 πi⋅ n = 1. Таким
образом, неоднозначность логарифма есть результат возможности раз
1
ного выбора пути, с разным числом обходов вокруг точки z = 0, где
z
обращается в бесконечность.
Величина рассматриваемого интеграла зависит от того, сколько раз
и в каком направлении мы сделали обход вокруг начала координат, но
не зависит от того, по какому пути производился этот обход. Докажем
dz
по ка
последнее утверждение. Для этого постараемся найти I A = ∫
z
dz
комунибудь пути ABA (рис. 64, а). Рассмотрим интеграл I 0 = ∫
по
z
пути, изображенному на рис. 64, б. Этот путь состоит из пути ABA,
двух близких прямых АС и СА и окружности радиуса ОС с цен
тром в начале координат. I 0 = 0, так как это — интеграл по замкнутому
1
контуру, внутри которого
нигде не обращается в бесконечность.
z
Интеграл I 0 слагается из I A , двух взаимно уничтожающихся ин
A
C
dz
dz
тегралов ∫
и ∫
и интеграла по окружности радиуса ОС. Так
z
z
C
A
как по окружности интегрирование происходит в направлении, проти

1
dz
zm

( m = 2, 3, 4, ... )

(24)

подынтегральная функция имеет особенность (обращается в бесконеч
ность) при z = 0. Однако этот интеграл равен нулю по любому замкну
тому контуру, как не охватывающему, так и охватывающему эту точку
(но не проходящему через нее!). В самом деле, в данном примере неопре
z − m +1
деленный интеграл равен
+ C, т.е. представляет собой однознач
−m + 1
ную функцию; а приращение однозначной функции по замкнутому
контуру равно нулю. (Почему?)
Интеграл (24) по окружности z = r при любом m можно подсчи
тать также следующим образом. Положим z = re iϕ ; тогда после про
стых преобразований интеграл примет вид
ir 1 − m



∫e

i (1 − m )ϕ

dϕ.

0

Непосредственное вычисление показывает, что он равен нулю при лю
бом целом m ≠ 1. Случай нецелого m мы исключили, так как тогда
подынтегральная функция неоднозначна.
Рассмотрим еще один пример. Пусть надо вычислить интеграл



cos z
dz
z3

(25)

по замкнутому контуру, обходящему в положительном направлении
начало координат z = 0, которое в этом примере является особой точ
кой для подынтегральной функции, так как там эта функция обращает
ся в бесконечность.

176

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

§ 9]

ВЫЧЕТЫ

177

dz
dz
по за
= ln z . Неравенство нулю интеграла ∫
z
z
мкнутому контуру находится в замечательном соответствии с неодноз
2
dz
начностью функции ln z. Рассмотрим пример I = ∫ . Идя от z = 1 к
z
1
Мы знаем, что



z = 2 по кратчайшему пути (рис. 63, а), найдем I = ln 2 − ln 1 =
Выбрав более длинный путь: сначала один круг вокруг
= ln 2 = 069.
,
начала координат, а потом к цели (рис. 63, б), получим I 1 = 2πi + 069
, .
Если сделать n оборотов вокруг начала координат, то получим
, .
I n = 2πi ⋅ n + 069

Рис. 64.

воположном направлению отсчета углов, то соответствующий интег
рал равен −2πi. Поэтому I 0 = 0 = I A − 2πi или I A = 2πi, т.е. величина
I A совпадает с величиной интеграла по окружности любого радиуса.
Аналогичными способами удается сводить интегралы по неудоб
ным для расчета линиям к интегралам по маленьким окружностям вок
руг точек, обращающих подынтегральную функцию в бесконечность.
При этом не следует думать, что интеграл обязательно окажется отлич
ным от нуля. Например, у интеграла


Рис. 63.

В § 4 мы выяснили, что, действительно, величины 2πi ⋅ n + 069
, при
всех целых n служат логарифмами числа 2, так как e 2 πi⋅ n = 1. Таким
образом, неоднозначность логарифма есть результат возможности раз
1
ного выбора пути, с разным числом обходов вокруг точки z = 0, где
z
обращается в бесконечность.
Величина рассматриваемого интеграла зависит от того, сколько раз
и в каком направлении мы сделали обход вокруг начала координат, но
не зависит от того, по какому пути производился этот обход. Докажем
dz
по ка
последнее утверждение. Для этого постараемся найти I A = ∫
z
dz
комунибудь пути ABA (рис. 64, а). Рассмотрим интеграл I 0 = ∫
по
z
пути, изображенному на рис. 64, б. Этот путь состоит из пути ABA,
двух близких прямых АС и СА и окружности радиуса ОС с цен
тром в начале координат. I 0 = 0, так как это — интеграл по замкнутому
1
контуру, внутри которого
нигде не обращается в бесконечность.
z
Интеграл I 0 слагается из I A , двух взаимно уничтожающихся ин
A
C
dz
dz
тегралов ∫
и ∫
и интеграла по окружности радиуса ОС. Так
z
z
C
A
как по окружности интегрирование происходит в направлении, проти

1
dz
zm

( m = 2, 3, 4, ... )

(24)

подынтегральная функция имеет особенность (обращается в бесконеч
ность) при z = 0. Однако этот интеграл равен нулю по любому замкну
тому контуру, как не охватывающему, так и охватывающему эту точку
(но не проходящему через нее!). В самом деле, в данном примере неопре
z − m +1
деленный интеграл равен
+ C, т.е. представляет собой однознач
−m + 1
ную функцию; а приращение однозначной функции по замкнутому
контуру равно нулю. (Почему?)
Интеграл (24) по окружности z = r при любом m можно подсчи
тать также следующим образом. Положим z = re iϕ ; тогда после про
стых преобразований интеграл примет вид
ir 1 − m



∫e

i (1 − m )ϕ

dϕ.

0

Непосредственное вычисление показывает, что он равен нулю при лю
бом целом m ≠ 1. Случай нецелого m мы исключили, так как тогда
подынтегральная функция неоднозначна.
Рассмотрим еще один пример. Пусть надо вычислить интеграл



cos z
dz
z3

(25)

по замкнутому контуру, обходящему в положительном направлении
начало координат z = 0, которое в этом примере является особой точ
кой для подынтегральной функции, так как там эта функция обращает
ся в бесконечность.

178

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

Вспомнив разложение функции cos z вокруг точки
пенной ряд Тейлора,

z = 0 в сте&

cos z = 1 −

z2 z4 z6
+

+ ...,
2! 4! 6!

можем написать
z z3
cos z 1
1
= 3 −
+ −
+ ...
3
2! z 4! 6!
z
z

(26)

В этом примере при z → 0 подынтегральная функция стремится
1
к бесконечности со скоростью
; такая особая точка называется
3
z
полюсом третьего порядка.
Чтобы вычислить интеграл (25), произведем почленное интегриро&
вание ряда (26). Неопределенный интеграл от любого члена, кроме вто&
рого, даст однозначную функцию (степень с целым показателем), и
потому соответствующий интеграл по замкнутому контуру равен
нулю. (В частности, равен нулю интеграл от первого, главного члена
разложения (26).) Что касается интеграла от второго члена, то в силу
предыдущего он равен


1 ⎞

1

∫ ⎜⎝ − 2 ! z ⎟⎠ dz = − 2 ∫

dz
1
= − 2 πi = − πi.
z
2

Значит, в этом примере и весь интеграл (25) равен −πi.
Рассмотрим теперь полюс общего вида. Если (однозначная!) функ&
ция f ( z ) имеет в некоторой точке z = a полюс порядка n, то вокруг
этой точки она разлагается в так называемый ряд Лорана
−n

f ( z ) = c− n ( z − a )

−n+1

+ c− n + 1 ( z − a )

+ ...

... + c−1 ( z − a )−1 + c0 + c1 ( z − a ) + c2 ( z − a )2 + ...
... =

§ 9]

ВЫЧЕТЫ

можно пользоваться разложением (27). Аналогично последнему при&
меру, после интегрирования по замкнутому контуру интегралы от всех
c
членов окажутся равными нулю, за исключением ∫ −1 dz = 2πic −1 .
z −a
Этому значению равен и весь интеграл (28). Коэффициент c −1 при
(– 1)&й степени z − a в разложении Лорана имеет специальное назва&
ние: вычет функции f ( z ) в точке а; таким образом, интеграл (28) ра&
вен
2πi Вычz=a f(z).

(29)

Пусть теперь требуется вычислить интеграл вида (28) по некоторо&
му контуру ( L) (рис. 65), причем подынтегральная функция f ( z ) яв&
ляется однозначной и аналитической всюду на контуре ( L) и внутри
него, за исключением некоторого числа особых точек. (На рис. 65 име&
ются три такие точки: a1 , a2 и a 3 .) Прове&
дем вспомогательные линии (на рис. 65 они
a2
показаны пунктиром) так, чтобы область,
ограниченная контуром ( L), разбилась на
a3
части, в каждой из которых расположено по
a1
(L)
одной особой точке. Обозначим контуры
этих частей, проходимые в положительном
направлении, через ( L1 ), ( L2 ) и ( L3 ). Тогда
Рис. 65.
легко проверить, что

∫ f ( z ) dz = ∫ f ( z ) dz + ∫ f ( z ) dz + ∫ f ( z ) dz,

(L )

(L 1 )

(L 2 )

(30)

(L 3 )

так как в правой части интегралы, взятые по вспомогательным линиям,
взаимно уничтожаются. Каждый из контуров ( L1 ), ( L2 ), ( L3 ) содер&
жит внутри себя только одну особую точку, поэтому каждый из интег&
ралов в правой части (30) вычисляется по формуле (29), и мы получаем

∫ f ( z ) dz = 2πi Выч z = a

c− n
c− n + 1
c
+
+ ... + −1 + c0 +
z −a
( z − a )− n ( z − a )− n −1

179

1

f ( z ) + 2πi Выч z = a 2 f ( z ) + 2πi Выч z = a 3 f ( z ) =

(L )

(27)

= 2πi [Выч z = a 1 f ( z ) + Выч z = a 2 f ( z ) + Выч z = a 3 f ( z )]. (31)

по целым положительным и отрицательным степеням z − a, начиная
с n&й степени. Пусть требуется вычислить интеграл

Итак, интеграл (28) равен произведению 2πi на сумму вычетов под&
ынтегральной функции во всех особых точках, расположенных внутри
контура интегрирования.
Покажем, как вычисляется вычет для наиболее важного случая по&
люса первого порядка. Такой полюс обычно получается, если подын&
тегральная функция f ( z ) представляет собой отношение двух
конечных функций: f ( z ) = g ( z ) h( z ), причем в некоторой точке z = a
числитель отличен от нуля, а знаменатель имеет нуль первого порядка,

+ c1 ( z − a ) + c2 ( z − a )2 + ...

∫ f ( z ) dz

(28)

по контуру, обходящему точку z = a в положительном направлении и
не содержащему, кроме этой точки, внутри себя других особых точек.
Как было сказано, от заданного интеграла можно перейти к интегралу
по маленькой окружности с центром в точке а, а вблизи этой точки

178

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

Вспомнив разложение функции cos z вокруг точки
пенной ряд Тейлора,

z = 0 в сте&

cos z = 1 −

z2 z4 z6
+

+ ...,
2! 4! 6!

можем написать
z z3
cos z 1
1
= 3 −
+ −
+ ...
3
2! z 4! 6!
z
z

(26)

В этом примере при z → 0 подынтегральная функция стремится
1
к бесконечности со скоростью
; такая особая точка называется
3
z
полюсом третьего порядка.
Чтобы вычислить интеграл (25), произведем почленное интегриро&
вание ряда (26). Неопределенный интеграл от любого члена, кроме вто&
рого, даст однозначную функцию (степень с целым показателем), и
потому соответствующий интеграл по замкнутому контуру равен
нулю. (В частности, равен нулю интеграл от первого, главного члена
разложения (26).) Что касается интеграла от второго члена, то в силу
предыдущего он равен


1 ⎞

1

∫ ⎜⎝ − 2 ! z ⎟⎠ dz = − 2 ∫

dz
1
= − 2 πi = − πi.
z
2

Значит, в этом примере и весь интеграл (25) равен −πi.
Рассмотрим теперь полюс общего вида. Если (однозначная!) функ&
ция f ( z ) имеет в некоторой точке z = a полюс порядка n, то вокруг
этой точки она разлагается в так называемый ряд Лорана
−n

f ( z ) = c− n ( z − a )

−n+1

+ c− n + 1 ( z − a )

+ ...

... + c−1 ( z − a )−1 + c0 + c1 ( z − a ) + c2 ( z − a )2 + ...
... =

§ 9]

ВЫЧЕТЫ

можно пользоваться разложением (27). Аналогично последнему при&
меру, после интегрирования по замкнутому контуру интегралы от всех
c
членов окажутся равными нулю, за исключением ∫ −1 dz = 2πic −1 .
z −a
Этому значению равен и весь интеграл (28). Коэффициент c −1 при
(– 1)&й степени z − a в разложении Лорана имеет специальное назва&
ние: вычет функции f ( z ) в точке а; таким образом, интеграл (28) ра&
вен
2πi Вычz=a f(z).

(29)

Пусть теперь требуется вычислить интеграл вида (28) по некоторо&
му контуру ( L) (рис. 65), причем подынтегральная функция f ( z ) яв&
ляется однозначной и аналитической всюду на контуре ( L) и внутри
него, за исключением некоторого числа особых точек. (На рис. 65 име&
ются три такие точки: a1 , a2 и a 3 .) Прове&
дем вспомогательные линии (на рис. 65 они
a2
показаны пунктиром) так, чтобы область,
ограниченная контуром ( L), разбилась на
a3
части, в каждой из которых расположено по
a1
(L)
одной особой точке. Обозначим контуры
этих частей, проходимые в положительном
направлении, через ( L1 ), ( L2 ) и ( L3 ). Тогда
Рис. 65.
легко проверить, что

∫ f ( z ) dz = ∫ f ( z ) dz + ∫ f ( z ) dz + ∫ f ( z ) dz,

(L )

(L 1 )

(L 2 )

(30)

(L 3 )

так как в правой части интегралы, взятые по вспомогательным линиям,
взаимно уничтожаются. Каждый из контуров ( L1 ), ( L2 ), ( L3 ) содер&
жит внутри себя только одну особую точку, поэтому каждый из интег&
ралов в правой части (30) вычисляется по формуле (29), и мы получаем

∫ f ( z ) dz = 2πi Выч z = a

c− n
c− n + 1
c
+
+ ... + −1 + c0 +
z −a
( z − a )− n ( z − a )− n −1

179

1

f ( z ) + 2πi Выч z = a 2 f ( z ) + 2πi Выч z = a 3 f ( z ) =

(L )

(27)

= 2πi [Выч z = a 1 f ( z ) + Выч z = a 2 f ( z ) + Выч z = a 3 f ( z )]. (31)

по целым положительным и отрицательным степеням z − a, начиная
с n&й степени. Пусть требуется вычислить интеграл

Итак, интеграл (28) равен произведению 2πi на сумму вычетов под&
ынтегральной функции во всех особых точках, расположенных внутри
контура интегрирования.
Покажем, как вычисляется вычет для наиболее важного случая по&
люса первого порядка. Такой полюс обычно получается, если подын&
тегральная функция f ( z ) представляет собой отношение двух
конечных функций: f ( z ) = g ( z ) h( z ), причем в некоторой точке z = a
числитель отличен от нуля, а знаменатель имеет нуль первого порядка,

+ c1 ( z − a ) + c2 ( z − a )2 + ...

∫ f ( z ) dz

(28)

по контуру, обходящему точку z = a в положительном направлении и
не содержащему, кроме этой точки, внутри себя других особых точек.
Как было сказано, от заданного интеграла можно перейти к интегралу
по маленькой окружности с центром в точке а, а вблизи этой точки

180

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

т.е. разложение знаменателя по степеням z − a начинается с члена
первой степени. Записав разложение числителя и знаменателя в ряд
Тейлора вокруг точки z = a, получим
f( z ) =

§ 9]

ВЫЧЕТЫ

Теория вычетов применяется также при вычислении некоторых ве
щественных интегралов с помощью искусственного сведения их к ком
плексным. Рассмотрим, например, интеграл


g′′( a )
( z − a )2 + ...
2
.
h′′( a )
h′( a )( z − a ) +
( z − a )2 + ...
2

g( a ) + g′( a )( z − a ) +

I1 =

g (a)
Вблизи точки z = a правую часть можно заменить на
.
h ′(a)( z − a)
Поэтому вычет, т.е. коэффициент при ( z − a) −1 , в данном случае равен
g( a )
.
Выч z = a f ( z ) =
h′( a )

z +1
I= ∫
dz,
z

(
1)sin z
(L )

sin ωx
dx = 0,
1 + x2
−∞

(35)

как интеграл от любой нечетной подынтегральной функции в симмет
ричных относительно нуля пределах. Из (34) и (35) следует, что


e iωx

∫ 1 + x2



dx =

cos ωx + i sin ωx
dx = I1 .
1 + x2
−∞



(36)

Рассмотрим теперь вспомогательный интеграл

(33)

Так как в каждой из этих точек знаменатель имеет нуль первого поряд
ка, а числитель отличен от нуля, то мы имеем два полюса первого по
рядка и вычеты в них можно подсчитать по формуле (32). В данном
примере

IR =

g (0)
g (1)
1
2
. Под
откуда Выч z = 0 f ( z ) =
=
= −1, Выч z =1 f ( z ) =
=
h ′(0) −1
h ′(1) sin 1
ставляя в (33), получаем



(L R

e iωz
dz,
1+ z2
)

(37)

где контур ( LR ) состоит из полуокружности и ее диаметра, изобра
женных на рис. 67. Так как подынтегральная функция имеет полюсы
первого порядка в точках z = ±i, из которых внутри ( LR ) содержится
только одна, то по формулам (31) и (32)
получаем
I R = 2πi Выч z = i

e iωz
e iωi
= 2 πi
= πe − ω .
2
2i
1+ z

С другой стороны, интеграл (37) можно
представить в виде суммы интеграла по
отрезку вещественной оси, равного

Рис. 67.

R

e iωx
dx,
1 + x2
−R

h′( z ) = sin z + ( z − 1) cos z,

2 

I = 2 πi  −1 +
 = 8,65i.

sin 1

(34)



−∞

где ( L) — окружность радиуса 2 с центром
в начале координат (рис. 66). В этом приме
ре неопределенный интеграл не выражается через элементарные функ
ции; однако интеграл по замкнутому контуру мы найдем без труда! Для
этого заметим, что подынтегральная функция имеет особенности там,
где ее знаменатель обращается в нуль, т.е. при z = 1 и z = kπ (k — лю
бое целое). Из этих точек, изображенных на рис. 66, внутрь ( L) попа
дают только две: z = 0 и z = 1. Поэтому в силу формулы (31)

h( z ) = ( z − 1) sin z,

(ω > 0).



Рис. 66.

g( z ) = z + 1,

cos ωx
dx
1 + x2
−∞



Здесь неопределенный интеграл также не выражается через элементар
ные функции, так что вычисление I 1 по стандартному методу невоз
можно. Для вычисления I 1 заметим сначала, что

(32)

Рассмотрим пример. Пусть требуется
вычислить интеграл

I = 2πi [Выч z =0 f ( z ) + Выч z =1 f ( z )].

181



(38)

и интеграла по полуокружности, которую мы обозначим через ( LR′ ).
Оценим этот последний интеграл. Из определения интеграла легко вы
вести оценку

∫ f ( z ) dz

(L )

 max f ( z ) ⋅ длину (L);
(L )

180

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

т.е. разложение знаменателя по степеням z − a начинается с члена
первой степени. Записав разложение числителя и знаменателя в ряд
Тейлора вокруг точки z = a, получим
f( z ) =

§ 9]

ВЫЧЕТЫ

Теория вычетов применяется также при вычислении некоторых ве
щественных интегралов с помощью искусственного сведения их к ком
плексным. Рассмотрим, например, интеграл


g′′( a )
( z − a )2 + ...
2
.
h′′( a )
h′( a )( z − a ) +
( z − a )2 + ...
2

g( a ) + g′( a )( z − a ) +

I1 =

g (a)
Вблизи точки z = a правую часть можно заменить на
.
h ′(a)( z − a)
Поэтому вычет, т.е. коэффициент при ( z − a) −1 , в данном случае равен
g( a )
.
Выч z = a f ( z ) =
h′( a )

z +1
I= ∫
dz,
z

(
1)sin z
(L )

sin ωx
dx = 0,
1 + x2
−∞

(35)

как интеграл от любой нечетной подынтегральной функции в симмет
ричных относительно нуля пределах. Из (34) и (35) следует, что


e iωx

∫ 1 + x2



dx =

cos ωx + i sin ωx
dx = I1 .
1 + x2
−∞



(36)

Рассмотрим теперь вспомогательный интеграл

(33)

Так как в каждой из этих точек знаменатель имеет нуль первого поряд
ка, а числитель отличен от нуля, то мы имеем два полюса первого по
рядка и вычеты в них можно подсчитать по формуле (32). В данном
примере

IR =

g (0)
g (1)
1
2
. Под
откуда Выч z = 0 f ( z ) =
=
= −1, Выч z =1 f ( z ) =
=
h ′(0) −1
h ′(1) sin 1
ставляя в (33), получаем



(L R

e iωz
dz,
1+ z2
)

(37)

где контур ( LR ) состоит из полуокружности и ее диаметра, изобра
женных на рис. 67. Так как подынтегральная функция имеет полюсы
первого порядка в точках z = ±i, из которых внутри ( LR ) содержится
только одна, то по формулам (31) и (32)
получаем
I R = 2πi Выч z = i

e iωz
e iωi
= 2 πi
= πe − ω .
2
2i
1+ z

С другой стороны, интеграл (37) можно
представить в виде суммы интеграла по
отрезку вещественной оси, равного

Рис. 67.

R

e iωx
dx,
1 + x2
−R

h′( z ) = sin z + ( z − 1) cos z,

2 

I = 2 πi  −1 +
 = 8,65i.

sin 1

(34)



−∞

где ( L) — окружность радиуса 2 с центром
в начале координат (рис. 66). В этом приме
ре неопределенный интеграл не выражается через элементарные функ
ции; однако интеграл по замкнутому контуру мы найдем без труда! Для
этого заметим, что подынтегральная функция имеет особенности там,
где ее знаменатель обращается в нуль, т.е. при z = 1 и z = kπ (k — лю
бое целое). Из этих точек, изображенных на рис. 66, внутрь ( L) попа
дают только две: z = 0 и z = 1. Поэтому в силу формулы (31)

h( z ) = ( z − 1) sin z,

(ω > 0).



Рис. 66.

g( z ) = z + 1,

cos ωx
dx
1 + x2
−∞



Здесь неопределенный интеграл также не выражается через элементар
ные функции, так что вычисление I 1 по стандартному методу невоз
можно. Для вычисления I 1 заметим сначала, что

(32)

Рассмотрим пример. Пусть требуется
вычислить интеграл

I = 2πi [Выч z =0 f ( z ) + Выч z =1 f ( z )].

181



(38)

и интеграла по полуокружности, которую мы обозначим через ( LR′ ).
Оценим этот последний интеграл. Из определения интеграла легко вы
вести оценку

∫ f ( z ) dz

(L )

 max f ( z ) ⋅ длину (L);
(L )

182

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

поэтому
iωz

e
e iωz
⋅ πR.
dz  max
2
2
1+ z
( L R′ ) 1 + z
( L R′ )



(39)

Представив z = x + iy и заметив, что y0 на ( LR′ ), получим на ( LR′ ),
что e iωz = e iω( x + iy ) = e iωx e − ωy = e − ωy 1. С другой стороны, на
( LR′ ) имеем
1
1

1 + z 2 = z 2 1 + 2  = R 2 1 + 2 ≈ R 2

z 
z

cos ωx
dx = πe − ω .
1 + x2
−∞

Упражнения
dz
1. Вычислите интеграл ∫ z
по окружности ( L ) радиуса 4 с центром
e −1
(L )


2. Вычислите интеграл



(40)

Последняя формула совершенно неочевидна, и ее получение без
привлечения комплексных чисел весьма затруднительно и требует
большого искусства. При помощи свойств интегралов от комплексных
функций удается находить многие интегралы такого рода от вещес
твенных функций стандартными приемами, требующими лишь
аккуратности.
На практике рассмотренный интеграл получается в задаче о возбуж
дении колебаний в системе с собственной частотой ω при действии
1
. Полученный ре
силы, меняющейся со временем по закону f (t) =
1+ t2
зультат дает закон уменьшения амплитуды возбуждаемых колебаний
при увеличении собственной частоты ω системы (см. § VII.5).
На формулу (40) интересно взглянуть с точки зрения результатов
1
обращается
§ III.4. Это как раз случай, когда функция f (x) =
1+ x 2
в нуль вместе со всеми производными на концах x = ±∞ интервала ин
тегрирования. Так как все эти производные не имеют разрывов, то из
§ III.4 следует, что интеграл I 1 (ω) при ω → ∞ стремится к нулю быс
трее любой отрицательной степени ω; однако точную скорость этого
стремления нам удалось получить, только применяя теорию вычетов.
Мерой негладкости функции f (x), определяющей эту скорость, здесь

183

служит расстояние от полюса этой функции, продолженной в комплек
сную плоскость, до мнимой оси. Конечно, короткий параграф не мог, к
сожалению, научить читателя пользоваться техникой интегрирования
комплексных функций; но мы надеемся, что он все же помог читателю
ощутить красоту теории функций комплексного переменного.

в точке 3i.

(при больших R = z ). Значит, правая, а с ней и левая части (39) при
1
1
R → ∞ стремятся к нулю как 2 R = .
R
R
Подводя итог, мы видим, что I R = πe − ω можно представить в виде
суммы интеграла (38) (который в пределе, при R → ∞, стремится
к (36), т.е. к I 1 ) и интеграла по ( LR′ ), стремящегося к нулю. Переходя
к пределу при R → ∞, получаем, что I 1 = πe − ω , т.е.



ОТВЕТЫ И РЕШЕНИЯ

[Гл. V

dx
.
6
x
+1
−∞



ОТВЕТЫ И РЕШЕНИЯ
§1


7π 

+ i sin
2  cos
 ; 5 ( cos ϕ + i sin ϕ)

4
4 

4

3π 


+ i sin  ;
ϕ = arctg  ; 2  cos


3
2
2

3 ( cos π + i sin π ); 1( cos 0 + i sin 0); 0 ( cos ϕ + i sin ϕ) (ϕ — любое).
§2

z1
z*
= w, то z1 = z 2 w, откуда z1* = ( z 2 w )* = z 2* w *, т.е. w* = 1* .
z2
z2
2. Так как второй корень равен 2 + i, то левая часть должна делиться на
z − (2 − i ) z − (2 + i ) = z 2 − 4 z + 5. Произведя деление и решив остающееся
1. Если

квадратное уравнение, находим z 3 , 4 = 1 ±

3.

3. Если z = x + iy, то z* = x − iy = x + i ( − y ), a z ** = x − i ( − y ) = x + iy = z.
4. zz* = x 2 + y 2 = z 2 . Интересно, что вещественность произведения zz*
можно доказать и не переходя к вещественной и мнимой частям, на основании
свойств сопряженных чисел: ( zz*)* = z * z ** = z * z = zz *, а число, равное свое
му сопряженному, обязательно вещественное.
§3
i

π

i



−i

π

i

π

1. а) 1 + i = 2 e 4 ; б) 1 − i = 2 e 4 = 2 e 4 ; в) −1 = e iπ ; г) 3i = 3 e 2 .
2. а) Прежде всего запишем число 1 + i в показательной форме, получим
π 16
π
π

i 
i
⋅ 16
i
16
16
4

1 + i = 2 e , отсюда (1 + i ) =  2 e 4  = 2 ⋅ e 4
= 2 8 ⋅ e i 4 π = 2 8 = 256;



( )

б) –1.
3. cos 3ϕ = cos3 ϕ − 3 cos ϕ sin 2 ϕ; sin 4ϕ = 4 cos3 ϕ sin ϕ − 4 cos ϕ sin 3 ϕ.
4. В формуле Эйлера e iϕ = cos ϕ + i sin ϕ заменим ϕ на −ϕ, получим
− iϕ
e = cos ϕ − i sin ϕ. Складывая эти две формулы почленно, получим

182

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

поэтому
iωz

e
e iωz
⋅ πR.
dz  max
2
2
1+ z
( L R′ ) 1 + z
( L R′ )



(39)

Представив z = x + iy и заметив, что y0 на ( LR′ ), получим на ( LR′ ),
что e iωz = e iω( x + iy ) = e iωx e − ωy = e − ωy 1. С другой стороны, на
( LR′ ) имеем
1
1

1 + z 2 = z 2 1 + 2  = R 2 1 + 2 ≈ R 2

z 
z

cos ωx
dx = πe − ω .
1 + x2
−∞

Упражнения
dz
1. Вычислите интеграл ∫ z
по окружности ( L ) радиуса 4 с центром
e −1
(L )


2. Вычислите интеграл



(40)

Последняя формула совершенно неочевидна, и ее получение без
привлечения комплексных чисел весьма затруднительно и требует
большого искусства. При помощи свойств интегралов от комплексных
функций удается находить многие интегралы такого рода от вещес
твенных функций стандартными приемами, требующими лишь
аккуратности.
На практике рассмотренный интеграл получается в задаче о возбуж
дении колебаний в системе с собственной частотой ω при действии
1
. Полученный ре
силы, меняющейся со временем по закону f (t) =
1+ t2
зультат дает закон уменьшения амплитуды возбуждаемых колебаний
при увеличении собственной частоты ω системы (см. § VII.5).
На формулу (40) интересно взглянуть с точки зрения результатов
1
обращается
§ III.4. Это как раз случай, когда функция f (x) =
1+ x 2
в нуль вместе со всеми производными на концах x = ±∞ интервала ин
тегрирования. Так как все эти производные не имеют разрывов, то из
§ III.4 следует, что интеграл I 1 (ω) при ω → ∞ стремится к нулю быс
трее любой отрицательной степени ω; однако точную скорость этого
стремления нам удалось получить, только применяя теорию вычетов.
Мерой негладкости функции f (x), определяющей эту скорость, здесь

183

служит расстояние от полюса этой функции, продолженной в комплек
сную плоскость, до мнимой оси. Конечно, короткий параграф не мог, к
сожалению, научить читателя пользоваться техникой интегрирования
комплексных функций; но мы надеемся, что он все же помог читателю
ощутить красоту теории функций комплексного переменного.

в точке 3i.

(при больших R = z ). Значит, правая, а с ней и левая части (39) при
1
1
R → ∞ стремятся к нулю как 2 R = .
R
R
Подводя итог, мы видим, что I R = πe − ω можно представить в виде
суммы интеграла (38) (который в пределе, при R → ∞, стремится
к (36), т.е. к I 1 ) и интеграла по ( LR′ ), стремящегося к нулю. Переходя
к пределу при R → ∞, получаем, что I 1 = πe − ω , т.е.



ОТВЕТЫ И РЕШЕНИЯ

[Гл. V

dx
.
6
x
+1
−∞



ОТВЕТЫ И РЕШЕНИЯ
§1


7π 

+ i sin
2  cos
 ; 5 ( cos ϕ + i sin ϕ)

4
4 

4

3π 


+ i sin  ;
ϕ = arctg  ; 2  cos


3
2
2

3 ( cos π + i sin π ); 1( cos 0 + i sin 0); 0 ( cos ϕ + i sin ϕ) (ϕ — любое).
§2

z1
z*
= w, то z1 = z 2 w, откуда z1* = ( z 2 w )* = z 2* w *, т.е. w* = 1* .
z2
z2
2. Так как второй корень равен 2 + i, то левая часть должна делиться на
z − (2 − i ) z − (2 + i ) = z 2 − 4 z + 5. Произведя деление и решив остающееся
1. Если

квадратное уравнение, находим z 3 , 4 = 1 ±

3.

3. Если z = x + iy, то z* = x − iy = x + i ( − y ), a z ** = x − i ( − y ) = x + iy = z.
4. zz* = x 2 + y 2 = z 2 . Интересно, что вещественность произведения zz*
можно доказать и не переходя к вещественной и мнимой частям, на основании
свойств сопряженных чисел: ( zz*)* = z * z ** = z * z = zz *, а число, равное свое
му сопряженному, обязательно вещественное.
§3
i

π

i



−i

π

i

π

1. а) 1 + i = 2 e 4 ; б) 1 − i = 2 e 4 = 2 e 4 ; в) −1 = e iπ ; г) 3i = 3 e 2 .
2. а) Прежде всего запишем число 1 + i в показательной форме, получим
π 16
π
π

i 
i
⋅ 16
i
16
16
4

1 + i = 2 e , отсюда (1 + i ) =  2 e 4  = 2 ⋅ e 4
= 2 8 ⋅ e i 4 π = 2 8 = 256;



( )

б) –1.
3. cos 3ϕ = cos3 ϕ − 3 cos ϕ sin 2 ϕ; sin 4ϕ = 4 cos3 ϕ sin ϕ − 4 cos ϕ sin 3 ϕ.
4. В формуле Эйлера e iϕ = cos ϕ + i sin ϕ заменим ϕ на −ϕ, получим
− iϕ
e = cos ϕ − i sin ϕ. Складывая эти две формулы почленно, получим

184

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

e iϕ + e − iϕ
. Почленным вычитанием этих же
2
формул получим вторую формулу.

e iϕ + e − iϕ = 2 cos ϕ , откуда cos ϕ =

§4

π

 3π

1 . а ) ln( −1) = i ( π + 2 kπ); б ) ln i = i  + 2 kπ  ; в ) ln( −i ) = i 
+ 2 kπ  ;
2

 2

1
π

г ) ln(1 + i ) = ln 2 + i  + 2 kπ  .
4

2
2. Так как −1 = cos π + i sin π , то общий вид чисел xk таких, что xk3 = −1, есть
xk = cos

π + 2 kπ
π + 2 kπ
(k = 0, 1, 2).
+ i sin
3
3

ОТВЕТЫ И РЕШЕНИЯ

§6
f ( z ) = ( x + iy )3 = x 3 + i3 x 2 y − 3 xy 2 − iy 3 , откуда u = x 3 − 3 xy 2 , v = 3 x 2 y − y 3 ;
∂u ∂v
∂v
∂u
=
= 3x 2 − 3 y2 ;
=−
= 6 xy.
∂x ∂y
∂x
∂y
§7
1. Из условия u = x + x 2 − y 2 находим

3
π
π 1
.
+ i sin = + i
3
3 2
2
x2 = cos

3. 1;

∂v
= 1 + 2 x. Для
∂y
того, чтобы отсюда найти v, достаточно проинтегрировать это равенство по y,
считая х постоянным. Получим
v ( x, y ) = y + 2 xy + ϕ ( x )*.

3

5π 1
.
+ i sin
= −i
3
3 2
2

4. На основании упражнения 4 к § 3 приходим к уравнению

e iϕ + e − iϕ
= 2.
2

Отсюда после легких преобразований получаем e 2 iϕ − 4 e iϕ + 1 = 0.
Это — квадратное уравнение относительно e iϕ ; решая его, находим
e iϕ = 2 ± 3 . Отсюда iϕ = ln(2 ± 3 ) + 2 kπi (k — любое целое). Деля на i и за
1
метив, что 2 − 3 =
и потому ln (2 − 3 ) = − ln (2 + 3 ), получаем
2+ 3
окончательный ответ: ϕ = ± ln(2 +

3 )i + 2 kπ = ±1317
, i + 2 kπ . Все эти решения

мнимые.
5. Аналогично находим ϕ = ± ln (2 +
§5
1. J =

3 )i +

∂v
= 2 y + ϕ′( x ). Но согласно второму из условий Коши–Рима
∂x
∂v
∂u
∂u
на
= − . Так как
= −2 y, то получаем 2 y + ϕ′( x ) = 2 y, откуда ϕ′( x ) = 0,
∂x
∂y
∂y
т.е. ϕ( x ) = C , где С — постоянная. Следовательно, v ( x, y ) = y + 2 xy + C .
Для определения С воспользуемся условием f(0 ) = 0, оно означает, что
u = 0, v = 0 при x = 0, y = 0. Итак, v = 0 при x = 0, y = 0, поэтому C = 0,
v ( x, y ) = y + 2 xy.
2. u ( x, y ) = − x 2 + y 2 + 1.
Теперь находим

x1 = cos π + i sin π = −1,

3
3 1
3
3
1
1
1
; –1; − − i
; −i
; − +i
.
+i
2
2
2
2 2
2
2
2

∂u
= 1 + 2 x.
∂x

Пользуясь первым из условий Коши–Римана, получаем

Поэтому
x0 = cos

185

π
+ 2 kπ .
2

ϕ 0 e iβ
e iωt . Таким образом, получаются те же формулы, что
1 

R + i  ωL −


ωC 

для разобранного в тексте случая R,Lцепи, однако вместо ωL надо подста
1
1
1
. В частном случае, когда ω 2 =
вить ωL −
, будет ωL −
= 0, т.е. индук
LC
ωC
ωC
тивность и емкость как бы взаимно уничтожаются.
1 
1
1
1
iβ iωt
2. J =  +
+ 2 2 ϕ 0 , α = β + arg(R + iωl )
 ϕ e e . Отсюда j0 =
2
 R i ωL  0
R
ω L
π
− при том же смысле обозначений, что в тексте.
2

§8
2 2
2
2
, ; б) −πi, πi; в) (1 + i ), ( −1 + i ) (сначала пишется результат для
3 3
3
3
верхней полуокружности, потом для нижней). В случае а) подынтегральная
функция аналитична всюду и потому интеграл не зависит от пути интегриро
вания. В случае б) подынтегральная функция обращается при z = 0 в беско
нечность, а в случае в) она имеет там точку ветвления.
а)

§9
1. Подынтегральная функция имеет внутри ( L ) два полюса первого по
рядка: z1 = 0, z 2 = 2 πi. Поэтому интеграл равен



2πi Выч z = 0







1
1
1
1
= 2πi 0 + 2 πi = 4πi.
+ Выч z = 2 πi z
ez −1
e −1
e
e

2. Подобно примеру (34), рассматриваемый интеграл равен интегралу от
1
по
контуру ( LR ) рис.
67
при
большом R.
1+ z6

функции f ( z ) =

* Так как при интегрировании х постоянно, то роль постоянной интегрирования
может играть любая функция ϕ, зависящая только от одного переменного х.

184

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

[Гл. V

e iϕ + e − iϕ
. Почленным вычитанием этих же
2
формул получим вторую формулу.

e iϕ + e − iϕ = 2 cos ϕ , откуда cos ϕ =

§4

π

 3π

1 . а ) ln( −1) = i ( π + 2 kπ); б ) ln i = i  + 2 kπ  ; в ) ln( −i ) = i 
+ 2 kπ  ;
2

 2

1
π

г ) ln(1 + i ) = ln 2 + i  + 2 kπ  .
4

2
2. Так как −1 = cos π + i sin π , то общий вид чисел xk таких, что xk3 = −1, есть
xk = cos

π + 2 kπ
π + 2 kπ
(k = 0, 1, 2).
+ i sin
3
3

ОТВЕТЫ И РЕШЕНИЯ

§6
f ( z ) = ( x + iy )3 = x 3 + i3 x 2 y − 3 xy 2 − iy 3 , откуда u = x 3 − 3 xy 2 , v = 3 x 2 y − y 3 ;
∂u ∂v
∂v
∂u
=
= 3x 2 − 3 y2 ;
=−
= 6 xy.
∂x ∂y
∂x
∂y
§7
1. Из условия u = x + x 2 − y 2 находим

3
π
π 1
.
+ i sin = + i
3
3 2
2
x2 = cos

3. 1;

∂v
= 1 + 2 x. Для
∂y
того, чтобы отсюда найти v, достаточно проинтегрировать это равенство по y,
считая х постоянным. Получим
v ( x, y ) = y + 2 xy + ϕ ( x )*.

3

5π 1
.
+ i sin
= −i
3
3 2
2

4. На основании упражнения 4 к § 3 приходим к уравнению

e iϕ + e − iϕ
= 2.
2

Отсюда после легких преобразований получаем e 2 iϕ − 4 e iϕ + 1 = 0.
Это — квадратное уравнение относительно e iϕ ; решая его, находим
e iϕ = 2 ± 3 . Отсюда iϕ = ln(2 ± 3 ) + 2 kπi (k — любое целое). Деля на i и за
1
метив, что 2 − 3 =
и потому ln (2 − 3 ) = − ln (2 + 3 ), получаем
2+ 3
окончательный ответ: ϕ = ± ln(2 +

3 )i + 2 kπ = ±1317
, i + 2 kπ . Все эти решения

мнимые.
5. Аналогично находим ϕ = ± ln (2 +
§5
1. J =

3 )i +

∂v
= 2 y + ϕ′( x ). Но согласно второму из условий Коши–Рима
∂x
∂v
∂u
∂u
на
= − . Так как
= −2 y, то получаем 2 y + ϕ′( x ) = 2 y, откуда ϕ′( x ) = 0,
∂x
∂y
∂y
т.е. ϕ( x ) = C , где С — постоянная. Следовательно, v ( x, y ) = y + 2 xy + C .
Для определения С воспользуемся условием f(0 ) = 0, оно означает, что
u = 0, v = 0 при x = 0, y = 0. Итак, v = 0 при x = 0, y = 0, поэтому C = 0,
v ( x, y ) = y + 2 xy.
2. u ( x, y ) = − x 2 + y 2 + 1.
Теперь находим

x1 = cos π + i sin π = −1,

3
3 1
3
3
1
1
1
; –1; − − i
; −i
; − +i
.
+i
2
2
2
2 2
2
2
2

∂u
= 1 + 2 x.
∂x

Пользуясь первым из условий Коши–Римана, получаем

Поэтому
x0 = cos

185

π
+ 2 kπ .
2

ϕ 0 e iβ
e iωt . Таким образом, получаются те же формулы, что
1 

R + i  ωL −


ωC 

для разобранного в тексте случая R,Lцепи, однако вместо ωL надо подста
1
1
1
. В частном случае, когда ω 2 =
вить ωL −
, будет ωL −
= 0, т.е. индук
LC
ωC
ωC
тивность и емкость как бы взаимно уничтожаются.
1 
1
1
1
iβ iωt
2. J =  +
+ 2 2 ϕ 0 , α = β + arg(R + iωl )
 ϕ e e . Отсюда j0 =
2
 R i ωL  0
R
ω L
π
− при том же смысле обозначений, что в тексте.
2

§8
2 2
2
2
, ; б) −πi, πi; в) (1 + i ), ( −1 + i ) (сначала пишется результат для
3 3
3
3
верхней полуокружности, потом для нижней). В случае а) подынтегральная
функция аналитична всюду и потому интеграл не зависит от пути интегриро
вания. В случае б) подынтегральная функция обращается при z = 0 в беско
нечность, а в случае в) она имеет там точку ветвления.
а)

§9
1. Подынтегральная функция имеет внутри ( L ) два полюса первого по
рядка: z1 = 0, z 2 = 2 πi. Поэтому интеграл равен



2πi Выч z = 0







1
1
1
1
= 2πi 0 + 2 πi = 4πi.
+ Выч z = 2 πi z
ez −1
e −1
e
e

2. Подобно примеру (34), рассматриваемый интеграл равен интегралу от
1
по
контуру ( LR ) рис.
67
при
большом R.
1+ z6

функции f ( z ) =

* Так как при интегрировании х постоянно, то роль постоянной интегрирования
может играть любая функция ϕ, зависящая только от одного переменного х.

186

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

Но f ( z ) имеет
z3 = −

внутри ( LR ) три

простых

полюса: z1 =

[Гл. V

3
1
+ i , z 2 = i,
2
2

3
1
+ i . Поэтому интеграл равен
2
2

 1
1
1  2 πi  z1 z 2 z 3 
πi
2
2 πi  5 + 5 + 5  =
 6 + 6 + 6  = − ( z1 + z 2 + z 3 ) = π .
6
3
3
6
z
6
z
6
z
z
z
z
 1
 1
2
3
2
3
В этом примере неопределенный интеграл выражается через элементарные
функции, однако приведенный способ вычисления гораздо проще.

ГЛАВА VI
ДЕЛЬТАAФУНКЦИЯ ДИРАКА*
§ 1. ДельтаAфункция Дирака δ(x)
Возьмем функцию y = Φ1 (x), имеющую максимум при x = 0, быс
троубывающую в обе стороны от x = 0, и притом такую, что
+∞

∫ Φ1 ( x ) dx = 1.

−∞

Эти условия отнюдь не определяют вид функции Φ1 (x); можно приду
мать много функций, удовлетворяющих всем поставленным выше тре
бованиям, например:
Φ1 ( x ) =
Φ1 ( x ) =

1 1
,
π 1 + x2

(1)

1 −x 2
e **.
π

(2)

Числовой множитель обеспечивает равенство интеграла единице. Гра
фики этих функций приведены на рис. 68. Произведем над линией

Рис. 68.

y = Φ1 (x) следующее преобразование: увеличим ее высоту в m раз
и одновременно уменьшим ее ширину во столько же раз. Напомним
* Эта глава, хотя и написана независимо, непосредственно перекликается с Добавле
нием к ВМ.


** Можно доказать, что



−∞

2

e − x dx =

π , см. § IV.7.

186

ФУНКЦИИ КОМПЛЕКСНОГО ПЕРЕМЕННОГО

Но f ( z ) имеет
z3 = −

внутри ( LR ) три

простых

полюса: z1 =

[Гл. V

3
1
+ i , z 2 = i,
2
2

3
1
+ i . Поэтому интеграл равен
2
2

 1
1
1  2 πi  z1 z 2 z 3 
πi
2
2 πi  5 + 5 + 5  =
 6 + 6 + 6  = − ( z1 + z 2 + z 3 ) = π .
6
3
3
6
z
6
z
6
z
z
z
z
 1
 1
2
3
2
3
В этом примере неопределенный интеграл выражается через элементарные
функции, однако приведенный способ вычисления гораздо проще.

ГЛАВА VI
ДЕЛЬТАAФУНКЦИЯ ДИРАКА*
§ 1. ДельтаAфункция Дирака δ(x)
Возьмем функцию y = Φ1 (x), имеющую максимум при x = 0, быс
троубывающую в обе стороны от x = 0, и притом такую, что
+∞

∫ Φ1 ( x ) dx = 1.

−∞

Эти условия отнюдь не определяют вид функции Φ1 (x); можно приду
мать много функций, удовлетворяющих всем поставленным выше тре
бованиям, например:
Φ1 ( x ) =
Φ1 ( x ) =

1 1
,
π 1 + x2

(1)

1 −x 2
e **.
π

(2)

Числовой множитель обеспечивает равенство интеграла единице. Гра
фики этих функций приведены на рис. 68. Произведем над линией

Рис. 68.

y = Φ1 (x) следующее преобразование: увеличим ее высоту в m раз
и одновременно уменьшим ее ширину во столько же раз. Напомним
* Эта глава, хотя и написана независимо, непосредственно перекликается с Добавле
нием к ВМ.


** Можно доказать, что



−∞

2

e − x dx =

π , см. § IV.7.

188

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

(см., например, ВМ, § IV.7), что если увеличить высоту линии y = Φ1 (x)
в m раз, то ее уравнение приобретает вид y = mΦ1 (x), а если уменьшить
ширину в m раз, то уравнение станет таким: y = Φ1 (mx). Значит, после
обоих преобразований уравнение кривой будет y = Φ m (x) = mΦ1 (mx).
m
1
Например, из (1) получим Φ m (x) =
. Ясно, что площадь, за
π 1 + (mx)2
ключенная между графиком и осью х, при растяжении кверху увели
чится в m раз, а при сжатии с боков уменьшится во столько же раз, т.е.
в конечном счете останется без изменения. Впрочем, это легко доказать
и с помощью интегрирования после замены переменной интегрирова
ния mx = s:


∫ Φ m ( x ) dx =

−∞









−∞

−∞

−∞

−∞

∫ mΦ1 ( mx ) dx = ∫ Φ m ( mx ) d ( mx ) = ∫ Φ1 ( s) ds = ∫ Φ1 ( x ) dx.

Какой вид имеет преобразованная функция при очень больших m,
или, выражаясь точнее, в пределе, при неограниченном возрастании m?
При любом фиксированном x ≠ 0 величина y = mΦ1 (mx) будет не
ограниченно приближаться к нулю при неограниченном росте m, потому
что уменьшение Φ1 (mx) при увеличении m происходит быстрее, чем
рост множителя m. Для этого надо, чтобы Φ1 (x) при x → ±∞ стреми
1
лась к нулю быстрее, чем
(это и означает, что функция быстроубы
x
m
1
вающая*). Так, например, в выражении Φ m (x) =
при
π 1 + (mx)2
данном x ≠ 0 и при достаточно большом m будет (mx)2 1 и, следо
m 1
1
вательно, Φ m (x) ≈
, т.е. неограниченно убывает при
=
π m2 x 2 πmx 2
возрастании m. Еще быстрее убывает при росте m величина Φ m (x),
полученная из формулы (2). Действительно, в этом случае
m −( mx )2
, а известно, что показательная функция с отрица
Φ m (x) =
e
π
тельным показателем убывает быстрее любой степени m (см., напри
мер, ВМ, § II.21).
Пусть теперь x = 0. Тогда Φ1 (mx) = Φ1 (0) постоянна при любом m,
а поэтому Φ m (0) = mΦ1 (0) неограниченно увеличивается с ростом m.
Следовательно, неограниченно увеличивая m, мы получаем функ
цию со следующими свойствами:
1) функция равна нулю при всех x < 0 и при всех x > 0;
2) функция бесконечна при x = 0;
3) интеграл от этой функции, взятый в пределах от −∞ до +∞, равен 1.
* Такая скорость убывания автоматически следует из сходимости интеграла (см.
§ III.1).

ДЕЛЬТАФУНКЦИЯ ДИРАКА δ(x )

§ 1]

189

Функция, обладающая этими свойствами, называется дельта функ
цией Дирака и обозначается через δ(x)*. Функция δ(x) необычайно
удобна и широко применяется сейчас в физике.
Мы пришли к понятию δ(x), рассматривая обычные хорошо извес
тные функции и преобразуя их определенным образом. Замечательно,
однако, что для применения δ(x) достаточно знать три се свойства, ко
торые мы перечислили выше, и совершенно не требуется знать, из какой
именно функции

冢π1 1 +1x

2

, или

1



2

e − x , или еще какойнибудь по

π
лучена функция δ(x). Грубо говоря, дельтафункция — это функция,
принимающая на узком участке большие значения, причем эти значе
ния согласованы с шириной участка так, что выполняется условие 3).
(Отсюда следует, в частности, что размерность [δ(x)] = 1 [x].)
Из свойств δ(x) следует основное соотношение
+∞

I = ∫ δ( x ) f ( x ) dx = f (0 ).

(3)

−∞

В самом деле, δ(x) = 0 при всех x ≠ 0, поэтому
+∞



−∞

−ε

I = ∫ δ ( x ) f ( x ) dx = ∫ δ ( x ) f ( x ) dx,

где ε — малая величина. В последнем интеграле промежуток интегри
рования мал (его длина равна 2ε), поэтому на нем f (x) ≈ f (0), следова
тельно,






+∞

−ε

−ε

−ε

−∞

I = ∫ δ ( x ) f ( x ) dx = ∫ δ ( x ) f (0 ) dx = f (0 ) ∫ δ ( x ) dx = f (0 ) ∫ δ ( x ) dx = f (0 ).

Итак, формула (3) следует из трех свойств δ(x). Справедливо и обрат
ное утверждение: если определить δ(x) как функцию, для которой вы
полняется соотношение (3) при любой f (x), то отсюда следуют все три
свойства δ(x). Не останавливаясь надетальном доказательстве этого
факта, покажем, например, что из (3) следует первое свойство: δ(x) = 0
при x ≠ 0.
Действительно, из формулы (3) ясно, что величина интеграла не за
висит от поведения функции f (x) при x ≠ 0, а зависит только от f (0).
Это означает, что f (x) входит под знак интеграла с множителем, рав
ным нулю при x ≠ 0, т.е. δ(x) = 0 при x ≠ 0.

* Поль Адриан Морис Дира´к, именем которого названа функция, крупнейший ан
глийский физиктеоретик, предсказавший в 1929 году существование античастиц — по
зитрона, антипротона и других, которые позже были открыты экспериментально.

188

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

(см., например, ВМ, § IV.7), что если увеличить высоту линии y = Φ1 (x)
в m раз, то ее уравнение приобретает вид y = mΦ1 (x), а если уменьшить
ширину в m раз, то уравнение станет таким: y = Φ1 (mx). Значит, после
обоих преобразований уравнение кривой будет y = Φ m (x) = mΦ1 (mx).
m
1
Например, из (1) получим Φ m (x) =
. Ясно, что площадь, за
π 1 + (mx)2
ключенная между графиком и осью х, при растяжении кверху увели
чится в m раз, а при сжатии с боков уменьшится во столько же раз, т.е.
в конечном счете останется без изменения. Впрочем, это легко доказать
и с помощью интегрирования после замены переменной интегрирова
ния mx = s:


∫ Φ m ( x ) dx =

−∞









−∞

−∞

−∞

−∞

∫ mΦ1 ( mx ) dx = ∫ Φ m ( mx ) d ( mx ) = ∫ Φ1 ( s) ds = ∫ Φ1 ( x ) dx.

Какой вид имеет преобразованная функция при очень больших m,
или, выражаясь точнее, в пределе, при неограниченном возрастании m?
При любом фиксированном x ≠ 0 величина y = mΦ1 (mx) будет не
ограниченно приближаться к нулю при неограниченном росте m, потому
что уменьшение Φ1 (mx) при увеличении m происходит быстрее, чем
рост множителя m. Для этого надо, чтобы Φ1 (x) при x → ±∞ стреми
1
лась к нулю быстрее, чем
(это и означает, что функция быстроубы
x
m
1
вающая*). Так, например, в выражении Φ m (x) =
при
π 1 + (mx)2
данном x ≠ 0 и при достаточно большом m будет (mx)2 1 и, следо
m 1
1
вательно, Φ m (x) ≈
, т.е. неограниченно убывает при
=
π m2 x 2 πmx 2
возрастании m. Еще быстрее убывает при росте m величина Φ m (x),
полученная из формулы (2). Действительно, в этом случае
m −( mx )2
, а известно, что показательная функция с отрица
Φ m (x) =
e
π
тельным показателем убывает быстрее любой степени m (см., напри
мер, ВМ, § II.21).
Пусть теперь x = 0. Тогда Φ1 (mx) = Φ1 (0) постоянна при любом m,
а поэтому Φ m (0) = mΦ1 (0) неограниченно увеличивается с ростом m.
Следовательно, неограниченно увеличивая m, мы получаем функ
цию со следующими свойствами:
1) функция равна нулю при всех x < 0 и при всех x > 0;
2) функция бесконечна при x = 0;
3) интеграл от этой функции, взятый в пределах от −∞ до +∞, равен 1.
* Такая скорость убывания автоматически следует из сходимости интеграла (см.
§ III.1).

ДЕЛЬТАФУНКЦИЯ ДИРАКА δ(x )

§ 1]

189

Функция, обладающая этими свойствами, называется дельта функ
цией Дирака и обозначается через δ(x)*. Функция δ(x) необычайно
удобна и широко применяется сейчас в физике.
Мы пришли к понятию δ(x), рассматривая обычные хорошо извес
тные функции и преобразуя их определенным образом. Замечательно,
однако, что для применения δ(x) достаточно знать три се свойства, ко
торые мы перечислили выше, и совершенно не требуется знать, из какой
именно функции

冢π1 1 +1x

2

, или

1



2

e − x , или еще какойнибудь по

π
лучена функция δ(x). Грубо говоря, дельтафункция — это функция,
принимающая на узком участке большие значения, причем эти значе
ния согласованы с шириной участка так, что выполняется условие 3).
(Отсюда следует, в частности, что размерность [δ(x)] = 1 [x].)
Из свойств δ(x) следует основное соотношение
+∞

I = ∫ δ( x ) f ( x ) dx = f (0 ).

(3)

−∞

В самом деле, δ(x) = 0 при всех x ≠ 0, поэтому
+∞



−∞

−ε

I = ∫ δ ( x ) f ( x ) dx = ∫ δ ( x ) f ( x ) dx,

где ε — малая величина. В последнем интеграле промежуток интегри
рования мал (его длина равна 2ε), поэтому на нем f (x) ≈ f (0), следова
тельно,






+∞

−ε

−ε

−ε

−∞

I = ∫ δ ( x ) f ( x ) dx = ∫ δ ( x ) f (0 ) dx = f (0 ) ∫ δ ( x ) dx = f (0 ) ∫ δ ( x ) dx = f (0 ).

Итак, формула (3) следует из трех свойств δ(x). Справедливо и обрат
ное утверждение: если определить δ(x) как функцию, для которой вы
полняется соотношение (3) при любой f (x), то отсюда следуют все три
свойства δ(x). Не останавливаясь на детальном доказательстве этого
факта, покажем, например, что из (3) следует первое свойство: δ(x) = 0
при x ≠ 0.
Действительно, из формулы (3) ясно, что величина интеграла не за
висит от поведения функции f (x) при x ≠ 0, а зависит только от f (0).
Это означает, что f (x) входит под знак интеграла с множителем, рав
ным нулю при x ≠ 0, т.е. δ(x) = 0 при x ≠ 0.

* Поль Адриан Морис Дира´к, именем которого названа функция, крупнейший ан
глийский физиктеоретик, предсказавший в 1929 году существование античастиц — по
зитрона, антипротона и других, которые позже были открыты экспериментально.

190

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

Заметим, что δ(x − a) отлично от нуля (и притом бесконечно)
только при x = a. Рассуждая, как при выводе формулы (3), получаем
формулу

ДЕЛЬТАФУНКЦИЯ ДИРАКА δ(x )

§ 1]

стержня есть ρ p (x)*. Тогда масса стержня, начало которого помещено
l

в начало координат, а конец в точку х = l, равна mp = ∫ ρ p (x) dx.
0

+∞

∫ δ( x − a ) f ( x ) dx = f ( a ).

(4)

−∞

Пусть в точке x = a стержня находится груз ma . Тогда полная мас
са стержня и груза равна
l

Отметим еще некоторые интересные формулы для дельтафункции.
Прежде всего
1
δ ( ax ) =
δ(x)
a

(a = const ≠ 0).

В самом деле, функция a δ(ax) удовлетворяет всем трем свойствам,
определяющим дельтафункцию. Чутьчуть менее очевидное третье
свойство проверяется с помощью подстановки ax = x 1 так:


a > 0;





a δ ( ax ) dx =

−∞


a < 0;



−∞

191



m = ma + ∫ ρ p ( x ) dx.
0

С помощью δфункции можно представить сосредоточенную массу как
массу, распределенную с плотностью ρ c (x) = ma δ (x − a). Действитель
но, последняя формула означает, что плотность отлична от нуля лишь
в малой окрестности точки x = a, причем
l



−∞

l

∫ ρc( x ) dx = ma ∫ δ ( x − a ) dx = ma .
0

δ ( ax ) a dx = ∫ δ ( x1 ) dx1 = 1,
−∞



−∞



−∞



−∞

a δ ( ax ) dx = − ∫ δ ( ax ) a dx = − ∫ δ ( x1 ) dx1 = ∫ δ ( x1 ) dx1 = 1.

0

Таким образом, введя функцию ρ c (x), мы можем сосредоточенную
массу записать в форме, которая по виду совпадает с формой записи
для распределенной массы.
Положим теперь

Еще одно свойство:

ρ( x ) = ρ p ( x ) + ρ c ( x ) = ρ p ( x ) + maδ ( x − a ).
δ (ϕ( x )) =

1
δ ( x − x0 ),
ϕ′( x0 )

если ϕ(x) обращается в нуль лишь при x = x 0 . Это свойство следует
из предыдущего, так как вблизи x = x 0 с точностью до малых высше
го порядка можно написать
ϕ ( x ) = ϕ ( x0 ) + ϕ′( x0 )( x − x0 ) = ϕ′( x0 )( x − x0 ).

Наконец,
f ( x )δ ( x − a ) = f ( a )δ ( x − a ),

что сразу вытекает из равенства функции δ(x − a) нулю при x ≠ a.
С помощью δфункции чрезвычайно удобно записывать многие фи
зические соотношения. Рассмотрим, например, тонкий стержень, на
котором в нескольких отдельных местах помещены грузы. Пусть раз
меры грузов весьма малы по сравнению с длиной стержня, а их массы
того же порядка, что и масса стержня. Тогда при решении задач (опре
деление полной массы, определение положения равновесия и т.п.) при
ходится рассматривать и массы грузов (их называют сосредоточенными
массами) и массу стержня (распределенная масса). Пусть плотность

Тогда полная масса равна
l

m = ∫ ρ( x ) dx.
0

Таким образом, полную массу можно не писать как сумму членов раз
ного вида; она записывается при помощи интеграла, т.е. так же, как рас
пределенная масса. Различный характер распределенной и сосредото
ченной масс сказывается лишь на виде функции ρ(x). Благодаря
этому мы можем единообразно записывать все те соотношения, кото
рые были нами получены раньше лишь для распределенной массы.
Так, например, масса, находящаяся между точками x = b и x = c
c

стержня, равна

∫ ρ(x) dx. Никаких оговорок о том, что

b > a, или b < a

b

и т.п. не требуется: функция ρ(x) содержит δ(x − a), а интегрирова
ние функции δ(x − a) автоматически добавит к массе стержня массу
груза, если только груз расположен между точками x = b и x = c.

* Индексы «р» и «с» будут обозначать «распределенный» и «сосредоточенный».

190

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

Заметим, что δ(x − a) отлично от нуля (и притом бесконечно)
только при x = a. Рассуждая, как при выводе формулы (3), получаем
формулу

ДЕЛЬТАФУНКЦИЯ ДИРАКА δ(x )

§ 1]

стержня есть ρ p (x)*. Тогда масса стержня, начало которого помещено
l

в начало координат, а конец в точку х = l, равна mp = ∫ ρ p (x) dx.
0

+∞

∫ δ( x − a ) f ( x ) dx = f ( a ).

(4)

−∞

Пусть в точке x = a стержня находится груз ma . Тогда полная мас
са стержня и груза равна
l

Отметим еще некоторые интересные формулы для дельтафункции.
Прежде всего
1
δ ( ax ) =
δ(x)
a

(a = const ≠ 0).

В самом деле, функция a δ(ax) удовлетворяет всем трем свойствам,
определяющим дельтафункцию. Чутьчуть менее очевидное третье
свойство проверяется с помощью подстановки ax = x 1 так:


a > 0;





a δ ( ax ) dx =

−∞


a < 0;



−∞

191



m = ma + ∫ ρ p ( x ) dx.
0

С помощью δфункции можно представить сосредоточенную массу как
массу, распределенную с плотностью ρ c (x) = ma δ (x − a). Действитель
но, последняя формула означает, что плотность отлична от нуля лишь
в малой окрестности точки x = a, причем
l



−∞

l

∫ ρc( x ) dx = ma ∫ δ ( x − a ) dx = ma .
0

δ ( ax ) a dx = ∫ δ ( x1 ) dx1 = 1,
−∞



−∞



−∞



−∞

a δ ( ax ) dx = − ∫ δ ( ax ) a dx = − ∫ δ ( x1 ) dx1 = ∫ δ ( x1 ) dx1 = 1.

0

Таким образом, введя функцию ρ c (x), мы можем сосредоточенную
массу записать в форме, которая по виду совпадает с формой записи
для распределенной массы.
Положим теперь

Еще одно свойство:

ρ( x ) = ρ p ( x ) + ρ c ( x ) = ρ p ( x ) + maδ ( x − a ).
δ (ϕ( x )) =

1
δ ( x − x0 ),
ϕ′( x0 )

если ϕ(x) обращается в нуль лишь при x = x 0 . Это свойство следует
из предыдущего, так как вблизи x = x 0 с точностью до малых высше
го порядка можно написать
ϕ ( x ) = ϕ ( x0 ) + ϕ′( x0 )( x − x0 ) = ϕ′( x0 )( x − x0 ).

Наконец,
f ( x )δ ( x − a ) = f ( a )δ ( x − a ),

что сразу вытекает из равенства функции δ(x − a) нулю при x ≠ a.
С помощью δфункции чрезвычайно удобно записывать многие фи
зические соотношения. Рассмотрим, например, тонкий стержень, на
котором в нескольких отдельных местах помещены грузы. Пусть раз
меры грузов весьма малы по сравнению с длиной стержня, а их массы
того же порядка, что и масса стержня. Тогда при решении задач (опре
деление полной массы, определение положения равновесия и т.п.) при
ходится рассматривать и массы грузов (их называют сосредоточенными
массами) и массу стержня (распределенная масса). Пусть плотность

Тогда полная масса равна
l

m = ∫ ρ( x ) dx.
0

Таким образом, полную массу можно не писать как сумму членов раз
ного вида; она записывается при помощи интеграла, т.е. так же, как рас
пределенная масса. Различный характер распределенной и сосредото
ченной масс сказывается лишь на виде функции ρ(x). Благодаря
этому мы можем единообразно записывать все те соотношения, кото
рые были нами получены раньше лишь для распределенной массы.
Так, например, масса, находящаяся между точками x = b и x = c
c

стержня, равна

∫ ρ(x) dx. Никаких оговорок о том, что

b > a, или b < a

b

и т.п. не требуется: функция ρ(x) содержит δ(x − a), а интегрирова
ние функции δ(x − a) автоматически добавит к массе стержня массу
груза, если только груз расположен между точками x = b и x = c.

* Индексы «р» и «с» будут обозначать «распределенный» и «сосредоточенный».

192

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

§ 2]

ФУНКЦИЯ ГРИНА

193

Точно так же положение центра тяжести стержня дается формулой
l

xc =

∫ x ρ(x) dx
0

l

, независимо от того, имеется на стержне сосредоточен

∫ ρ(x) dx
0

ная масса или нет.
Случай нескольких сосредоточенных масс рассматривается бук
вально так же.
Рассмотрим еще пример. В механике наряду с действием сил, плавно
изменяющихся с течением времени, приходится рассматривать резкий
удар, столкновение тел. При ударе на тело действует кратковременная,
но очень большая сила. В большинстве случаев детальное изучение за
висимости силы от времени на протяжении короткого момента, в тече
ние которого длится удар, не представляет интереса (см., например,
ВМ, § VI.5). Достаточно знать импульс силы, т.е. I у = ∫ F dt. Тогда

силу при ударе можно записать так: F (t) = I у δ (t − t у ), где t у — момент
удара, I у — импульс удара. Эта запись показывает, что сила отлична
от нуля лишь в момент удара, а импульс этой силы равен I у .
Отметим в заключение, что дельтафункция рассматривается лишь
для вещественных значений независимой переменной.
Упражнения


1. Вычислите

∫x

2

δ( x − 3 ) dx.

−∞

2. Упростите выражения:
а) ( x 2 + 3 )δ ( x + 5 ); б) δ(2 x − 8 ); в) δ( x 2 + x − 2 ).

Рис. 69.

Рис. 70.

Допустим сначала, что приложенная нагрузка имеет специальный
вид, а именно, представляет собой единичную сосредоточенную на
грузку, приложенную в некоторой точке воздействия ξ оси х, и об
означим через y = G(x; ξ) соответствующий прогиб в любой точке
наблюдения х (рис. 70). Эта функция G(x; ξ) называется функцией
влияния или функцией Грина (по имени английского математика
Дж. Грина (1793–1841)) рассматриваемой задачи. Мы сейчас покажем,
что если она известна, то легко найти прогиб и от воздействия произ
вольной нагрузки с плотностью f (x).
В самом деле, рассмотрим нагрузку, приходящуюся на участок оси
от точки ξ до точки ξ + d ξ. Эта нагрузка равна f ( ξ) d ξ; поэтому про
гиб от нее в точке х равен G(x; ξ)f ( ξ) d ξ, так как из закона линейнос
ти вытекает, что если внешнюю нагрузку умножить на постоянный
множитель, то и прогиб умножится на тот же множитель. Складывая
такие бесконечно малые прогибы от всех элементов нагрузки от ξ = 0
до ξ = l, получаем суммарный прогиб (см. рис. 69)
l

y = h( x ) = ∫ G ( x; ξ ) f ( ξ ) d ξ.

(5)

0

§ 2. Функция Грина
Рассмотрим сначала пример. Пусть тонкая гибкая нить длины l на
тянута вдоль оси x постоянной силой F. В системе, изображенной на
рис. 69, такое натяжение осуществляется при помощи блока и груза.
Пусть на нить действует перпендикулярно оси х сила, распределен
ная с плотностью f (x), т.е. на малый участок нити между точками х и
l

x + dx действует сила f (x) dx, а на всю нить действует сила

∫ f (x) dx.
0

Найдем форму y(x), которую при этом примет нить; здесь функция
y(x) — это отклонение той точки нити, которая в первоначальном со
стоянии находилась в точке x оси x.
Мы будем считать, что натяжение F нити гораздо больше всей силы,
действующей на нить, так что отклонение нити мало´. Тогда можно по
льзоваться законом линейности, согласно которому при наложении не
скольких нагрузок соответствующие прогибы также складываются.

В рассматриваемом примере нетрудно выписать функцию G(x; ξ)
в явном виде. В самом деле, найдем составляющие сил натяжения нити
вдоль оси у. Слева от точки ξ она равна (см. рис. 70)
z
− F sin α = − F ,
ξ

где z — отклонение точки ξ, нам заранее не заданное; отметим, что при
этом выводе мы воспользовались малостью отклонений и поэтому при
подсчете синуса заменили гипотенузу треугольника на его больший ка
тет. Аналогично получаем составляющую силы натяжения справа от ξ
−F

z
.
l −ξ

Если под действием заданной силы нить находится в равновесии, то
это означает, что сумма всех сил, действующих на нить, т.е. сумма сил

192

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

§ 2]

ФУНКЦИЯ ГРИНА

193

Точно так же положение центра тяжести стержня дается формулой
l

xc =

∫ x ρ(x) dx
0

l

, независимо от того, имеется на стержне сосредоточен

∫ ρ(x) dx
0

ная масса или нет.
Случай нескольких сосредоточенных масс рассматривается бук
вально так же.
Рассмотрим еще пример. В механике наряду с действием сил, плавно
изменяющихся с течением времени, приходится рассматривать резкий
удар, столкновение тел. При ударе на тело действует кратковременная,
но очень большая сила. В большинстве случаев детальное изучение за
висимости силы от времени на протяжении короткого момента, в тече
ние которого длится удар, не представляет интереса (см., например,
ВМ, § VI.5). Достаточно знать импульс силы, т.е. I у = ∫ F dt. Тогда

силу при ударе можно записать так: F (t) = I у δ (t − t у ), где t у — момент
удара, I у — импульс удара. Эта запись показывает, что сила отлична
от нуля лишь в момент удара, а импульс этой силы равен I у .
Отметим в заключение, что дельтафункция рассматривается лишь
для вещественных значений независимой переменной.
Упражнения


1. Вычислите

∫x

2

δ( x − 3 ) dx.

−∞

2. Упростите выражения:
а) ( x 2 + 3 )δ ( x + 5 ); б) δ(2 x − 8 ); в) δ( x 2 + x − 2 ).

Рис. 69.

Рис. 70.

Допустим сначала, что приложенная нагрузка имеет специальный
вид, а именно, представляет собой единичную сосредоточенную на
грузку, приложенную в некоторой точке воздействия ξ оси х, и об
означим через y = G(x; ξ) соответствующий прогиб в любой точке
наблюдения х (рис. 70). Эта функция G(x; ξ) называется функцией
влияния или функцией Грина (по имени английского математика
Дж. Грина (1793–1841)) рассматриваемой задачи. Мы сейчас покажем,
что если она известна, то легко найти прогиб и от воздействия произ
вольной нагрузки с плотностью f (x).
В самом деле, рассмотрим нагрузку, приходящуюся на участок оси
от точки ξ до точки ξ + d ξ. Эта нагрузка равна f ( ξ) d ξ; поэтому про
гиб от нее в точке х равен G(x; ξ)f ( ξ) d ξ, так как из закона линейнос
ти вытекает, что если внешнюю нагрузку умножить на постоянный
множитель, то и прогиб умножится на тот же множитель. Складывая
такие бесконечно малые прогибы от всех элементов нагрузки от ξ = 0
до ξ = l, получаем суммарный прогиб (см. рис. 69)
l

y = h( x ) = ∫ G ( x; ξ ) f ( ξ ) d ξ.

(5)

0

§ 2. Функция Грина
Рассмотрим сначала пример. Пусть тонкая гибкая нить длины l на
тянута вдоль оси x постоянной силой F. В системе, изображенной на
рис. 69, такое натяжение осуществляется при помощи блока и груза.
Пусть на нить действует перпендикулярно оси х сила, распределен
ная с плотностью f (x), т.е. на малый участок нити между точками х и
l

x + dx действует сила f (x) dx, а на всю нить действует сила

∫ f (x) dx.
0

Найдем форму y(x), которую при этом примет нить; здесь функция
y(x) — это отклонение той точки нити, которая в первоначальном со
стоянии находилась в точке x оси x.
Мы будем считать, что натяжение F нити гораздо больше всей силы,
действующей на нить, так что отклонение нити мало´. Тогда можно по
льзоваться законом линейности, согласно которому при наложении не
скольких нагрузок соответствующие прогибы также складываются.

В рассматриваемом примере нетрудно выписать функцию G(x; ξ)
в явном виде. В самом деле, найдем составляющие сил натяжения нити
вдоль оси у. Слева от точки ξ она равна (см. рис. 70)
z
− F sin α = − F ,
ξ

где z — отклонение точки ξ, нам заранее не заданное; отметим, что при
этом выводе мы воспользовались малостью отклонений и поэтому при
подсчете синуса заменили гипотенузу треугольника на его больший ка
тет. Аналогично получаем составляющую силы натяжения справа от ξ
−F

z
.
l −ξ

Если под действием заданной силы нить находится в равновесии, то
это означает, что сумма всех сил, действующих на нить, т.е. сумма сил

194

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

натяжения и заданной силы, равна нулю. Поэтому равна нулю и сумма
составляющих этих сил по оси у. Так как в нашем случае заданная сила
равна 1 и действует вдоль оси у, то на основании предыдущего получаем
1− F

z
z
−F
= 0,
ξ
l −ξ

ξ(l − ξ)
. Если z известно, то отклонение любой
Fl
точки нити найти легко, пользуясь тем, что нить имеет форму ломаной.
Получим
откуда находим z =

x
y( x ) = z ,
ξ
y( x ) = z

если x < ξ,

l −x
,
l −ξ

если x > ξ.

Подставляя сюда найденное значение z и вспоминая, что форма от
клонения при единичной сосредоточенной нагрузке дает функцию
Грина, получаем в данной задаче


G ( x; ξ ) = ⎨



1
x ( l − ξ ), если x < ξ,
Fl
1
ξ ( l − x ), если x > ξ.
Fl

Найденное выражение для функции Грина можно подставить
в формулу (5) для прогиба от произвольной нагрузки. Так как G(x; ξ)
при ξ < x и при ξ > x записывается с помощью различных формул, то
интеграл разбиваем на два:
x

l

y = h( x ) = ∫ G ( x; ξ ) f ( ξ ) d ξ + ∫ G ( x; ξ ) f ( ξ ) d ξ =
0

x

x

=

l

x
l −x
ξ f ( ξ ) d ξ + ∫ ( l − ξ ) f ( ξ ) d ξ.
Fl x
Fl ∫0

Тот же результат можно получить, выписав дифференциальное
уравнение для функции y(x) и решив его. Однако замечательно, что
нам удалось найти решение задачи, даже не выписывая самого диффе
ренциального уравнения. Нам достаточно было знать, что действует за
кон линейности.
Перейдем теперь к общей схеме построения функции влияния.
Пусть внешнее воздействие на какойлибо объект описывается функ
цией f (x) (a  x  b; в приведенном примере это и была функция f (x)),
а результат этого воздействия — функцией F (x) (в приведенном при

§ 2]

ФУНКЦИЯ ГРИНА

195

мере это была функция h(x)). Можно себе представить, что каждой за
данной функции f отвечает новая функция F, т.е. получается, что
каждая функция f по какомуто определенному закону преобразуется
в новую функцию F. Такой закон преобразования функцийпрообра
зов в функцииобразы в математике называется оператором. Напри
мер, хорошо известен оператор дифференцирования D, действующий
по закону Df = f ′, т.е. D(sin x) = cos x, D(x 3) = 3x 2 и т.д. Здесь
sin x — прообраз, который преобразуется оператором D в образ cos х
и т.д. Понятие оператора аналогично понятию функции, но если функ
ция давала закон преобразования чисел (значений независимой пере
менной) в числа (значения зависимой переменной), то оператор
преобразует функции в функции.
Обозначим оператор перехода от функции внешнего воздействия
f (x) к функции«отклику» F (x) через L, так что F = Lf . Мы пред
положим, что действует закон линейности или принцип суперпозии: при
сложении внешних воздействий их результаты также складываются;
этот закон часто выполняется с достаточной точностью, когда внешние
воздействия не слишком велики. Его можно записать в форме
L( f1 + f2 ) = Lf1 + Lf2 .

(6)

Оператор, обладающий таким свойством, называется линейным. (Проверь
те, что, например, оператор дифференцирования является линейным.) Из
этого свойства можно вывести, что при умножении внешнего воздействия
на константу его результат умножится на ту же константу, т.е.
L(Cf ) = CLf

C = const.

(7)

Мы не будем этого доказывать. (Попробуйте это обосновать, считая
1
сначала С целым положительным, затем полагая C = (n = 2, 3, 4, ...),
n
m
далее полагая C = , где m и n — целые положительные, затем для
n
C = 0 и, наконец, считая С отрицательным.)
В примере, разобранном в начале этого параграфа, мы под G(x; ξ)
понимали результат воздействия единичной силы, сосредоточенной
в некоторой точке ξ, т.е., другими словами (см. § 1), распределенной
с плотностью δ (x − ξ). Так и в общем случае мы обозначим через
G(x; ξ) результат внешнего воздействия, описываемого дельтафункци
ей с особенностью в некоторой фиксированной точке ξ, т.е. функцией
δ (x − ξ). Таким образом,
G ( x; ξ ) = L [δ ( x − ξ )].

Как же с помощью этой функции Грина G(x; ξ) выразить результат
преобразования любой заданной функции f(x)? Для этого представим

194

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

натяжения и заданной силы, равна нулю. Поэтому равна нулю и сумма
составляющих этих сил по оси у. Так как в нашем случае заданная сила
равна 1 и действует вдоль оси у, то на основании предыдущего получаем
1− F

z
z
−F
= 0,
ξ
l −ξ

ξ(l − ξ)
. Если z известно, то отклонение любой
Fl
точки нити найти легко, пользуясь тем, что нить имеет форму ломаной.
Получим
откуда находим z =

x
y( x ) = z ,
ξ
y( x ) = z

если x < ξ,

l −x
,
l −ξ

если x > ξ.

Подставляя сюда найденное значение z и вспоминая, что форма от
клонения при единичной сосредоточенной нагрузке дает функцию
Грина, получаем в данной задаче


G ( x; ξ ) = ⎨



1
x ( l − ξ ), если x < ξ,
Fl
1
ξ ( l − x ), если x > ξ.
Fl

Найденное выражение для функции Грина можно подставить
в формулу (5) для прогиба от произвольной нагрузки. Так как G(x; ξ)
при ξ < x и при ξ > x записывается с помощью различных формул, то
интеграл разбиваем на два:
x

l

y = h( x ) = ∫ G ( x; ξ ) f ( ξ ) d ξ + ∫ G ( x; ξ ) f ( ξ ) d ξ =
0

x

x

=

l

x
l −x
ξ f ( ξ ) d ξ + ∫ ( l − ξ ) f ( ξ ) d ξ.
Fl x
Fl ∫0

Тот же результат можно получить, выписав дифференциальное
уравнение для функции y(x) и решив его. Однако замечательно, что
нам удалось найти решение задачи, даже не выписывая самого диффе
ренциального уравнения. Нам достаточно было знать, что действует за
кон линейности.
Перейдем теперь к общей схеме построения функции влияния.
Пусть внешнее воздействие на какойлибо объект описывается функ
цией f (x) (a  x  b; в приведенном примере это и была функция f (x)),
а результат этого воздействия — функцией F (x) (в приведенном при

§ 2]

ФУНКЦИЯ ГРИНА

195

мере это была функция h(x)). Можно себе представить, что каждой за
данной функции f отвечает новая функция F, т.е. получается, что
каждая функция f по какомуто определенному закону преобразуется
в новую функцию F. Такой закон преобразования функцийпрообра
зов в функцииобразы в математике называется оператором. Напри
мер, хорошо известен оператор дифференцирования D, действующий
по закону Df = f ′, т.е. D(sin x) = cos x, D(x 3) = 3x 2 и т.д. Здесь
sin x — прообраз, который преобразуется оператором D в образ cos х
и т.д. Понятие оператора аналогично понятию функции, но если функ
ция давала закон преобразования чисел (значений независимой пере
менной) в числа (значения зависимой переменной), то оператор
преобразует функции в функции.
Обозначим оператор перехода от функции внешнего воздействия
f (x) к функции«отклику» F (x) через L, так что F = Lf . Мы пред
положим, что действует закон линейности или принцип суперпозии: при
сложении внешних воздействий их результаты также складываются;
этот закон часто выполняется с достаточной точностью, когда внешние
воздействия не слишком велики. Его можно записать в форме
L( f1 + f2 ) = Lf1 + Lf2 .

(6)

Оператор, обладающий таким свойством, называется линейным. (Проверь
те, что, например, оператор дифференцирования является линейным.) Из
этого свойства можно вывести, что при умножении внешнего воздействия
на константу его результат умножится на ту же константу, т.е.
L(Cf ) = CLf

C = const.

(7)

Мы не будем этого доказывать. (Попробуйте это обосновать, считая
1
сначала С целым положительным, затем полагая C = (n = 2, 3, 4, ...),
n
m
далее полагая C = , где m и n — целые положительные, затем для
n
C = 0 и, наконец, считая С отрицательным.)
В примере, разобранном в начале этого параграфа, мы под G(x; ξ)
понимали результат воздействия единичной силы, сосредоточенной
в некоторой точке ξ, т.е., другими словами (см. § 1), распределенной
с плотностью δ (x − ξ). Так и в общем случае мы обозначим через
G(x; ξ) результат внешнего воздействия, описываемого дельтафункци
ей с особенностью в некоторой фиксированной точке ξ, т.е. функцией
δ (x − ξ). Таким образом,
G ( x; ξ ) = L [δ ( x − ξ )].

Как же с помощью этой функции Грина G(x; ξ) выразить результат
преобразования любой заданной функции f(x)? Для этого представим

196

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

функцию f в виде суммы «столбчатых» функций (рис. 71), каждая из
которых сосредоточена лишь в одной точке ξ, а вне бесконечно малой
окрестности этой точки она равна
нулю. Поэтому такая столбчатая
функция пропорциональна дель
тафункции δ (x − ξ), а так как интег
рал от столбчатой функции равен
f (ξ) d ξ, то она просто равна
f (ξ) d ξ δ (x − ξ). Таким образом,
мы получаем представление

[

]

f ( x ) = ∑ [ f ( ξ ) d ξ]δ ( x − ξ ).

Рис. 71.
L

Строго говоря, при бесконечно ма
лых d ξ здесь надо писать не знак
суммы, а знак интеграла, так что это,
по существу, формула (4) в другой
записи; однако закон линейности
для сумм в пределе переносится и на
интегралы.
Каждая столбчатая функция
в силу свойства (7) преобразуется в

[[f ( ξ ) d ξ]δ ( x − ξ )] = [f ( ξ ) d ξ] L[δ ( x − ξ )] = f ( ξ ) G ( x; ξ ) d ξ.

§ 3]

ФУНКЦИИ, СВЯЗАННЫЕ С ДЕЛЬТАФУНКЦИЕЙ

197

Таким образом, иногда даже самые общие представления о свой
ствах физических систем указывают путь решения конкретных задач.
Отметим в заключение, что функцииобразы Lf не обязаны быть
определенными на том же интервале, что функциипрообразы f; более
того, независимые переменные х и ξ в формуле (8) могут иметь раз
ный физический смысл. Независимая переменная ξ может играть
роль времени; тогда функция влияния описывает результат воздей
ствия «единичного импульса», подействовавшего в момент ξ.
Упражнение
Напишите функцию влияния для операторов: a) Lf = 2 f ( x ); б) Lf =
= sin x ⋅ f ( x ); в) Lf = f ( x + 1); г) Lf = f ( x 2 ).

§ 3. Функции, связанные с дельтафункцией
При помощи δфункции легко записываются некоторые другие
функции, имеющие большое значение. Важным примером может слу
жить единичная функция* e(x) (другое обозначение ϑ(x)):
x

e( x ) =

∫ δ ( x ) dx.

(9)

−∞

Ясно, что при x < 0 получаем e(x) = 0, а при x > 0 получаем e(x) = 1.
Таким образом, e(x) — это разрывная функция, испытывающая
скачок при x = 0. Ее график («ступенька») изображен на рис. 72, она по

Поэтому сумма таких функций в силу свойства (6) преобразуется в
L

[∑ [f ( ξ ) d ξ]δ ( x − ξ )] = ∑ L[[f ( ξ ) d ξ]δ ( x − ξ )] = ∑ f ( ξ ) G ( x; ξ ) d ξ.

При бесконечно малых d ξ эта сумма является интегралом, т.е. окон
чательно
b

F ( x ) = L[ f ( x )] = ∫ G ( x; ξ ) f ( ξ ) d ξ

(8)

a

(сравните с формулой (5)).
Функцию влияния можно в более простых случаях подсчитать тео
ретически, как в разобранном выше примере, а в более сложных зада
чах определить экспериментально, произведя необходимые замеры,
например измеряя деформацию системы под действием сосредоточен
ной силы. При этом возможность применения принципа суперпозиции
или, как говорят, линейность рассматриваемой системы либо следует
из общетеоретических принципов, либо также может быть проверена
экспериментально. После того как функция Грина найдена и линей
ность системы установлена, решение задачи пишется по формуле (8)
для любого внешнего воздействия f.

Рис. 72.

Рис. 73.

лучается при внезапном подключении какоголибо постоянного воз
действия, например, напряжения в электрическую цепь (при этом неза
висимая переменная играет роль времени).
Равенство (9) можно получить также с помощью приближенных
представлений дельтафункции. В § 1 мы видели, что одним из таких

* Ее также называют функцией Хевисайда по имени английского физика О. Хевисай
да (1850–1925).

196

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

функцию f в виде суммы «столбчатых» функций (рис. 71), каждая из
которых сосредоточена лишь в одной точке ξ, а вне бесконечно малой
окрестности этой точки она равна
нулю. Поэтому такая столбчатая
функция пропорциональна дель
тафункции δ (x − ξ), а так как интег
рал от столбчатой функции равен
f (ξ) d ξ, то она просто равна
f (ξ) d ξ δ (x − ξ). Таким образом,
мы получаем представление

[

]

f ( x ) = ∑ [ f ( ξ ) d ξ]δ ( x − ξ ).

Рис. 71.
L

Строго говоря, при бесконечно ма
лых d ξ здесь надо писать не знак
суммы, а знак интеграла, так что это,
по существу, формула (4) в другой
записи; однако закон линейности
для сумм в пределе переносится и на
интегралы.
Каждая столбчатая функция
в силу свойства (7) преобразуется в

[[f ( ξ ) d ξ]δ ( x − ξ )] = [f ( ξ ) d ξ] L[δ ( x − ξ )] = f ( ξ ) G ( x; ξ ) d ξ.

§ 3]

ФУНКЦИИ, СВЯЗАННЫЕ С ДЕЛЬТАФУНКЦИЕЙ

197

Таким образом, иногда даже самые общие представления о свой
ствах физических систем указывают путь решения конкретных задач.
Отметим в заключение, что функцииобразы Lf не обязаны быть
определенными на том же интервале, что функциипрообразы f; более
того, независимые переменные х и ξ в формуле (8) могут иметь раз
ный физический смысл. Независимая переменная ξ может играть
роль времени; тогда функция влияния описывает результат воздей
ствия «единичного импульса», подействовавшего в момент ξ.
Упражнение
Напишите функцию влияния для операторов: a) Lf = 2 f ( x ); б) Lf =
= sin x ⋅ f ( x ); в) Lf = f ( x + 1); г) Lf = f ( x 2 ).

§ 3. Функции, связанные с дельтафункцией
При помощи δфункции легко записываются некоторые другие
функции, имеющие большое значение. Важным примером может слу
жить единичная функция* e(x) (другое обозначение ϑ(x)):
x

e( x ) =

∫ δ ( x ) dx.

(9)

−∞

Ясно, что при x < 0 получаем e(x) = 0, а при x > 0 получаем e(x) = 1.
Таким образом, e(x) — это разрывная функция, испытывающая
скачок при x = 0. Ее график («ступенька») изображен на рис. 72, она по

Поэтому сумма таких функций в силу свойства (6) преобразуется в
L

[∑ [f ( ξ ) d ξ]δ ( x − ξ )] = ∑ L[[f ( ξ ) d ξ]δ ( x − ξ )] = ∑ f ( ξ ) G ( x; ξ ) d ξ.

При бесконечно малых d ξ эта сумма является интегралом, т.е. окон
чательно
b

F ( x ) = L[ f ( x )] = ∫ G ( x; ξ ) f ( ξ ) d ξ

(8)

a

(сравните с формулой (5)).
Функцию влияния можно в более простых случаях подсчитать тео
ретически, как в разобранном выше примере, а в более сложных зада
чах определить экспериментально, произведя необходимые замеры,
например измеряя деформацию системы под действием сосредоточен
ной силы. При этом возможность применения принципа суперпозиции
или, как говорят, линейность рассматриваемой системы либо следует
из общетеоретических принципов, либо также может быть проверена
экспериментально. После того как функция Грина найдена и линей
ность системы установлена, решение задачи пишется по формуле (8)
для любого внешнего воздействия f.

Рис. 72.

Рис. 73.

лучается при внезапном подключении какоголибо постоянного воз
действия, например, напряжения в электрическую цепь (при этом неза
висимая переменная играет роль времени).
Равенство (9) можно получить также с помощью приближенных
представлений дельтафункции. В § 1 мы видели, что одним из таких

* Ее также называют функцией Хевисайда по имени английского физика О. Хевисай
да (1850–1925).

198

ДЕЛЬТАФУНКЦИЯ ДИРАКА

представлений служит функция

[Гл. VI

m
1
при большом m. Однако
π 1 + (mx)2

x

m
1
1
dx = arctg mx
2
π
π
mx
1
+
(
)
−∞



x
−∞

=

1
1
arctg mx + .
π
2

График этого интеграла при m = 1 и m = 5 показан на рис. 73.
В пределе, при m → ∞, из интеграла получаем e(x), т.е. приходим к ра
венству (9).
Тот же результат можно получить с помощью столбчатой функции,
график которой изображен на рис. 74, а (из нее также в пределе, при
N → ∞, получается дельтафункция).
График интеграла от нее показан на
рис. 74, б. В пределе, при N → ∞, и
здесь получаем равенство (9).
Равенство (9) можно продемон
стрировать на следующем физичес
ком примере. Рассмотрим прямоли
нейное
движение
массы m под
действием переменной силы F (t), на
правленной вдоль этой же прямой.
Записав выражение второго закона
Ньютона и проведя интегрирование,
получим равенство (см., например,
ВМ, § VI.4)
t

v( t ) =

1
∫ F ( t ) dt
m −∞

t


1
v( t ) = ∫ I уδ( t − t у ) dt =
e( t − t у ),
m −∞
m



после удара.
m
Вернемся к математике. Если продифференцировать равенство (9),
то получится, что
(10)

Это равенство также можно показать на только что разобранных приме
рах. Так, в качестве приближенного представления функции e(x) можно

199

взять функцию, изображенную на рис. 74, б, производная которой пока
зана на рис. 74, а; в пределе, при N → ∞, мы приходим к равенству (10).
Мы в нашем изложении исходили из дельтафункции и пришли
к единичной функции с помощью интегрирования. Можно было пойти
и по обратному пути: исходить из функции e(x) и получить функцию
δ(x) с помощью дифференцирования. Таким образом, дельтафункция
получается при дифференцировании разрывной функции e(x). По
добно этому при дифференцировании любой разрывной функции по
являются дельтаслагаемые.
Рассмотрим, например, функцию f (x), заданную двумя формулами:
⎧ x3,
f(x) = ⎨
2
⎩ x + 2,

если 0 < x < 1,
если 1 < x < ∞.

График этой функции, имеющий разрыв при x = 1, показан жирными
линиями на рис. 75. Было бы ошибочно приравнять f ′(x) просто
функции ϕ(x), полученной дифференциро
ванием обеих формул:
⎧ 3x 2 ,
ϕ( x ) = ⎨
⎩ 2 x,

если 0 < x < 1,
если 1 < x < ∞.

(11)

В самом деле, если мы проинтегрируем по
следнюю функцию, например, от значения
х = 0, то мы получим
x

x

при 0 < x < 1: ∫ ϕ( x ) dx =∫ 3 x 2 dx =x 3
0

(мы приняли, что начальная скорость
при t = −∞ равна нулю). Пусть сила
имеет характер удара: F (t) = I у δ(t − t у ) (см. конец § 1). Интегрируя,
получим

e′( x ) = δ( x ).

ФУНКЦИИ, СВЯЗАННЫЕ С ДЕЛЬТАФУНКЦИЕЙ

x

Рис. 74.

т.е. скорость v равна нулю до удара и равна

§ 3]

0

1

при x > 1: ∫ ϕ( x ) dx =∫ ϕ( x ) dx +
x

0
1

0
x

+ ∫ ϕ( x ) dx = ∫ 3 x 2 dx + ∫ 2 x dx = x 3
1

0

1

1
0

+ x2

x

= x2.

1

Рис. 75.

Таким образом, получается не f (x), а непрерывная функция f1 (x),
график которой при x > 1 показан на рис. 75 пунктиром. Чтобы из
f1 (x) получить f (x), надо к первой функции прибавить «ступеньку»
с разрывом при x = 1, равным разрыву функции f (x), т.е. равным
f (1 + 0 ) − f (1 − 0 ) = (12 + 2 ) − 13 = 2 *.

Таким образом, f (x) = f1 (x) + 2e(x − 1), откуда окончательно
f ′( x ) = f1′( x ) + 2 e′( x − 1) = ϕ ( x ) + 2δ ( x − 1),

где ϕ(x) задана формулами (11).
* Запись f (1 − 0) — это условное, но удобное обозначение для предела значения
f (1 − ε) при ε → 0 (ε > 0); аналогично расшифровывается запись f (1 + 0).

198

ДЕЛЬТАФУНКЦИЯ ДИРАКА

представлений служит функция

[Гл. VI

m
1
при большом m. Однако
π 1 + (mx)2

x

m
1
1
dx = arctg mx
2
π
π
mx
1
+
(
)
−∞



x
−∞

=

1
1
arctg mx + .
π
2

График этого интеграла при m = 1 и m = 5 показан на рис. 73.
В пределе, при m → ∞, из интеграла получаем e(x), т.е. приходим к ра
венству (9).
Тот же результат можно получить с помощью столбчатой функции,
график которой изображен на рис. 74, а (из нее также в пределе, при
N → ∞, получается дельтафункция).
График интеграла от нее показан на
рис. 74, б. В пределе, при N → ∞, и
здесь получаем равенство (9).
Равенство (9) можно продемон
стрировать на следующем физичес
ком примере. Рассмотрим прямоли
нейное
движение
массы m под
действием переменной силы F (t), на
правленной вдоль этой же прямой.
Записав выражение второго закона
Ньютона и проведя интегрирование,
получим равенство (см., например,
ВМ, § VI.4)
t

v( t ) =

1
∫ F ( t ) dt
m −∞

t


1
v( t ) = ∫ I уδ( t − t у ) dt =
e( t − t у ),
m −∞
m



после удара.
m
Вернемся к математике. Если продифференцировать равенство (9),
то получится, что
(10)

Это равенство также можно показать на только что разобранных приме
рах. Так, в качестве приближенного представления функции e(x) можно

199

взять функцию, изображенную на рис. 74, б, производная которой пока
зана на рис. 74, а; в пределе, при N → ∞, мы приходим к равенству (10).
Мы в нашем изложении исходили из дельтафункции и пришли
к единичной функции с помощью интегрирования. Можно было пойти
и по обратному пути: исходить из функции e(x) и получить функцию
δ(x) с помощью дифференцирования. Таким образом, дельтафункция
получается при дифференцировании разрывной функции e(x). По
добно этому при дифференцировании любой разрывной функции по
являются дельтаслагаемые.
Рассмотрим, например, функцию f (x), заданную двумя формулами:
⎧ x3,
f(x) = ⎨
2
⎩ x + 2,

если 0 < x < 1,
если 1 < x < ∞.

График этой функции, имеющий разрыв при x = 1, показан жирными
линиями на рис. 75. Было бы ошибочно приравнять f ′(x) просто
функции ϕ(x), полученной дифференциро
ванием обеих формул:
⎧ 3x 2 ,
ϕ( x ) = ⎨
⎩ 2 x,

если 0 < x < 1,
если 1 < x < ∞.

(11)

В самом деле, если мы проинтегрируем по
следнюю функцию, например, от значения
х = 0, то мы получим
x

x

при 0 < x < 1: ∫ ϕ( x ) dx =∫ 3 x 2 dx =x 3
0

(мы приняли, что начальная скорость
при t = −∞ равна нулю). Пусть сила
имеет характер удара: F (t) = I у δ(t − t у ) (см. конец § 1). Интегрируя,
получим

e′( x ) = δ( x ).

ФУНКЦИИ, СВЯЗАННЫЕ С ДЕЛЬТАФУНКЦИЕЙ

x

Рис. 74.

т.е. скорость v равна нулю до удара и равна

§ 3]

0

1

при x > 1: ∫ ϕ( x ) dx =∫ ϕ( x ) dx +
x

0
1

0
x

+ ∫ ϕ( x ) dx = ∫ 3 x 2 dx + ∫ 2 x dx = x 3
1

0

1

1
0

+ x2

x

= x2.

1

Рис. 75.

Таким образом, получается не f (x), а непрерывная функция f1 (x),
график которой при x > 1 показан на рис. 75 пунктиром. Чтобы из
f1 (x) получить f (x), надо к первой функции прибавить «ступеньку»
с разрывом при x = 1, равным разрыву функции f (x), т.е. равным
f (1 + 0 ) − f (1 − 0 ) = (12 + 2 ) − 13 = 2 *.

Таким образом, f (x) = f1 (x) + 2e(x − 1), откуда окончательно
f ′( x ) = f1′( x ) + 2 e′( x − 1) = ϕ ( x ) + 2δ ( x − 1),

где ϕ(x) задана формулами (11).
* Запись f (1 − 0) — это условное, но удобное обозначение для предела значения
f (1 − ε) при ε → 0 (ε > 0); аналогично расшифровывается запись f (1 + 0).

200

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

С функцией e(x) тесно связана функция sign x*, которую можно
определить так:
sign x* =

§ 3]

ФУНКЦИИ, СВЯЗАННЫЕ С ДЕЛЬТАФУНКЦИЕЙ

201

показанного на рис. 78, а, при большом М; тогда функция δ ′(x) будет при
ближенно представлена графиком, показанным на рис. 78, б.

x
.
x

Она равна –1 при х < 0 и +1 при х > 0; таким образом, она показывает
знак числа х. Легко убедиться в правильности соотношения
sign x = 2 e( x ) − 1.

При интегрировании функции e(x) получается уже непрерывная
функция, график которой изображен на
рис. 76, так как

Рис. 76.


⎪при x < 0 равен
x

∫ e( x ) dx ⎨

−∞
⎪при x > 0 равен


冢Проверьте, что эта функция равна

x+ x

x

∫ 0 dx = 0,

−∞
0

−∞

0



.
2
Дельтафункцию можно не только интегрировать, но и дифферен
цировать; ее производная δ ′ (x) имеет еще более «острую» особен
ность, чем δ(x), причем принимает значения обоих знаков. Так, если
исходить из приближенного представления функнии δ(x) в виде
m −( mx )2
при большом m (см. § 1), то мы получаемприближенное
e
π
представление δ ′ (x) в виде функции
2
d ⎡ m − ( mx ) 2 ⎤
2
e
m3 xe − ( mx ) ,

⎥=−
dx ⎣ π
π


график которой показан на рис. 77. Эта
функция принимает экстремальные значе
1
0,71
ния при x = ±
, равные по абсо

m
2m

Рис. 77.

2 2
лютной величине
m = 0,47m2 . (Про
πe
верьте.) Эти значения пропорциональны
уже m2 , а не m, как при представлении
функции δ(x).
Можно исходить из приближенного пред
ставления функции δ(x) в виде треугольника,

* sign — первые буквы латинского слова signum (знак).

Рис. 78.

x

∫ 0 dx + ∫ 1 dx = x.

Если δфункция описывает плотность единичного заряда, располо
женного в начале координат (ср. § 1), то δ ′(x) описывает плотность
«диполя», расположенного там же. Такой диполь получается, если раз
местить заряды q и −q соответственно в точках x = 0 и x = l , а затем,
оставляя p = ql (момент диполя) без изменения, устремить l к нулю,
a q к бесконечности так что в пределе получатся два равных бесконечно
больших заряда противоположного знака на бесконечно близком рас
стоянии. До перехода к пределу плотность заряда имеет вид
qδ( x ) − qδ( x − l ) = p

δ( x − l ) − δ( x )
;
−l

поэтому после перехода к пределу при l → 0 плотность заряда равна
pδ ′(x).
Интегралы с участием δ ′(x) вычисляются с помощью интегриро
вания по частям:




∫ f ( x ) δ′( x − a ) dx = f ( x )δ( x − a ) −∞ −

−∞



− ∫ f ′( x ) δ′( x − a ) dx = − f ′( a ) .

(12)

−∞

Дельтафункцию можно рассматривать также на плоскости и в про
странстве. Например, в пространстве под функцией δ(x, y, z ) надо по
нимать функцию, равную нулю всюду вне начала координат (0; 0; 0),
равную бесконечности в начале и притом такую, что интеграл от нее по
всему пространству равен единице. Легко проверить, что этим условиям,
в частности, удовлетворяет функция
δ( x, y, z ) = δ( x )δ( y )δ( z ).

200

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

С функцией e(x) тесно связана функция sign x*, которую можно
определить так:
sign x* =

§ 3]

ФУНКЦИИ, СВЯЗАННЫЕ С ДЕЛЬТАФУНКЦИЕЙ

201

показанного на рис. 78, а, при большом М; тогда функция δ ′(x) будет при
ближенно представлена графиком, показанным на рис. 78, б.

x
.
x

Она равна –1 при х < 0 и +1 при х > 0; таким образом, она показывает
знак числа х. Легко убедиться в правильности соотношения
sign x = 2 e( x ) − 1.

При интегрировании функции e(x) получается уже непрерывная
функция, график которой изображен на
рис. 76, так как

Рис. 76.


⎪при x < 0 равен
x

∫ e( x ) dx ⎨

−∞
⎪при x > 0 равен


冢Проверьте, что эта функция равна

x+ x

x

∫ 0 dx = 0,

−∞
0

−∞

0



.
2
Дельтафункцию можно не только интегрировать, но и дифферен
цировать; ее производная δ ′ (x) имеет еще более «острую» особен
ность, чем δ(x), причем принимает значения обоих знаков. Так, если
исходить из приближенного представления функнии δ(x) в виде
m −( mx )2
при большом m (см. § 1), то мы получаем приближенное
e
π
представление δ ′ (x) в виде функции
2
d ⎡ m − ( mx ) 2 ⎤
2
e
m3 xe − ( mx ) ,

⎥=−
dx ⎣ π
π


график которой показан на рис. 77. Эта
функция принимает экстремальные значе
1
0,71
ния при x = ±
, равные по абсо

m
2m

Рис. 77.

2 2
лютной величине
m = 0,47m2 . (Про
πe
верьте.) Эти значения пропорциональны
уже m2 , а не m, как при представлении
функции δ(x).
Можно исходить из приближенного пред
ставления функции δ(x) в виде треугольника,

* sign — первые буквы латинского слова signum (знак).

Рис. 78.

x

∫ 0 dx + ∫ 1 dx = x.

Если δфункция описывает плотность единичного заряда, располо
женного в начале координат (ср. § 1), то δ ′(x) описывает плотность
«диполя», расположенного там же. Такой диполь получается, если раз
местить заряды q и −q соответственно в точках x = 0 и x = l , а затем,
оставляя p = ql (момент диполя) без изменения, устремить l к нулю,
a q к бесконечности так что в пределе получатся два равных бесконечно
больших заряда противоположного знака на бесконечно близком рас
стоянии. До перехода к пределу плотность заряда имеет вид
qδ( x ) − qδ( x − l ) = p

δ( x − l ) − δ( x )
;
−l

поэтому после перехода к пределу при l → 0 плотность заряда равна
pδ ′(x).
Интегралы с участием δ ′(x) вычисляются с помощью интегриро
вания по частям:




∫ f ( x ) δ′( x − a ) dx = f ( x )δ( x − a ) −∞ −

−∞



− ∫ f ′( x ) δ′( x − a ) dx = − f ′( a ) .

(12)

−∞

Дельтафункцию можно рассматривать также на плоскости и в про
странстве. Например, в пространстве под функцией δ(x, y, z ) надо по
нимать функцию, равную нулю всюду вне начала координат (0; 0; 0),
равную бесконечности в начале и притом такую, что интеграл от нее по
всему пространству равен единице. Легко проверить, что этим условиям,
в частности, удовлетворяет функция
δ( x, y, z ) = δ( x )δ( y )δ( z ).

202

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

Таким образом, массу m, сосредоточенную в точке (a; b; c), можно рас
сматривать как массу, распределенную в пространстве с плотностью

ОТВЕТЫ И РЕШЕНИЯ

и равен, по определению, пределу
n

lim ∑ f ( xi )μ ( Δl i ),

ρ ( x, y, z ) = mδ( x − a )δ( y − b )δ( z − c ).

k =1

Упражнения
1. Найдите x ′ ; x ″ .
1 −1 ⎤′
⎡⎛

2. Найдите ⎢⎜⎜1 + e x ⎟⎟ ⎥ .
⎢⎝
⎠ ⎥


3. Убедитесь в справедливости формулы (12) непосредственно, воспользо
вавшись разложением функции f ( x ) в ряд по степеням x − a и приближен
ным представлением функции δ′( x ) в виде, показанном на рис. 78, б.

составленному в точности по тому же правилу, как для обычного интег
рала (см., например, ВМ, § I.8), однако взамен длины частей (Δl i )
основного интервала (l) берется их мера μ(Δl i ). Если в качестве меры
взять обычную длину, то мы приходим к обычному определению интег
рала, т.е. интеграл Стилтьеса является обобщением этого обычного ин
теграла*.

то от интег
Если заданная мера имеет конечную плотность ρ =
dx
рала Стилтьеса (14) можно перейти к обычному интегралу

§ 4. Понятие об интеграле Стилтьеса

b

С дельтафункцией непосредственно связано одно полезное расши
рение понятия интеграла. Рассмотрим сначала пример. Пусть на отрез
ке (l ) оси x с концами a, b расположена некоторая масса m и тре
буется определить силу, с которой эта масса притягивает единичную
точечную массу m0 , расположенную в точке x = c, левее (l ), той же
оси. Ответ очень простой. Так как по закону Ньютона масса dm, распо
m dm
ложенная в точке x, притягивает m0 с силой dF = É 0 2 (здесь ко
(x − c)
эффициент пропорциональности É — так называемая гравитацион
ная постоянная), то общая сила равна
F=



(l )

É

m0 dm
1
= É m0 ∫
dm.
2
(x − c)
( x − c )2
(l )

(13)

ρ( x )
dx.
x
(
− c )2
a

Однако, как было указано в § 1, масса m может содержать часть, со
средоточенную в отдельных точках. Тогда интеграл (13) можно пони
мать как интеграл по мере m. Под этим понимается, что каждой части
(Δl ) отрезка (l ) (в том числе, и каждой точке этого отрезка) отвечает
его «мера» (в данном примере масса) m (Δl ), причем выполняется закон
сложения: мера целого равна сумме мер частей. Интеграл по мере (он
также называется интегралом Стилтьеса) в общем случае имеет вид
(14)

(15)

a

Упражнение
Часто мера на оси х задается с помощью вспомогательной функции g( x )
по правилу: мера интервала α  x β равна g(β + 0 ) − g(α − 0 ) (или просто
g(β ) − g(α ), если функция g( x ) непрерывная). Тогда вместо интеграла (14) пи
b

шут



f ( x ) dg( x ), а формула (15) приобретает вид

(l )



(l )

∫x

1
3

2

d ( x );

f ( x ) dg( x ) = ∫ f ( x ) g′( x )dx.
a

1

∫ sin x de( x ); ∫ cos x de( x ).

−1

0

−ϑ

ОТВЕТЫ И РЕШЕНИЯ
§1
1. 3 2 = 9.

b

f ( x ) dμ = ∫ f ( x ) ρ( x ) dx.

Если же имеются точки с отличной от нуля мерой, то, как мы видели в
§ 1, плотность ρ(x) будет иметь дельтообразные слагаемые. Допуская
такие слагаемые, мы можем совершить переход (15) и в этом случае.

Найдите

Ém0 ∫

∫ f ( x ) dμ



(l )

1

Если масса m распределена вдоль (l ) так, что она в каждой точ
ке х имеет конечную плотность ρ = ρ( x), то dm = ρ(x) dx и от интег
рала (13) можно перейти к обычному интегралу

(e )

203

[

]

1
2. а) ( −5 )2 + 3 δ ( x + 5 ) = 28δ( x + 5 ); б) δ (2 x − 8 ) = δ (2( x − 4 )) = δ ( x − 4 );
2
в) многочлен P ( x ) = x 2 + x − 2 имеет нули x1 = 1, x2 = −2, причем P ′( x1 ) = 3,
1
1
P ′( x2 ) = −3. Отсюда δ ( x 2 + x − 2 ) = δ ( x − 1) + δ ( x + 2 ).
3
3

* Чтобы отличать обычный интеграл от интеграла Стилтьеса, первый иногда называют
интегралом Римана.

202

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

Таким образом, массу m, сосредоточенную в точке (a; b; c), можно рас
сматривать как массу, распределенную в пространстве с плотностью

ОТВЕТЫ И РЕШЕНИЯ

и равен, по определению, пределу
n

lim ∑ f ( xi )μ ( Δl i ),

ρ ( x, y, z ) = mδ( x − a )δ( y − b )δ( z − c ).

k =1

Упражнения
1. Найдите x ′ ; x ″ .
1 −1 ⎤′
⎡⎛

2. Найдите ⎢⎜⎜1 + e x ⎟⎟ ⎥ .
⎢⎝
⎠ ⎥


3. Убедитесь в справедливости формулы (12) непосредственно, воспользо
вавшись разложением функции f ( x ) в ряд по степеням x − a и приближен
ным представлением функции δ′( x ) в виде, показанном на рис. 78, б.

составленному в точности по тому же правилу, как для обычного интег
рала (см., например, ВМ, § I.8), однако взамен длины частей (Δl i )
основного интервала (l) берется их мера μ(Δl i ). Если в качестве меры
взять обычную длину, то мы приходим к обычному определению интег
рала, т.е. интеграл Стилтьеса является обобщением этого обычного ин
теграла*.

то от интег
Если заданная мера имеет конечную плотность ρ =
dx
рала Стилтьеса (14) можно перейти к обычному интегралу

§ 4. Понятие об интеграле Стилтьеса

b

С дельтафункцией непосредственно связано одно полезное расши
рение понятия интеграла. Рассмотрим сначала пример. Пусть на отрез
ке (l ) оси x с концами a, b расположена некоторая масса m и тре
буется определить силу, с которой эта масса притягивает единичную
точечную массу m0 , расположенную в точке x = c, левее (l ), той же
оси. Ответ очень простой. Так как по закону Ньютона масса dm, распо
m dm
ложенная в точке x, притягивает m0 с силой dF = É 0 2 (здесь ко
(x − c)
эффициент пропорциональности É — так называемая гравитацион
ная постоянная), то общая сила равна
F=



(l )

É

m0 dm
1
= É m0 ∫
dm.
2
(x − c)
( x − c )2
(l )

(13)

ρ( x )
dx.
x
(
− c )2
a

Однако, как было указано в § 1, масса m может содержать часть, со
средоточенную в отдельных точках. Тогда интеграл (13) можно пони
мать как интеграл по мере m. Под этим понимается, что каждой части
(Δl ) отрезка (l ) (в том числе, и каждой точке этого отрезка) отвечает
его «мера» (в данном примере масса) m (Δl ), причем выполняется закон
сложения: мера целого равна сумме мер частей. Интеграл по мере (он
также называется интегралом Стилтьеса) в общем случае имеет вид
(14)

(15)

a

Упражнение
Часто мера на оси х задается с помощью вспомогательной функции g( x )
по правилу: мера интервала α  x β равна g(β + 0 ) − g(α − 0 ) (или просто
g(β ) − g(α ), если функция g( x ) непрерывная). Тогда вместо интеграла (14) пи
b

шут



f ( x ) dg( x ), а формула (15) приобретает вид

(l )



(l )

∫x

1
3

2

d ( x );

f ( x ) dg( x ) = ∫ f ( x ) g′( x )dx.
a

1

∫ sin x de( x ); ∫ cos x de( x ).

−1

0

−ϑ

ОТВЕТЫ И РЕШЕНИЯ
§1
1. 3 2 = 9.

b

f ( x ) dμ = ∫ f ( x ) ρ( x ) dx.

Если же имеются точки с отличной от нуля мерой, то, как мы видели в
§ 1, плотность ρ(x) будет иметь дельтообразные слагаемые. Допуская
такие слагаемые, мы можем совершить переход (15) и в этом случае.

Найдите

Ém0 ∫

∫ f ( x ) dμ



(l )

1

Если масса m распределена вдоль (l ) так, что она в каждой точ
ке х имеет конечную плотность ρ = ρ( x), то dm = ρ(x) dx и от интег
рала (13) можно перейти к обычному интегралу

(e )

203

[

]

1
2. а) ( −5 )2 + 3 δ ( x + 5 ) = 28δ( x + 5 ); б) δ (2 x − 8 ) = δ (2( x − 4 )) = δ ( x − 4 );
2
в) многочлен P ( x ) = x 2 + x − 2 имеет нули x1 = 1, x2 = −2, причем P ′( x1 ) = 3,
1
1
P ′( x2 ) = −3. Отсюда δ ( x 2 + x − 2 ) = δ ( x − 1) + δ ( x + 2 ).
3
3

* Чтобы отличать обычный интеграл от интеграла Стилтьеса, первый иногда называют
интегралом Римана.

204

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

§2
а) 2δ( x − ξ ); б) sin x ⋅ δ( x − ξ ) = sin ξ ⋅ δ( x − ξ ); в) ( x − ξ + 1); г) δ( x 2 − ξ ) =
 0 ( ξ < 0 ),

=  1
δ( x − ξ ) + δ( x + ξ ) ( ξ > 0 ).
2 ξ


[

]

§3
1. sign x; 2δ( x ).
1 −2 1


2. 1 + e x  e x x −2 − δ( x ).




3.

ГЛАВА VII
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
a+

a

∫ f ( x )δ′( x − a ) dx ≈ ∫ 1 f ( x )4 M

−∞

a−



2

a

2

1
2M



dx −

f ( x )4 M 2 dx ≈

a

2M

≈ 4 M  ∫ [ f ( a ) + f ′( a )( x − a )] dx −
a − 1
 2M

a+



[ f ( a ) + f ′( a )( x − a )] dx  =



1
2M



a


f ′( a ) 1  
f ′( a ) 1  
1
1
= 4 M 2  f ( a )

− f(a )
+
 = − f ′( a )
2 
M
M
2
2
2
2 4 M 2  
M
4
 

Переходя к пределу при M → −∞, получаем точное равенство (12).
§4
2
; 0; 1.
5

Простейшие дифференциальные уравнения, возникающие при рас
смотрении различных физических процессов, например вытекания
воды из сосуда, радиоактивного распада, движения материальной точ
ки, решаются уже в основах интегрального исчисления (см., например,
ВМ, гл. V, VI и VII). Здесь мы познакомим читателя с некоторыми об
щими понятиями, относящимися к дифференциальным уравнениям,
и рассмотрим отдельные классы уравнений, которые нетрудно решить.
Некоторые дальнейшие сведения о дифференциальных уравнениях
содержатся в следующей главе.
Дифференциальные уравнения с одной независимой переменной
называются обыкновенными дифференциальными уравнениями. Если
независимых переменных две или больше, то в дифференциальное
уравнение входят частные производные по этим переменным. Такие
уравнения называются дифференциальными уравнениями с частными
производными.
В этой и следующей главах мы будем рассматривать только обыкно
венные дифференциальные уравнения. Нам потребуются результаты
§§ VI.1–2 и формула Эйлера из § V.3.
§ 1. Геометрический смысл дифференциального уравнения
первого порядка
Дифференциальным уравнением первого порядка называется соот
ношение вида

dy 
F  x, y,  = 0,

dx 

где у — неизвестная функция х. В дальнейшем мы будем считать это
уравнение разрешенным относительно производной, т.е. имеющим вид
dy
= f ( x, y ).
dx

(1)

Оказывается, что, даже не отыскивая решения y(x ) аналитически,
в виде формулы, можно составить представление об общей картине

204

ДЕЛЬТАФУНКЦИЯ ДИРАКА

[Гл. VI

§2
а) 2δ( x − ξ ); б) sin x ⋅ δ( x − ξ ) = sin ξ ⋅ δ( x − ξ ); в) ( x − ξ + 1); г) δ( x 2 − ξ ) =
 0 ( ξ < 0 ),

=  1
δ( x − ξ ) + δ( x + ξ ) ( ξ > 0 ).
2 ξ


[

]

§3
1. sign x; 2δ( x ).
1 −2 1


2. 1 + e x  e x x −2 − δ( x ).




3.

ГЛАВА VII
ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ
a+

a

∫ f ( x )δ′( x − a ) dx ≈ ∫ 1 f ( x )4 M

−∞

a−



2

a

2

1
2M



dx −

f ( x )4 M 2 dx ≈

a

2M

≈ 4 M  ∫ [ f ( a ) + f ′( a )( x − a )] dx −
a − 1
 2M

a+



[ f ( a ) + f ′( a )( x − a )] dx  =



1
2M



a


f ′( a ) 1  
f ′( a ) 1  
1
1
= 4 M 2  f ( a )

− f(a )
+
 = − f ′( a )
2 
M
M
2
2
2
2 4 M 2  
M
4
 

Переходя к пределу при M → −∞, получаем точное равенство (12).
§4
2
; 0; 1.
5

Простейшие дифференциальные уравнения, возникающие при рас
смотрении различных физических процессов, например вытекания
воды из сосуда, радиоактивного распада, движения материальной точ
ки, решаются уже в основах интегрального исчисления (см., например,
ВМ, гл. V, VI и VII). Здесь мы познакомим читателя с некоторыми об
щими понятиями, относящимися к дифференциальным уравнениям,
и рассмотрим отдельные классы уравнений, которые нетрудно решить.
Некоторые дальнейшие сведения о дифференциальных уравнениях
содержатся в следующей главе.
Дифференциальные уравнения с одной независимой переменной
называются обыкновенными дифференциальными уравнениями. Если
независимых переменных две или больше, то в дифференциальное
уравнение входят частные производные по этим переменным. Такие
уравнения называются дифференциальными уравнениями с частными
производными.
В этой и следующей главах мы будем рассматривать только обыкно
венные дифференциальные уравнения. Нам потребуются результаты
§§ VI.1–2 и формула Эйлера из § V.3.
§ 1. Геометрический смысл дифференциального уравнения
первого порядка
Дифференциальным уравнением первого порядка называется соот
ношение вида

dy 
F  x, y,  = 0,

dx 

где у — неизвестная функция х. В дальнейшем мы будем считать это
уравнение разрешенным относительно производной, т.е. имеющим вид
dy
= f ( x, y ).
dx

(1)

Оказывается, что, даже не отыскивая решения y(x ) аналитически,
в виде формулы, можно составить представление об общей картине

206

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

этих решений на основе геометрического смысла уравнения (1). В этом
параграфе мы рассмотрим, как это делается.
dy
Вспомним геометрический смысл производной
. В плоскости х,
dx
dy
равна тангенсу угла наклона
у для кривой y = y(x) величина
dx
dy
от
касательной к кривой. Следовательно, зная зависимость
dx
переменных х, у, выраженную уравне7
нием (1), можно найти направление каса7
тельной к кривой, являющейся графиком
решения (1), причем это направление
можно определить для любой точки плос7
кости. Отметим, что график решения
дифференциального уравнения называет7
ся интегральной линией этого уравнения.
Направление касательной можно по7
казать на чертеже, проведя через любую
Рис. 79.
данную точку (х; у) маленький отрезок
прямой под углом ϑ, удовлетворяющим условию tg ϑ = f (x, y)*.
dy
Так, например, пусть
= x 2 + y 2 , тогда f (x, y) = x 2 + y 2 .
dx
Составим таблицу:
x

y

dy
= tgθ
dx

x

y

dy
= tgθ
dx

–1
–1

–1
0

2
1

0
1

1
–1

1
2

1

2
1

1
1

0
1

1
2

–1
0
0

–1
0

0

На рис. 80 показаны направления касательных в каждой из девяти
точек, приведенных в таблице. Если на чертеже увеличивать число то7
чек, в которых проведено направление касательной, то на глаз видно,
как вырисовывается совокупность кривых, удовлетворяющих диффе7
ренциальному уравнению. (См. рис. 81, соответствующий уравнению

* При построении нет надобности находить угол ϑ и строить его. Гораздо быстрее
найти нужное направление, откладывая по оси х отрезок длины 1, а по оси у отрезок
dy
длины
= tg θ (рис. 79).
dx

§ 1]

ГЕОМЕТРИЧЕСКИЙ СМЫСЛ УРАВНЕНИЯ ПЕРВОГО ПОРЯДКА

Рис. 80.

207

Рис. 81.

dy
= x 2 + y 2 .) Ясно, что уравнение имеет бесконечное количество ин7
dx
тегральных линий и через каждую точку (x 0 ; y 0 ) плоскости проходит
одна такая линия. Таким образом, чтобы выделить из всех решений
уравнения (1) какое7то одно определенное частное (т.е. конкретное)
решение, надо задать дополнительное условие:
при некотором x = x 0 задано значение y = y 0 .

(2)

Это условие называется начальным условием, так как если независимой
переменной служит время, то условие (2) означает задание искомой
функции в начальный момент времени.
Хотя в начальном условии (2) задаются два параметра х0 и у0, но на
самом деле при выборе частного решения уравнения (1) имеется лишь
одна степень свободы. Действительно, точка (x 0 ; y 0 ) может переме7
щаться вдоль определяемой ею интегральной линии, отчего эта линия,
конечно, не меняется. При таком перемещении имеется одна степень
свободы, которая, таким образом, для выбора интегральной линии явля7
ется лишней, т.е. на самом деле при таком выборе имеется 2 – 1 = 1 сте7
пень свободы (см. аналогичное рассуждение в § IV.8). Чтобы указать
существенный параметр при этом выборе, можно зафиксировать х0 и
провести вертикальную прямую x = x 0 , тогда различные интегральные
кривые пересекут ее на различной высоте. Это означает, что различные
кривые соответствуют различным значениям y(x 0 ) = y 0 .
Для того чтобы провести большое количество отрезков, дающих на7
правление касательной, удобно воспользоваться следующим приемом.
Построим на чертеже линии f (x, y) = C для нескольких значений по7
стоянной С. В каждой точке такой линии, согласно (1), величина tgθ
постоянна и равна С. Таким образом, все интересующие нас отрезки,

206

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

этих решений на основе геометрического смысла уравнения (1). В этом
параграфе мы рассмотрим, как это делается.
dy
Вспомним геометрический смысл производной
. В плоскости х,
dx
dy
равна тангенсу угла наклона
у для кривой y = y(x) величина
dx
dy
от
касательной к кривой. Следовательно, зная зависимость
dx
переменных х, у, выраженную уравне7
нием (1), можно найти направление каса7
тельной к кривой, являющейся графиком
решения (1), причем это направление
можно определить для любой точки плос7
кости. Отметим, что график решения
дифференциального уравнения называет7
ся интегральной линией этого уравнения.
Направление касательной можно по7
казать на чертеже, проведя через любую
Рис. 79.
данную точку (х; у) маленький отрезок
прямой под углом ϑ, удовлетворяющим условию tg ϑ = f (x, y)*.
dy
Так, например, пусть
= x 2 + y 2 , тогда f (x, y) = x 2 + y 2 .
dx
Составим таблицу:
x

y

dy
= tgθ
dx

x

y

dy
= tgθ
dx

–1
–1

–1
0

2
1

0
1

1
–1

1
2

1

2
1

1
1

0
1

1
2

–1
0
0

–1
0

0

На рис. 80 показаны направления касательных в каждой из девяти
точек, приведенных в таблице. Если на чертеже увеличивать число то7
чек, в которых проведено направление касательной, то на глаз видно,
как вырисовывается совокупность кривых, удовлетворяющих диффе7
ренциальному уравнению. (См. рис. 81, соответствующий уравнению

* При построении нет надобности находить угол ϑ и строить его. Гораздо быстрее
найти нужное направление, откладывая по оси х отрезок длины 1, а по оси у отрезок
dy
длины
= tg θ (рис. 79).
dx

§ 1]

ГЕОМЕТРИЧЕСКИЙ СМЫСЛ УРАВНЕНИЯ ПЕРВОГО ПОРЯДКА

Рис. 80.

207

Рис. 81.

dy
= x 2 + y 2 .) Ясно, что уравнение имеет бесконечное количество ин7
dx
тегральных линий и через каждую точку (x 0 ; y 0 ) плоскости проходит
одна такая линия. Таким образом, чтобы выделить из всех решений
уравнения (1) какое7то одно определенное частное (т.е. конкретное)
решение, надо задать дополнительное условие:
при некотором x = x 0 задано значение y = y 0 .

(2)

Это условие называется начальным условием, так как если независимой
переменной служит время, то условие (2) означает задание искомой
функции в начальный момент времени.
Хотя в начальном условии (2) задаются два параметра х0 и у0, но на
самом деле при выборе частного решения уравнения (1) имеется лишь
одна степень свободы. Действительно, точка (x 0 ; y 0 ) может переме7
щаться вдоль определяемой ею интегральной линии, отчего эта линия,
конечно, не меняется. При таком перемещении имеется одна степень
свободы, которая, таким образом, для выбора интегральной линии явля7
ется лишней, т.е. на самом деле при таком выборе имеется 2 – 1 = 1 сте7
пень свободы (см. аналогичное рассуждение в § IV.8). Чтобы указать
существенный параметр при этом выборе, можно зафиксировать х0 и
провести вертикальную прямую x = x 0 , тогда различные интегральные
кривые пересекут ее на различной высоте. Это означает, что различные
кривые соответствуют различным значениям y(x 0 ) = y 0 .
Для того чтобы провести большое количество отрезков, дающих на7
правление касательной, удобно воспользоваться следующим приемом.
Построим на чертеже линии f (x, y) = C для нескольких значений по7
стоянной С. В каждой точке такой линии, согласно (1), величина tgθ
постоянна и равна С. Таким образом, все интересующие нас отрезки,

208

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

показывающие направление касательной* в любой точке линии
f (x, y) = C, параллельны.
Линии f (x, y) = C называются изоклинами. В частности, линия
f (x, y) = 0 называется изоклиной нулей; в каждой точке этой линии ка7
сательная к интегральным кривым уравнения (1) горизонтальна. Ли7
ния, в точках которой касательные вертикальны, называется изоклиной
dy
2x + y
бесконечностей. Например, для уравнения
изоклина
=
dx x − y − 1
бесконечностей есть прямая x − y = 1.
На рис. 81 наглядно видно, что интегральные кривые не пересека7
ются одна с другой, во всяком случае под ненулевым углом. Действи7
тельно, уравнение (1) показывает, что при данных х и у есть только
dy
, т.е. через данную точку
одно определенное значение величины
dx
кривая может проходить только под одним определенным наклоном.
Более подробное исследование показывает, что различные интеграль7
ные кривые не могут и соприкасаться друг с другом в какой7либо точке,
если в ней правая часть уравнения (1) и ее частная производная по у
принимают конечные значения. Таким образом, условие (2) действи7
тельно определяет единственное решение уравнения (1).
Упражнения
dy
1. Найдите изоклины уравнения
= x2 + y2.
dx
2. Найдите уравнение геометрического места точек перегиба интеграль7
dy
ных кривых общего уравнения (1); уравнения
= x2 + y2.
dx

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

209

Перепишем уравнение так:
dy
= ψ ( x ) dx.
ϕ( y )

Проинтегрируем правую и левую части последнего равенства:
dy

∫ ϕ( y ) = ∫ ψ ( x ) dx + C

(4)

(мы пишем лишь одну произвольную постоянную, так как обе постоян7
ные, получающиеся при вычислении интегралов, можно объединить
в одну). Из этого общего решения уравнения (3) получаем его частные
решения, придавая С всевозможные значения. Мы видим, что в об7
щем решении уравнения (1) присутствует одна произвольная постоян7
ная, что находится в соответствии с наличием одной степени свободы
при выборе частного решения (§ 1).
Если дополнительно задано начальное условие (2), то легко найти
С. Для этого запишем для краткости формулу (4) в виде
Φ( y ) = Ψ( x ) + C .

Полагая здесь x = x 0 , y = y 0 , получим
Φ( y0 ) = Ψ( x0 ) + C ,

откуда
C = Φ( y0 ) − Ψ( x0 )

и окончательно
Φ( y ) = Ψ( x ) + Φ( y0 ) − Ψ( x0 ),

§ 2. Интегрируемые типы уравнений первого порядка
Рассмотрим несколько видов дифференциальных уравнений, реше7
ния которых получить нетрудно.
I. Уравнения с разделяющимися переменными. Так называются
уравнения вида
dy
= ϕ( y ) ⋅ ψ ( x )**.
dx

§ 2]

(3)

В этом уравнении правая часть ϕ(y) ⋅ ψ(x) есть произведение двух
функций, одна из которых зависит только от у, а другая только от х.
* Следует помнить, что речь идет о касательных к интегральным линиям дифферен7
dy
циального уравнения
= f (x , y ), а не о касательных к самой линии f (x , y ) = C .
dx
** Уравнения такого вида встречаются, например, в задаче о радиоактивном распаде
и в задаче о вытекании воды из сосуда (см. ВМ, гл. V).

т.е.
Φ( y ) − Φ( y0 ) = Ψ( x ) − Ψ( x0 ).

Найденное частное решение можно также записать в виде
y

x

0

0

dy
∫ ϕ( y ) = ∫ ψ ( x ) dx.
y
x

Непосредственно ясно, что это решение удовлетворяет условию (2).
Выполнив фактически интегрирование, получим искомое решение.
II. Линейные однородные уравнения. Линейным однородным
уравнением первого порядка называется уравнение
dy
= f ( x ) y.
dx

(5)

208

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

показывающие направление касательной* в любой точке линии
f (x, y) = C, параллельны.
Линии f (x, y) = C называются изоклинами. В частности, линия
f (x, y) = 0 называется изоклиной нулей; в каждой точке этой линии ка7
сательная к интегральным кривым уравнения (1) горизонтальна. Ли7
ния, в точках которой касательные вертикальны, называется изоклиной
dy
2x + y
бесконечностей. Например, для уравнения
изоклина
=
dx x − y − 1
бесконечностей есть прямая x − y = 1.
На рис. 81 наглядно видно, что интегральные кривые не пересека7
ются одна с другой, во всяком случае под ненулевым углом. Действи7
тельно, уравнение (1) показывает, что при данных х и у есть только
dy
, т.е. через данную точку
одно определенное значение величины
dx
кривая может проходить только под одним определенным наклоном.
Более подробное исследование показывает, что различные интеграль7
ные кривые не могут и соприкасаться друг с другом в какой7либо точке,
если в ней правая часть уравнения (1) и ее частная производная по у
принимают конечные значения. Таким образом, условие (2) действи7
тельно определяет единственное решение уравнения (1).
Упражнения
dy
1. Найдите изоклины уравнения
= x2 + y2.
dx
2. Найдите уравнение геометрического места точек перегиба интеграль7
dy
ных кривых общего уравнения (1); уравнения
= x2 + y2.
dx

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

209

Перепишем уравнение так:
dy
= ψ ( x ) dx.
ϕ( y )

Проинтегрируем правую и левую части последнего равенства:
dy

∫ ϕ( y ) = ∫ ψ ( x ) dx + C

(4)

(мы пишем лишь одну произвольную постоянную, так как обе постоян7
ные, получающиеся при вычислении интегралов, можно объединить
в одну). Из этого общего решения уравнения (3) получаем его частные
решения, придавая С всевозможные значения. Мы видим, что в об7
щем решении уравнения (1) присутствует одна произвольная постоян7
ная, что находится в соответствии с наличием одной степени свободы
при выборе частного решения (§ 1).
Если дополнительно задано начальное условие (2), то легко найти
С. Для этого запишем для краткости формулу (4) в виде
Φ( y ) = Ψ( x ) + C .

Полагая здесь x = x 0 , y = y 0 , получим
Φ( y0 ) = Ψ( x0 ) + C ,

откуда
C = Φ( y0 ) − Ψ( x0 )

и окончательно
Φ( y ) = Ψ( x ) + Φ( y0 ) − Ψ( x0 ),

§ 2. Интегрируемые типы уравнений первого порядка
Рассмотрим несколько видов дифференциальных уравнений, реше7
ния которых получить нетрудно.
I. Уравнения с разделяющимися переменными. Так называются
уравнения вида
dy
= ϕ( y ) ⋅ ψ ( x )**.
dx

§ 2]

(3)

В этом уравнении правая часть ϕ(y) ⋅ ψ(x) есть произведение двух
функций, одна из которых зависит только от у, а другая только от х.
* Следует помнить, что речь идет о касательных к интегральным линиям дифферен7
dy
циального уравнения
= f (x , y ), а не о касательных к самой линии f (x , y ) = C .
dx
** Уравнения такого вида встречаются, например, в задаче о радиоактивном распаде
и в задаче о вытекании воды из сосуда (см. ВМ, гл. V).

т.е.
Φ( y ) − Φ( y0 ) = Ψ( x ) − Ψ( x0 ).

Найденное частное решение можно также записать в виде
y

x

0

0

dy
∫ ϕ( y ) = ∫ ψ ( x ) dx.
y
x

Непосредственно ясно, что это решение удовлетворяет условию (2).
Выполнив фактически интегрирование, получим искомое решение.
II. Линейные однородные уравнения. Линейным однородным
уравнением первого порядка называется уравнение
dy
= f ( x ) y.
dx

(5)

210

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Оно представляет собой частный случай уравнения (3), но мы останав7
ливаемся на нем особо из7за его большой важности. Проводя в (5) раз7
деление переменных и интегрируя, получим
dy
= f ( x ) dx,
y

x

ln y = ∫ f ( x ) dx + ln C ;
a

в правой части мы записали произвольную постоянную в форме lnC
для удобства дальнейших выкладок. Отсюда находим у
x

∫ f (x )
y = Ce a

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

211

Будем искать то решение уравнения (9), которое обращается в нуль
при некотором значении x = x 0 . При зафиксированной функции f (x)
это решение y(x) определяется выбором функции g (x), т.е. g (x)
можно истолковывать как некое внешнее воздействие, а y(x) — как
его результат (другими словами, закон, по которому функции g (x) со7
поставляется решение y(x), является оператором, см. § VI.2). Легко
проверить, что при этом имеет место принцип суперпозиции, т.е. если
функции g (x) складываются, то и соответствующие решения склады7
ваются. В самом деле, если

dx

,

(6)

где а — какое7либо фиксированное значение х. Формула (6) дает об7
щее решение уравнения (5).
Обозначим для краткости
x

y1 ( x ) = e

§ 2]

∫ f (x )

a

dx

.

(7)

Так как эта функция получается из (6) при С = 1, то она представляет со7
бой частное решение уравнения (5). Формулу (6) можно записать в виде
y = Cy1 ( x ).

(8)

Легко и непосредственно проверить, что если y 1 (x) представляет со7
бой какое7то частное решение уравнения (5), то и функция (8) при лю7
бом постоянном С также удовлетворяет уравнению (5):
dy
dy d (Cy1 )
=
= C 1 = Cf ( x ) y1 = f ( x ) y.
dx
dx
dx

Таким образом, чтобы получить общее решение уравнения (5), надо
взять какое7либо одно его частное решение и умножить это частное ре7
шение на произвольную постоянную. Полагая, в частности, C = 0, мы
видим, что одно из частных решений уравнения (5) представляет собой
тождественный нуль; конечно, это нулевое решение непригодно для
построения общего решения.
III. Линейные неоднородные уравнения. Линейное неоднородное
уравнение первого порядка имеет вид
dy
= f ( x ) y + g( x )*.
dx

(9)

dy1
= f ( x ) y1 + g1 ( x ),
dx

dy2
= f ( x ) y2 + g 2 ( x ),
dx

причем y 1 (x 0 ) = 0, y 2 (x 0 ) = 0, то функция y = y 1 (x) + y 2 (x) удовлет7
воряет уравнению
dy
= f ( x ) y + [ g1 ( x ) + g 2 ( x )]
dx

и условию y(x 0 ) = 0 (почему?).
На основании § VI.2 решение уравнения (9) можно получить с по7
мощью построения соответствующей функции влияния G(x; ξ), кото7
рая служит решением уравнения
dy
= f ( x ) y + δ( x − ξ )
dx

при любом фиксированном ξ. Будем считать, что ξ > x 0 ; тогда при
x 0 < x < ξ уравнение (10) превращается в (5), т.е. решение имеет вид
(8), но так как ищется решение, для которого y(x 0 ) = 0, то C = 0, т.е.
y(x) ≡ 0. Если, далее, проинтегрировать уравнение (10) от x = ξ − 0 до
x = ξ + 0, то мы получим
ξ+ 0

y(ξ + 0 ) − y(ξ − 0 ) =



ξ+ 0

f ( x ) y dx +

ξ −0

∫ δ( x − ξ) dx =0 + 1 = 1

ξ −0

(так как решение у остается конечным, то интеграл от первого слагае7
мого в правой части (10) по бесконечно малому промежутку бесконеч7
но мал и им можно пренебречь). Но согласно только что доказанному
y(ξ − 0) = 0; отсюда
y(ξ + 0 ) = 1.

* Такое уравнение встречается, например, в задаче о радиоактивном семействе (см.
ВМ, гл. V). В этой задаче независимой переменной х служит время, а функцией у — ко7
личество данного радиоактивного вещества в системе, так что искомое решение y (x )
описывает закон изменения этого количества во времени. Коэффициент f (x ) равен от7
рицательной постоянной, абсолютная величина которой представляет собой вероят7
ность распада данного вещества в единицу времени, а свободный член g (x ) равен
скорости ввода этого вещества в рассматриваемую систему.

(10)

(11)

Однако при x > ξ уравнение (10) также превращается в (5) и потому
имеет решение (8); условие (11) дает
1 = Cy1 ( ξ ),

т.е. C =

1
1
и y=
y1 ( x ).
y1 ( ξ )
y1 ( ξ )

210

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Оно представляет собой частный случай уравнения (3), но мы останав7
ливаемся на нем особо из7за его большой важности. Проводя в (5) раз7
деление переменных и интегрируя, получим
dy
= f ( x ) dx,
y

x

ln y = ∫ f ( x ) dx + ln C ;
a

в правой части мы записали произвольную постоянную в форме lnC
для удобства дальнейших выкладок. Отсюда находим у
x

∫ f (x )
y = Ce a

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

211

Будем искать то решение уравнения (9), которое обращается в нуль
при некотором значении x = x 0 . При зафиксированной функции f (x)
это решение y(x) определяется выбором функции g (x), т.е. g (x)
можно истолковывать как некое внешнее воздействие, а y(x) — как
его результат (другими словами, закон, по которому функции g (x) со7
поставляется решение y(x), является оператором, см. § VI.2). Легко
проверить, что при этом имеет место принцип суперпозиции, т.е. если
функции g (x) складываются, то и соответствующие решения склады7
ваются. В самом деле, если

dx

,

(6)

где а — какое7либо фиксированное значение х. Формула (6) дает об7
щее решение уравнения (5).
Обозначим для краткости
x

y1 ( x ) = e

§ 2]

∫ f (x )

a

dx

.

(7)

Так как эта функция получается из (6) при С = 1, то она представляет со7
бой частное решение уравнения (5). Формулу (6) можно записать в виде
y = Cy1 ( x ).

(8)

Легко и непосредственно проверить, что если y 1 (x) представляет со7
бой какое7то частное решение уравнения (5), то и функция (8) при лю7
бом постоянном С также удовлетворяет уравнению (5):
dy
dy d (Cy1 )
=
= C 1 = Cf ( x ) y1 = f ( x ) y.
dx
dx
dx

Таким образом, чтобы получить общее решение уравнения (5), надо
взять какое7либо одно его частное решение и умножить это частное ре7
шение на произвольную постоянную. Полагая, в частности, C = 0, мы
видим, что одно из частных решений уравнения (5) представляет собой
тождественный нуль; конечно, это нулевое решение непригодно для
построения общего решения.
III. Линейные неоднородные уравнения. Линейное неоднородное
уравнение первого порядка имеет вид
dy
= f ( x ) y + g( x )*.
dx

(9)

dy1
= f ( x ) y1 + g1 ( x ),
dx

dy2
= f ( x ) y2 + g 2 ( x ),
dx

причем y 1 (x 0 ) = 0, y 2 (x 0 ) = 0, то функция y = y 1 (x) + y 2 (x) удовлет7
воряет уравнению
dy
= f ( x ) y + [ g1 ( x ) + g 2 ( x )]
dx

и условию y(x 0 ) = 0 (почему?).
На основании § VI.2 решение уравнения (9) можно получить с по7
мощью построения соответствующей функции влияния G(x; ξ), кото7
рая служит решением уравнения
dy
= f ( x ) y + δ( x − ξ )
dx

при любом фиксированном ξ. Будем считать, что ξ > x 0 ; тогда при
x 0 < x < ξ уравнение (10) превращается в (5), т.е. решение имеет вид
(8), но так как ищется решение, для которого y(x 0 ) = 0, то C = 0, т.е.
y(x) ≡ 0. Если, далее, проинтегрировать уравнение (10) от x = ξ − 0 до
x = ξ + 0, то мы получим
ξ+ 0

y(ξ + 0 ) − y(ξ − 0 ) =



ξ+ 0

f ( x ) y dx +

ξ −0

∫ δ( x − ξ) dx =0 + 1 = 1

ξ −0

(так как решение у остается конечным, то интеграл от первого слагае7
мого в правой части (10) по бесконечно малому промежутку бесконеч7
но мал и им можно пренебречь). Но согласно только что доказанному
y(ξ − 0) = 0; отсюда
y(ξ + 0 ) = 1.

* Такое уравнение встречается, например, в задаче о радиоактивном семействе (см.
ВМ, гл. V). В этой задаче независимой переменной х служит время, а функцией у — ко7
личество данного радиоактивного вещества в системе, так что искомое решение y (x )
описывает закон изменения этого количества во времени. Коэффициент f (x ) равен от7
рицательной постоянной, абсолютная величина которой представляет собой вероят7
ность распада данного вещества в единицу времени, а свободный член g (x ) равен
скорости ввода этого вещества в рассматриваемую систему.

(10)

(11)

Однако при x > ξ уравнение (10) также превращается в (5) и потому
имеет решение (8); условие (11) дает
1 = Cy1 ( ξ ),

т.е. C =

1
1
и y=
y1 ( x ).
y1 ( ξ )
y1 ( ξ )

212

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

( x0 < x < ξ ),

x

y=

( x > ξ).



x



x0

x0

x

x

=



x0

213

y1 ( x )
g( ξ ) dξ,
y2 ( ξ)

y0 = 0 + Cy1 ( x0 ),

где функция y 1 (x) дается формулой (7). Аналогично можно прове7
рить, что та же окончательная формула (12) справедлива и при x < x 0 .
Отметим, что в ее правой части можно вынести y 1 (x) (но не y 1 (ξ)!)
из7под знака интеграла.
Особенно часто пользуются последней формулой при x 0 = −∞, что
физически наиболее естественно. Тогда решение (12) обладает тем сво7
йством, что если функция g (x) тождественно равна нулю до некото7
рого х, то и решение тождественно равно нулю до этого х. Таким
образом, в этом случае формула (12) дает в каком7то смысле «чистый»
результат воздействия функции g (x).
Формула (12) дает частное решение уравнения (9) — именно то, кото7
рое при x = x 0 обращается в нуль.Чтобы получить общее решение урав7
нения (9), заметим, что разность двух любых решений этого уравнения
удовлетворяет соответствующему однородному уравнению (5): если
dy2
= f ( x ) y2 + g( x ),
dx

то
d ( y1 − y2 )
= f ( x )( y1 − y2 )
dx

(почему?). Значит, эта разность должна иметь вид (8), где С произ7
вольно. Итак, общее решение линейного неоднородного уравнения
представляет собой сумму какого7либо его частного решения и общего
решения соответствующего однородного уравнения. Выбирая в качес7

(13)

т.е. C =

y0
,
y1 ( x0 )

и окончательно получаем искомое решение
x



x0

(12)

y1 ( x )
g( ξ ) dξ + Cy1 ( x ).
y2 ( ξ)

Если нас интересует частное решение, удовлетворяющее условию (2),
то, подставляя в (13) x = x 0 , находим

y=

y( x ) = ∫ G ( x; ξ ) g( ξ ) dξ = ∫ G ( x; ξ ) g( ξ ) dξ + ∫ G ( x; ξ ) g( ξ ) dξ =

dy1
= f ( x ) y1 + g( x ),
dx



x0

График функции G(x, ξ) при фиксиро7
ванном ξ показан на рис. 82 жирной ли7
нией, имеющей разрыв при x = ξ.
Теперь можно написать искомое реше7
ние уравнения (9) при любой функции
g (x) на основе соответствующим образом
преобразованной общей формулы (VI.8):

Рис. 82.

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

тве этого частного решения найденное нами решение (12), получаем
общее решение уравнения (9) в форме

Итак, в данной задаче функция Грина имеет вид
⎧0

G ( x, ξ ) = ⎨ y1 ( x )
⎪ y (ξ)
⎩ 1

§ 2]

y1 ( x )
y (x)
.
g( ξ ) dξ + y0 1
y2 ( ξ)
y1 ( x0 )

К тем же результатам можно прийти другим путем, с помощью бо7
лее быстрого, но искусственного способа «вариации произвольной по7
стоянной». Великий французский математик и механик Лагранж
предложил, исходя из формулы (8), искать решение уравнения (9)
в форме
y = u ( x ) y1 ( x ),

(14)

где u (x) — некоторая неизвестная функция, а y 1 (x) имеет прежний
смысл (7). Подставляя (14) в (9), получаем
u y1′ + u′ y1 = f ( x )u y1 + g( x ).

Но так как y 1 представляет собой решение однородного уравнения, то
первые слагаемые слева и справа взаимно уничтожаются, и мы получаем
u′ y1 ( x ) = g( x ), откуда u′ =

g( x )
,
y1 ( x )

x

u( x ) =

g( ξ )

∫ y1 ( ξ ) dξ + C

x0

(в последнем интеграле мы заменили обозначение переменной интег7
рирования на ξ, чтобы отличить его от верхнего предела). Подставляя
полученный результат в (14), приходим к формуле (13).
IV. Простые случаи линейных уравнений. Имеются случаи, когда
решение линейного уравнения выглядит особенно просто. Так будет,
в частности, если коэффициент f(x) постоянный:
f ( x ) ≡ p = const.

Тогда однородное уравнение (5) имеет вид
dy
= py
dx

212

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

( x0 < x < ξ ),

x

y=

( x > ξ).



x



x0

x0

x

x

=



x0

213

y1 ( x )
g( ξ ) dξ,
y2 ( ξ)

y0 = 0 + Cy1 ( x0 ),

где функция y 1 (x) дается формулой (7). Аналогично можно прове7
рить, что та же окончательная формула (12) справедлива и при x < x 0 .
Отметим, что в ее правой части можно вынести y 1 (x) (но не y 1 (ξ)!)
из7под знака интеграла.
Особенно часто пользуются последней формулой при x 0 = −∞, что
физически наиболее естественно. Тогда решение (12) обладает тем сво7
йством, что если функция g (x)тождественно равна нулю до некото7
рого х, то и решение тождественно равно нулю до этого х. Таким
образом, в этом случае формула (12) дает в каком7то смысле «чистый»
результат воздействия функции g (x).
Формула (12) дает частное решение уравнения (9) — именно то, кото7
рое при x = x 0 обращается в нуль.Чтобы получить общее решение урав7
нения (9), заметим, что разность двух любых решений этого уравнения
удовлетворяет соответствующему однородному уравнению (5): если
dy2
= f ( x ) y2 + g( x ),
dx

то
d ( y1 − y2 )
= f ( x )( y1 − y2 )
dx

(почему?). Значит, эта разность должна иметь вид (8), где С произ7
вольно. Итак, общее решение линейного неоднородного уравнения
представляет собой сумму какого7либо его частного решения и общего
решения соответствующего однородного уравнения. Выбирая в качес7

(13)

т.е. C =

y0
,
y1 ( x0 )

и окончательно получаем искомое решение
x



x0

(12)

y1 ( x )
g( ξ ) dξ + Cy1 ( x ).
y2 ( ξ)

Если нас интересует частное решение, удовлетворяющее условию (2),
то, подставляя в (13) x = x 0 , находим

y=

y( x ) = ∫ G ( x; ξ ) g( ξ ) dξ = ∫ G ( x; ξ ) g( ξ ) dξ + ∫ G ( x; ξ ) g( ξ ) dξ =

dy1
= f ( x ) y1 + g( x ),
dx



x0

График функции G(x, ξ) при фиксиро7
ванном ξ показан на рис. 82 жирной ли7
нией, имеющей разрыв при x = ξ.
Теперь можно написать искомое реше7
ние уравнения (9) при любой функции
g (x) на основе соответствующим образом
преобразованной общей формулы (VI.8):

Рис. 82.

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

тве этого частного решения найденное нами решение (12), получаем
общее решение уравнения (9) в форме

Итак, в данной задаче функция Грина имеет вид
⎧0

G ( x, ξ ) = ⎨ y1 ( x )
⎪ y (ξ)
⎩ 1

§ 2]

y1 ( x )
y (x)
.
g( ξ ) dξ + y0 1
y2 ( ξ)
y1 ( x0 )

К тем же результатам можно прийти другим путем, с помощью бо7
лее быстрого, но искусственного способа «вариации произвольной по7
стоянной». Великий французский математик и механик Лагранж
предложил, исходя из формулы (8), искать решение уравнения (9)
в форме
y = u ( x ) y1 ( x ),

(14)

где u (x) — некоторая неизвестная функция, а y 1 (x) имеет прежний
смысл (7). Подставляя (14) в (9), получаем
u y1′ + u′ y1 = f ( x )u y1 + g( x ).

Но так как y 1 представляет собой решение однородного уравнения, то
первые слагаемые слева и справа взаимно уничтожаются, и мы получаем
u′ y1 ( x ) = g( x ), откуда u′ =

g( x )
,
y1 ( x )

x

u( x ) =

g( ξ )

∫ y1 ( ξ ) dξ + C

x0

(в последнем интеграле мы заменили обозначение переменной интег7
рирования на ξ, чтобы отличить его от верхнего предела). Подставляя
полученный результат в (14), приходим к формуле (13).
IV. Простые случаи линейных уравнений. Имеются случаи, когда
решение линейного уравнения выглядит особенно просто. Так будет,
в частности, если коэффициент f(x) постоянный:
f ( x ) ≡ p = const.

Тогда однородное уравнение (5) имеет вид
dy
= py
dx

214

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

и общее решение
px

y = Ce ,

(15)

что можно получить из формул (7) и (8), приняв для простоты а = 0, но
легко получить и непосредственно с помощью разделения переменных
или простой подстановкой.
Соответствующее неоднородное уравнение особенно просто решает;
ся, если свободный член, т.е. g (x), представляет собой постоянную или
экспоненту (показательную функцию). Рассмотрим сначала уравнение
dy
= py + A
dx

(A = const).

(16)

Как мы знаем, для получения его общего решения надо найти ка;
кое;либо его частное решение, а затем сложить результат с общим ре;
шением (15) соответствующего однородного уравнения. Однако
частное решение уравнения (16) легко разыскать в форме y = B = const.
Подставляя в (16), получаем
0 = pB + A,

A
т.е. B = − .
p

Рассмотрим теперь уравнение
(17)

(18)

так как тогда после подстановки в (17) все члены будут подобными,
и возникает надежда добиться равенства с помощью подбора В. Про;
делаем это:
Bke kx = pBe kx + Ae kx .

A
. Подставляя в (18), получаем час;
k−p
тное решение уравнения (17), а после добавления общего решения

Отсюда легко находим B =

соответствующего однородного уравнения — общее решение урав;
нения (17):
y=

A kx
e + Ce px ,
k−p

где С — произвольная постоянная.
Полученное решение, очевидно, непригодно, если k = p. В этом осо;
бом случае решение уравнения (17) найдем с помощью общей форму;
лы (13), заметив, что в рассматриваемом случае частное решение
y1 (x) однородного уравнения равно e px . Получим, приняв для про;
стоты x 0 = 0,
x

y=∫
0

e px
e pξ

x

Ae pξ dξ + Ce px = Ae px ∫ dξ + Ce px = Axe px + Ce px .

(19)

0

Итак, для k = p в частном решении при экспоненте появляется допол;
нительный множитель х.
Общее неоднородное уравнение

⎧0

G (x , ξ) = ⎨ e px
p( x − ξ )
⎪⎩ pξ = e
e

(x 0 < x < ξ),
(x > ξ).

Общее решение в силу формулы (13) имеет вид

Производная от показательной функции пропорциональна самой
функции; поэтому естественно искать частное решение уравнения (17)
в форме
y = Be ,

215

решается с помощью функции Грина, которая в данном случае имеет
особенно простой вид

A
y = − + Ce px .
p

kx

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

dy
= py + g (x )
dx

Итак, общее решение уравнения (16) имеет вид

dy
= py + Ae kx .
dx

§ 2]

x

y = ∫ e p( x − ξ) g (ξ) dξ + Ce px .
x0

Рассмотренными здесь уравнениями не исчерпываются типы урав;
нений, решения которых могут быть записаны в виде точных формул,
содержащих элементарные функции и интегралы от них. В курсах диф;
ференциальных уравнений можно найти еще несколько таких типов;
наиболее полно они рассмотрены в книге Э. Камке «Справочник по об;
ыкновенным дифференциальным уравнениям», «Наука», 1971.
Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво;
ряющие указанным начальным данным.
dy
1.
= 2xy, y = 1 при x = 0.
dx

214

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

и общее решение
px

y = Ce ,

(15)

что можно получить из формул (7) и (8), приняв для простоты а = 0, но
легко получить и непосредственно с помощью разделения переменных
или простой подстановкой.
Соответствующее неоднородное уравнение особенно просто решает;
ся, если свободный член, т.е. g (x), представляет собой постоянную или
экспоненту (показательную функцию). Рассмотрим сначала уравнение
dy
= py + A
dx

(A = const).

(16)

Как мы знаем, для получения его общего решения надо найти ка;
кое;либо его частное решение, а затем сложить результат с общим ре;
шением (15) соответствующего однородного уравнения. Однако
частное решение уравнения (16) легко разыскать в форме y = B = const.
Подставляя в (16), получаем
0 = pB + A,

A
т.е. B = − .
p

Рассмотрим теперь уравнение
(17)

(18)

так как тогда после подстановки в (17) все члены будут подобными,
и возникает надежда добиться равенства с помощью подбора В. Про;
делаем это:
Bke kx = pBe kx + Ae kx .

A
. Подставляя в (18), получаем час;
k−p
тное решение уравнения (17), а после добавления общего решения

Отсюда легко находим B =

соответствующего однородного уравнения — общее решение урав;
нения (17):
y=

A kx
e + Ce px ,
k−p

где С — произвольная постоянная.
Полученное решение, очевидно, непригодно, если k = p. В этом осо;
бом случае решение уравнения (17) найдем с помощью общей форму;
лы (13), заметив, что в рассматриваемом случае частное решение
y1 (x) однородного уравнения равно e px . Получим, приняв для про;
стоты x 0 = 0,
x

y=∫
0

e px
e pξ

x

Ae pξ dξ + Ce px = Ae px ∫ dξ + Ce px = Axe px + Ce px .

(19)

0

Итак, для k = p в частном решении при экспоненте появляется допол;
нительный множитель х.
Общее неоднородное уравнение

⎧0

G (x , ξ) = ⎨ e px
p( x − ξ )
⎪⎩ pξ = e
e

(x 0 < x < ξ),
(x > ξ).

Общее решение в силу формулы (13) имеет вид

Производная от показательной функции пропорциональна самой
функции; поэтому естественно искать частное решение уравнения (17)
в форме
y = Be ,

215

решается с помощью функции Грина, которая в данном случае имеет
особенно простой вид

A
y = − + Ce px .
p

kx

ИНТЕГРИРУЕМЫЕ ТИПЫ УРАВНЕНИЙ ПЕРВОГО ПОРЯДКА

dy
= py + g (x )
dx

Итак, общее решение уравнения (16) имеет вид

dy
= py + Ae kx .
dx

§ 2]

x

y = ∫ e p( x − ξ) g (ξ) dξ + Ce px .
x0

Рассмотренными здесь уравнениями не исчерпываются типы урав;
нений, решения которых могут быть записаны в виде точных формул,
содержащих элементарные функции и интегралы от них. В курсах диф;
ференциальных уравнений можно найти еще несколько таких типов;
наиболее полно они рассмотрены в книге Э. Камке «Справочник по об;
ыкновенным дифференциальным уравнениям», «Наука», 1971.
Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво;
ряющие указанным начальным данным.
dy
1.
= 2xy, y = 1 при x = 0.
dx

216

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

2.
3.
4.
5.
6.
7.

dy
dx
dy
dx
dy
dx
dy
dx
dy
dx
dy
dx

y =1

при

= e− y ,

y =1

при x = 0.

x
= ,
y

y =1

при

x = 0.

1
e

при

x = 1.

при

x = 0.

при

x = 0.

x = 1.

= − y + ex ,

y=

= −2 y + 4 x,

y = −2

+ y = cos x,

y=

ЛИНЕЙНЫЕ ОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

m

§ 3. Линейные однородные уравнения второго порядка
с постоянными коэффициентами
Дифференциальное уравнение второго порядка содержит вторую
производную от искомой функции; его общий вид таков:

dy d 2 y ⎞
F ⎜ x, y, , 2 ⎟ = 0.
dx dx ⎠


Если это уравнение зависит от искомой функции и ее производных линей7
но (зависимость от х может быть любой), то оно называется линейным.
Таким образом, линейное уравнение второго порядка имеет общий вид
a( x )

§ 3]

217

Рассмотрим сначала уравнение свободных колебаний; оно имеет вид

y
= ,
x

3
2

[Гл. VII

d 2y
dy
+ b( x )
+ c ( x ) y = f ( x ).
dx
dx 2

(21)

и называется линейным однородным уравнением. Его свойства во мно7
гом аналогичны свойствам линейного однородного уравнения первого
порядка, разобранным в § 2. Так, легко проверить, что если y 1 (t) — ка7
кое7либо частное решение уравнения (21), то и Cy 1 (t), где С — любая
постоянная, также служит решением того же уравнения. В частности,
при C = 0 получаем тождественно нулевое решение уравнения (21).
Кроме того, легко проверить, что если y 1 (t) и y 2 (t) — два частных ре7
шения уравнения (21), то их сумма y = y 1 (t) + y 2 (t) также служит ре7
шением того же уравнения (проверьте, подставив эту сумму в (21)!).
Из сказанного следует, что если найдены два частных решения
y 1 (t) и y 2 (t) уравнения (21), то их линейная комбинация
y = С1 y1 ( t ) + С 2 y2 ( t ),

(22)

где С1 и С2 — произвольные постоянные, также служит решением
того же уравнения. Но общее решение дифференциального уравнения
второго порядка получается в результате двух интегрирований и пото7
му содержит в себе две произвольные постоянные. Значит, выражение
(22) служит общим решением уравнения (21). Конечно, при
этом y 1 (t) и y 2 (t) не должны быть пропорциональными, так как если
y 2 (t) = ky 1 (t), то
С1 y1 ( t ) + С 2 y2 ( t ) = (С1 + С 2 k ) y1 ( t ) = Сy1 ( t ),

Мы рассмотрим наиболее важный частный случай, когда коэффи7
циенты а, b, с при искомой функции и ее производных являются по7
стоянными. Такое уравнение встречается в задачах о механических
и электрических колебаниях (см., например, ВМ, гл. VI и VIII), причем
в этих задачах независимой переменной служит время t. Мы остано7
вимся на рассмотрении механических колебаний простейшего осцил7
лятора; тогда уравнение имеет вид
d 2y
dy
m 2 +h
+ ky = f ( t ),
dt
dt

d 2y
dy
+h
+ ky = 0
dt
dt 2

(20)

где у — отклонение колеблющейся точки от положения равновесия
при отсутствии внешней силы, m — масса этой точки, h — коэффи7
циент трения (считается, что сила трения пропорциональна скорости),
k — коэффициент упругости восстанавливающей силы (эта сила при7
нимается пропорциональной отклонению) и f (t) — внешняя сила*.
* При этом нам придется частично повторить результаты из гл. VI ВМ, однако здесь
изложение будет более полным и будет проводиться с более общих позиций.

т.е., по существу, здесь имеется только одна произвольная постоянная
(не выполнено условие существенности параметров, ср. § IV.8).
Как же найти два «независимых» решения уравнения (21)? Эйлер,
основываясь на свойстве пропорциональности экспоненты своим про7
изводным, предложил искать частные решения в виде
y = e pt ,

(23)

где p — некоторая постоянная, которую нужно определить. Так как
dy
d2y
при таком выборе
= pe pt ,
= p2 e pt , то после подстановки в
2
dt
dt
(21) и сокращения на e pt получаем для определения p квадратное
уравнение (так называемое характеристическое уравнение)
mp2 + hp + k = 0.

(24)

Как известно из алгебры, при решении квадратного уравнения могут
представиться различные случаи в зависимости от знака дискриминанта
D = h2 − 4mk.

216

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

2.
3.
4.
5.
6.
7.

dy
dx
dy
dx
dy
dx
dy
dx
dy
dx
dy
dx

y =1

при

= e− y ,

y =1

при x = 0.

x
= ,
y

y =1

при

x = 0.

1
e

при

x = 1.

при

x = 0.

при

x = 0.

x = 1.

= − y + ex ,

y=

= −2 y + 4 x,

y = −2

+ y = cos x,

y=

ЛИНЕЙНЫЕ ОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

m

§ 3. Линейные однородные уравнения второго порядка
с постоянными коэффициентами
Дифференциальное уравнение второго порядка содержит вторую
производную от искомой функции; его общий вид таков:

dy d 2 y ⎞
F ⎜ x, y, , 2 ⎟ = 0.
dx dx ⎠


Если это уравнение зависит от искомой функции и ее производных линей7
но (зависимость от х может быть любой), то оно называется линейным.
Таким образом, линейное уравнение второго порядка имеет общий вид
a( x )

§ 3]

217

Рассмотрим сначала уравнение свободных колебаний; оно имеет вид

y
= ,
x

3
2

[Гл. VII

d 2y
dy
+ b( x )
+ c ( x ) y = f ( x ).
dx
dx 2

(21)

и называется линейным однородным уравнением. Его свойства во мно7
гом аналогичны свойствам линейного однородного уравнения первого
порядка, разобранным в § 2. Так, легко проверить, что если y 1 (t) — ка7
кое7либо частное решение уравнения (21), то и Cy 1 (t), где С — любая
постоянная, также служит решением того же уравнения. В частности,
при C = 0 получаем тождественно нулевое решение уравнения (21).
Кроме того, легко проверить, что если y 1 (t) и y 2 (t) — два частных ре7
шения уравнения (21), то их сумма y = y 1 (t) + y 2 (t) также служит ре7
шением того же уравнения (проверьте, подставив эту сумму в (21)!).
Из сказанного следует, что если найдены два частных решения
y 1 (t) и y 2 (t) уравнения (21), то их линейная комбинация
y = С1 y1 ( t ) + С 2 y2 ( t ),

(22)

где С1 и С2 — произвольные постоянные, также служит решением
того же уравнения. Но общее решение дифференциального уравнения
второго порядка получается в результате двух интегрирований и пото7
му содержит в себе две произвольные постоянные. Значит, выражение
(22) служит общим решением уравнения (21). Конечно, при
этом y 1 (t) и y 2 (t) не должны быть пропорциональными, так как если
y 2 (t) = ky 1 (t), то
С1 y1 ( t ) + С 2 y2 ( t ) = (С1 + С 2 k ) y1 ( t ) = Сy1 ( t ),

Мы рассмотрим наиболее важный частный случай, когда коэффи7
циенты а, b, с при искомой функции и ее производных являются по7
стоянными. Такое уравнение встречается в задачах о механических
и электрических колебаниях (см., например, ВМ, гл. VI и VIII), причем
в этих задачах независимой переменной служит время t. Мы остано7
вимся на рассмотрении механических колебаний простейшего осцил7
лятора; тогда уравнение имеет вид
d 2y
dy
m 2 +h
+ ky = f ( t ),
dt
dt

d 2y
dy
+h
+ ky = 0
dt
dt 2

(20)

где у — отклонение колеблющейся точки от положения равновесия
при отсутствии внешней силы, m — масса этой точки, h — коэффи7
циент трения (считается, что сила трения пропорциональна скорости),
k — коэффициент упругости восстанавливающей силы (эта сила при7
нимается пропорциональной отклонению) и f (t) — внешняя сила*.
* При этом нам придется частично повторить результаты из гл. VI ВМ, однако здесь
изложение будет более полным и будет проводиться с более общих позиций.

т.е., по существу, здесь имеется только одна произвольная постоянная
(не выполнено условие существенности параметров, ср. § IV.8).
Как же найти два «независимых» решения уравнения (21)? Эйлер,
основываясь на свойстве пропорциональности экспоненты своим про7
изводным, предложил искать частные решения в виде
y = e pt ,

(23)

где p — некоторая постоянная, которую нужно определить. Так как
dy
d2y
при таком выборе
= pe pt ,
= p2 e pt , то после подстановки в
2
dt
dt
(21) и сокращения на e pt получаем для определения p квадратное
уравнение (так называемое характеристическое уравнение)
mp2 + hp + k = 0.

(24)

Как известно из алгебры, при решении квадратного уравнения могут
представиться различные случаи в зависимости от знака дискриминанта
D = h2 − 4mk.

218

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Если трение велико, точнее, если h2 > 4mk, то уравнение (24) имеет
вещественные корни
p1 ,

2

=

2

(25)

где С1 и С2 — некоторые постоянные. Таким образом, при большом
трении отклонение точки от положения равновесия с возрастанием t
стремится к нулю по экспоненциальному закону, без колебаний.
Если трение мало´, точнее, если h2 < 4mk, то уравнение (24) имеет
мнимые сопряженные корни

где обозначено γ =

=−

h
±i
2m

h
, ω=
2m

k
h2

= − γ ± iω,
m 4 m2

k
h2
. Имея в виду (23), получаем об7

m 4m 2

щее решение (22)
y = С1 e − γt + iωt + С 2 e − γt − iωt = e − γt (С1 e iωt + С 2 e − iωt ).

(26)

Множители e iωt и e − iωt , как выяснено в § V.4, являются периодичес7

кими функциями. Их период равен T = . Поэтому ω есть круговая
ω
частота колебаний. Множитель e − γt характеризует скорость затухания
колебаний. Выражение (26) будет решением уравнения (21) при любых
постоянных С1 и С2 . Для того чтобы получить вещественное решение,
1
1
возьмем любое C1 = re iϕ и положим C2 = re − iϕ = C1* . Тогда
2
2
1
⎛1
⎞ 1
y = e − γt ⎜ re iϕ e iωt + re − iϕ e − iωt ⎟ = re − γt e i ( ωt + ϕ) + e − i ( ωt + ϕ) .
⎝2
⎠ 2
2

[

]

Воспользуемся формулой Эйлера. Получим
1
y = re − γt [ cos(ωt + ϕ) + i sin (ωt + ϕ) + cos(ωt + ϕ) −
2
−i sin (ωt + ϕ) = re − γt cos(ωt + ϕ).
− γt

219

раскрыв косинус суммы:
y = re −γt (cosωt cosϕ − sin ωt sin ϕ) =
= ( r cosϕ) e − γt cosωt + ( − r sin ϕ) e − γt sin ωt =

y = С1 e − at + С 2 e − bt ,

2

ЛИНЕЙНЫЕ ОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

− h ± h − 4 mk
.
2m

Обозначим их p1 = − a, p2 = − b, так как они оба отрицательные. Тогда
на основе (22) и (23) получаем общее решение уравнения (21) в виде

p1 ,

§ 3]

Решение y = re cos(ωt + ϕ) — вещественное, оно содержит две про7
извольные постоянные r и ϕ. Иногда его записывают в ином виде,

= C1 e − γt cosωt + C 2 e − γt sin ωt,

где через С1 и С2 обозначены соответствующие множители в скоб7
ках (они не равны С1 и С2 в формуле (26)!). Здесь хоронго видны ве7
щественные независимые решения уравнения (21) (см. формулу (22)).
Обычно этот переход к вещественному решению проводят быстрее,
исходя из следующих соображений. Если в левую часть уравнения (21)
подставить комплексную функцию от вещественного аргумен7
та t и произвести все действия, то в силу указанных в § V.5 свойств та7
ких функций те же действия произведутся над вещественной, а также
над мнимой частями этой функции. Поэтому если после выполнения
этих действий над комплексной функцией получится нуль, то и после
выполнения действий над вещественной частью этой функции полу7
чится нуль, то же и над мнимой. Таким образом, если имеется комплек7
сное решение (23) уравнения (21), то вещественная и мнимая части
решения также являются решениями уравнения (21).
Отметим, что последнее утверждение справедливо для любого ли7
нейного однородного уравнения (т.е. уравнения, в которое у и его про7
изводные входят линейно, причем в уравнении нет члена, не
содержащего ни у, ни какой7нибудь его производной) с вещественными
коэффициентами. Если же у или его производные входят в уравнение
нелинейно, то это утверждение неверно. Поэтому, например, если квад7
ратное уравнение имеет два мнимых корня, то вещественная и мнимая
части корней не являются в отдельности корнями этого уравнения.
Итак, когда трение мало, то система испытывает колебания, затуха7
ющие по экспоненциальному закону. Особое значение имеет случай,
когда трение отсутствует, т.е. h = 0. В этом случае характеристическое
уравнение (24) приобретает вид
mp 2 + k = 0,

откуда
p1 , 2 = ± i

k
.
m

Решение дифференциального уравнения имеет вид
y = С1 e iωt + С 2 e − iωt = r cos(ωt + ϕ ), где ω =

k
,
m

(27)

218

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Если трение велико, точнее, если h2 > 4mk, то уравнение (24) имеет
вещественные корни
p1 ,

2

=

2

(25)

где С1 и С2 — некоторые постоянные. Таким образом, при большом
трении отклонение точки от положения равновесия с возрастанием t
стремится к нулю по экспоненциальному закону, без колебаний.
Если трение мало´, точнее, если h2 < 4mk, то уравнение (24) имеет
мнимые сопряженные корни

где обозначено γ =

=−

h
±i
2m

h
, ω=
2m

k
h2

= − γ ± iω,
m 4 m2

k
h2
. Имея в виду (23), получаем об7

m 4m 2

щее решение (22)
y = С1 e − γt + iωt + С 2 e − γt − iωt = e − γt (С1 e iωt + С 2 e − iωt ).

(26)

Множители e iωt и e − iωt , как выяснено в § V.4, являются периодичес7

кими функциями. Их период равен T = . Поэтому ω есть круговая
ω
частота колебаний. Множитель e − γt характеризует скорость затухания
колебаний. Выражение (26) будет решением уравнения (21) при любых
постоянных С1 и С2 . Для того чтобы получить вещественное решение,
1
1
возьмем любое C1 = re iϕ и положим C2 = re − iϕ = C1* . Тогда
2
2
1
⎛1
⎞ 1
y = e − γt ⎜ re iϕ e iωt + re − iϕ e − iωt ⎟ = re − γt e i ( ωt + ϕ) + e − i ( ωt + ϕ) .
⎝2
⎠ 2
2

[

]

Воспользуемся формулой Эйлера. Получим
1
y = re − γt [ cos(ωt + ϕ) + i sin (ωt + ϕ) + cos(ωt + ϕ) −
2
−i sin (ωt + ϕ) = re − γt cos(ωt + ϕ).
− γt

219

раскрыв косинус суммы:
y = re −γt (cosωt cosϕ − sin ωt sin ϕ) =
= ( r cosϕ) e − γt cosωt + ( − r sin ϕ) e − γt sin ωt =

y = С1 e − at + С 2 e − bt ,

2

ЛИНЕЙНЫЕ ОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

− h ± h − 4 mk
.
2m

Обозначим их p1 = − a, p2 = − b, так как они оба отрицательные. Тогда
на основе (22) и (23) получаем общее решение уравнения (21) в виде

p1 ,

§ 3]

Решение y = re cos(ωt + ϕ) — вещественное, оно содержит две про7
извольные постоянные r и ϕ. Иногда его записывают в ином виде,

= C1 e − γt cosωt + C 2 e − γt sin ωt,

где через С1 и С2 обозначены соответствующие множители в скоб7
ках (они не равны С1 и С2 в формуле (26)!). Здесь хоронго видны ве7
щественные независимые решения уравнения (21) (см. формулу (22)).
Обычно этот переход к вещественному решению проводят быстрее,
исходя из следующих соображений. Если в левую часть уравнения (21)
подставить комплексную функцию от вещественного аргумен7
та t и произвести все действия, то в силу указанных в § V.5 свойств та7
ких функций те же действия произведутся над вещественной, а также
над мнимой частями этой функции. Поэтому если после выполнения
этих действий над комплексной функцией получится нуль, то и после
выполнения действий над вещественной частью этой функции полу7
чится нуль, то же и над мнимой. Таким образом, если имеется комплек7
сное решение (23) уравнения (21), то вещественная и мнимая части
решения также являются решениями уравнения (21).
Отметим, что последнее утверждение справедливо для любого ли7
нейного однородного уравнения (т.е. уравнения, в которое у и его про7
изводные входят линейно, причем в уравнении нет члена, не
содержащего ни у, ни какой7нибудь его производной) с вещественными
коэффициентами. Если же у или его производные входят в уравнение
нелинейно, то это утверждение неверно. Поэтому, например, если квад7
ратное уравнение имеет два мнимых корня, то вещественная и мнимая
части корней не являются в отдельности корнями этого уравнения.
Итак, когда трение мало, то система испытывает колебания, затуха7
ющие по экспоненциальному закону. Особое значение имеет случай,
когда трение отсутствует, т.е. h = 0. В этом случае характеристическое
уравнение (24) приобретает вид
mp 2 + k = 0,

откуда
p1 , 2 = ± i

k
.
m

Решение дифференциального уравнения имеет вид
y = С1 e iωt + С 2 e − iωt = r cos(ωt + ϕ ), где ω =

k
,
m

(27)

220

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

т.е. в рассматриваемой системе происходят незатухающие гармоничес)
кие колебания с произвольными амплитудой и начальной фазой
k
.
и вполне определенной частотой ω =
m
Интересно проследить за поведением полной энергии системы.
Нетрудно показать (см., например, ВМ, § VI.10), что эта энергия имеет
выражение
E=

2

mv 2 ky 2 1 ⎡ ⎛ dy ⎞
+
= ⎢m ⎜ ⎟ + ky 2 ⎥,
2
2
2 ⎣⎢ ⎝ dt ⎠
⎥⎦

(28)

причем в правой части первое слагаемое равно кинетической, а вто)
рое — потенциальной энергии осциллятора. Подставив сюда формулу
(27) для решения, получим
1
1
1
E = mω 2 r 2 sin 2 (ωt + ϕ ) + kr 2 cos2 (ωt + ϕ ) ≡ kr 2 .
2
2
2

2

dy
dy d 2 y
dy ⎤ dy ⎛
dE 1 ⎡
dy

⎛ dy ⎞
= ⎢2 m
+ 2ky
=
− ky⎟ + ky
= −⎜ ⎟ ;
⎜ −h

2


⎝ dt ⎠
dt
dt dt
dt ⎦ dt
dt
dt 2 ⎣

производная отрицательна, следовательно, Е убывает.
В реальных задачах нас интересует не общее решение, а вполне
определенное частное решение. Так как в общем решении дифферен)
циального уравнения второго порядка имеются две произвольные по)
стоянные (т.е. две степени свободы), то для выбора частного решения
требуется задать два дополнительных соотношения, с помощью кото)
рых и находим значения этих произвольных постоянных. Обычно в ка)
честве таких дополнительных условий задаются так называемые
начальные условия, а именно, при некотором значении независимой пе)
ременной задаются значения искомой функции и ее производной.
Для уравнения (21) начальные условия состоят в задании значений
t =t 0

= y0 ,

dy
dt

t =t 0

= v0 ,

ЛИНЕЙНЫЕ ОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

(29)

т.е. начального отклонения и начальной скорости колеблющейся точ)
ки. Из физических соображений ясно, что эти условия полностью

221

определяют процесс колебаний. Это легко доказать и математически.
Рассмотрим, например, случай большого трения, когда общее решение
имеет вид (25). Дифференцируя это решение и подставляя t = t 0 на
основании (29) получим
C1 e − at 0 + C 2 e − bt 0 = y0 ,
−C1 ae − at 0 − C 2be − bt 0 = v 0 ,

откуда находим для C1 и C2 вполне определенные значения
C1 =

by0 + v 0 at 0
e ,
b−a

C2 =

ay0 + v 0 bt 0
e .
a −b

Подставив эти значения в (25), получим искомое частное решение,
удовлетворяющее условиям (29):
y=

Таким образом, в случае h = 0 полная энергия остается постоянной
и в процессе колебаний происходит только «перекачка» кинетической
энергии в потенциальную и обратно.
Если трение имеется, то полная энергия системы убывает, рассеива)
ется (переходит в тепло, которое в дифференциальном уравнении не
учитывается). Действительно, дифференцируя формулу (28) и ис)
пользуя дифференциальное уравнение (21), найдем

y

§ 3]

by0 + v 0 at 0 − at ay0 + v 0 bt 0 − bt
e e =
e e +
a −b
b−a
= y0

be − a ( t − t 0 ) − ae − b ( t − t 0 )
e−a (t −t 0 ) − e−b (t −t 0 )
.
+ v0
b−a
b−a

(30)

Формула (30) дает возможность рассмотреть еще не разобранный проме)
жуточный случай, когда h2 = 4mk и потому характеристическое урав)
нение (24) имеет совпадающие корни p1, 2 = − a. Тогда решение (25) не
является общим, так как C1 e − at + C2 e − at = (C1 + C2 )e − at = Ce − at , т.е.
здесь, по существу, имеется лишь одна степень свободы, а не две, как
требуется. Если в формуле (30) совершить переход к пределу при
b → a, то, воспользовавшись правилом Лопиталя (см., например, ВМ,
§ II.21), получим в пределе решение

[

]

y = y0 e − a ( t − t 0 ) + a ( t − t 0 ) e − a ( t − t 0 ) + v 0 ( t − t 0 ) e − a ( t − t 0 ) =
= y0 e − a ( t − t 0 ) + ( ay0 + v 0 )( t − t 0 )e − a ( t − t 0 ) .

(31)

Мы видим, что здесь в решении появляется член вида te − at . При воз)
растании t этот член стремится к нулю, так как показательная функ)
ция стремится к нулю быстрее, чем любая степень t стремится
к бесконечности (см. там же). Таким образом, и в данном случае проис)
ходит затухание без колебаний.
Если заметить, что начальные условия произвольны, и перегруппи)
ровать слагаемые в правой части (31), то можно записать общее реше)
ние уравнения (21) в данном промежуточном случае в виде
y = C1 e − at + C 2 te − at .

220

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

т.е. в рассматриваемой системе происходят незатухающие гармоничес)
кие колебания с произвольными амплитудой и начальной фазой
k
.
и вполне определенной частотой ω =
m
Интересно проследить за поведением полной энергии системы.
Нетрудно показать (см., например, ВМ, § VI.10), что эта энергия имеет
выражение
E=

2

mv 2 ky 2 1 ⎡ ⎛ dy ⎞
+
= ⎢m ⎜ ⎟ + ky 2 ⎥,
2
2
2 ⎣⎢ ⎝ dt ⎠
⎥⎦

(28)

причем в правой части первое слагаемое равно кинетической, а вто)
рое — потенциальной энергии осциллятора. Подставив сюда формулу
(27) для решения, получим
1
1
1
E = mω 2 r 2 sin 2 (ωt + ϕ ) + kr 2 cos2 (ωt + ϕ ) ≡ kr 2 .
2
2
2

2

dy
dy d 2 y
dy ⎤ dy ⎛
dE 1 ⎡
dy

⎛ dy ⎞
= ⎢2 m
+ 2ky
=
− ky⎟ + ky
= −⎜ ⎟ ;
⎜ −h

2


⎝ dt ⎠
dt
dt dt
dt ⎦ dt
dt
dt 2 ⎣

производная отрицательна, следовательно, Е убывает.
В реальных задачах нас интересует не общее решение, а вполне
определенное частное решение. Так как в общем решении дифферен)
циального уравнения второго порядка имеются две произвольные по)
стоянные (т.е. две степени свободы), то для выбора частного решения
требуется задать два дополнительных соотношения, с помощью кото)
рых и находим значения этих произвольных постоянных. Обычно в ка)
честве таких дополнительных условий задаются так называемые
начальные условия, а именно, при некотором значении независимой пе)
ременной задаются значения искомой функции и ее производной.
Для уравнения (21) начальные условия состоят в задании значений
t =t 0

= y0 ,

dy
dt

t =t 0

= v0 ,

ЛИНЕЙНЫЕ ОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

(29)

т.е. начального отклонения и начальной скорости колеблющейся точ)
ки. Из физических соображений ясно, что эти условия полностью

221

определяют процесс колебаний. Это легко доказать и математически.
Рассмотрим, например, случай большого трения, когда общее решение
имеет вид (25). Дифференцируя это решение и подставляя t = t 0 на
основании (29) получим
C1 e − at 0 + C 2 e − bt 0 = y0 ,
−C1 ae − at 0 − C 2be − bt 0 = v 0 ,

откуда находим для C1 и C2 вполне определенные значения
C1 =

by0 + v 0 at 0
e ,
b−a

C2 =

ay0 + v 0 bt 0
e .
a −b

Подставив эти значения в (25), получим искомое частное решение,
удовлетворяющее условиям (29):
y=

Таким образом, в случае h = 0 полная энергия остается постоянной
и в процессе колебаний происходит только «перекачка» кинетической
энергии в потенциальную и обратно.
Если трение имеется, то полная энергия системы убывает, рассеива)
ется (переходит в тепло, которое в дифференциальном уравнении не
учитывается). Действительно, дифференцируя формулу (28) и ис)
пользуя дифференциальное уравнение (21), найдем

y

§ 3]

by0 + v 0 at 0 − at ay0 + v 0 bt 0 − bt
e e =
e e +
a −b
b−a
= y0

be − a ( t − t 0 ) − ae − b ( t − t 0 )
e−a (t −t 0 ) − e−b (t −t 0 )
.
+ v0
b−a
b−a

(30)

Формула (30) дает возможность рассмотреть еще не разобранный проме)
жуточный случай, когда h2 = 4mk и потому характеристическое урав)
нение (24) имеет совпадающие корни p1, 2 = − a. Тогда решение (25) не
является общим, так как C1 e − at + C2 e − at = (C1 + C2 )e − at = Ce − at , т.е.
здесь, по существу, имеется лишь одна степень свободы, а не две, как
требуется. Если в формуле (30) совершить переход к пределу при
b → a, то, воспользовавшись правилом Лопиталя (см., например, ВМ,
§ II.21), получим в пределе решение

[

]

y = y0 e − a ( t − t 0 ) + a ( t − t 0 ) e − a ( t − t 0 ) + v 0 ( t − t 0 ) e − a ( t − t 0 ) =
= y0 e − a ( t − t 0 ) + ( ay0 + v 0 )( t − t 0 )e − a ( t − t 0 ) .

(31)

Мы видим, что здесь в решении появляется член вида te − at . При воз)
растании t этот член стремится к нулю, так как показательная функ)
ция стремится к нулю быстрее, чем любая степень t стремится
к бесконечности (см. там же). Таким образом, и в данном случае проис)
ходит затухание без колебаний.
Если заметить, что начальные условия произвольны, и перегруппи)
ровать слагаемые в правой части (31), то можно записать общее реше)
ние уравнения (21) в данном промежуточном случае в виде
y = C1 e − at + C 2 te − at .

222

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво7
ряющие указанным начальным данным:
π
при t = .
1. y′′ + y = 0,
y′ = −2
y = 0,
2
1
при t = 0.
2. 4 y′′ − 8 y′ + 5 y = 0,
y′ =
y = 0,
2
при t = 0.
3. y′′ − 3 y′ + 2 y = 0,
y′ = 3
y = 2,
при t = 0.
4. y′′ − y = 0,
y′ = −2
y = 4,
5. y′′ − 2 y′ + y = 0,
при t = 1.
y = 0,
y′ = e
6. y′′ + 4 y′ + 4 y = 0,
при t = 0.
y = 1,
y′ = 3

§ 4]

ПРОСТЕЙШЕЕ ЛИНЕЙНОЕ НЕОДНОРОДНОЕ УРАВНЕНИЕ

при любом зафиксированном τ и начальных условиях (33). Будем
считать для определенности, что t > t 0 . Тогда в промежутке
от t 0 до τ правая часть уравнения (34) равна нулю, а потому при
нулевых условиях (33) и решение равно нулю. Проинтегрировав урав7
нение (34) от τ − 0 до τ + 0*, получим
⎛ dy
m⎜
⎝ dt

dy
dt

d 2y
= f ( t );
dt 2

(32)

t =t 0

= 0,

v=

dy
dt

t =t 0

= 0*.

(33)

Как и в § 2 (см. начало раздела III), убеждаемся, что решение y(t)
полностью определяется заданием функции f (t), причем имеет место
принцип суперпозиции. Значит, на основании общей методики § VI.2
можно построить функцию Грина, решив уравнение
m

d 2y
= δ( t − τ )
dt 2

(34)

* Здесь можно принять t 0 = −∞, что во многих задачах наиболее физически естес7
твенно (ср. § 2). Мы, однако, оставляем произвольное t 0 для перехода к дальнейшему,
так как при t 0 = −∞ неудобно задавать ненулевые начальные условия.

τ − 0⎠

dy
dt

τ−0

τ+0

=

= 0, откуда

1
.
m

(35)

τ+0

=y

τ −0

(36)

= 0.
2

2

d y
= 0, т.е.
= 0,
dt 2
dt 2
и нам нужно найти решение этого уравнения при начальных условиях
(35) и (36). Нетрудно непосредственно проверить, что всем этим требо7
1
ваниям удовлетворяет функция y = (t − τ). Итак, мы получаем
m
функцию Грина для рассматриваемой задачи
Однако при t > τ уравнение (34) имеет вид m

d y

( t 0 < t < τ ),
⎧0

G ( t; τ ) = ⎨ 1
⎪⎩ m ( t − τ ) ( τ < t < ∞ ).

это означает, что тело движется под действием силы, зависимость кото7
рой от времени задана. Найдем решение, удовлетворяющее нулевым
начальным условиям:
y


⎟ = 1.

dy
dt

dy
имеет конечный разрыв
dt
(конечный скачок); поэтому сама функция y(t) при t = τ разрыва не
имеет, т.е.
y

где Y (x) — некоторое его частное решение, a C1 y 1 (x) + C2 y 2 (x) — об7
щее решение соответствующего однородного уравнения (21).
Частное решение уравнения (20) можно подобно § 2 построить с по7
мощью функции Грина. Рассмотрим сначала самый простой случай,
когда h = k = 0, т.е. когда уравнение (20) имеет вид



Мы видим, что при t = τ производная

y = Y ( x ) + C1 y1 ( x ) + C 2 y2 ( x ),

m

τ+0

Но в силу только что доказанного

§ 4. Простейшее линейное неоднородное уравнение
второго порядка
Перейдем к рассмотрению уравнения вынужденных колебаний (20).
Прежде всего надо заметить, что рассуждения § 2 о связи решений не7
однородного уравнения с решениями соответствующего однородного
уравнения остаются здесь в силе; поэтому общее решение уравнения
(20) имеет вид

223

(37)

(То, что эта непрерывная функция с «изломом» при t = τ удовлетворя7
ет уравнению (34), вытекает также из рассмотрений § VI.3; см. рис. 76,
где изображена функция, вторая производная которой равна δ(x).) В си7
лу общей формулы (VI.8), примененной к данному случаю, получаем
искомое решение уравнения (32) при начальных условиях (33):


y( t ) = ∫ G ( t; τ ) f ( τ ) dτ =
t0

t



t0

t

= ∫ G ( t; τ ) f ( τ ) dτ + ∫ G ( t; τ ) f ( τ ) dτ =
* См. это обозначение в сноске на стр. 199.

t

1
( t − τ ) f ( τ ) dτ.
m t∫
0

(38)

222

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво7
ряющие указанным начальным данным:
π
при t = .
1. y′′ + y = 0,
y′ = −2
y = 0,
2
1
при t = 0.
2. 4 y′′ − 8 y′ + 5 y = 0,
y′ =
y = 0,
2
при t = 0.
3. y′′ − 3 y′ + 2 y = 0,
y′ = 3
y = 2,
при t = 0.
4. y′′ − y = 0,
y′ = −2
y = 4,
5. y′′ − 2 y′ + y = 0,
при t = 1.
y = 0,
y′ = e
6. y′′ + 4 y′ + 4 y = 0,
при t = 0.
y = 1,
y′ = 3

§ 4]

ПРОСТЕЙШЕЕ ЛИНЕЙНОЕ НЕОДНОРОДНОЕ УРАВНЕНИЕ

при любом зафиксированном τ и начальных условиях (33). Будем
считать для определенности, что t > t 0 . Тогда в промежутке
от t 0 до τ правая часть уравнения (34) равна нулю, а потому при
нулевых условиях (33) и решение равно нулю. Проинтегрировав урав7
нение (34) от τ − 0 до τ + 0*, получим
⎛ dy
m⎜
⎝ dt

dy
dt

d 2y
= f ( t );
dt 2

(32)

t =t 0

= 0,

v=

dy
dt

t =t 0

= 0*.

(33)

Как и в § 2 (см. начало раздела III), убеждаемся, что решение y(t)
полностью определяется заданием функции f (t), причем имеет место
принцип суперпозиции. Значит, на основании общей методики § VI.2
можно построить функцию Грина, решив уравнение
m

d 2y
= δ( t − τ )
dt 2

(34)

* Здесь можно принять t 0 = −∞, что во многих задачах наиболее физически естес7
твенно (ср. § 2). Мы, однако, оставляем произвольное t 0 для перехода к дальнейшему,
так как при t 0 = −∞ неудобно задавать ненулевые начальные условия.

τ − 0⎠

dy
dt

τ−0

τ+0

=

= 0, откуда

1
.
m

(35)

τ+0

=y

τ −0

(36)

= 0.
2

2

d y
= 0, т.е.
= 0,
dt 2
dt 2
и нам нужно найти решение этого уравнения при начальных условиях
(35) и (36). Нетрудно непосредственно проверить, что всем этим требо7
1
ваниям удовлетворяет функция y = (t − τ). Итак, мы получаем
m
функцию Грина для рассматриваемой задачи
Однако при t > τ уравнение (34) имеет вид m

d y

( t 0 < t < τ ),
⎧0

G ( t; τ ) = ⎨ 1
⎪⎩ m ( t − τ ) ( τ < t < ∞ ).

это означает, что тело движется под действием силы, зависимость кото7
рой от времени задана. Найдем решение, удовлетворяющее нулевым
начальным условиям:
y


⎟ = 1.

dy
dt

dy
имеет конечный разрыв
dt
(конечный скачок); поэтому сама функция y(t) при t = τ разрыва не
имеет, т.е.
y

где Y (x) — некоторое его частное решение, a C1 y 1 (x) + C2 y 2 (x) — об7
щее решение соответствующего однородного уравнения (21).
Частное решение уравнения (20) можно подобно § 2 построить с по7
мощью функции Грина. Рассмотрим сначала самый простой случай,
когда h = k = 0, т.е. когда уравнение (20) имеет вид



Мы видим, что при t = τ производная

y = Y ( x ) + C1 y1 ( x ) + C 2 y2 ( x ),

m

τ+0

Но в силу только что доказанного

§ 4. Простейшее линейное неоднородное уравнение
второго порядка
Перейдем к рассмотрению уравнения вынужденных колебаний (20).
Прежде всего надо заметить, что рассуждения § 2 о связи решений не7
однородного уравнения с решениями соответствующего однородного
уравнения остаются здесь в силе; поэтому общее решение уравнения
(20) имеет вид

223

(37)

(То, что эта непрерывная функция с «изломом» при t = τ удовлетворя7
ет уравнению (34), вытекает также из рассмотрений § VI.3; см. рис. 76,
где изображена функция, вторая производная которой равна δ(x).) В си7
лу общей формулы (VI.8), примененной к данному случаю, получаем
искомое решение уравнения (32) при начальных условиях (33):


y( t ) = ∫ G ( t; τ ) f ( τ ) dτ =
t0

t



t0

t

= ∫ G ( t; τ ) f ( τ ) dτ + ∫ G ( t; τ ) f ( τ ) dτ =
* См. это обозначение в сноске на стр. 199.

t

1
( t − τ ) f ( τ ) dτ.
m t∫
0

(38)

224

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Вывод формулы для решения закончен, и желающие могут сразу
перейти к § 5, где разбирается общее уравнение вынужденных колеба7
ний. Однако мы здесь сделаем еще несколько замечаний по поводу раз7
бираемого здесь частного случая.
Функцию Грина (37), а с ней и формулу (38) можно получить и не7
посредственно из физических соображений. В самом деле, уравнение
(34), определяющее функцию Грина, означает, что на тело, которое в на7
чальный момент находилось в начале координат и было неподвижным,
в момент τ подействовала мгновенная сила с единичным импульсом
(см. конец § VI. 1). Но после действия кратковременной силы тело дви7
жется с постоянной скоростью, равной отношению импульса силы
1
к массе тела (см., например, ВМ, § VI.5), т.е. в данном случае . Поэто7
m
му y(t), т.е. пройденный путь выражается как раз по формулам (37).
Формулу (38) можно получить и без упоминания о функции Грина,
хотя, по существу, тем же методом. Для этого достаточно мысленно
представить силу f на промежутке от t 0 до t как последователь7
ность кратковременных сил, каждая из которых действует на некото7
ром промежутке от τ до τ + dτ и потому имеет импульс f(τ) dτ. Если
бы действовала только эта кратковременная сила, то тело набрало бы
f(τ) dτ
и к моменту t прошло бы путь
скорость
m
f ( τ ) dτ
(t − τ).
m

(39)

Однако в силу линейности уравнения (32) имеет место принцип су7
перпозиции, другими словами, принцип сложения движений, согласно
которому при наложении нескольких сил законы движения также
складываются. Поэтому результаты (39) надо сложить по всем τ от
от t 0 до t, т.е. мы приходим к формуле (38).
Выведем теперь формулу (38) совсем иным путем, с помощью двук7
ратного интегрирования формулы (32). Первое интегрирование дает
t

m [ y′( t ) − y′( t 0 )] = ∫ f ( t ) dt,
t0

или, с учетом второго условия (33),
t

m y′( t ) = ∫ f ( t ) dt.

§ 4]

ПРОСТЕЙШЕЕ ЛИНЕЙНОЕ НЕОДНОРОДНОЕ УРАВНЕНИЕ

225

разумениям; однако сейчас нам удобнее применить более аккуратное
обозначение
t

m y′( t ) = ∫ f ( τ ) dτ,

(40)

t0

в котором строго различается переменная интегрирования τ от вер7
хнего предела t: скорость тела в момент времени t зависит от значе7
ний силы во все предыдущие моменты τ, т.е. зависит от f (τ),
где τ принимает все значения от t 0 до t. (Такое различение совер7
шенно необходимо в формуле (38), где в подынтегральное выражение
входит разность t − τ.)
Вновь интегрируя формулу (40), получаем с учетом первого усло7
вия (33)
t
t ⎛t1

m y( t ) = ∫ m y′( t1 ) dt1 = ∫ ⎜ ∫ f ( τ ) dτ⎟ dt1 .



t0
t0 ⎝t0

Получился двукратный интеграл (ср. § IV.7), в котором перемен7
ная t1 внешнего интегрирования меняется от t 0 до t, а при каждом
t1 переменная τ внутреннего интегрирования меняется от τ = t 0 до
τ = t1 . Таким образом, интегрирование
производится по треугольнику (σ), пока7
занному на рис. 83. Однако, как известно,
двойной интеграл можно вычислять
и в противоположном порядке, сначала
по t1 , а затем по τ. Тогда интегрирование
по t1 будет производиться при фиксиро7
ваном τ от t1 = τ до t1 = t (см. рис. 83),
авнешнее интегрирование по τ —
Рис. 83.
от t 0 до t; в результате получаем
t

t

t0

τ

m y( t ) = ∫∫ f ( τ ) dτ dt1 = ∫ dτ ∫ f ( τ ) dt1 .
( σ)

Но из7под знака внутреннего интеграла можно вынести f (τ), не зави7
сящее от переменной интегрирования t1 , так что
t

t

t

t0

τ

t0

m y( t ) = ∫ dτ f ( τ ) ∫ dt1 = ∫ dτ ⋅ f ( τ ) ( t − τ ),

t0

В этой формуле переменная интегрирования обозначена той же буквой
t, что и верхний предел. Обычно такие обозначения не приводят к недо7

и мы приходим к формуле (38).
Проверим, что формула (38) действительно дает решение постав7
ленной задачи; это будет также полезным упражнением на дифферен7

224

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Вывод формулы для решения закончен, и желающие могут сразу
перейти к § 5, где разбирается общее уравнение вынужденных колеба7
ний. Однако мы здесь сделаем еще несколько замечаний по поводу раз7
бираемого здесь частного случая.
Функцию Грина (37), а с ней и формулу (38) можно получить и не7
посредственно из физических соображений. В самом деле, уравнение
(34), определяющее функцию Грина, означает, что на тело, которое в на7
чальный момент находилось в начале координат и было неподвижным,
в момент τ подействовала мгновенная сила с единичным импульсом
(см. конец § VI. 1). Но после действия кратковременной силы тело дви7
жется с постоянной скоростью, равной отношению импульса силы
1
к массе тела (см., например, ВМ, § VI.5), т.е. в данном случае . Поэто7
m
му y(t), т.е. пройденный путь выражается как раз по формулам (37).
Формулу (38) можно получить и без упоминания о функции Грина,
хотя, по существу, тем же методом. Для этого достаточно мысленно
представить силу f на промежутке от t 0 до t как последователь7
ность кратковременных сил, каждая из которых действует на некото7
ром промежутке от τ до τ + dτ и потому имеет импульс f(τ) dτ. Если
бы действовала только эта кратковременная сила, то тело набрало бы
f(τ) dτ
и к моменту t прошло бы путь
скорость
m
f ( τ ) dτ
(t − τ).
m

(39)

Однако в силу линейности уравнения (32) имеет место принцип су7
перпозиции, другими словами, принцип сложения движений, согласно
которому при наложении нескольких сил законы движения также
складываются. Поэтому результаты (39) надо сложить по всем τ от
от t 0 до t, т.е. мы приходим к формуле (38).
Выведем теперь формулу (38) совсем иным путем, с помощью двук7
ратного интегрирования формулы (32). Первое интегрирование дает
t

m [ y′( t ) − y′( t 0 )] = ∫ f ( t ) dt,
t0

или, с учетом второго условия (33),
t

m y′( t ) = ∫ f ( t ) dt.

§ 4]

ПРОСТЕЙШЕЕ ЛИНЕЙНОЕ НЕОДНОРОДНОЕ УРАВНЕНИЕ

225

разумениям; однако сейчас нам удобнее применить более аккуратное
обозначение
t

m y′( t ) = ∫ f ( τ ) dτ,

(40)

t0

в котором строго различается переменная интегрирования τ от вер7
хнего предела t: скорость тела в момент времени t зависит от значе7
ний силы во все предыдущие моменты τ, т.е. зависит от f (τ),
где τ принимает все значения от t 0 до t. (Такое различение совер7
шенно необходимо в формуле (38), где в подынтегральное выражение
входит разность t − τ.)
Вновь интегрируя формулу (40), получаем с учетом первого усло7
вия (33)
t
t ⎛t1

m y( t ) = ∫ m y′( t1 ) dt1 = ∫ ⎜ ∫ f ( τ ) dτ⎟ dt1 .



t0
t0 ⎝t0

Получился двукратный интеграл (ср. § IV.7), в котором перемен7
ная t1 внешнего интегрирования меняется от t 0 до t, а при каждом
t1 переменная τ внутреннего интегрирования меняется от τ = t 0 до
τ = t1 . Таким образом, интегрирование
производится по треугольнику (σ), пока7
занному на рис. 83. Однако, как известно,
двойной интеграл можно вычислять
и в противоположном порядке, сначала
по t1 , а затем по τ. Тогда интегрирование
по t1 будет производиться при фиксиро7
ваном τ от t1 = τ до t1 = t (см. рис. 83),
а внешнее интегрирование по τ —
Рис. 83.
от t 0 до t; в результате получаем
t

t

t0

τ

m y( t ) = ∫∫ f ( τ ) dτ dt1 = ∫ dτ ∫ f ( τ ) dt1 .
( σ)

Но из7под знака внутреннего интеграла можно вынести f (τ), не зави7
сящее от переменной интегрирования t1 , так что
t

t

t

t0

τ

t0

m y( t ) = ∫ dτ f ( τ ) ∫ dt1 = ∫ dτ ⋅ f ( τ ) ( t − τ ),

t0

В этой формуле переменная интегрирования обозначена той же буквой
t, что и верхний предел. Обычно такие обозначения не приводят к недо7

и мы приходим к формуле (38).
Проверим, что формула (38) действительно дает решение постав7
ленной задачи; это будет также полезным упражнением на дифферен7

226

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

ПРОСТЕЙШЕЕ ЛИНЕЙНОЕ НЕОДНОРОДНОЕ УРАВНЕНИЕ

y( t ) = y (1 ) ( t ) + y ( 2 ) ( t ),

t

(41)

(производная интеграла по верхнему пределу) хорошо известна из ин)
тегрального исчисления, вторая формула
d
dt

⎛b
⎞ b
⎜⎜ ∫ F ( s; t ) ds⎟⎟ = ∫ Ft′ ( s; t ) ds
⎝a
⎠ a

( a , b = const )

(42)

(производная интеграла по параметру) была указана в § III.6. Но как на)
йти производную от правой части (38), куда t входит и в качестве пред)
ела интегрирования и в качестве параметра под знак интеграла? Для
этого надо взять сумму двух слагаемых, одно из которых получается
в результате дифференцирования интеграла (38) при зафиксирован)
ном t под знаком интеграла, а другое — при зафиксированном t в вер)
хнем пределе (ср., например, ВМ, § II.4). Дифференцирование
производится по формулам (41) и (42):
dy 1
= ( t − τ ) f ( τ)
dt m

t

t

1 ∂
1
+ ∫ [( t − τ ) f ( τ)] dτ = ∫ f ( τ) dτ.

m
t
m
τ =t
t
t
0

(43)

0

При вторичном дифференцировании пользуемся формулой (41), т.е.
d 2y 1
= f ( t ).
dt 2 m

Отсюда вытекает, что уравнение (32) удовлетворяется. Справедливость
условий (33) получится, если в формулах (38) и (43) положить t = t 0 .
В качестве примера найдем закон движения тела, на которое действует
сила, пропорциональная времени, протекшему с начала движения.
В этом случае f (t) = a(t − t 0 ), поэтому f (τ) = a(τ − t 0 ). Получаем
t

t

0

0

a
1
y( t ) = ∫ ( t − τ ) a ( τ − t 0 ) dτ = ∫ [( t − t 0 ) − ( τ − t 0 )] ( τ − t 0 ) dτ =
mt
mt
a
( t − t 0 )2 a ( t − t 0 )3 a ( t − t 0 )3
.
= ( t − t0 )

=
2
3
6m
m
m

Мы решили задачу с нулевыми начальными данными. Это — самая
важная часть дела, так как если мы умеем решать задачу с нулевыми на)
чальными данными, то решение задачи с произвольными начальными
данными y = y 0 , v = v 0 при t = t 0 не представляет труда. Действи)
тельно, пусть
2

m

d y
= f ( t ), y = y0 , v = v 0 при t = t 0 .
dt 2

227

Тогда

цирование. Мы будем исходить из двух формул. Первая

d ⎛
⎜ ϕ ( s ) ds⎟ = ϕ ( t )
dt ⎝ ∫a


§ 4]

где y (1 ) (t) есть решение задачи с нулевыми начальными данными:
m

d 2 y (1 )
= f ( t ),
dt 2

dy (1 )
dt

y (1 ) ( t 0 ) = 0,

t =t 0

= v (1 ) ( t 0 ) = 0,

а y (2 ) (t) есть решение задачи без силы
m

d 2 y (2 )
= 0,
dt 2

dy ( 2 )
dt

y ( 2 ) ( t 0 ) = y0 ,

t =t 0

= v ( 2 ) ( t0 ) = v0 .

(Читатель легко проверит, что y = y (1 ) + y (2 ) является решением по)
ставленной задачи.) Функцию y (2 ) (t) найти просто, y (2 ) (t) =
= v 0 (t − t 0 ) + y 0 , поэтому
t

y( t ) =

1
( t − τ ) f ( τ ) dτ + v 0 ( t − t 0 ) + y0 .
m t∫
0

Исследуем решение (38), отвечающее нулевым начальным услови)
ям, приняв для простоты t 0 = −∞. Для этого запишем его так:
t

y( t ) =

t

t

1
1
1
∫ ( t − τ ) f ( τ ) dτ = m ∫ tf ( τ ) dτ − m ∫ τf ( τ ) dτ.
m −∞
−∞
−∞

Так как t не есть переменная интегрирования, то ее можно вынести за
знак интеграла, поэтому
t

y( t ) =

t

t
1
∫ f ( τ ) dτ − m ∫ τf ( τ ) dτ.
m −∞
−∞

Эту формулу на основании (43) можно переписать так:
t

y( t ) = tv( t ) −

1
∫ τf ( τ ) dτ.
m −∞

Вынесем v(t) за скобку, получим
y( t ) = v( t ) ⋅ ( t − θ ),

где положено
t

θ=

1
∫ τ f ( τ ) dτ
m −∞
v( t )

t

∫ τ f ( τ ) dτ

= −∞t

∫ f ( τ ) dτ

t

, а v( t ) =

1
∫ f ( τ ) dτ.
m −∞

−∞

Записанные таким образом формулы особенно удобны, если сила по
прошествии некоторого промежутка времени перестает действовать.

226

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

ПРОСТЕЙШЕЕ ЛИНЕЙНОЕ НЕОДНОРОДНОЕ УРАВНЕНИЕ

y( t ) = y (1 ) ( t ) + y ( 2 ) ( t ),

t

(41)

(производная интеграла по верхнему пределу) хорошо известна из ин)
тегрального исчисления, вторая формула
d
dt

⎛b
⎞ b
⎜⎜ ∫ F ( s; t ) ds⎟⎟ = ∫ Ft′ ( s; t ) ds
⎝a
⎠ a

( a , b = const )

(42)

(производная интеграла по параметру) была указана в § III.6. Но как на)
йти производную от правой части (38), куда t входит и в качестве пред)
ела интегрирования и в качестве параметра под знак интеграла? Для
этого надо взять сумму двух слагаемых, одно из которых получается
в результате дифференцирования интеграла (38) при зафиксирован)
ном t под знаком интеграла, а другое — при зафиксированном t в вер)
хнем пределе (ср., например, ВМ, § II.4). Дифференцирование
производится по формулам (41) и (42):
dy 1
= ( t − τ ) f ( τ)
dt m

t

t

1 ∂
1
+ ∫ [( t − τ ) f ( τ)] dτ = ∫ f ( τ) dτ.

m
t
m
τ =t
t
t
0

(43)

0

При вторичном дифференцировании пользуемся формулой (41), т.е.
d 2y 1
= f ( t ).
dt 2 m

Отсюда вытекает, что уравнение (32) удовлетворяется. Справедливость
условий (33) получится, если в формулах (38) и (43) положить t = t 0 .
В качестве примера найдем закон движения тела, на которое действует
сила, пропорциональная времени, протекшему с начала движения.
В этом случае f (t) = a(t − t 0 ), поэтому f (τ) = a(τ − t 0 ). Получаем
t

t

0

0

a
1
y( t ) = ∫ ( t − τ ) a ( τ − t 0 ) dτ = ∫ [( t − t 0 ) − ( τ − t 0 )] ( τ − t 0 ) dτ =
mt
mt
a
( t − t 0 )2 a ( t − t 0 )3 a ( t − t 0 )3
.
= ( t − t0 )

=
2
3
6m
m
m

Мы решили задачу с нулевыми начальными данными. Это — самая
важная часть дела, так как если мы умеем решать задачу с нулевыми на)
чальными данными, то решение задачи с произвольными начальными
данными y = y 0 , v = v 0 при t = t 0 не представляет труда. Действи)
тельно, пусть
2

m

d y
= f ( t ), y = y0 , v = v 0 при t = t 0 .
dt 2

227

Тогда

цирование. Мы будем исходить из двух формул. Первая

d ⎛
⎜ ϕ ( s ) ds⎟ = ϕ ( t )
dt ⎝ ∫a


§ 4]

где y (1 ) (t) есть решение задачи с нулевыми начальными данными:
m

d 2 y (1 )
= f ( t ),
dt 2

dy (1 )
dt

y (1 ) ( t 0 ) = 0,

t =t 0

= v (1 ) ( t 0 ) = 0,

а y (2 ) (t) есть решение задачи без силы
m

d 2 y (2 )
= 0,
dt 2

dy ( 2 )
dt

y ( 2 ) ( t 0 ) = y0 ,

t =t 0

= v ( 2 ) ( t0 ) = v0 .

(Читатель легко проверит, что y = y (1 ) + y (2 ) является решением по)
ставленной задачи.) Функцию y (2 ) (t) найти просто, y (2 ) (t) =
= v 0 (t − t 0 ) + y 0 , поэтому
t

y( t ) =

1
( t − τ ) f ( τ ) dτ + v 0 ( t − t 0 ) + y0 .
m t∫
0

Исследуем решение (38), отвечающее нулевым начальным услови)
ям, приняв для простоты t 0 = −∞. Для этого запишем его так:
t

y( t ) =

t

t

1
1
1
∫ ( t − τ ) f ( τ ) dτ = m ∫ tf ( τ ) dτ − m ∫ τf ( τ ) dτ.
m −∞
−∞
−∞

Так как t не есть переменная интегрирования, то ее можно вынести за
знак интеграла, поэтому
t

y( t ) =

t

t
1
∫ f ( τ ) dτ − m ∫ τf ( τ ) dτ.
m −∞
−∞

Эту формулу на основании (43) можно переписать так:
t

y( t ) = tv( t ) −

1
∫ τf ( τ ) dτ.
m −∞

Вынесем v(t) за скобку, получим
y( t ) = v( t ) ⋅ ( t − θ ),

где положено
t

θ=

1
∫ τ f ( τ ) dτ
m −∞
v( t )

t

∫ τ f ( τ ) dτ

= −∞t

∫ f ( τ ) dτ

t

, а v( t ) =

1
∫ f ( τ ) dτ.
m −∞

−∞

Записанные таким образом формулы особенно удобны, если сила по
прошествии некоторого промежутка времени перестает действовать.

228

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Для моментов времени t после окончания действия силы интегралы
t

∫ τf (τ) dτ

−∞

t

и

∫ f (τ) dτ

не зависят от t. Увеличение t в этих интегра7

−∞

лах приводит только к увеличению той части области интегрирования,
где подынтегральная функция равна нулю. После окончания действия
силы тело движется с постоянной скоростью v = v кон , при этом вели7
чина θ = θ кон постоянна. Поэтому график y(t) после окончания де7
йствия силы есть прямая линия
y = v кон ⋅ ( t − θ кон ).

Величина θ кон есть абсцисса точки пересе7
чения этой прямой с осью t (рис. 84). Физи7
ческий смысл величины θ кон таков: если
тело начнет движение в момент времени
t = θ кон со скоростью v = v кон , то оно будет
двигаться по тому же закону, по которому
фактически движется тело после окончания
действия силы.

Рис. 84.

Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво7
ряющие указанным начальным данным:
d 2x
1.
= 0,
x(2 ) = 1,
x′(2 ) = −3.
dt 2
2
d x
2.
= 1,
x(0 ) = −2,
x′(0 ) = 0.
dt 2
2
d x
3.
= sin t,
x(0 ) = 0,
x′(0 ) = 1.
dt 2
d 2x
4.
= et ,
x( −∞ ) = 0,
x′( −∞ ) = 0.
dt 2

§ 5. Линейные неоднородные уравнения второго порядка
с постоянными коэффициентами

d 2y
dy
+h
+ ky = δ( t − τ )
dt
dt 2

229

ЛИНЕЙНЫЕ НЕОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

при начальных условиях (33). Считая t > t 0 , получаем, что y(t) ≡ 0
при t 0 < t < τ, а интегрируя (44) от t = τ − 0 до t = τ + 0, приходим к тем
же условиям (35) и (36), так как интегралы от конечных второго и
третьего слагаемых в (44) равны нулю. Таким образом, при t > τ тре7
буется найти решение однородного уравнения (21) при начальных
условиях (35) и (36). Исходя из общего решения уравнения (21)
y = C1 e p 1 t + C 2 e p 2 t ,

где p1 и p2 — корни характеристического уравнения (24), и рассуж7
дая подобно концу § 3, получаем искомое решение
y=

e− p1 τ
e− p2 τ
1
e p1 t +
e p2 t =
e p1 (t − τ ) − e p2 (t − τ ) ;
m( p1 − p2 )
m( p2 − p1 )
m( p1 − p2 )

[

]

это решение пригодно как для малого, так и для большого трения.
Итак, получаем функцию Грина
⎧0

G ( t; τ ) = ⎨
1
p1 (t − τ )
− e p2 (t − τ )
⎪ m( p − p ) e

1
2

[

( t 0 < t < τ ),

]

( τ < t < ∞ ).

(Эта функция, как и в условиях § 4, непрерывна, но имеет при t = τ из7
лом.) Отсюда подобно (38) получаем решение уравнения (20) при ну7
левых начальных условиях (33)
y( t ) =

1
m( p1 − p2 )

t

∫ [e

p1 (t − τ )

]

− e p 2 ( t − τ ) f ( τ ) dτ.

t0

(45)

Как и в § 1 (раздел IV), при внешней нагрузке особенно простого
вида решение уравнения (20) можно найти без всякой функции Грина.
Так будет, если f (t) = const, т.е. если рассматривается уравнение
m

d 2y
dy
+h
+ ky = A ( = const ).
2
dt
dt

(46)

Нетрудно разыскать частное решение вида y = B = const. Подставляя
в (46), получим

Функцию Грина можно применить и к общему уравнению (20),
описывающему движение упруго закрепленного тела под действием
внешней силы, зависящей только от времени, при наличии трения,
пропорционального скорости.
Как и в § 4, будем искать решение при нулевых начальных условиях
(33). Для построения функции Грина нужно подобно § 4 (см. уравне7
ние (34)) решить уравнение
m

§ 5]

(44)

0 + 0 + kB = A,

т.е. B =

A
.
k

Учитывая замечание, сделанное в начале § 4, получаем общее решение
уравнения (46)
y=

A
+ C1 e p 1 t + C 2 e p 2 t ,
k

(47)

где C1 и C2 — произвольные постоянные, определяемые из началь7
ных условий. В § 3 мы видели, что решение однородного уравнения

228

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

Для моментов времени t после окончания действия силы интегралы
t

∫ τf (τ) dτ

−∞

t

и

∫ f (τ) dτ

не зависят от t. Увеличение t в этих интегра7

−∞

лах приводит только к увеличению той части области интегрирования,
где подынтегральная функция равна нулю. После окончания действия
силы тело движется с постоянной скоростью v = v кон , при этом вели7
чина θ = θ кон постоянна. Поэтому график y(t) после окончания де7
йствия силы есть прямая линия
y = v кон ⋅ ( t − θ кон ).

Величина θ кон есть абсцисса точки пересе7
чения этой прямой с осью t (рис. 84). Физи7
ческий смысл величины θ кон таков: если
тело начнет движение в момент времени
t = θ кон со скоростью v = v кон , то оно будет
двигаться по тому же закону, по которому
фактически движется тело после окончания
действия силы.

Рис. 84.

Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво7
ряющие указанным начальным данным:
d 2x
1.
= 0,
x(2 ) = 1,
x′(2 ) = −3.
dt 2
2
d x
2.
= 1,
x(0 ) = −2,
x′(0 ) = 0.
dt 2
2
d x
3.
= sin t,
x(0 ) = 0,
x′(0 ) = 1.
dt 2
d 2x
4.
= et ,
x( −∞ ) = 0,
x′( −∞ ) = 0.
dt 2

§ 5. Линейные неоднородные уравнения второго порядка
с постоянными коэффициентами

d 2y
dy
+h
+ ky = δ( t − τ )
dt
dt 2

229

ЛИНЕЙНЫЕ НЕОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

при начальных условиях (33). Считая t > t 0 , получаем, что y(t) ≡ 0
при t 0 < t < τ, а интегрируя (44) от t = τ − 0 до t = τ + 0, приходим к тем
же условиям (35) и (36), так как интегралы от конечных второго и
третьего слагаемых в (44) равны нулю. Таким образом, при t > τ тре7
буется найти решение однородного уравнения (21) при начальных
условиях (35) и (36). Исходя из общего решения уравнения (21)
y = C1 e p 1 t + C 2 e p 2 t ,

где p1 и p2 — корни характеристического уравнения (24), и рассуж7
дая подобно концу § 3, получаем искомое решение
y=

e− p1 τ
e− p2 τ
1
e p1 t +
e p2 t =
e p1 (t − τ ) − e p2 (t − τ ) ;
m( p1 − p2 )
m( p2 − p1 )
m( p1 − p2 )

[

]

это решение пригодно как для малого, так и для большого трения.
Итак, получаем функцию Грина
⎧0

G ( t; τ ) = ⎨
1
p1 (t − τ )
− e p2 (t − τ )
⎪ m( p − p ) e

1
2

[

( t 0 < t < τ ),

]

( τ < t < ∞ ).

(Эта функция, как и в условиях § 4, непрерывна, но имеет при t = τ из7
лом.) Отсюда подобно (38) получаем решение уравнения (20) при ну7
левых начальных условиях (33)
y( t ) =

1
m( p1 − p2 )

t

∫ [e

p1 (t − τ )

]

− e p 2 ( t − τ ) f ( τ ) dτ.

t0

(45)

Как и в § 1 (раздел IV), при внешней нагрузке особенно простого
вида решение уравнения (20) можно найти без всякой функции Грина.
Так будет, если f (t) = const, т.е. если рассматривается уравнение
m

d 2y
dy
+h
+ ky = A ( = const ).
2
dt
dt

(46)

Нетрудно разыскать частное решение вида y = B = const. Подставляя
в (46), получим

Функцию Грина можно применить и к общему уравнению (20),
описывающему движение упруго закрепленного тела под действием
внешней силы, зависящей только от времени, при наличии трения,
пропорционального скорости.
Как и в § 4, будем искать решение при нулевых начальных условиях
(33). Для построения функции Грина нужно подобно § 4 (см. уравне7
ние (34)) решить уравнение
m

§ 5]

(44)

0 + 0 + kB = A,

т.е. B =

A
.
k

Учитывая замечание, сделанное в начале § 4, получаем общее решение
уравнения (46)
y=

A
+ C1 e p 1 t + C 2 e p 2 t ,
k

(47)

где C1 и C2 — произвольные постоянные, определяемые из началь7
ных условий. В § 3 мы видели, что решение однородного уравнения

230

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

(21) при возрастании t стремится к нулю, так как p1 и p2 — либо
отрицательные вещественные, либо мнимые с отрицательной вещес7
твенной частью; таким образом, из (47) получаем при больших t
A
y= .
k

d 2y
dy
+h
+ ky = Ae qt .
dt
dt 2

(49)

В этом случае легко найти частное решение вида y = Be qt . Подстав7
A
ляя, получаем mBq 2 e qt + hBqe qt + kBe qt = Ae qt , т.е. B =
,
mq 2 + hq + k
откуда искомое частное решение имеет вид
Ae qt
.
y=
2
mq + hq + k

d 2y
dy
+h
+ ky = A sin ωt.
2
dt
dt

m

d 2y
dy
+h
+ ky = Ae iωt ,
dt
dt 2

[

[

]

A
( k − mω 2 ) sin ωt − hω cos ωt .
( k − mω 2 )2 + h 2ω 2

(52)

Чтобы получить общее решение уравнения (51), надо к найденному
частному решению (52) добавить общее решение соответствующего
однородного уравнения. Но так как каждое из решений однородного
уравнения при возрастании t стремится к нулю, то после переходного
процесса тело начинает колебаться по гармоническому закону (52), не
зависящему от начальных условий. Это стационарное решение можно
было найти и по методам § V.5.
Остановимся особо на случае, когда трение отсутствует, т.е. уравне7
ние (20) заменяется на
m

d 2y
+ ky = f ( t ).
dt 2

(53)

В этом случае характеристическое уравнение имеет корни p1, 2 = ±iω 0 ,
где
k
m

ω0 =

— частота свободных колебаний системы, т.е. колебаний без внешней
силы. Формула (45), преобразованная по формуле Эйлера, дает реше7
ние при нулевых начальных условиях (33)
y=

1
m ⋅ 2iω 0

t

∫ [e

iω 0 ( t − τ )

]

− e − iω 0 ( t − τ ) f ( τ ) dτ =

t0

=

1
mω 0

t

∫ sin ω 0 ( t − τ )

f ( τ ) dτ.

(54)

t0

(Проверьте с помощью дифференцирования, что правая часть действи7
тельно удовлетворяет уравнению (53) и начальным условиям (33).)
Пользуясь формулой
sin ω 0 ( t − τ ) = sin ω 0 t ⋅ cos ω 0 τ − sin ω 0 τ ⋅ cos ω 0 t,

а у полученного решения взять мнимую часть (см, аналогичные рас7
суждения в § V.5). На основании (50) получаем комплексное решение
y=

y=

(51)

Здесь можно воспользоваться тем, что в силу формулы Эйлера правая
часть является мнимой частью функции Ae iωt . Значит, достаточно ре7
шить уравнение

231

Отсюда легко выделить мнимую часть, т.е. частное решение уравне7
ния (51)

(50)

Это решение непригодно, если q является корнем характеристичес7
кого уравнения (24), так как тогда знаменатель обращается в нуль. По7
добно § 2 можно, исходя из общей формулы (45), показать, что в этом
особом случае уравнение (49) имеет частное решение вида Bte qt .
Рассмотрим, наконец, решение уравнения
m

ЛИНЕЙНЫЕ НЕОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

(48)

Этот результат ясен и физически. При постоянной внешней силе и при
наличии трения колебания затухают и по прошествии «переходного
процесса», определяемого начальными условиями, тело остановится
в положении, где сила упругости ky (взятая с обратным знаком) будет
равна внешней силе А; отсюда и получаем (48). Это стационарное по7
ложение уже не зависит от начальных условий. Простым является и ре7
шение уравнения
m

§ 5]

]

A ( k − mω 2 ) − ihω
Ae iωt
A
iωt
(cos ωt + i sin ωt ).
=
e
=
( k − mω 2 )2 + h 2ω 2
m(iω)2 + hiω + k k − mω 2 + ihω

перепишем решение в виде
y( t ) =

t

t

0

0

1
1
sin ω 0 t ⋅ ∫ f ( τ )cos ω 0 τ dτ −
cos ω 0 t ⋅ ∫ f ( τ )sin ω 0 τ dτ .
ω0
mω 0
m
t
t

Если после некоторого момента времени t1 действие силы f (t) пре7
кращается, то интегралы в этой формуле перестают зависеть от времени

230

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

(21) при возрастании t стремится к нулю, так как p1 и p2 — либо
отрицательные вещественные, либо мнимые с отрицательной вещес7
твенной частью; таким образом, из (47) получаем при больших t
A
y= .
k

d 2y
dy
+h
+ ky = Ae qt .
dt
dt 2

(49)

В этом случае легко найти частное решение вида y = Be qt . Подстав7
A
ляя, получаем mBq 2 e qt + hBqe qt + kBe qt = Ae qt , т.е. B =
,
mq 2 + hq + k
откуда искомое частное решение имеет вид
Ae qt
.
y=
2
mq + hq + k

d 2y
dy
+h
+ ky = A sin ωt.
2
dt
dt

m

d 2y
dy
+h
+ ky = Ae iωt ,
dt
dt 2

[

[

]

A
( k − mω 2 ) sin ωt − hω cos ωt .
( k − mω 2 )2 + h 2ω 2

(52)

Чтобы получить общее решение уравнения (51), надо к найденному
частному решению (52) добавить общее решение соответствующего
однородного уравнения. Но так как каждое из решений однородного
уравнения при возрастании t стремится к нулю, то после переходного
процесса тело начинает колебаться по гармоническому закону (52), не
зависящему от начальных условий. Это стационарное решение можно
было найти и по методам § V.5.
Остановимся особо на случае, когда трение отсутствует, т.е. уравне7
ние (20) заменяется на
m

d 2y
+ ky = f ( t ).
dt 2

(53)

В этом случае характеристическое уравнение имеет корни p1, 2 = ±iω 0 ,
где
k
m

ω0 =

— частота свободных колебаний системы, т.е. колебаний без внешней
силы. Формула (45), преобразованная по формуле Эйлера, дает реше7
ние при нулевых начальных условиях (33)
y=

1
m ⋅ 2iω 0

t

∫ [e

iω 0 ( t − τ )

]

− e − iω 0 ( t − τ ) f ( τ ) dτ =

t0

=

1
mω 0

t

∫ sin ω 0 ( t − τ )

f ( τ ) dτ.

(54)

t0

(Проверьте с помощью дифференцирования, что правая часть действи7
тельно удовлетворяет уравнению (53) и начальным условиям (33).)
Пользуясь формулой
sin ω 0 ( t − τ ) = sin ω 0 t ⋅ cos ω 0 τ − sin ω 0 τ ⋅ cos ω 0 t,

а у полученного решения взять мнимую часть (см, аналогичные рас7
суждения в § V.5). На основании (50) получаем комплексное решение
y=

y=

(51)

Здесь можно воспользоваться тем, что в силу формулы Эйлера правая
часть является мнимой частью функции Ae iωt . Значит, достаточно ре7
шить уравнение

231

Отсюда легко выделить мнимую часть, т.е. частное решение уравне7
ния (51)

(50)

Это решение непригодно, если q является корнем характеристичес7
кого уравнения (24), так как тогда знаменатель обращается в нуль. По7
добно § 2 можно, исходя из общей формулы (45), показать, что в этом
особом случае уравнение (49) имеет частное решение вида Bte qt .
Рассмотрим, наконец, решение уравнения
m

ЛИНЕЙНЫЕ НЕОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

(48)

Этот результат ясен и физически. При постоянной внешней силе и при
наличии трения колебания затухают и по прошествии «переходного
процесса», определяемого начальными условиями, тело остановится
в положении, где сила упругости ky (взятая с обратным знаком) будет
равна внешней силе А; отсюда и получаем (48). Это стационарное по7
ложение уже не зависит от начальных условий. Простым является и ре7
шение уравнения
m

§ 5]

]

A ( k − mω 2 ) − ihω
Ae iωt
A
iωt
(cos ωt + i sin ωt ).
=
e
=
( k − mω 2 )2 + h 2ω 2
m(iω)2 + hiω + k k − mω 2 + ihω

перепишем решение в виде
y( t ) =

t

t

0

0

1
1
sin ω 0 t ⋅ ∫ f ( τ )cos ω 0 τ dτ −
cos ω 0 t ⋅ ∫ f ( τ )sin ω 0 τ dτ .
ω0
mω 0
m
t
t

Если после некоторого момента времени t1 действие силы f (t) пре7
кращается, то интегралы в этой формуле перестают зависеть от времени

232

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

при t > t1 и решение принимает вид
y( t ) = a cos ω 0 t + b sin ω 0 t,

1
mω 0

t1



f ( τ )sin ω 0 τ dτ ,

b=

если t > t1 ,

t0

1
mω 0

t1

∫ f ( τ )cos ω 0 τ dτ .

t0

Таким образом, если первоначально тело покоилось, затем в течение
некоторого времени на него действовала внешняя сила f(t), то по
окончании действия силы тело будет совершать свободные колебания
с частотой ω0 и амплитудой a 2 + b2 .
Формулу (54) можно записать иначе, введя «комплексное отклоне7
ние от положения равновесия»
w(t ) =

1
mω 0

t

iω ( t − τ )
f ( τ ) dτ =
∫e 0

t0

1
mω 0

t

∫e

− iω 0 τ

ЛИНЕЙНЫЕ НЕОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

y=

1
mω 0
=

t

∫ sin ω 0 ( t − τ ) A sin ωτ dτ =
0

A
mω 0
=

f ( τ ) dτ ⋅ e iω 0 t ,

t

1

∫ 2 [cos(ωτ − ω 0 ( t − τ )) − cos(ωτ + ω 0 ( t − τ ))] dτ =
0

A ⎡ sin(ωτ − ω 0 ( t − τ )) sin(ωτ + ω 0 ( t − τ )) ⎤ t

=

2 mω 0 ⎢⎣
ω + ω0
ω − ω0
⎦ τ =0
=

t0

для которого вещественное отклонение y(t) служит мнимой частью.
Если t 0 — начальный момент действия силы, то формулу можно пере7
писать в виде
w(t ) =

t

1
mω 0

∫e

− iω 0 τ

так как при этом преобразовании к интегралу добавляется часть, рав7
ная нулю. Если сила действует только до некоторого момента t1 вре7
мени, то, начиная с этого момента, можно написать
w(t ) =

1
mω 0

∫e

− iω 0 τ

f ( τ ) dτ ⋅ e iω 0 t

(55)

(этот интеграл фактически распространен по интервалу от t = t 0 до
t = t1 ). Получается гармоническое колебание с частотой ω 0 и ампли7
тудой
1
mω 0

∫e

− iω 0 τ

f ( τ ) dτ .

−∞

Подобные интегралы (так называемые «интегралы Фурье») мы будем
рассматривать в гл. XIV.
Если вынуждающая сила имеет вид f (t) = A sin ωt, то можно найти
частное решение уравнения по формуле (52), которая при отсутствии
трения, т.е. при h = 0, упрощается и приобретает вид
y=

A
A
sin ωt =
sin ωt.
k − mω 2
m(ω 20 − ω 2 )

=

y=

A
(ω sin ω 0 t − ω 0 sin ωt ).
mω 0 (ω + ω 0 )(ω − ω 0 )

(57)

A
[ω 0 sin ω 0 t − ω 0 sin ωt + (ω − ω 0 )sin ω 0 t]=
mω 0 (ω + ω 0 )(ω − ω 0 )
=

A
A
sin ω 0 t =
( sin ω 0 t − sin ωt ) +
m(ω + ω 0 )(ω − ω 0 )
mω 0 (ω + ω 0 )
=

−∞



sin ωt sin( −ω 0 t ) sin ω 0 t ⎤
A ⎡ sin ωt
=


+
ω + ω0
ω − ω 0 ⎥⎦
2 mω 0 ⎢⎣ω + ω 0 ω − ω 0

Пусть частота ω вынуждающей силы близка к собственной частоте
ω 0 осциллятора. Преобразуя правую часть (57) по формуле

f ( τ ) dτ ⋅ e iω 0 t ,

−∞



233

На это колебание, происходящее с частотой ω вынуждающей силы,
накладывается свободное колебание с собственной частотой ω 0 , зави7
сящее от начальных условий и при отсутствии трения не затухающее.
Особо интересен случай, когда синусоидальная внешняя сила действу7
ет на осциллятор без трения при нулевых начальных условиях. Тогда реше7
ние находится по формуле (54) и, приняв для простоты t 0 = 0, получим

где
a =−

§ 5]

(56)

2A
ω −ω
ω +ω
A
sin 0
t cos 0
t+
sin ω 0 t
2
2
m(ω + ω 0 )(ω − ω 0 )
mω 0 (ω + ω 0 )

и заменяя приближенно ω 0 + ω на 2ω 0 , получим
y≈

−A
ω − ω0
A
sin
sin ω 0 t.
t cosω 0 t +
2
mω 0 (ω − ω 0 )
2 mω 20

Наиболее интересно первое, главное слагаемое. Его можно записать
в виде
M ( t ) cos ω 0 t,

где M ( t ) =

−A
ω − ω0
sin
t,
2
mω 0 (ω − ω 0 )

и истолковать как гармоническое колебание с частотой ω 0 и медлен7
но изменяющейся амплитудой. Эта амплитуда меняется от 0 до
M 0 = max M ( t ) =

A
mω 0 ω − ω 0

(58)

232

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

при t > t1 и решение принимает вид
y( t ) = a cos ω 0 t + b sin ω 0 t,

1
mω 0

t1



f ( τ )sin ω 0 τ dτ ,

b=

если t > t1 ,

t0

1
mω 0

t1

∫ f ( τ )cos ω 0 τ dτ .

t0

Таким образом, если первоначально тело покоилось, затем в течение
некоторого времени на него действовала внешняя сила f(t), то по
окончании действия силы тело будет совершать свободные колебания
с частотой ω0 и амплитудой a 2 + b2 .
Формулу (54) можно записать иначе, введя «комплексное отклоне7
ние от положения равновесия»
w(t ) =

1
mω 0

t

iω ( t − τ )
f ( τ ) dτ =
∫e 0

t0

1
mω 0

t

∫e

− iω 0 τ

ЛИНЕЙНЫЕ НЕОДНОРОДНЫЕ УРАВНЕНИЯ ВТОРОГО ПОРЯДКА

y=

1
mω 0
=

t

∫ sin ω 0 ( t − τ ) A sin ωτ dτ =
0

A
mω 0
=

f ( τ ) dτ ⋅ e iω 0 t ,

t

1

∫ 2 [cos(ωτ − ω 0 ( t − τ )) − cos(ωτ + ω 0 ( t − τ ))] dτ =
0

A ⎡ sin(ωτ − ω 0 ( t − τ )) sin(ωτ + ω 0 ( t − τ )) ⎤ t

=

2 mω 0 ⎢⎣
ω + ω0
ω − ω0
⎦ τ =0
=

t0

для которого вещественное отклонение y(t) служит мнимой частью.
Если t 0 — начальный момент действия силы, то формулу можно пере7
писать в виде
w(t ) =

t

1
mω 0

∫e

− iω 0 τ

так как при этом преобразовании к интегралу добавляется часть, рав7
ная нулю. Если сила действует только до некоторого момента t1 вре7
мени, то, начиная с этого момента, можно написать
w(t ) =

1
mω 0

∫e

− iω 0 τ

f ( τ ) dτ ⋅ e iω 0 t

(55)

(этот интеграл фактически распространен по интервалу от t = t 0 до
t = t1 ). Получается гармоническое колебание с частотой ω 0 и ампли7
тудой
1
mω 0

∫e

− iω 0 τ

f ( τ ) dτ .

−∞

Подобные интегралы (так называемые «интегралы Фурье») мы будем
рассматривать в гл. XIV.
Если вынуждающая сила имеет вид f (t) = A sin ωt, то можно найти
частное решение уравнения по формуле (52), которая при отсутствии
трения, т.е. при h = 0, упрощается и приобретает вид
y=

A
A
sin ωt =
sin ωt.
k − mω 2
m(ω 20 − ω 2 )

=

y=

A
(ω sin ω 0 t − ω 0 sin ωt ).
mω 0 (ω + ω 0 )(ω − ω 0 )

(57)

A
[ω 0 sin ω 0 t − ω 0 sin ωt + (ω − ω 0 )sin ω 0 t]=
mω 0 (ω + ω 0 )(ω − ω 0 )
=

A
A
sin ω 0 t =
( sin ω 0 t − sin ωt ) +
m(ω + ω 0 )(ω − ω 0 )
mω 0 (ω + ω 0 )
=

−∞



sin ωt sin( −ω 0 t ) sin ω 0 t ⎤
A ⎡ sin ωt
=


+
ω + ω0
ω − ω 0 ⎥⎦
2 mω 0 ⎢⎣ω + ω 0 ω − ω 0

Пусть частота ω вынуждающей силы близка к собственной частоте
ω 0 осциллятора. Преобразуя правую часть (57) по формуле

f ( τ ) dτ ⋅ e iω 0 t ,

−∞



233

На это колебание, происходящее с частотой ω вынуждающей силы,
накладывается свободное колебание с собственной частотой ω 0 , зави7
сящее от начальных условий и при отсутствии трения не затухающее.
Особо интересен случай, когда синусоидальная внешняя сила действу7
ет на осциллятор без трения при нулевых начальных условиях. Тогда реше7
ние находится по формуле (54) и, приняв для простоты t 0 = 0, получим

где
a =−

§ 5]

(56)

2A
ω −ω
ω +ω
A
sin 0
t cos 0
t+
sin ω 0 t
2
2
m(ω + ω 0 )(ω − ω 0 )
mω 0 (ω + ω 0 )

и заменяя приближенно ω 0 + ω на 2ω 0 , получим
y≈

−A
ω − ω0
A
sin
sin ω 0 t.
t cosω 0 t +
2
mω 0 (ω − ω 0 )
2 mω 20

Наиболее интересно первое, главное слагаемое. Его можно записать
в виде
M ( t ) cos ω 0 t,

где M ( t ) =

−A
ω − ω0
sin
t,
2
mω 0 (ω − ω 0 )

и истолковать как гармоническое колебание с частотой ω 0 и медлен7
но изменяющейся амплитудой. Эта амплитуда меняется от 0 до
M 0 = max M ( t ) =

A
mω 0 ω − ω 0

(58)

234

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

с периодом

.
ω − ω0

T=

Такие колебания называются биениями, их график изображен на
рис. 85. Они получаются в результате интерференции вынужденного

§ 6]

УСТОЙЧИВЫЕ И НЕУСТОЙЧИВЫЕ РЕШЕНИЯ

Если осциллятор без трения, то в особом случае, когда ω = ω 0 , т.е.
частота вынуждающей силы совпадает с собственной частотой, форму7
ла (56) непригодна; напомним, что это тот самый случай, который был
нами пропущен в конце § V.5. Воспользуемся общей формулой (54),
приняв для простоты t 0 = 0:
y=

1
m

t

∫ sin ω 0 ( t − τ )⋅ A sin ω 0 τ dτ =
0

=

A
2m

t

∫ [cos ω 0 ( t − 2 τ ) − cosω 0 t] dτ =
0

=
Рис. 85.

(56) и свободного колебаний из7за близости их по амплитуде и частоте
(см. формулу (57)). Мы видим, что как время раскачки при биениях,
так и амплитуда биений обратно пропорциональны ω − ω 0 , т.е. раз7
ности частот свободных колебаний и вынуждающей силы.
Если осциллятор обладает малым трением, то процесс колебаний
также начнется с биений, однако по прошествии достаточного времени
свободное колебание затухнет и останется только вынужденное коле7
бание (52). Его амплитуда равна при очень малом h
A
( k − mω 2 )2 + h 2ω 2

2 2

2

A

2

( k − mω ) + h ω =


A
k − mω

2



( k − mω 2 )2 + h 2ω 2

A
m

ω 20

−ω

2

=

A



A
.
m ω 0 − ω (ω 0 + ω) 2 mω 0 ω − ω 0


Сравнивая с формулой (58), мы видим, что амплитуда вынужденных
колебаний равна половине амплитуды биений. Таким образом, график
колебаний имеет вид, показанный на рис. 86. Интервал времени, на ко7
тором биения переходят в чисто гармонические колебания, является
переходным периодом, а сам этот процесс — переходным процессом.

235

⎤t
A ⎡ sin ω 0 ( t − 2 τ )
A
A
=
− τ cos ω 0 t ⎥
sin ω 0 t −
t cos ω 0 t.

2m ⎣
−2ω 0
2m
⎦ τ = 0 2 mω 0

Первое из полученных слагаемых представляет собой свободное гар7
моническое колебание и присутствует только из7за необходимости
удовлетворить нулевым начальным условиям. В отличие от этого вто7
рое слагаемое представляет собой колебание, амплитуда которого с те7
чением времени стремится к бесконечности по линейному закону.
В этом и состоит очень важное явление резонанса, который получается,
когда частота вынуждающей силы совпадает с собственной частотой
системы.
Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво7
ряющие указанным начальным, данным:
1. y′′ − y = 1,
при t = 0.
y = 0,
y′ = 0
2. y′′ + y = t,
при t = 0.
y = 1,
y′ = 0

§ 6. Устойчивые и неустойчивые решения
Начнем с самого простого уравнения
dy
= ay ( a = const ),
dt

(59)

причем переменную t будем истолковывать как время. Его общее ре7
шение легко получить:
y = Ce at ,

(60)

где С —произвольная постоянная, определяемая из начального условия
y( t 0 ) = y0 .

Подставляя в (60), находим
Рис. 86.

y0 = Ce at 0 ,

т.е. C = y0 e − at 0

234

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

с периодом

.
ω − ω0

T=

Такие колебания называются биениями, их график изображен на
рис. 85. Они получаются в результате интерференции вынужденного

§ 6]

УСТОЙЧИВЫЕ И НЕУСТОЙЧИВЫЕ РЕШЕНИЯ

Если осциллятор без трения, то в особом случае, когда ω = ω 0 , т.е.
частота вынуждающей силы совпадает с собственной частотой, форму7
ла (56) непригодна; напомним, что это тот самый случай, который был
нами пропущен в конце § V.5. Воспользуемся общей формулой (54),
приняв для простоты t 0 = 0:
y=

1
m

t

∫ sin ω 0 ( t − τ )⋅ A sin ω 0 τ dτ =
0

=

A
2m

t

∫ [cos ω 0 ( t − 2 τ ) − cosω 0 t] dτ =
0

=
Рис. 85.

(56) и свободного колебаний из7за близости их по амплитуде и частоте
(см. формулу (57)). Мы видим, что как время раскачки при биениях,
так и амплитуда биений обратно пропорциональны ω − ω 0 , т.е. раз7
ности частот свободных колебаний и вынуждающей силы.
Если осциллятор обладает малым трением, то процесс колебаний
также начнется с биений, однако по прошествии достаточного времени
свободное колебание затухнет и останется только вынужденное коле7
бание (52). Его амплитуда равна при очень малом h
A
( k − mω 2 )2 + h 2ω 2

2 2

2

A

2

( k − mω ) + h ω =


A
k − mω

2



( k − mω 2 )2 + h 2ω 2

A
m

ω 20

−ω

2

=

A



A
.
m ω 0 − ω (ω 0 + ω) 2 mω 0 ω − ω 0


Сравнивая с формулой (58), мы видим, что амплитуда вынужденных
колебаний равна половине амплитуды биений. Таким образом, график
колебаний имеет вид, показанный на рис. 86. Интервал времени, на ко7
тором биения переходят в чисто гармонические колебания, является
переходным периодом, а сам этот процесс — переходным процессом.

235

⎤t
A ⎡ sin ω 0 ( t − 2 τ )
A
A
=
− τ cos ω 0 t ⎥
sin ω 0 t −
t cos ω 0 t.

2m ⎣
−2ω 0
2m
⎦ τ = 0 2 mω 0

Первое из полученных слагаемых представляет собой свободное гар7
моническое колебание и присутствует только из7за необходимости
удовлетворить нулевым начальным условиям. В отличие от этого вто7
рое слагаемое представляет собой колебание, амплитуда которого с те7
чением времени стремится к бесконечности по линейному закону.
В этом и состоит очень важное явление резонанса, который получается,
когда частота вынуждающей силы совпадает с собственной частотой
системы.
Упражнения
Найдите решения следующих дифференциальных уравнений, удовлетво7
ряющие указанным начальным, данным:
1. y′′ − y = 1,
при t = 0.
y = 0,
y′ = 0
2. y′′ + y = t,
при t = 0.
y = 1,
y′ = 0

§ 6. Устойчивые и неустойчивые решения
Начнем с самого простого уравнения
dy
= ay ( a = const ),
dt

(59)

причем переменную t будем истолковывать как время. Его общее ре7
шение легко получить:
y = Ce at ,

(60)

где С —произвольная постоянная, определяемая из начального условия
y( t 0 ) = y0 .

Подставляя в (60), находим
Рис. 86.

y0 = Ce at 0 ,

т.е. C = y0 e − at 0

236

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

и окончательно
y = y0 e

a(t −t 0 )

.

(61)

В частности, при y 0 = 0 получаем нулевое решение y ≡ 0. Однако
допустим теперь, что начальное значение y 0 , которое мы считали рав7
ным нулю, на самом деле оказалось хотя и малым, но отличным от нуля.
Как будет вести себя тогда решение с течением времени, т.е. с возраста7
нием t? Будет ли такое возмущенное решение приближаться к невозму$
щенному нулевому решению или удаляться от него?
Ответ на эти вопросы существенно зависит от знака коэффициен7
та а. Если a < 0, то формула (61) сразу показывает, что при увеличе7
нии t решения безгранично приближаются к нулю, так что при боль7
ших t они практически становятся просто равными нулю. В такой
ситуации невозмущенное решение называется асимптотически устой$
чивым относительно изменения (возмущения) начального условия или
асимптотически устойчивым по Ляпунову по имени выдающегося рус7
ского математика и механика А.М. Ляпунова (1857–1918), который впер7
вые начал систематически изучать понятие устойчивости процессов.
Совсем иная картина будет в случае a > 0. Здесь при y 0 ≠ 0 и при
возрастании t решение по абсолютной величине безгранично увели7
чивается, т.е. становится не малым, даже если y 0 было как угодно ма7
лым. Здесь невозмущенное решение называется неустойчивым.
Уравнение (59) при a > 0 получается, например, при рассмотрении
размножения бактерий в питательной среде, причем у означает массу
бактерий в единице объема, а а — это интенсивность размножения.
Ясно, что если бактерий в начальный момент совершенно не было, то
и с течением времени они не появятся. Однако эта картина неустойчи7
ва в том смысле, что сознательное или случайное внесение в среду как
угодно малого количества бактерий приводит с течением времени
к мощному загрязнению среды бактериями.
Интересен промежуточный случай a = 0. Здесь решения будут про7
сто постоянными и потому при малом начальном отклонении возму7
щенного решения от невозмущенного первое будет и при возрастании t
близким ко второму, хотя и не будет к нему асимптотически (при t → ∞)
приближаться. Такая картина называется неасимптотической устойчи$
востью невозмущенного решения.
Рассмотрим теперь более общее уравнение
dy
= f ( y ).
dt

(62)

Нетрудно найти все стационарные решения, т.е. решения вида
y = const. Для этого надо в (62) положить y = y~ = const, что даст
f( ~
y ) = 0.

(63)

§ 6]

УСТОЙЧИВЫЕ И НЕУСТОЙЧИВЫЕ РЕШЕНИЯ

237

Таким образом, стационарные решения уравнения (62) — это нули
функции f (y), стоящей в правой части. Остановимся на одном таком
решении y = y~ и выясним, будет ли оно устойчивым.
Допустим сначала, что функция f (y) является убывающей, во вся7
ком случае, в некоторой близости значения y = y~; тогда если у пере7
~ то f (y) переходит от положительных значе7
ходит через значение y,
ний к отрицательным. В этом случае примерная картина поля
направлений, определенного уравнением (62) (ср. § 1), показана на
рис. 87; при построении этого поля надо учесть, что изоклины для урав7

Рис. 87.

Рис. 88.

нения (62) имеют вид y = const (почему?), т.е. представляют собой
прямые, параллельные оси t (они также показаны на рис. 87). На
рис. 87 жирными линиями показаны интегральная прямая y = y~, изо7
бражающая невозмущенное стационарное решение, и несколько дру7
гих интегральных линий, получающихся при изменении начального
условия. Ясно, что если y 0 мало отличается от y~ (например, в преде7
лах рисунка), то возмущенное решение мало отличается от невозму7
щенного и при возрастании t, а при t → ∞ асимптотически к нему
приближается. Таким образом, в данном случае невозмущенное реше7
ние асимптотически устойчиво.
Пусть теперь f (y) возрастает от отрицательных значений к поло7
~ Соответствующая
жительным, когда у переходит через значение y.
картина показана на рис. 88. Ясно, что как бы ни было y 0 близким к y~
~ соответствующее решение y(t) с возрастанием t
(но не равным y!),
уйдет от невозмущенного решения на конечное, не малое расстояние.
Это значит, что в данном случае невозмущенное стационарное решение
неустойчиво. (Проверьте, что полученные ранее признаки устойчивос7
ти и неустойчивости для уравнения (59) можно получить как сле7
дствие общих признаков, указанных для уравнения (62).)
Полученные сейчас признаки можно вывести иным способом, не
опираясь на геометрическую картину. Разложим правую часть (62)

236

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

и окончательно
y = y0 e

a(t −t 0 )

.

(61)

В частности, при y 0 = 0 получаем нулевое решение y ≡ 0. Однако
допустим теперь, что начальное значение y0 , которое мы считали рав7
ным нулю, на самом деле оказалось хотя и малым, но отличным от нуля.
Как будет вести себя тогда решение с течением времени, т.е. с возраста7
нием t? Будет ли такое возмущенное решение приближаться к невозму$
щенному нулевому решению или удаляться от него?
Ответ на эти вопросы существенно зависит от знака коэффициен7
та а. Если a < 0, то формула (61) сразу показывает, что при увеличе7
нии t решения безгранично приближаются к нулю, так что при боль7
ших t они практически становятся просто равными нулю. В такой
ситуации невозмущенное решение называется асимптотически устой$
чивым относительно изменения (возмущения) начального условия или
асимптотически устойчивым по Ляпунову по имени выдающегося рус7
ского математика и механика А.М. Ляпунова (1857–1918), который впер7
вые начал систематически изучать понятие устойчивости процессов.
Совсем иная картина будет в случае a > 0. Здесь при y 0 ≠ 0 и при
возрастании t решение по абсолютной величине безгранично увели7
чивается, т.е. становится не малым, даже если y 0 было как угодно ма7
лым. Здесь невозмущенное решение называется неустойчивым.
Уравнение (59) при a > 0 получается, например, при рассмотрении
размножения бактерий в питательной среде, причем у означает массу
бактерий в единице объема, а а — это интенсивность размножения.
Ясно, что если бактерий в начальный момент совершенно не было, то
и с течением времени они не появятся. Однако эта картина неустойчи7
ва в том смысле, что сознательное или случайное внесение в среду как
угодно малого количества бактерий приводит с течением времени
к мощному загрязнению среды бактериями.
Интересен промежуточный случай a = 0. Здесь решения будут про7
сто постоянными и потому при малом начальном отклонении возму7
щенного решения от невозмущенного первое будет и при возрастании t
близким ко второму, хотя и не будет к нему асимптотически (при t → ∞)
приближаться. Такая картина называется неасимптотической устойчи$
востью невозмущенного решения.
Рассмотрим теперь более общее уравнение
dy
= f ( y ).
dt

(62)

Нетрудно найти все стационарные решения, т.е. решения вида
y = const. Для этого надо в (62) положить y = y~ = const, что даст
f( ~
y ) = 0.

(63)

§ 6]

УСТОЙЧИВЫЕ И НЕУСТОЙЧИВЫЕ РЕШЕНИЯ

237

Таким образом, стационарные решения уравнения (62) — это нули
функции f (y), стоящей в правой части. Остановимся на одном таком
решении y = y~ и выясним, будет ли оно устойчивым.
Допустим сначала, что функция f (y) является убывающей, во вся7
ком случае, в некоторой близости значения y = y~; тогда если у пере7
~ то f (y) переходит от положительных значе7
ходит через значение y,
ний к отрицательным. В этом случае примерная картина поля
направлений, определенного уравнением (62) (ср. § 1), показана на
рис. 87; при построении этого поля надо учесть, что изоклины для урав7

Рис. 87.

Рис. 88.

нения (62) имеют вид y = const (почему?), т.е. представляют собой
прямые, параллельные оси t (они также показаны на рис. 87). На
рис. 87 жирными линиями показаны интегральная прямая y = y~, изо7
бражающая невозмущенное стационарное решение, и несколько дру7
гих интегральных линий, получающихся при изменении начального
условия. Ясно, что если y 0 мало отличается от y~ (например, в преде7
лах рисунка), то возмущенное решение мало отличается от невозму7
щенного и при возрастании t, а при t → ∞ асимптотически к нему
приближается. Таким образом, в данном случае невозмущенное реше7
ние асимптотически устойчиво.
Пусть теперь f (y) возрастает от отрицательных значений к поло7
~ Соответствующая
жительным, когда у переходит через значение y.
картина показана на рис. 88. Ясно, что как бы ни было y 0 близким к y~
~ соответствующее решение y(t) с возрастанием t
(но не равным y!),
уйдет от невозмущенного решения на конечное, не малое расстояние.
Это значит, что в данном случае невозмущенное стационарное решение
неустойчиво. (Проверьте, что полученные ранее признаки устойчивос7
ти и неустойчивости для уравнения (59) можно получить как сле7
дствие общих признаков, указанных для уравнения (62).)
Полученные сейчас признаки можно вывести иным способом, не
опираясь на геометрическую картину. Разложим правую часть (62)

238

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

в степенной ряд около значения y = y~, тогда в силу условия (63) посто)
янного члена в разложении не будет и мы получим
dy
= f ′( ~
y )( y − ~
y ) + ...,
dt

то есть
d(y − ~
y)
= f ′( ~
y )( y − ~
y ) + ...,
dt

(64)

где многоточием обозначены члены высшего порядка малости. Под)
черкнем, что при выяснении устойчивости по Ляпунову изучается по)
ведение возмущенных решений, мало отличающихся от невозмущен)
ного, т.е. рассматриваются лишь малые значения y − y~. Поэтому
в правой части уравнения (64) основную роль играет выписанный, ли)
нейный член. Отбрасывая члены высшего порядка малости, получаем
уравнение вида (59), в котором a = f ′(y~). Применяя результаты, полу)
ченные выше для уравнения (59), находим, что при f ′(y~) < 0 решение
y − y~ = 0, т.е. y = y~, асимптотически устойчиво; если же f ′(y~) > 0, то ре)
шение y = y~ неустойчиво. Однако в первом случае функция f (y)
убывает (во всяком случае, около значения y = y~), а во втором — воз)
растает, так что мы. приходим к тем же выводам, которые были получены
из геометрических соображений. В особом случае, когда f ′(y~) = a = 0,
для уравнения (59) имеет место неасимптотическая устойчивость, т. е.
решения, близкие к невозмущенному, не стремятся к нему, но и не ухо)
дят от него; тогда для полного уравнения (64) начинают играть сущес)
твенную роль члены высшего порядка малости, которые в одном при)
мере могут направить возмущенные решения к невозмущенному,
а в другом — увести их на значительное расстояние. Мы не будем раз)
бирать этот особый случай.
В качестве примера рассмотрим тепловой режим в некотором объе)
ме, если в нем происходит химическая реакция, связанная с выделени)
ем тепла, и в то же время тепло отводится в окружающее пространство.
Так как скорость реакции зависит от температуры Т в данном объеме
(мы будем рассматривать среднюю температуру в данный момент вре)
мени t), то и скорость Q выделения тепла при реакции зависит от Т,
Q = Q(T). Примем эту зависимость такой, как показано на рис. 89. Кро)
ме того, примем, что скорость отвода тепла в окружающее простра)
нство равна a(T − T c ), где а —коэффициент пропорциональности,
a T c — температура окружающей среды. Тогда при постоянной теплоем)
кости с рассматриваемого объема дифференциальное уравнение про)
цесса приобретает вид
dT
d ( cT )
≡c
= Q (T ) − a (T − Tc ).
dt
dt

(65)

§ 6]

УСТОЙЧИВЫЕ И НЕУСТОЙЧИВЫЕ РЕШЕНИЯ

239

В силу сказанного выше стационарное
состояние, при котором температура в
процессе реакции остается постоянной,
возможно при тех Т, для которых пра)
вая часть обращается в нуль, т.е. гра)
фик Q(Т) пересекается с графиком
a(T − T c ) (см. рис. 89). Мы видим, что
если окружающая температура T c дос)
таточно велика (на рис. 89 при T c = T c ),
тo стационарное состояние невозмож)
но, подача тепла будет все время больше
Рис. 89.
его отвода, и объем будет безгранично
разогреваться. Если же эта температура мала (на рис. 89 при T c = T c ), то
мыслимы два стационарных состояния, с температурой T1 или T2 .
Вблизи значения T1 правая часть (65) переходит от положительных
значений к отрицательным, т.е. убывает. Мы видели ранее, что такое со)
стояние является устойчивым. Это видно и из рис. 89, так как если тем)
пература T опустится ниже T1 , то выделяться при реакции будет
больше тепла, чем отводиться, т.е. объем будет разогреваться, а
если T поднимется выше T1 , то тепла будет отводиться больше, чем
выделяться, и объем будет остывать. Аналогично проверяем, что стаци)
онарная температура T2 будет неустойчивой. Таким образом, при
T c = T c развитие процесса зависит от начальной температуры следую)
щим образом: если она была менее T2 , то с течением времени
температура стремится к стационарному значению T1 , если же началь)
ная температура была более T2 , то температура будет катастрофически
нарастать. Эти соображения были положены в основу теории теплово)
го взрыва лауреатом Нобелевской премии Н.Н. Семеновым в 1927 г.
Перейдем теперь к уравнению свободных колебаний (21)
m

d 2y
dy
+h
+ ky = 0 ( m, n, k > 0 )
dt
dt 2

с общим решением
y = C1 e p 1 t + C 2 e p 2 t ,

(66)

где p1 и p2 — корни характеристического уравнения (24), а C1 ,
и C2 — произвольные постоянные, определяемые из начальных усло)
вий. Это уравнение имеет стационарное решение y ≡ 0. В § 3 мы видели,
что все остальные решения при возрастании t стремятся к нулю (коле)
бательным или неколебательным образом) и, таким образом, указанное
стационарное решение является асимптотически устойчивым. При от)
сутствии трения, т.е. при h = 0, мы видели, что решения периодичны; по)
этому при малых начальном отклонении и начальной скорости решение

238

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

в степенной ряд около значения y = y~, тогда в силу условия (63) посто)
янного члена в разложении не будет и мы получим
dy
= f ′( ~
y )( y − ~
y ) + ...,
dt

то есть
d(y − ~
y)
= f ′( ~
y )( y − ~
y ) + ...,
dt

(64)

где многоточием обозначены члены высшего порядка малости. Под)
черкнем, что при выяснении устойчивости по Ляпунову изучается по)
ведение возмущенных решений, мало отличающихся от невозмущен)
ного, т.е. рассматриваются лишь малые значения y − y~. Поэтому
в правой части уравнения (64) основную роль играет выписанный, ли)
нейный член. Отбрасывая члены высшего порядка малости, получаем
уравнение вида (59), в котором a = f ′(y~). Применяя результаты, полу)
ченные выше для уравнения (59), находим, что при f ′(y~) < 0 решение
y − y~ = 0, т.е. y = y~, асимптотически устойчиво; если же f ′(y~) > 0, то ре)
шение y = y~ неустойчиво. Однако в первом случае функция f (y)
убывает (во всяком случае, около значения y = y~), а во втором — воз)
растает, так что мы. приходим к тем же выводам, которые были получены
из геометрических соображений. В особом случае, когда f ′(y~) = a = 0,
для уравнения (59) имеет место неасимптотическая устойчивость, т. е.
решения, близкие к невозмущенному, не стремятся к нему, но и не ухо)
дят от него; тогда для полного уравнения (64) начинают играть сущес)
твенную роль члены высшего порядка малости, которые в одном при)
мере могут направить возмущенные решения к невозмущенному,
а в другом — увести их на значительное расстояние. Мы не будем раз)
бирать этот особый случай.
В качестве примера рассмотрим тепловой режим в некотором объе)
ме, если в нем происходит химическая реакция, связанная с выделени)
ем тепла, и в то же время тепло отводится в окружающее пространство.
Так как скорость реакции зависит от температуры Т в данном объеме
(мы будем рассматривать среднюю температуру в данный момент вре)
мени t), то и скорость Q выделения тепла при реакции зависит от Т,
Q = Q(T). Примем эту зависимость такой, как показано на рис. 89. Кро)
ме того, примем, что скорость отвода тепла в окружающее простра)
нство равна a(T − T c ), где а —коэффициент пропорциональности,
a T c — температура окружающей среды. Тогда при постоянной теплоем)
кости с рассматриваемого объема дифференциальное уравнение про)
цесса приобретает вид
dT
d ( cT )
≡c
= Q (T ) − a (T − Tc ).
dt
dt

(65)

§ 6]

УСТОЙЧИВЫЕ И НЕУСТОЙЧИВЫЕ РЕШЕНИЯ

239

В силу сказанного выше стационарное
состояние, при котором температура в
процессе реакции остается постоянной,
возможно при тех Т, для которых пра)
вая часть обращается в нуль, т.е. гра)
фик Q(Т) пересекается с графиком
a(T − T c ) (см. рис. 89). Мы видим, что
если окружающая температура T c дос)
таточно велика (на рис. 89 при T c = T c ),
тo стационарное состояние невозмож)
но, подача тепла будет все время больше
Рис. 89.
его отвода, и объем будет безгранично
разогреваться. Если же эта температура мала (на рис. 89 при T c = T c ), то
мыслимы два стационарных состояния, с температурой T1 или T2 .
Вблизи значения T1 правая часть (65) переходит от положительных
значений к отрицательным, т.е. убывает. Мы видели ранее, что такое со)
стояние является устойчивым. Это видно и из рис. 89, так как если тем)
пература T опустится ниже T1 , то выделяться при реакции будет
больше тепла, чем отводиться, т.е. объем будет разогреваться, а
если T поднимется выше T1 , то тепла будет отводиться больше, чем
выделяться, и объем будет остывать. Аналогично проверяем, что стаци)
онарная температура T2 будет неустойчивой. Таким образом, при
T c = T c развитие процесса зависит от начальной температуры следую)
щим образом: если она была менее T2 , то с течением времени
температура стремится к стационарному значению T1 , если же началь)
ная температура была более T2 , то температура будет катастрофически
нарастать. Эти соображения были положены в основу теории теплово)
го взрыва лауреатом Нобелевской премии Н.Н. Семеновым в 1927 г.
Перейдем теперь к уравнению свободных колебаний (21)
m

d 2y
dy
+h
+ ky = 0 ( m, n, k > 0 )
dt
dt 2

с общим решением
y = C1 e p 1 t + C 2 e p 2 t ,

(66)

где p1 и p2 — корни характеристического уравнения (24), а C1 ,
и C2 — произвольные постоянные, определяемые из начальных усло)
вий. Это уравнение имеет стационарное решение y ≡ 0. В § 3 мы видели,
что все остальные решения при возрастании t стремятся к нулю (коле)
бательным или неколебательным образом) и, таким образом, указанное
стационарное решение является асимптотически устойчивым. При от)
сутствии трения, т.е. при h = 0, мы видели, что решения периодичны; по)
этому при малых начальном отклонении и начальной скорости решение

240

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

будет малым и с возрастанием t, но не будет стремиться к нулю. Зна7
чит, при отсутствии трения стационарное решение будет устойчивым,
но не асимптотически.
С помощью специально подобранных схем возможно построить
системы с одной степенью свободы, описываемые уравнением (21) (где
у представляет собой отклонение системы от стационарного состоя7
ния), для которых h < 0 или k < 0. Такие системы можно истолковать
как системы с отрицательным трением или с отрицательной упругос7
тью. (См., например, описание работы туннельного диода в ВМ,
§ VIII.16, при которой систему можно истолковать как осциллятор с
отрицательным трением.) Легко проверить, что у всех таких систем
стационарное решение y ≡ 0 неустойчиво. В самом деле, из алгебры
известны свойства корней p1 и p2 квадратного уравнения (24):
h
p1 + p2 = − ,
m

p1 p2 =

k
.
m

Из первого равенства видно, что если h < 0, то либо по крайней мере
один корень вещественный положительный, либо же корни мнимые
сопряженные с положительной вещественной частью. Из второго раве7
нства видно, что если k < 0, то корни разного знака и потому среди них
имеется один положительный. Таким образом, во всех этих случаях
среди корней имеется по крайней мере один либо вещественный поло7
жительный, либо мнимый с положительной вещественной частью.
Пусть p1 — этот корень. Тогда первое слагаемое в правой части (66)
имеет вид
C1 e p 1 t ( p1 > 0 )

либо C1 e ( γ + iω ) t = C1 e γt (cos ωt + i sin ωt ) ( γ > 0 ),

и потому при как угодно малом C1 (т.е. при как угодно малых началь7
ных данных) при возрастании t оно стремится к бесконечности. Это
и означает неустойчивость стационарного решения.
Упражнение
Найдите стационарные решения уравнения

dy
= y 3 − 4 y и выясните их
dt

устойчивость.

ОТВЕТЫ И РЕШЕНИЯ
§ 1
1. Окружности x 2 + y 2 = C с центром в начале координат.
2. В точках перегиба должно быть y′′ = 0. В силу уравнения (1) и формулы

для производной сложной функции (§ IV. 1) получаем y′′ = ( f ( x, y ))′ =

= fx′ ( x, y ) + f y′ ( x, y ) y′ = fx′ + f y′ f . Значит, искомое уравнение имеегвид
dy
= x 2 + y 2 получаем x + y( x 2 + y 2 ) = 0.
fx′ + f y′ f = 0. Для уравнения
dx

ОТВЕТЫ И РЕШЕНИЯ

§ 2
2


ex ⎛ ex
− ⎜ − 1⎟ e − x .
2 ⎝2


1. y = e x .

5. y =

2. y = x.

6. y = 2 x − 1 − e −2 x .
1
7. y = e − x + (sin x + cos x ).
2

3. y = ln( x + e ).
4. y = 1 + x 2 .
§ 3
1. y = 2 cos t.
t
2. y = e t sin .
2
3. y = e 2 t + e t .
§ 4
1. x = −3( t − 2 ) + 1 = −3 t + 7.
t2
2. x = − 2.
2

4. y = e t + 3 e − t .
5. y = ( t − 1)e t .
6. y = (5 t + 1)e −2 t .

3. x = 2 t − sin t.
t

4. x = ∫ ( t − τ )e τ dτ = e t .
−∞

§ 5

1
1. y = ( e t + e − t ) − 1.
2
2. y = t + cos t − sin t.
§ 6
y = ±2 (неустойчивые), y = 0 (асимптотически устойчивое).

241

240

ДИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ

[Гл. VII

будет малым и с возрастанием t, но не будет стремиться к нулю. Зна7
чит, при отсутствии трения стационарное решение будет устойчивым,
но не асимптотически.
С помощью специально подобранных схем возможно построить
системы с одной степенью свободы, описываемые уравнением (21) (где
у представляет собой отклонение системы от стационарного состоя7
ния), для которых h < 0 или k < 0. Такие системы можно истолковать
как системы с отрицательным трением или с отрицательной упругос7
тью. (См., например, описание работы туннельного диода в ВМ,
§ VIII.16, при которой систему можно истолковать как осциллятор с
отрицательным трением.) Легко проверить, что у всех таких систем
стационарное решение y ≡ 0 неустойчиво. В самом деле, из алгебры
известны свойства корней p1 и p2 квадратного уравнения (24):
h
p1 + p2 = − ,
m

p1 p2 =

k
.
m

Из первого равенства видно, что если h < 0, то либо по крайней мере
один корень вещественный положительный, либо же корни мнимые
сопряженные с положительной вещественной частью. Из второго раве7
нства видно, что если k < 0, то корни разного знака и потому среди них
имеется один положительный. Таким образом, во всех этих случаях
среди корней имеется по крайней мере один либо вещественный поло7
жительный, либо мнимый с положительной вещественной частью.
Пусть p1 — этот корень. Тогда первое слагаемое в правой части (66)
имеет вид
C1 e p 1 t ( p1 > 0 )

либо C1 e ( γ + iω ) t = C1 e γt (cos ωt + i sin ωt ) ( γ > 0 ),

и потому при как угодно малом C1 (т.е. при как угодно малых началь7
ных данных) при возрастании t оно стремится к бесконечности. Это
и означает неустойчивость стационарного решения.
Упражнение
Найдите стационарные решения уравнения

dy
= y 3 − 4 y и выясните их
dt

устойчивость.

ОТВЕТЫ И РЕШЕНИЯ
§ 1
1. Окружности x 2 + y 2 = C с центром в начале координат.
2. В точках перегиба должно быть y′′ = 0. В силу уравнения (1) и формулы

для производной сложной функции (§ IV. 1) получаем y′′ = ( f ( x, y ))′ =

= fx′ ( x, y ) + f y′ ( x, y ) y′ = fx′ + f y′ f . Значит, искомое уравнение имеегвид
dy
= x 2 + y 2 получаем x + y( x 2 + y 2 ) = 0.
fx′ + f y′ f = 0. Для уравнения
dx

ОТВЕТЫ И РЕШЕНИЯ

§ 2
2


ex ⎛ ex
− ⎜ − 1⎟ e − x .
2 ⎝2


1. y = e x .

5. y =

2. y = x.

6. y = 2 x − 1 − e −2 x .
1
7. y = e − x + (sin x + cos x ).
2

3. y = ln( x + e ).
4. y = 1 + x 2 .
§ 3
1. y = 2 cos t.
t
2. y = e t sin .
2
3. y = e 2 t + e t .
§ 4
1. x = −3( t − 2 ) + 1 = −3 t + 7.
t2
2. x = − 2.
2

4. y = e t + 3 e − t .
5. y = ( t − 1)e t .
6. y = (5 t + 1)e −2 t .

3. x = 2 t − sin t.
t

4. x = ∫ ( t − τ )e τ dτ = e t .
−∞

§ 5

1
1. y = ( e t + e − t ) − 1.
2
2. y = t + cos t − sin t.
§ 6
y = ±2 (неустойчивые), y = 0 (асимптотически устойчивое).

241

§ 1]

243

ОСОБЫЕ ТОЧКИ

ГЛАВА VIII
ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЯХ
Рис. 90.

Эта глава является непосредственным продолжением предыдущей
и существенно на нее опирается.
§ 1. Особые точки
В § VII.1 мы установили, что интегральные линии уравнения
dy
= f (x, y) не пересекаются между собой. Однако из этого правила
dx
есть важное исключение. Действительно, может оказаться, что при не$
которых значениях х и у функция f (x, y) не имеет определенного
y
значения. Например, f (x, y) = не имеет определенного значения
x
при х = 0, у = 0. Точка плоскости, в которой f (x, y) теряет смысл, на$
dy
зывается особой точкой дифференциального уравнения
= f (x, y).
dx
Через особую точку может проходить несколько интегральных кри$
вых.
Еслий f (x, y) имеет вид отношения двух функций простого вида
ϕ ( x , y)
, то координаты осо$
(например, двух многочленов), f (x, y) =
ψ ( x , y)
бой точки находятся из системы уравнений
ϕ ( x, y ) = 0, 

ψ ( x, y ) = 0. 

Рассмотрим несколько примеров особых точек, принадлежащих к наи$
более часто встречающимся в приложениях типам.
dy y
1.
= . Решением этого уравнения является функция y = Cx
dx x
при любом постоянном С. Совокупность интегральных линий пред$
ставляет собой все прямые линии, проходящие через начало координат
(рис. 90). Таким образом, интегральные линии пересекаются в особой
точке x = 0, y = 0.

Рис. 91.

dy 2y
= . Решением является y = Cx 2 . Интегральные кривые —
dx
x
параболы с вершиной в начале координат. В этом случае все интеграль$
ные кривые, за исключением интегральной линии x = 0, касаются меж$
ду собой в особой точке x = 0, y = 0 (рис. 91).
В рассмотренных примерах все интегральные линии проходят через
особую точку, имея там определенное направление. Такая особая точка
называется узлом.
3. Бывают особые точки, вблизи которых интегральные кривые ве$
dy
y
дут себя иначе. Пусть
= − . Интегральные линии имеют уравнение
dx
x
xy = C. При C = 0 получаем x = 0 или
y = 0 — две прямые, проходящие через
начало координат. При C ≠ 0 интег$
ральные кривые — гиперболы. Итак, две
интегральные линии проходят через
особую точку x = 0, y = 0, остальные не
проходят через нее. Особая точка такого
типа называется седлом (рис. 92).
4. Интегральными кривыми урав$
dy
x
нения
= − являются окружности
dx
y
Рис. 92.
x 2 + y 2 = C. В этом случае интеграль$
ные кривые окружают особую точку, но через саму особую точку не
проходит ни одна интегральная кривая (рис. 93).
Особая точка такого типа называется центром.
dy x + y
5. При интегрировании уравнения
с особой точкой
=
dx x − y
в начале координат удобно перейти к полярным координатам ρ, ϕ по
формулам x = ρ cos ϕ, y = ρ sin ϕ, откуда
2.

dx = cos ϕ ⋅ dρ − ρ sin ϕ dϕ,

dy = sin ϕ ⋅ dρ + ρ cos ϕ dϕ.

§ 1]

243

ОСОБЫЕ ТОЧКИ

ГЛАВА VIII
ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ
УРАВНЕНИЯХ
Рис. 90.

Эта глава является непосредственным продолжением предыдущей
и существенно на нее опирается.
§ 1. Особые точки
В § VII.1 мы установили, что интегральные линии уравнения
dy
= f (x, y) не пересекаются между собой. Однако из этого правила
dx
есть важное исключение. Действительно, может оказаться, что при не$
которых значениях х и у функция f (x, y) не имеет определенного
y
значения. Например, f (x, y) = не имеет определенного значения
x
при х = 0, у = 0. Точка плоскости, в которой f (x, y) теряет смысл, на$
dy
зывается особой точкой дифференциального уравнения
= f (x, y).
dx
Через особую точку может проходить несколько интегральных кри$
вых.
Еслий f (x, y) имеет вид отношения двух функций простого вида
ϕ ( x , y)
, то координаты осо$
(например, двух многочленов), f (x, y) =
ψ ( x , y)
бой точки находятся из системы уравнений
ϕ ( x, y ) = 0, 

ψ ( x, y ) = 0. 

Рассмотрим несколько примеров особых точек, принадлежащих к наи$
более часто встречающимся в приложениях типам.
dy y
1.
= . Решением этого уравнения является функция y = Cx
dx x
при любом постоянном С. Совокупность интегральных линий пред$
ставляет собой все прямые линии, проходящие через начало координат
(рис. 90). Таким образом, интегральные линии пересекаются в особой
точке x = 0, y = 0.

Рис. 91.

dy 2y
= . Решением является y = Cx 2 . Интегральные кривые —
dx
x
параболы с вершиной в начале координат. В этом случае все интеграль$
ные кривые, за исключением интегральной линии x = 0, касаются меж$
ду собой в особой точке x = 0, y = 0 (рис. 91).
В рассмотренных примерах все интегральные линии проходят через
особую точку, имея там определенное направление. Такая особая точка
называется узлом.
3. Бывают особые точки, вблизи которых интегральные кривые ве$
dy
y
дут себя иначе. Пусть
= − . Интегральные линии имеют уравнение
dx
x
xy = C. При C = 0 получаем x = 0 или
y = 0 — две прямые, проходящие через
начало координат. При C ≠ 0 интег$
ральные кривые — гиперболы. Итак, две
интегральные линии проходят через
особую точку x = 0, y = 0, остальные не
проходят через нее. Особая точка такого
типа называется седлом (рис. 92).
4. Интегральными кривыми урав$
dy
x
нения
= − являются окружности
dx
y
Рис. 92.
x 2 + y 2 = C. В этом случае интеграль$
ные кривые окружают особую точку, но через саму особую точку не
проходит ни одна интегральная кривая (рис. 93).
Особая точка такого типа называется центром.
dy x + y
5. При интегрировании уравнения
с особой точкой
=
dx x − y
в начале координат удобно перейти к полярным координатам ρ, ϕ по
формулам x = ρ cos ϕ, y = ρ sin ϕ, откуда
2.

dx = cos ϕ ⋅ dρ − ρ sin ϕ dϕ,

dy = sin ϕ ⋅ dρ + ρ cos ϕ dϕ.

244

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 2]

СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

245

т.е. мы получаем систему дифференциальных уравнений первого по*
рядка.
От одного уравнения второго порядка
d 2y
dy ⎞

= F ⎜ x, y, ⎟

dx ⎠
dx 2

с одной искомой функцией легко перейти к равносильной системе из
двух уравнений первого порядка с двумя искомыми функциями. Для
dy
этого надо рассматривать
как дополнительную неизвестную
dx
функцию. Обозначая ее через z, получим

Рис. 94.

Рис. 93.

После подстановки в уравнение и приведения подобных членов полу*

чим (проверьте!) dρ = ρ dϕ, откуда
= dϕ и ρ = Ce ϕ . Придавая С все*
ρ
возможные значения, получим семейство спиралей, накручивающихся на
начало координат (рис. 94). Особая точка такаго типа называется фокусом.
В приведенных примерах легко установить характер поведения ин*
тегральных кривых вблизи особой точки, так как легко решить диффе*
ренциальные уравнения. В более сложных случаях можно составить
примерное представление о характере особой точки, вычерчивая изо*
клины. Более эффективные способы исследования особых точек ле*
жат за пределами нашей книги. Применение этих способов показывает,
в частности, что при выполнении условия ϕ x′ ψ ′y ≠ ϕ ′y ψ x′ особая точ*
ка обязательно принадлежит к одному из разобранных типов.
Упражнение
Определите характер особой точки для уравнении

(2)

dy x dy x + 2 y
;
= ;
=
dx y dx
x

dy
2x + y
.
=−
dx
x + 2y

dy
= z,
dx

d 2 y d ⎛ dy ⎞ dz
=
⎜ ⎟= .
dx 2 dx ⎝ dx ⎠ dx

Поэтому вместо уравнения (2) можно написать равносильную систему
dy

= z,
⎪⎪
dx

dz
= F ( x, y, z ).⎪⎪

dx

Аналогично уравнение третьего порядка

d 3y
dy d 2 y ⎞
= Φ ⎜ x, y, , 2 ⎟
3
dx dx ⎠
dx


можно заменить равносильной системой трех уравнений первого по*
рядка. Для этого надо положить
dy
= z,
dx

d 2 y dz
=
= u.
dx 2 dx

Тогда получаем систему
§ 2. Системы дифференциальных уравнений

До сих пор мы считали, что нам дано одно дифференциальное урав*
нение, из которого нужно найти одну искомую функцию. Бывает, что
неизвестных функций больше одной, например две: y(x) и z (x). Тог*
да и дифференциальных уравнений должно быть два. Если это — урав*
нения первого порядка (разрешенные относительно производных от
искомых функций), то они имеют общий вид
dy
= f ( x, y, z ),
dx
dz
= ϕ ( x, y, z ),
dx


⎪⎪


⎪⎭

(1)

dy

= z,

dx

dz

= u,

dx

du

= Φ ( x, y, z, u ).⎪
dx


Подобным образом от уравнения любого порядка и даже от системы
уравнений любого порядка легко перейти к равносильной системе пер*
вого порядка. Обратно, можно проверить, что от системы n уравнений
первого порядка с n искомыми функциями можно, вообще говоря, пе*
рейти к одному равносильному уравнению порядка n с одной искомой

244

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 2]

СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

245

т.е. мы получаем систему дифференциальных уравнений первого по*
рядка.
От одного уравнения второго порядка
d 2y
dy ⎞

= F ⎜ x, y, ⎟

dx ⎠
dx 2

с одной искомой функцией легко перейти к равносильной системе из
двух уравнений первого порядка с двумя искомыми функциями. Для
dy
этого надо рассматривать
как дополнительную неизвестную
dx
функцию. Обозначая ее через z, получим

Рис. 94.

Рис. 93.

После подстановки в уравнение и приведения подобных членов полу*

чим (проверьте!) dρ = ρ dϕ, откуда
= dϕ и ρ = Ce ϕ . Придавая С все*
ρ
возможные значения, получим семейство спиралей, накручивающихся на
начало координат (рис. 94). Особая точка такаго типа называется фокусом.
В приведенных примерах легко установить характер поведения ин*
тегральных кривых вблизи особой точки, так как легко решить диффе*
ренциальные уравнения. В более сложных случаях можно составить
примерное представление о характере особой точки, вычерчивая изо*
клины. Более эффективные способы исследования особых точек ле*
жат за пределами нашей книги. Применение этих способов показывает,
в частности, что при выполнении условия ϕ x′ ψ ′y ≠ ϕ ′y ψ x′ особая точ*
ка обязательно принадлежит к одному из разобранных типов.
Упражнение
Определите характер особой точки для уравнении

(2)

dy x dy x + 2 y
;
= ;
=
dx y dx
x

dy
2x + y
.
=−
dx
x + 2y

dy
= z,
dx

d 2 y d ⎛ dy ⎞ dz
=
⎜ ⎟= .
dx 2 dx ⎝ dx ⎠ dx

Поэтому вместо уравнения (2) можно написать равносильную систему
dy

= z,
⎪⎪
dx

dz
= F ( x, y, z ).⎪⎪

dx

Аналогично уравнение третьего порядка

d 3y
dy d 2 y ⎞
= Φ ⎜ x, y, , 2 ⎟
3
dx dx ⎠
dx


можно заменить равносильной системой трех уравнений первого по*
рядка. Для этого надо положить
dy
= z,
dx

d 2 y dz
=
= u.
dx 2 dx

Тогда получаем систему
§ 2. Системы дифференциальных уравнений

До сих пор мы считали, что нам дано одно дифференциальное урав*
нение, из которого нужно найти одну искомую функцию. Бывает, что
неизвестных функций больше одной, например две: y(x) и z (x). Тог*
да и дифференциальных уравнений должно быть два. Если это — урав*
нения первого порядка (разрешенные относительно производных от
искомых функций), то они имеют общий вид
dy
= f ( x, y, z ),
dx
dz
= ϕ ( x, y, z ),
dx


⎪⎪


⎪⎭

(1)

dy

= z,

dx

dz

= u,

dx

du

= Φ ( x, y, z, u ).⎪
dx


Подобным образом от уравнения любого порядка и даже от системы
уравнений любого порядка легко перейти к равносильной системе пер*
вого порядка. Обратно, можно проверить, что от системы n уравнений
первого порядка с n искомыми функциями можно, вообще говоря, пе*
рейти к одному равносильному уравнению порядка n с одной искомой

246

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

функцией. Поэтому общее решение такой системы получается в резуль$
тате n интегрирований и, таким образом, содержит n произвольных
постоянных. Задания n начальных условий (при некотором значе$
нии х задаются значения всех искомых функций) как раз достаточно,
чтобы найти значения этих постоянных и, таким образом, получить час$
тное решение.
Будем рассматривать для простоты систему из двух уравнений пер$
вого порядка вида (1). Иногда удается, даже не решив систему, найти
соотношение, связывающее компоненты (т.е. y(x) и z (x)) любого ее
частного решения. Такое соотношение имеет вид
H ( x, y, z; C ) = 0

(3)

(причем С — постоянная, которая меняется от решения к решению)
и называется первым интегралом этой системы уравнений. Знание пер$
вого интеграла дает возможность понизить число уравнений в системе
на единицу, т.е. перейти к одному уравнению первого порядка с одной
искомой функцией. Для этого можно из (3) выразить z через все
остальное и подставить результат в первое уравнение (1); тогда полу$
чится одно уравнение первого порядка с одной искомой функцией
y(x). Если это уравнение проинтегрировать, т.е. найти y(x), то z (x)
можно будет найти без интегрирований из равенства (3).
Аналогичным образом знание двух независимых первых интегра$
лов (т.е. таких, что ни один из них не является следствием другого)

§ 3]

ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ СИСТЕМ

При свободных колебаниях без трения энергия должна сохраняться.
И действительно, в силу (4)
dE
dv
dx
= mv
+ kx
= − kxv + kxv = 0
dt
dt
dt

(это — математическое доказательство закона сохранения энергии
в данном примере). Таким образом, E = const для любого решения
системы (4), т. е. формула (5), в которой E играет роль произвольной
постоянной С, служит первым интегралом системы (4).
Подчеркнем в заключение, что, как видно из предыдущего, наибо$
лее естественно рассматривать системы, в которых число уравнений
равно числу неизвестных функций; такие системы принято называть
замкнутыми. Если уравнений меньше, чем искомых функций, то систе$
ма называется незамкнутой (недоопределенной); чаще всего незамкну$
тость системы свидетельствует о том, что просто не все необходимые
соотношения выписаны. Если уравнений больше, чем неизвестных
функций, то система называется переопределенной; переопределен$
ность системы обычно свидетельствует либо о ее зависимости (т.е.
о том, что некоторые из уравнений являются следствиями остальных
и потому излишни), либо об ошибке при ее составлении.
Упражнение
Рассмотрите систему уравнений

H1 ( x, y, z; C1 ) = 0, 

H 2 ( x, y, z; C 2 ) = 0 

dy
= y + z,
dx

дает общее решение системы (1), записанное в неявной форме. Для
системы из n уравнений первого порядка общее решение получается
из n независимых первых интегралов.
В некоторых случаях первые интегралы подсказываются физичес$
кими соображениями, чаще всего теми или иными законами сохране$
ния. Например, запишем уравнение одномерных упругих линейных
колебаний без трения (см. § VII.3)
m

d 2x
+ kx = 0
dt 2

dv
= − kx.
m
dt

§ 3. Определители и решение линейных систем
с постоянными коэффициентами
Прежде чем перейти к дальнейшему, рассмотрим понятие опреде$
лителя, играющее большую роль при решении и исследовании систем
линейных уравнений различного вида. Начнем с системы двух алгебра$
ических уравнений первой степени с двумя неизвестными

2

2

mv
kx
.
E=
+
2
2

a1 x + b1 y = d 1 , 

a 2 x + b2 y = d 2 . 

(4)

В § VII.3 мы уже упоминали о выражении для полной энергии колеб$
лющейся точки
(5)

dz
= − y + z.
dx

Умножив первое уравнение на у и второе на z, а затем сложив результаты,
найдите первый интеграл системы. Какие можно сделать из него выводы о по$
ведении частных решений при x → ±∞?

в форме системы первого порядка
dx
= v,
dt

247

(6)

Решая ее (что мы предоставим сделать читателю), получим ответ
x=

d 1b2 − b1 d 2
,
a1b2 − b1 a 2

y=

a1 d 2 − d 1 a 2
.
a1b2 − b1 a 2

(7)

246

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

функцией. Поэтому общее решение такой системы получается в резуль$
тате n интегрирований и, таким образом, содержит n произвольных
постоянных. Задания n начальных условий (при некотором значе$
нии х задаются значения всех искомых функций) как раз достаточно,
чтобы найти значения этих постоянных и, таким образом, получить час$
тное решение.
Будем рассматривать для простоты систему из двух уравнений пер$
вого порядка вида (1). Иногда удается, даже не решив систему, найти
соотношение, связывающее компоненты (т.е. y(x) и z (x)) любого ее
частного решения. Такое соотношение имеет вид
H ( x, y, z; C ) = 0

(3)

(причем С — постоянная, которая меняется от решения к решению)
и называется первым интегралом этой системы уравнений. Знание пер$
вого интеграла дает возможность понизить число уравнений в системе
на единицу, т.е. перейти к одному уравнению первого порядка с одной
искомой функцией. Для этого можно из (3) выразить z через все
остальное и подставить результат в первое уравнение (1); тогда полу$
чится одно уравнение первого порядка с одной искомой функцией
y(x). Если это уравнение проинтегрировать, т.е. найти y(x), то z (x)
можно будет найти без интегрирований из равенства (3).
Аналогичным образом знание двух независимых первых интегра$
лов (т.е. таких, что ни один из них не является следствием другого)

§ 3]

ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ СИСТЕМ

При свободных колебаниях без трения энергия должна сохраняться.
И действительно, в силу (4)
dE
dv
dx
= mv
+ kx
= − kxv + kxv = 0
dt
dt
dt

(это — математическое доказательство закона сохранения энергии
в данном примере). Таким образом, E = const для любого решения
системы (4), т. е. формула (5), в которой E играет роль произвольной
постоянной С, служит первым интегралом системы (4).
Подчеркнем в заключение, что, как видно из предыдущего, наибо$
лее естественно рассматривать системы, в которых число уравнений
равно числу неизвестных функций; такие системы принято называть
замкнутыми. Если уравнений меньше, чем искомых функций, то систе$
ма называется незамкнутой (недоопределенной); чаще всего незамкну$
тость системы свидетельствует о том, что просто не все необходимые
соотношения выписаны. Если уравнений больше, чем неизвестных
функций, то система называется переопределенной; переопределен$
ность системы обычно свидетельствует либо о ее зависимости (т.е.
о том, что некоторые из уравнений являются следствиями остальных
и потому излишни), либо об ошибке при ее составлении.
Упражнение
Рассмотрите систему уравнений

H1 ( x, y, z; C1 ) = 0, 

H 2 ( x, y, z; C 2 ) = 0 

dy
= y + z,
dx

дает общее решение системы (1), записанное в неявной форме. Для
системы из n уравнений первого порядка общее решение получается
из n независимых первых интегралов.
В некоторых случаях первые интегралы подсказываются физичес$
кими соображениями, чаще всего теми или иными законами сохране$
ния. Например, запишем уравнение одномерных упругих линейных
колебаний без трения (см. § VII.3)
m

d 2x
+ kx = 0
dt 2

dv
= − kx.
m
dt

§ 3. Определители и решение линейных систем
с постоянными коэффициентами
Прежде чем перейти к дальнейшему, рассмотрим понятие опреде$
лителя, играющее большую роль при решении и исследовании систем
линейных уравнений различного вида. Начнем с системы двух алгебра$
ических уравнений первой степени с двумя неизвестными

2

2

mv
kx
.
E=
+
2
2

a1 x + b1 y = d 1 , 

a 2 x + b2 y = d 2 . 

(4)

В § VII.3 мы уже упоминали о выражении для полной энергии колеб$
лющейся точки
(5)

dz
= − y + z.
dx

Умножив первое уравнение на у и второе на z, а затем сложив результаты,
найдите первый интеграл системы. Какие можно сделать из него выводы о по$
ведении частных решений при x → ±∞?

в форме системы первого порядка
dx
= v,
dt

247

(6)

Решая ее (что мы предоставим сделать читателю), получим ответ
x=

d 1b2 − b1 d 2
,
a1b2 − b1 a 2

y=

a1 d 2 − d 1 a 2
.
a1b2 − b1 a 2

(7)

248

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Выражение a1 b2 − b1 a2 называется определителем (детерминантом)
второго порядка и записывается в виде
a1b2 − b1 a 2 =

a1

b1

a 2 b2

,

(8)

где вертикальные черточки — знак определителя. С помощью этого об$
означения формулы (7) можно переписать в виде
d1
x=

b1

a1

d1

d 2 b2

a2

d2

a1 b1
a 2 b2

,

y=

a1 b1
a 2 b2

§ 3]

Определитель третьего порядка можно выразить через определите$
ли второго порядка. Для этого надо преобразовать выражение (12)
и воспользоваться обозначением (8):
a1 b1
a 2 b2
a 3 b3

c1
c2 = a1 (b2 c3 − c2b3 ) − b1 ( a 2 c3 − c2 a 3 ) + c1 (a 2b3 − b2 a 3 ) =
c3
= a1

.

(9)

(10)

приводит к формулам

x=

a1 b1
a 2 b2
a 3 b3

c1
c2
c3

,

y=

c1
c2
c3

a1 b1
a 2 b2
a 3 b3

c1
c2
c3

,

z=

a1 b1
a 2 b2
a 3 b3

d1
d2
d3

a1 b1
a 2 b2
a 3 b3

c1
c2
c3

,

(11)

b1

a 2 b2
a 3 b3

c1
c2 = a1b2 c3 − a1 c2b3 − b1 a 2 c3 + b1 c2 a 3 + c1 a 2b3 − c1b2 a 3 .
c3

Оказывается, что формулы, аналогичные (9) и (11), справедливы
для систем, состоящих из любого числа уравнений первой степени,
если число неизвестных равно числу уравнений. При этом детерминан$
ты (определители) четвертого порядка определяются по аналогии
с формулой (13):
a1 b1
a 2 b2
a 3 b3
a 4 b4

c1
c2
c3
c4

d1
b2
d2
= a1 b3
d3
b4
d4

c2
c3
c4

d2
a2
d 3 − b1 a 3
d4
a4

c2
c3
c4

d2
d3 +
d4
a 2 b2
+ c1 a 3 b3

где в числителях и знаменателях стоят определители третьего порядка,
вычисляемые по формуле
a1

(13)

1 
3
1

= 1 1 ⋅ 2 − ⋅ 1 − 2 ( −1 ⋅ 1 − 1 ⋅ 3) = + 8 = 9 .

2 
2
2

a1 x + b1 y + c1 z = d 1 , 

a 2 x + b2 y + c2 z = d 2 ,
a 3 x + b3 y + c3 z = d 3 

d1
d2
d3

c2
a b
+ c1 2 2 .
c3
a 3 b3

1 0 −2
1
1
1 = 1 1 2 − 0 −1 2 + ( −2 ) −1 1 =
2
3 1
1 2
3 2
3 1 2

Аналогичное решение системы уравнений

a1
a2
a3

a
c2
− b1 2
a3
c3

−1 1

0 −3
= 0 ⋅ 1 − ( −3 ) ⋅ 2 = 0 + 6 = 6.
2 1

c1
c2
c3

b2
b3

По этой формуле можно вычислять значение определителя. Например,

Покажем на примере вычисление определителя:

d 1 b1
d 2 b2
d 3 b3

249

ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ СИСТЕМ

(12)

Формулы (11) совершенно аналогичны формулам (9). В знаменате$
ле стоит один и тот же определитель, составленный из коэффициентов
при неизвестных (так называемый определитель системы). В числите$
ле же для каждой из неизвестных стоит определитель, полученный из
определителя системы подстановкой столбца свободных членов вмес$
то столбца коэффициентов при данной неизвестной.

a 4 b4

d2
a 2 b2
d 3 − d 1 a 3 b3

c2
c3

d4

c4

a 4 b4

(надо как следует продумать структуру выражения, стоящего в правой
части). Определители пятого порядка выражаются через определители
четвертого порядка и т.д.
В формулах (9) и (11) подразумевается, что определитель системы,
стоящий в знаменателях, не равен нулю. В этом случае сама система (6)
и соответственно (10) имеют вполне определенное единственное реше$
ние; конечно, под решением такой системы понимается набор значений
всех неизвестных. Иногда встречаются системы с определителем, рав$
ным нулю; их свойства совсем иные.

248

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Выражение a1 b2 − b1 a2 называется определителем (детерминантом)
второго порядка и записывается в виде
a1b2 − b1 a 2 =

a1

b1

a 2 b2

,

(8)

где вертикальные черточки — знак определителя. С помощью этого об$
означения формулы (7) можно переписать в виде
d1
x=

b1

a1

d1

d 2 b2

a2

d2

a1 b1
a 2 b2

,

y=

a1 b1
a 2 b2

§ 3]

Определитель третьего порядка можно выразить через определите$
ли второго порядка. Для этого надо преобразовать выражение (12)
и воспользоваться обозначением (8):
a1 b1
a 2 b2
a 3 b3

c1
c2 = a1 (b2 c3 − c2b3 ) − b1 ( a 2 c3 − c2 a 3 ) + c1 (a 2b3 − b2 a 3 ) =
c3
=a1

.

(9)

(10)

приводит к формулам

x=

a1 b1
a 2 b2
a 3 b3

c1
c2
c3

,

y=

c1
c2
c3

a1 b1
a 2 b2
a 3 b3

c1
c2
c3

,

z=

a1 b1
a 2 b2
a 3 b3

d1
d2
d3

a1 b1
a 2 b2
a 3 b3

c1
c2
c3

,

(11)

b1

a 2 b2
a 3 b3

c1
c2 = a1b2 c3 − a1 c2b3 − b1 a 2 c3 + b1 c2 a 3 + c1 a 2b3 − c1b2 a 3 .
c3

Оказывается, что формулы, аналогичные (9) и (11), справедливы
для систем, состоящих из любого числа уравнений первой степени,
если число неизвестных равно числу уравнений. При этом детерминан$
ты (определители) четвертого порядка определяются по аналогии
с формулой (13):
a1 b1
a 2 b2
a 3 b3
a 4 b4

c1
c2
c3
c4

d1
b2
d2
= a1 b3
d3
b4
d4

c2
c3
c4

d2
a2
d 3 − b1 a 3
d4
a4

c2
c3
c4

d2
d3 +
d4
a 2 b2
+ c1 a 3 b3

где в числителях и знаменателях стоят определители третьего порядка,
вычисляемые по формуле
a1

(13)

1 
3
1

= 1 1 ⋅ 2 − ⋅ 1 − 2 ( −1 ⋅ 1 − 1 ⋅ 3) = + 8 = 9 .

2 
2
2

a1 x + b1 y + c1 z = d 1 , 

a 2 x + b2 y + c2 z = d 2 ,
a 3 x + b3 y + c3 z = d 3 

d1
d2
d3

c2
a b
+ c1 2 2 .
c3
a 3 b3

1 0 −2
1
1
1 = 1 1 2 − 0 −1 2 + ( −2 ) −1 1 =
2
3 1
1 2
3 2
3 1 2

Аналогичное решение системы уравнений

a1
a2
a3

a
c2
− b1 2
a3
c3

−1 1

0 −3
= 0 ⋅ 1 − ( −3 ) ⋅ 2 = 0 + 6 = 6.
2 1

c1
c2
c3

b2
b3

По этой формуле можно вычислять значение определителя. Например,

Покажем на примере вычисление определителя:

d 1 b1
d 2 b2
d 3 b3

249

ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ СИСТЕМ

(12)

Формулы (11) совершенно аналогичны формулам (9). В знаменате$
ле стоит один и тот же определитель, составленный из коэффициентов
при неизвестных (так называемый определитель системы). В числите$
ле же для каждой из неизвестных стоит определитель, полученный из
определителя системы подстановкой столбца свободных членов вмес$
то столбца коэффициентов при данной неизвестной.

a 4 b4

d2
a 2 b2
d 3 − d 1 a 3 b3

c2
c3

d4

c4

a 4 b4

(надо как следует продумать структуру выражения, стоящего в правой
части). Определители пятого порядка выражаются через определители
четвертого порядка и т.д.
В формулах (9) и (11) подразумевается, что определитель системы,
стоящий в знаменателях, не равен нулю. В этом случае сама система (6)
и соответственно (10) имеют вполне определенное единственное реше$
ние; конечно, под решением такой системы понимается набор значений
всех неизвестных. Иногда встречаются системы с определителем, рав$
ным нулю; их свойства совсем иные.

250

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Рассмотрим для простоты систему (6). Если ее определитель равен
нулю,
a1 b1
= a1b2 − b1 a 2 = 0,
a 2 b2

то
a1b2 = b1 a 2 ,

a1 b1
= ,
a 2 b2

т.е. левые части системы пропорциональны. Например, система может
иметь вид
2x + 3 y = d1 , 

8 x + 12 y = d 2 . 

(14)

Ясно, что при произвольном выборе правых частей система несовмес$
тна, противоречива (не имеет ни одного решения). И только если пра$
вые части находятся в той же пропорции, что и левые (в данном
примере d 2 = 4d 1 ), то одно из уравнений является следствием другого
и потому может быть отброшено. Но тогда останется одно уравнение с
двумя неизвестными вида
2x + 3 y = d1 ,

которое имеет бесконечное количество решений; например, можно
придать х любое значение и найти соответствующее у.
Оказывается, что рассмотренная картина является типичной.
Именно, если определитель системы равен нулю, то между левыми час$
тями системы имеется определенное соотношение (быть может, не
одно). Если такие же соотношения справедливы для правых частей, то
система имеет бесконечное количество решений; в противном случае
нет ни одного решения.
Важным частным случаем является система n линейных однород$
ных (т.е. без свободных членов) уравнений с n неизвестными. Напри$
мер, в случае n = 3 система имеет вид
a1 x + b1 y + c1 z = 0, 

a 2 x + b2 y + c2 z = 0, 
a 3 x + b3 y + c3 z = 0. 

Такая система, конечно, имеет нулевое («тривиальное», т.е. неинтерес$
ное) решение x = y = z = 0. Часто бывает важно выяснить, имеются ли
другие (ненулевые) решения. На основании предыдущего легко дать
ответ на этот вопрос. Если определитель системы не равен нулю, то
имеется только одно решение, а значит, ненулевых решений нет. Если

§ 3]

ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ СИСТЕМ

251

же он равен нулю, то система имеет бесконечное количество ненулевых
решений, так как несовместной в данном случае она быть не может.
Чтобы найти эти решения, одно из уравнений системы отбрасывается,
подобно тому как это было сделано для системы (14).
Применим полученные результаты к решению системы линейных
однородных дифференциальных уравнений с постоянными коэффи$
циентами.
Рассмотрим, например, систему
dy
= a1 y + b1 z,
dx
dz
= a 2 y + b2 z,
dx



,



(15)

в которой все коэффициенты a1 b1 , a2 b2 постоянны. Ее частные ре$
шения ищут в виде
y = λe px ,

z = µe px ,

(16)

где λ, µ, p — пока неизвестные постоянные. Подстановка в (15) дает
после сокращения на e px и переноса всех членов в одну сторону
( a1 − p ) λ + b1µ = 0, 

a 2 λ + (b2 − p )µ = 0. 

(17)

Эти равенства можно рассматривать как систему из двух алгебраи$
ческих однородных уравнений первой степени с двумя неизвестными
λ, µ. Чтобы она имела ненулевое решение, а только такое решение
в силу (16) нас интересует, необходимо и достаточно, чтобы определи$
тель системы был равен нулю:
a1 − p
b1
= 0.
a2
b2 − p

(18)

Это — характеристическое уравнение для системы (15), из которого
мы находим возможные значения для p. Его можно переписать, «рас$
крыв» определитель, в виде
p 2 − ( a1 + b2 ) p + a1b2 − b1 a 2 = 0

(проверьте!).
Мы видим, что уравнение (18) имеет вторую степень относительно p;
поэтому оно имеет два корня p1 , p2 . Если эти корни различные, то мож$
но любой из них ( pk ) подставить в систему (17), найти какое$либо не$
нулевое решение λ k , µ k и по формуле (16) получить соответствующее
решение y(x), z (x) системы (15). Так как величины λ k , µ k определе$
ны с точностью до произвольного общего множителя, то умножим реше$
ние, отвечающее корню p1 , на произвольную постоянную C1 ,

250

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Рассмотрим для простоты систему (6). Если ее определитель равен
нулю,
a1 b1
= a1b2 − b1 a 2 = 0,
a 2 b2

то
a1b2 = b1 a 2 ,

a1 b1
= ,
a 2 b2

т.е. левые части системы пропорциональны. Например, система может
иметь вид
2x + 3 y = d1 , 

8 x + 12 y = d 2 . 

(14)

Ясно, что при произвольном выборе правых частей система несовмес$
тна, противоречива (не имеет ни одного решения). И только если пра$
вые части находятся в той же пропорции, что и левые (в данном
примере d 2 = 4d 1 ), то одно из уравнений является следствием другого
и потому может быть отброшено. Но тогда останется одно уравнение с
двумя неизвестными вида
2x + 3 y = d1 ,

которое имеет бесконечное количество решений; например, можно
придать х любое значение и найти соответствующее у.
Оказывается, что рассмотренная картина является типичной.
Именно, если определитель системы равен нулю, то между левыми час$
тями системы имеется определенное соотношение (быть может, не
одно). Если такие же соотношения справедливы для правых частей, то
система имеет бесконечное количество решений; в противном случае
нет ни одного решения.
Важным частным случаем является система n линейных однород$
ных (т.е. без свободных членов) уравнений с n неизвестными. Напри$
мер, в случае n = 3 система имеет вид
a1 x + b1 y + c1 z = 0, 

a 2 x + b2 y + c2 z = 0, 
a 3 x + b3 y + c3 z = 0. 

Такая система, конечно, имеет нулевое («тривиальное», т.е. неинтерес$
ное) решение x = y = z = 0. Часто бывает важно выяснить, имеются ли
другие (ненулевые) решения. На основании предыдущего легко дать
ответ на этот вопрос. Если определитель системы не равен нулю, то
имеется только одно решение, а значит, ненулевых решений нет. Если

§ 3]

ОПРЕДЕЛИТЕЛИ И РЕШЕНИЕ ЛИНЕЙНЫХ СИСТЕМ

251

же он равен нулю, то система имеет бесконечное количество ненулевых
решений, так как несовместной в данном случае она быть не может.
Чтобы найти эти решения, одно из уравнений системы отбрасывается,
подобно тому как это было сделано для системы (14).
Применим полученные результаты к решению системы линейных
однородных дифференциальных уравнений с постоянными коэффи$
циентами.
Рассмотрим, например, систему
dy
= a1 y + b1 z,
dx
dz
= a 2 y + b2 z,
dx



,



(15)

в которой все коэффициенты a1 b1 , a2 b2 постоянны. Ее частные ре$
шения ищут в виде
y = λe px ,

z = µe px ,

(16)

где λ, µ, p — пока неизвестные постоянные. Подстановка в (15) дает
после сокращения на e px и переноса всех членов в одну сторону
( a1 − p ) λ + b1µ = 0, 

a 2 λ + (b2 − p )µ = 0. 

(17)

Эти равенства можно рассматривать как систему из двух алгебраи$
ческих однородных уравнений первой степени с двумя неизвестными
λ, µ. Чтобы она имела ненулевое решение, а только такое решение
в силу (16) нас интересует, необходимо и достаточно, чтобы определи$
тель системы был равен нулю:
a1 − p
b1
= 0.
a2
b2 − p

(18)

Это — характеристическое уравнение для системы (15), из которого
мы находим возможные значения для p. Его можно переписать, «рас$
крыв» определитель, в виде
p 2 − ( a1 + b2 ) p + a1b2 − b1 a 2 = 0

(проверьте!).
Мы видим, что уравнение (18) имеет вторую степень относительно p;
поэтому оно имеет два корня p1 , p2 . Если эти корни различные, то мож$
но любой из них ( pk ) подставить в систему (17), найти какое$либо не$
нулевое решение λ k , µ k и по формуле (16) получить соответствующее
решение y(x), z (x) системы (15). Так как величины λ k , µ k определе$
ны с точностью до произвольного общего множителя, то умножим реше$
ние, отвечающее корню p1 , на произвольную постоянную C1 ,

252

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

а решение, отвечающее корню p2 , на C2 и сложим результаты. Мы по$
лучим общее решение системы (15)
y = C1 λ 1 e p 1 x + C 2 λ 2 e p 2 x , 

z = C1µ1 e p 1 x + C 2µ 2 e p 2 x . 

(19)

Здесь произвольные постоянные C1 и C2 можно найти, например,
если даны дополнительно начальные условия, имеющие для системы
(15) вид:
при x = x 0 заданы y = y 0 и z = z 0 .
Если корни уравнения (17) мнимые, то решение можно либо оста$
вить в форме (19), либо записать в вещественной форме, подобно
§ VII.3. Если p1 = p2 , то у и z получаются в виде комбинации функ$
ций e p 1 x и xe p 1 x (ср. § VII.3).
Упражнения
1. Исследуйте разрешимость
x + 2 y = 3, 
 при различных а, b.
3 x + ay = b 

системы

2. Найдите общее решение системы

алгебраических

уравнений

§ 4]

УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ СОСТОЯНИЯ РАВНОВЕСИЯ

закон развития процесса не меняется с течением времени; такие про$
цессы называются автономными. (Автономные системы появляются,
в частности, когда уравнения охватывают все тела, участвующие в зада$
че, так как законы природы неизменны во времени.).
Пусть состояние равновесия рассматриваемого объекта (когда он не
меняется с течением времени) описывается постоянными значениями
x = x 0 , y = y 0 ; тогда эта система постоянных, рассматриваемых как
функции времени, также должна удовлетворять системе (20). Из не$
посредственной подстановки в (20) следует, что для этого необходимо
и достаточно, чтобы одновременно
P ( x0 , y0 ) = 0,

§ 4. Устойчивость по Ляпунову состояния равновесия
Понятие устойчивости как способности того или иного объекта, со$
стояния или процесса сопротивляться неучитываемым заранее внеш$
ним воздействиям появилось еще в античной науке и сейчас занимает
одно из центральных мест в физике и технике. Существуют различные
конкретные реализации этого общего понятия в зависимости от типа
рассматриваемого объекта, характера внешних воздействий и т.д.
Здесь мы рассмотрим понятие устойчивости по Ляпунову, одно из наи$
более важных, уже освещенное на простых примерах в § VII.6.
Пусть состояние некоторого объекта описывается конечным чис$
лом параметров, для простоты двумя параметрами х, у, так что изме$
нение этого объекта во времени задается двумя функциями x = x(t),
y = y(t) (t — время). Пусть закон этого изменения имеет вид системы
дифференциальных уравнений
dx
= P ( x, y ),
dt
dy
= Q ( x, y )
dt







(20)

с заданными правыми частями, не содержащими явно независимой
переменной t. Последнее условие означает, что дифференциальный

Q ( x0 , y0 ) = 0.

(21)

Пусть в некоторый момен t 0 объект под влиянием каких$то при$
чин вышел из состояния равновесия, т.е. параметры х, у стали равны$
ми x = x 0 + ∆x 0 , y = y 0 + ∆y 0 . Тогда для выяснения дальнейшего
изменения рассматриваемого объекта надо решить систему уравнений
(20) при начальных условиях:
x ( t 0 ) = x 0 + ∆x 0 ,

dx
dy
= 4 x − y,
= −6 x + 3 y.
dt
dt

253

y ( t 0 ) = y0 + ∆y0 .

(22)

Исследуемое состояние равновесия называется устойчивым по Ля
пунову, если после малого отклонения от этого состояния объект про$
должает оставаться вблизи от него в продолжение всего дальнейшего
времени. Другими словами, при малых ∆x 0 , ∆y 0 для решения систе$
мы (20) при начальных условиях (22) разности ∆x = x(t) − x 0 ,
∆y = y(t) − y 0 должны быть малыми при всех t > t 0 .
Для выяснения того, будет ли иметь место устойчивость, подставим
в систему (20)
x = x 0 + ∆x 0 ,

y = y0 + ∆y0 ,

что даст
d ( ∆x )

= P ( x0 + ∆x, y0 + ∆y ) = (Px′ )0 ∆x + (Py′ )0 ∆y + ..., 

dt

d ( ∆y )
= Q ( x0 + ∆x, y0 + ∆y ) = (Q ′x )0 ∆x + (Q ′y )0 ∆y + ...,

dt

(23)

где обозначено (Px′ ) 0 = Px′ (x 0 , y 0 ) и т.п. Здесь при преобразовании
правых частей мы воспользовались формулой Тейлора (§ IV.6) и фор$
мулами (21); многоточиями обозначены члены выше первого порядка
малости.
Так как при выяснении устойчивости рассматриваются лишь малые
∆x, ∆y, то в правых частях системы (23) основную роль играют выпи$
санные, линейные члены (ср. аналогичное рассуждение в § VII.6). Поэ$

252

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

а решение, отвечающее корню p2 , на C2 и сложим результаты. Мы по$
лучим общее решение системы (15)
y = C1 λ 1 e p 1 x + C 2 λ 2 e p 2 x , 

z = C1µ1 e p 1 x + C 2µ 2 e p 2 x . 

(19)

Здесь произвольные постоянные C1 и C2 можно найти, например,
если даны дополнительно начальные условия, имеющие для системы
(15) вид:
при x = x 0 заданы y = y 0 и z = z 0 .
Если корни уравнения (17) мнимые, то решение можно либо оста$
вить в форме (19), либо записать в вещественной форме, подобно
§ VII.3. Если p1 = p2 , то у и z получаются в виде комбинации функ$
ций e p 1 x и xe p 1 x (ср. § VII.3).
Упражнения
1. Исследуйте разрешимость
x + 2 y = 3, 
 при различных а, b.
3 x + ay = b 

системы

2. Найдите общее решение системы

алгебраических

уравнений

§ 4]

УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ СОСТОЯНИЯ РАВНОВЕСИЯ

закон развития процесса не меняется с течением времени; такие про$
цессы называются автономными. (Автономные системы появляются,
в частности, когда уравнения охватывают все тела, участвующие в зада$
че, так как законы природы неизменны во времени.).
Пусть состояние равновесия рассматриваемого объекта (когда он не
меняется с течением времени) описывается постоянными значениями
x = x 0 , y = y 0 ; тогда эта система постоянных, рассматриваемых как
функции времени, также должна удовлетворять системе (20). Из не$
посредственной подстановки в (20) следует, что для этого необходимо
и достаточно, чтобы одновременно
P ( x0 , y0 ) = 0,

§ 4. Устойчивость по Ляпунову состояния равновесия
Понятие устойчивости как способности того или иного объекта, со$
стояния или процесса сопротивляться неучитываемым заранее внеш$
ним воздействиям появилось еще в античной науке и сейчас занимает
одно из центральных мест в физике и технике. Существуют различные
конкретные реализации этого общего понятия в зависимости от типа
рассматриваемого объекта, характера внешних воздействий и т.д.
Здесь мы рассмотрим понятие устойчивости по Ляпунову, одно из наи$
более важных, уже освещенное на простых примерах в § VII.6.
Пусть состояние некоторого объекта описывается конечным чис$
лом параметров, для простоты двумя параметрами х, у, так что изме$
нение этого объекта во времени задается двумя функциями x = x(t),
y = y(t) (t — время). Пусть закон этого изменения имеет вид системы
дифференциальных уравнений
dx
= P ( x, y ),
dt
dy
= Q ( x, y )
dt







(20)

с заданными правыми частями, не содержащими явно независимой
переменной t. Последнее условие означает, что дифференциальный

Q ( x0 , y0 ) = 0.

(21)

Пусть в некоторый момен t 0 объект под влиянием каких$то при$
чин вышел из состояния равновесия, т.е. параметры х, у стали равны$
ми x = x 0 + ∆x 0 , y = y 0 + ∆y 0 . Тогда для выяснения дальнейшего
изменения рассматриваемого объекта надо решить систему уравнений
(20) при начальных условиях:
x ( t 0 ) = x 0 + ∆x 0 ,

dx
dy
= 4 x − y,
= −6 x + 3 y.
dt
dt

253

y ( t 0 ) = y0 + ∆y0 .

(22)

Исследуемое состояние равновесия называется устойчивым по Ля
пунову, если после малого отклонения от этого состояния объект про$
должает оставаться вблизи от него в продолжение всего дальнейшего
времени. Другими словами, при малых ∆x 0 , ∆y 0 для решения систе$
мы (20) при начальных условиях (22) разности ∆x = x(t) − x 0 ,
∆y = y(t) − y 0 должны быть малыми при всех t > t 0 .
Для выяснения того, будет ли иметь место устойчивость, подставим
в систему (20)
x = x 0 + ∆x 0 ,

y = y0 + ∆y0 ,

что даст
d ( ∆x )

= P ( x0 + ∆x, y0 + ∆y ) = (Px′ )0 ∆x + (Py′ )0 ∆y + ..., 

dt

d ( ∆y )
= Q ( x0 + ∆x, y0 + ∆y ) = (Q ′x )0 ∆x + (Q ′y )0 ∆y + ...,

dt

(23)

где обозначено (Px′ ) 0 = Px′ (x 0 , y 0 ) и т.п. Здесь при преобразовании
правых частей мы воспользовались формулой Тейлора (§ IV.6) и фор$
мулами (21); многоточиями обозначены члены выше первого порядка
малости.
Так как при выяснении устойчивости рассматриваются лишь малые
∆x, ∆y, то в правых частях системы (23) основную роль играют выпи$
санные, линейные члены (ср. аналогичное рассуждение в § VII.6). Поэ$

254

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

тому заменим систему (23) на укороченную систему (систему первого
приближения), отбросив члены высшего порядка малости:
d ( ∆x )

= (Px′ )0 ∆x + (Py′ )0 ∆y, 

dt

d ( ∆y )
= (Q x′ )0 ∆x + (Q ′y )0 ∆y.

dt

(24)

Система (24) — это линейная система с постоянными коэффициен$
тами, которая решается по методу § 3. Согласно формуле (19) (где,
правда, были применены иные обозначения) решение системы (24) по$
лучается как комбинация функций вида e pt , где p удовлетворяет ха$
рактеристическому уравнению
(Px′ )0 − p
(Py′ )0
= 0.
(Q ′x )0
(Q ′y )0 − p

e pt = e rt (cos st + i sin st ),

или

e 0 t = 1,

255

т.е. получается, будто бы рассматриваемый объект колеблется (или
остается неподвижным) около состояния равновесия, не стремясь к не$
му. Но тогда из$за неограниченности времени начинают влиять отбро$
шенные члены высшего порядка малости, которые могут нарушить
устойчивость. Итак, в рассматриваемом особом случае по корням урав$
нения (25) нельзя заключить об устойчивости или неустойчивости со$
стояния равновесия; чтобы это сделать, надо привлечь какие$либо
дополнительные соображения, например привлечь дальнейшие члены
разложений (23). Мы не будем проводить такое исследование, отметим
лишь, что малые возмущения здесь будут нарастать или затухать зна$
чительно медленнее, так как время изменения такого возмущения в за$
данное число (например, в е) раз будет обратно пропорциональным
этому возмущению или даже иметь еще более высокий порядок.
Упражнение
Найдите состояния равновесия для системы
dx
= − x − y, 

dt

dy
3
= −y + y

dt

(26)

то нарастание или затухание возмущения определяется знаком p,
если p вещественное, и знаком r, если p мнимое: если этот знак
плюс, то возмущение нарастает, а если минус, то затухает. Мы прихо$
дим к следующим выводам. Если все корни характеристического урав$
нения (25) имеют отрицательную вещественную часть (в частности,
они могут быть вещественными отрицательными), то рассматриваемое
состояние равновесия (x 0 ; y 0 ) устойчиво по Ляпунову. Кроме того,
тогда при малых ∆x 0 , ∆y 0 будет x(t) → x 0 , y(t) → y 0 при t → ∞;
такая устойчивость, как мы указывали в § VII.6, называется асимпто
тической. Если же среди корней уравнения (25) имеется по крайней
мере один с положительной вещественной частью, то рассматриваемое
состояние равновесия неустойчиво по Ляпунову.
Эти результаты мы вывели для системы (24), но согласно сказанно$
му выше те же утверждения справедливы для полной системы (23).
Отметим, что наличие двойного корня у уравнения (25) не нарушает
наших утверждений, так как хотя тогда в решении появляется t в ка$
честве множителя, но экспонента e pt при p < 0 стремится к нулю
быстрее, чем t к бесконечности.
Оба полученных вывода не охватывают случая, когда среди корней
уравнения (25) нет корней с положительной вещественной частью, но
имеется по крайней мере один с нулевой вещественной частью. Тогда
в общем решении системы (24) появляются функции вида
e ist = 1

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

(25)

При этом малым ∆x 0 , ∆y 0 отвечают малые значения произвольных
постоянных C1 , C2 и поэтому все дело в поведении функции e pt при
возрастании t. Так как p может быть и мнимым, p = r + is, а тогда

e ist = cos st + i sin st,

§ 5]

и исследуйте их устойчивость.

§ 5. Построение приближенных формул для решения
Методы построения приближенных формул для решения диффе$
ренциального уравнения во многом аналогичны описанным в § I.4 ме$
тодам решения «конечных» уравнений. Мы будем для простоты
рассматривать уравнения первого порядка, хотя те же методы естес$
твенно переносятся на уравнения любого порядка и на системы
уравнений.
Начнем с метода итераций. Пусть рассматривается дифференци$
альное уравнение первого порядка с заданным начальным условием
dy
= f ( x, y ),
dx
y( x0 ) = y0 .






(27)

Если взять интегралы от обеих частей уравнения, получим
x

x

dy

∫ dx dx = y − y0 = ∫ f ( s, y( s )) ds *,

x0

x0

x

* Мы часто применяем обозначения вида

∫ ϕ(x ) dx , однако в данном случае нужно

x0

применять более аккуратную запись, различая верхний предел и переменную интегриро$
вания (ср. ВМ, § I.14).

254

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

тому заменим систему (23) на укороченную систему (систему первого
приближения), отбросив члены высшего порядка малости:
d ( ∆x )

= (Px′ )0 ∆x + (Py′ )0 ∆y, 

dt

d ( ∆y )
= (Q x′ )0 ∆x + (Q ′y )0 ∆y.

dt

(24)

Система (24) — это линейная система с постоянными коэффициен$
тами, которая решается по методу § 3. Согласно формуле (19) (где,
правда, были применены иные обозначения) решение системы (24) по$
лучается как комбинация функций вида e pt , где p удовлетворяет ха$
рактеристическому уравнению
(Px′ )0 − p
(Py′ )0
= 0.
(Q ′x )0
(Q ′y )0 − p

e pt = e rt (cos st + i sin st ),

или

e 0 t = 1,

255

т.е. получается, будто бы рассматриваемый объект колеблется (или
остается неподвижным) около состояния равновесия, не стремясь к не$
му. Но тогда из$за неограниченности времени начинают влиять отбро$
шенные члены высшего порядка малости, которые могут нарушить
устойчивость. Итак, в рассматриваемом особом случае по корням урав$
нения (25) нельзя заключить об устойчивости или неустойчивости со$
стояния равновесия; чтобы это сделать, надо привлечь какие$либо
дополнительные соображения, например привлечь дальнейшие члены
разложений (23). Мы не будем проводить такое исследование, отметим
лишь, что малые возмущения здесь будут нарастать или затухать зна$
чительно медленнее, так как время изменения такого возмущения в за$
данное число (например, в е) раз будет обратно пропорциональным
этому возмущению или даже иметь еще более высокий порядок.
Упражнение
Найдите состояния равновесия для системы
dx
= − x − y, 

dt

dy
3
= −y + y

dt

(26)

то нарастание или затухание возмущения определяется знаком p,
если p вещественное, и знаком r, если p мнимое: если этот знак
плюс, то возмущение нарастает, а если минус, то затухает. Мы прихо$
дим к следующим выводам. Если все корни характеристического урав$
нения (25) имеют отрицательную вещественную часть (в частности,
они могут быть вещественными отрицательными), то рассматриваемое
состояние равновесия (x 0 ; y 0 ) устойчиво по Ляпунову. Кроме того,
тогда при малых ∆x 0 , ∆y 0 будет x(t) → x 0 , y(t) → y 0 при t → ∞;
такая устойчивость, как мы указывали в § VII.6, называется асимпто
тической. Если же среди корней уравнения (25) имеется по крайней
мере один с положительной вещественной частью, то рассматриваемое
состояние равновесия неустойчиво по Ляпунову.
Эти результаты мы вывели для системы (24), но согласно сказанно$
му выше те же утверждения справедливы для полной системы (23).
Отметим, что наличие двойного корня у уравнения (25) не нарушает
наших утверждений, так как хотя тогда в решении появляется t в ка$
честве множителя, но экспонента e pt при p < 0 стремится к нулю
быстрее, чем t к бесконечности.
Оба полученных вывода не охватывают случая, когда среди корней
уравнения (25) нет корней с положительной вещественной частью, но
имеется по крайней мере один с нулевой вещественной частью. Тогда
в общем решении системы (24) появляются функции вида
e ist = 1

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

(25)

При этом малым ∆x 0 , ∆y 0 отвечают малые значения произвольных
постоянных C1 , C2 и поэтому все дело в поведении функции e pt при
возрастании t. Так как p может быть и мнимым, p = r + is, а тогда

e ist = cos st + i sin st,

§ 5]

и исследуйте их устойчивость.

§ 5. Построение приближенных формул для решения
Методы построения приближенных формул для решения диффе$
ренциального уравнения во многом аналогичны описанным в § I.4 ме$
тодам решения «конечных» уравнений. Мы будем для простоты
рассматривать уравнения первого порядка, хотя те же методы естес$
твенно переносятся на уравнения любого порядка и на системы
уравнений.
Начнем с метода итераций. Пусть рассматривается дифференци$
альное уравнение первого порядка с заданным начальным условием
dy
= f ( x, y ),
dx
y( x0 ) = y0 .






(27)

Если взять интегралы от обеих частей уравнения, получим
x

x

dy

∫ dx dx = y − y0 = ∫ f ( s, y( s )) ds *,

x0

x0

x

* Мы часто применяем обозначения вида

∫ ϕ(x ) dx , однако в данном случае нужно

x0

применять более аккуратную запись, различая верхний предел и переменную интегриро$
вания (ср. ВМ, § I.14).

256

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 5]

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

257

Рассмотрим, например, задачу

т.е.

y′ = x 2 + y 2 , 

y(0 ) = 1.


x

y( x ) = y0 +

∫ f ( s, y( s )) ds.

(28)

x0

Уравнение (28) равносильно сразу обоим равенствам (27), так как
после его дифференцирования получается первое равенство, а после
подстановки x = x 0 — второе. Уравнение (28) является интегральным
уравнением, так как в нем неизвестная функция стоит под знаком ин$
теграла. Поскольку оно включает в себя не только первое, но и второе
равенства (27), то оно имеет лишь единственное решение, а не беско$
нечное количество, как дифференциальное уравнение.
Вид уравнения (28) удобен для применения метода итераций (срав$
ните с уравнением (I.22)), хотя сейчас неизвестной является не число,
а функция. Выбрав некоторую функцию y 0 (x) в качестве нулевого
приближения (желательно, чтобы она была по возможности ближе
к искомому решению; если о последнем ничего не известно, то можно по$
ложить хотя бы y 0 (x) ≡ y 0 ), находим первое приближение по формуле
x

y1 ( x ) = y0 +

∫ f ( s, y0 ( s )) ds.

x0

Подставляя результат в правую часть (28), находим второе приближе$
ние и т.д.; вообще
x

yn + 1 ( x ) = y0 +

∫ f ( s, yn ( s )) ds

( n = 0, 1, 2, ... ).

x0

Подобно § I.3, если процесс итераций сходится, т.е. если последова$
тельные приближения стремятся с ростом n к некоторой предельной
функции, то она удовлетворяет уравнению (28).
Замечательно, что метод итераций для уравнения (28) сходится, во
всяком случае для всех х, достаточно близких к x 0 . Это связано с тем,
что при вычислении последующих приближений надо интегрировать
предыдущие, а при последовательном интегрировании функции в це$
лом «сглаживаются» и всякие неточности, происходящие из$за выбора
нулевого приближения, погрешностей округления и т.п., постепенно
устраняются.
(В отличие от этого при последовательном дифференцировании
функции, как правило, ухудшаются, первоначальные неточности раз$
растаются, и поэтому итерационный метод, основанный на последова$
тельном дифференцировании, не дал бы сходимости. Ср. аналогичные
соображения в § II.2.)

(29)

После интегрирования получим
x

y( x ) = 1 +

x3
+ y 2 ( s ) ds .
3 ∫0

Выберем в качестве нулевого приближения для искомого решения,
о котором мы пока ничего не знаем, функцию y 0 (x) ≡ 1, так как она
удовлетворяет хотя бы начальному условию. Тогда получим (проверь$
те!), выписывая степени до x 4 включительно,
y1 ( x ) = 1 + x +

x3
,
3
2

y2 ( x ) = 1 +

x

x3
s3
2
1
+ ∫ 1 + s +  ds = 1 + x + x 2 + x 3 + x 4 + ...,
3
3
3
6


0

4 3 5 4
x + x + ...,
3
6
4 3 7 4
2
y4 ( x ) = 1 + x + x + x + x + ...,
3
6
4 3 7 4
2
y5 ( x ) = 1 + x + x + x + x + ...
3
6
y3 ( x ) = 1 + x + x 2 +

Графики последовательных приближений показаны на рис. 95, где пун$
ктиром показано также точное решение. Мы видим, что для небольших
x процесс сходится.
Вопрос о том, на каком приближении нужно остановиться, на прак$
тике обычно решается с помощью сравнения последующих приближе$
ний с предыдущими.
Другой приближенный способ основан на том, что из данных (27)
можно с помощью дифференцирования найти значения y ′(x 0 ), y ′′(x 0 )
и т.д., после чего составить разложение решения в степенной ряд Тей$
лора (см., например, ВМ, § II.17). Необходимое количество членов
определяется с помощью их последовательного вычисления и сравне$
ния с выбранной степенью точности.
Рассмотрим, например, задачу (29). Подстановкой в правую часть
уравнения находим, что y ′(0) = 02 + 12 = 1. Если продифференциро$
вать обе части уравнения, получим y ′′ = 2x + 2yy ′ и, подставив x = 0,
найдем y ′′(0) = 2 ⋅ 0 + 2 ⋅ 1⋅ 1 = 2. Аналогично находим
y′′′ = 2 + 2 y′ 2 + 2 yy′′;

y′′′(0 ) = 8;

y IV = 6 y′y′′ + 2 yy′′′;

y IV (0 ) = 28

256

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 5]

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

257

Рассмотрим, например, задачу

т.е.

y′ = x 2 + y 2 , 

y(0 ) = 1.


x

y( x ) = y0 +

∫ f ( s, y( s )) ds.

(28)

x0

Уравнение (28) равносильно сразу обоим равенствам (27), так как
после его дифференцирования получается первое равенство, а после
подстановки x = x 0 — второе. Уравнение (28) является интегральным
уравнением, так как в нем неизвестная функция стоит под знаком ин$
теграла. Поскольку оно включает в себя не только первое, но и второе
равенства (27), то оно имеет лишь единственное решение, а не беско$
нечное количество, как дифференциальное уравнение.
Вид уравнения (28) удобен для применения метода итераций (срав$
ните с уравнением (I.22)), хотя сейчас неизвестной является не число,
а функция. Выбрав некоторую функцию y 0 (x) в качестве нулевого
приближения (желательно, чтобы она была по возможности ближе
к искомому решению; если о последнем ничего не известно, то можно по$
ложить хотя бы y 0 (x) ≡ y 0 ), находим первое приближение по формуле
x

y1 ( x ) = y0 +

∫ f ( s, y0 ( s )) ds.

x0

Подставляя результат в правую часть (28), находим второе приближе$
ние и т.д.; вообще
x

yn + 1 ( x ) = y0 +

∫ f ( s, yn ( s )) ds

( n = 0, 1, 2, ... ).

x0

Подобно § I.3, если процесс итераций сходится, т.е. если последова$
тельные приближения стремятся с ростом n к некоторой предельной
функции, то она удовлетворяет уравнению (28).
Замечательно, что метод итераций для уравнения (28) сходится, во
всяком случае для всех х, достаточно близких к x 0 . Это связано с тем,
что при вычислении последующих приближений надо интегрировать
предыдущие, а при последовательном интегрировании функции в це$
лом «сглаживаются» и всякие неточности, происходящие из$за выбора
нулевого приближения, погрешностей округления и т.п., постепенно
устраняются.
(В отличие от этого при последовательном дифференцировании
функции, как правило, ухудшаются, первоначальные неточности раз$
растаются, и поэтому итерационный метод, основанный на последова$
тельном дифференцировании, не дал бы сходимости. Ср. аналогичные
соображения в § II.2.)

(29)

После интегрирования получим
x

y( x ) = 1 +

x3
+ y 2 ( s ) ds .
3 ∫0

Выберем в качестве нулевого приближения для искомого решения,
о котором мы пока ничего не знаем, функцию y 0 (x) ≡ 1, так как она
удовлетворяет хотя бы начальному условию. Тогда получим (проверь$
те!), выписывая степени до x 4 включительно,
y1 ( x ) = 1 + x +

x3
,
3
2

y2 ( x ) = 1 +

x

x3
s3
2
1
+ ∫ 1 + s +  ds = 1 + x + x 2 + x 3 + x 4 + ...,
3
3
3
6


0

4 3 5 4
x + x + ...,
3
6
4 3 7 4
2
y4 ( x ) = 1 + x + x + x + x + ...,
3
6
4 3 7 4
2
y5 ( x ) = 1 + x + x + x + x + ...
3
6
y3 ( x ) = 1 + x + x 2 +

Графики последовательных приближений показаны на рис. 95, где пун$
ктиром показано также точное решение. Мы видим, что для небольших
x процесс сходится.
Вопрос о том, на каком приближении нужно остановиться, на прак$
тике обычно решается с помощью сравнения последующих приближе$
ний с предыдущими.
Другой приближенный способ основан на том, что из данных (27)
можно с помощью дифференцирования найти значения y ′(x 0 ), y ′′(x 0 )
и т.д., после чего составить разложение решения в степенной ряд Тей$
лора (см., например, ВМ, § II.17). Необходимое количество членов
определяется с помощью их последовательного вычисления и сравне$
ния с выбранной степенью точности.
Рассмотрим, например, задачу (29). Подстановкой в правую часть
уравнения находим, что y ′(0) = 02 + 12 = 1. Если продифференциро$
вать обе части уравнения, получим y ′′ = 2x + 2yy ′ и, подставив x = 0,
найдем y ′′(0) = 2 ⋅ 0 + 2 ⋅ 1⋅ 1 = 2. Аналогично находим
y′′′ = 2 + 2 y′ 2 + 2 yy′′;

y′′′(0 ) = 8;

y IV = 6 y′y′′ + 2 yy′′′;

y IV (0 ) = 28

258

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 5]

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

259

ность при некотором x = x 1  1. Подсчет значения x 1 (которое зави$
сит от начального значения y(0)) по методам § VIII.7 дает x 1 = 0959
, .
При x → x 1 − 0 будет x 2  y 2 , и потому y(x) ≈ 1 (x 1 − x).
С описанным методом тесно связан метод применения степенных ря$
дов с неопределенными коэффициентами. Он состоит в том, что реше$
ние уравнения ищется в форме ряда с неизвестными коэффициентами
y = a + b( x − x0 ) + c( x − x0 )2 + d ( x − x0 )3 + ... ,

которые находятся с помощью подстановки в уравнение, последующе$
го приравнивания коэффициентов при одинаковых степенях и приме$
нения начального условия, если оно задано.
Применим метод неопределенных коэффициентов к рассмотрен$
ной выше задаче (29). Так как x 0 = 0, то пишем
y = a + bx + cx 2 + dx 3 + ex 4 + ...

(31)

Подставляя x = 0, получаем в силу начального условия, что a = 1. Пе$
ред подстановкой ряда (31) в уравнение (29) удобно правую часть
этого уравнения разложить по степеням y − 1. (В общем случае произ$
водится разложение правой части в ряд Тейлора по степеням x − x 0 ,
y − y 0 согласно формуле
f ( x, y ) = f0 + ( fx′ )0 ( x − x0 ) + ( f y′ )0 ( y − y0 ) + ...,

где нулевой индекс означает подстановку значений x = x 0 , y = y 0 ).
Получим

Рис. 95.

и т.д. Подставляя это в формулу Тейлора, получим
y′(0 )
y′′(0 ) 2
4
7
y = y(0 ) +
x+
x + ... = 1 + x + x 2 + x 3 + x 4 + ...
1!
2!
3
6

y′ = x 2 + [( y − 1) + 1] = x 2 + 1 + 2( y − 1) + ( y − 1)2 .
2

(30)

Мы получили ту же формулу, что и по методу последовательных
приближений. Этой формулой можно пользоваться лишь для неболь$
ших x ; например, при x = 1 ряд (30) (как и описанный выше метод
итераций) расходится. Можно показать, что это вызвано существом рас$
сматриваемой задачи. В самом деле, рассмотрим решение y 1 (x) уравне$
dy
ния
= y 2 при начальном условии y 1 (0) = 1. Так как x 2 + y 2 > y 2 , то
dx
поле направлений в плоскости х, у, определяющее исходное решение
y(x), расположено круче, чем поле направлений, определяющее реше$
ние y 1 (x). Но y(0) = y 1 (0); значит, при x > 0 линия y = y(x) прохо$
дит выше, чем линия y = y 1 (x). Решение y 1 (x) легко найти
1
1
с помощью разделения переменных, y 1 (x) =
. Итак, y(x) >
1− x
1− x
(x > 0). При x → 1 − 0 правая часть стремится к бесконечности; значит,
решение y(x) при возрастании х от 0 также обращается в бесконеч$

Подставляя ряд (31), получаем
b + 2 cx + 3 dx 2 + 4 ex 3 + ... = 1 + x 2 + 2(bx + cx 2 + dx 3 + ex 4 + ... ) +
+ (bx + cx 2 + dx 3 + ... )2 .

Раскрывая в правой части скобки и приводя подобные члены, а затем
приравнивая коэффициенты при одинаковых степенях х, приходим
к соотношениям b = 1, 2c = 2b, 3d = 1 + 2c + b2 , 4e = 2d + 2bc, ..., откуда
4
7
последовательно находим b = 1, c = 1, d = , e = , ... Подставляя эти
3
6
значения в (31), мы вновь приходим к ряду (30).
При решении дифференциальных уравнений применяется также
метод малого параметра (см. § I.4). Приведем примеры.
Задача
y′ =

x
,
1 + 0,1xy

y(0 ) = 0

(32)

258

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 5]

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

259

ность при некотором x = x 1  1. Подсчет значения x 1 (которое зави$
сит от начального значения y(0)) по методам § VIII.7 дает x 1 = 0959
, .
При x → x 1 − 0 будет x 2  y 2 , и потому y(x) ≈ 1 (x 1 − x).
С описанным методом тесно связан метод применения степенных ря$
дов с неопределенными коэффициентами. Он состоит в том, что реше$
ние уравнения ищется в форме ряда с неизвестными коэффициентами
y = a + b( x − x0 ) + c( x − x0 )2 + d ( x − x0 )3 + ... ,

которые находятся с помощью подстановки в уравнение, последующе$
го приравнивания коэффициентов при одинаковых степенях и приме$
нения начального условия, если оно задано.
Применим метод неопределенных коэффициентов к рассмотрен$
ной выше задаче (29). Так как x 0 = 0, то пишем
y = a + bx + cx 2 + dx 3 + ex 4 + ...

(31)

Подставляя x = 0, получаем в силу начального условия, что a = 1. Пе$
ред подстановкой ряда (31) в уравнение (29) удобно правую часть
этого уравнения разложить по степеням y − 1. (В общем случае произ$
водится разложение правой части в ряд Тейлора по степеням x − x 0 ,
y − y 0 согласно формуле
f ( x, y ) = f0 + ( fx′ )0 ( x − x0 ) + ( f y′ )0 ( y − y0 ) + ...,

где нулевой индекс означает подстановку значений x = x 0 , y = y 0 ).
Получим

Рис. 95.

и т.д. Подставляя это в формулу Тейлора, получим
y′(0 )
y′′(0 ) 2
4
7
y = y(0 ) +
x+
x + ... = 1 + x + x 2 + x 3 + x 4 + ...
1!
2!
3
6

y′ = x 2 + [( y − 1) + 1] = x 2 + 1 + 2( y − 1) + ( y − 1)2 .
2

(30)

Мы получили ту же формулу, что и по методу последовательных
приближений. Этой формулой можно пользоваться лишь для неболь$
ших x ; например, при x = 1 ряд (30) (как и описанный выше метод
итераций) расходится. Можно показать, что это вызвано существом рас$
сматриваемой задачи. В самом деле, рассмотрим решение y 1 (x) уравне$
dy
ния
= y 2 при начальном условии y 1 (0) = 1. Так как x 2 + y 2 > y 2 , то
dx
поле направлений в плоскости х, у, определяющее исходное решение
y(x), расположено круче, чем поле направлений, определяющее реше$
ние y 1 (x). Но y(0) = y 1 (0); значит, при x > 0 линия y = y(x) прохо$
дит выше, чем линия y = y 1 (x). Решение y 1 (x) легко найти
1
1
с помощью разделения переменных, y 1 (x) =
. Итак, y(x) >
1− x
1− x
(x > 0). При x → 1 − 0 правая часть стремится к бесконечности; значит,
решение y(x) при возрастании х от 0 также обращается в бесконеч$

Подставляя ряд (31), получаем
b + 2 cx + 3 dx 2 + 4 ex 3 + ... = 1 + x 2 + 2(bx + cx 2 + dx 3 + ex 4 + ... ) +
+ (bx + cx 2 + dx 3 + ... )2 .

Раскрывая в правой части скобки и приводя подобные члены, а затем
приравнивая коэффициенты при одинаковых степенях х, приходим
к соотношениям b = 1, 2c = 2b, 3d = 1 + 2c + b2 , 4e = 2d + 2bc, ..., откуда
4
7
последовательно находим b = 1, c = 1, d = , e = , ... Подставляя эти
3
6
значения в (31), мы вновь приходим к ряду (30).
При решении дифференциальных уравнений применяется также
метод малого параметра (см. § I.4). Приведем примеры.
Задача
y′ =

x
,
1 + 0,1xy

y(0 ) = 0

(32)

260

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

не содержит параметров. Однако можно рассмотреть более общую задачу
y′ =

x
,
1 + αxy

y(0 ) = 0,

Рассмотрим в качестве другого примера задачу
y′ = sin( xy ),

y(0 ) = α.

(37)

В отличие от предыдущего примера здесь параметр входит в начальное
условие. При α = 0 задача (37) имеет решение y ≡ 0. Поэтому при маD
лых α ищем решение в форме
y = αu + α 2 v + α 3 w + ...

(u = u( x ), v = v( x ), ...).

(38)

Подстановка значения x = 0 дает

(34)

u(0 ) = 1,

v(0 ) = 0,

w(0 ) = 0.

(39)

С другой стороны, подставив (38) в дифференциальное уравнение
(37), получим, с учетом ряда Тейлора для синуса,

где u = u(x), v = v(x) и т.д. — пока неизвестные функции х.
Подстановка (34) в (33) дает после умножения на знаменатель
α


( x + αu′ + α 2 v′ + α 3 w′ + ... )⎜1 + x 3 + α 2 xu + α 3 xv + ...⎟ = x;


2

261

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

(33)

из которой (32) получается при α = 01
, . Задача (33) легко решается при
x2
. Поэтому ищем решение разложенным
α = 0: тогда получается y =
2
в ряд по степеням α, т.е.
x2
y=
+ αu + α 2 v + α 3 w + ...,
2

§ 5]

(35)

au′ + α 2 v′ + α 3 w′ + ... =
=

αu(0 ) + α 2 v(0 ) + ... = 0,

(αxu + α 2 xv + α 3 xw + ... ) (αxu + α 2 xv + α 3 xw + ... )3

+ ...
1!
3!

Приравнивание коэффициентов при одинаковых степенях α дает

т.е.
u(0 ) = 0,

v(0 ) = 0,

w(0 ) = 0, ...

(36)

Раскрывая скобки в (35) и приравнивая нулю коэффициенты при стеD
пенях α, получим последовательно
u′ +

1 4
x = 0,
2

v′ +

x3
u′ + x 2 u = 0,
2

w′ +

x3
v′ + xuu′ + x 2 v = 0 и т.д.,
2

откуда с учетом равенств (36) найдем (проверьте!)
u=−

x5
,
10

v=

7 8
x ,
160

w=

71 11
x и т.д.
1760

Поэтому формула (34) дает
y=

x 2 α 5 7α 2 8 71α 3 11
− x +
x −
x + ...
2 10
160
1760

В частности, для уравнения (32) получим
y=

7x 8
71x11
x2 x5

+

+ ...
2 100 16 000 1 760 000

Этот ряд прекрасно сходится при x J 1 и неплохо — при 1 < x < 15
, *.
* Замена s = −αxy , v(s) = −αx 3 , которую мы предоставляем читателю, переводит (33)
в уравнение, не содержащее параметра. При s = 1 происходит катастрофа: dy dx = ∞.
Численное интегрирование по методам § VIII. 7 показывает, что v(1) = 1087
, , Поэтому ряд
(34) не может сходиться при x > 3 1087
,
α ; при α = 01
, правая часть равна 2,16.

u′ = xu,

v′ = xv,

w′ = xw −

x 3 u3
, ...
3!

Интегрируя эти уже линейные уравнения с учетом начальных услоD
вий (39), найдем (проверьте!)
x2

u=e 2 ,

3

v = 0,

w=

x2

x2
1
1
(1 − x 2 ) e 2 − e 2.
12
12

Подстановка этих выражений в (38) дает разложение искомого решеD
ния, пригодное для небольших α . При этом, чем больше x , тем больD
ше коэффициенты и потому тем меньше интервал значений α, при
которых ряд применим.
В более сложных случаях при применении метода малого параметра
часто бывает полезно найти хотя бы первый содержащий параметр
член разложения, так как он дает представление о поведении решения
при небольшом изменении этого параметра.
Подчеркнем в заключение, что на практике, особенно при грубых,
прикидочных расчетах, широко применяется упрощение самого исходD
ного уравнения путем отбрасывания сравнительно малых членов, заD
мены медленно меняющихся коэффициентов на постоянные и т.п.
После такого упрощения может получиться уравнение одного из инD
тегрируемых типов и, интегрируя, мы получим функцию, которая моD
жет считаться приближенным решением исходного, полного уравнеD
ния; во всяком случае, она часто правильно передает характер поведения
точного решения. Найдя это «нулевое приближение», иногда удается

260

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

не содержит параметров. Однако можно рассмотреть более общую задачу
y′ =

x
,
1 + αxy

y(0 ) = 0,

Рассмотрим в качестве другого примера задачу
y′ = sin( xy ),

y(0 ) = α.

(37)

В отличие от предыдущего примера здесь параметр входит в начальное
условие. При α = 0 задача (37) имеет решение y ≡ 0. Поэтому при маD
лых α ищем решение в форме
y = αu + α 2 v + α 3 w + ...

(u = u( x ), v = v( x ), ...).

(38)

Подстановка значения x = 0 дает

(34)

u(0 ) = 1,

v(0 ) = 0,

w(0 ) = 0.

(39)

С другой стороны, подставив (38) в дифференциальное уравнение
(37), получим, с учетом ряда Тейлора для синуса,

где u = u(x), v = v(x) и т.д. — пока неизвестные функции х.
Подстановка (34) в (33) дает после умножения на знаменатель
α


( x + αu′ + α 2 v′ + α 3 w′ + ... )⎜1 + x 3 + α 2 xu + α 3 xv + ...⎟ = x;


2

261

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

(33)

из которой (32) получается при α = 01
, . Задача (33) легко решается при
x2
. Поэтому ищем решение разложенным
α = 0: тогда получается y =
2
в ряд по степеням α, т.е.
x2
y=
+ αu + α 2 v + α 3 w + ...,
2

§ 5]

(35)

au′ + α 2 v′ + α 3 w′ + ... =
=

αu(0 ) + α 2 v(0 ) + ... = 0,

(αxu + α 2 xv + α 3 xw + ... ) (αxu + α 2 xv + α 3 xw + ... )3

+ ...
1!
3!

Приравнивание коэффициентов при одинаковых степенях α дает

т.е.
u(0 ) = 0,

v(0 ) = 0,

w(0 ) = 0, ...

(36)

Раскрывая скобки в (35) и приравнивая нулю коэффициенты при стеD
пенях α, получим последовательно
u′ +

1 4
x = 0,
2

v′ +

x3
u′ + x 2 u = 0,
2

w′ +

x3
v′ + xuu′ + x 2 v = 0 и т.д.,
2

откуда с учетом равенств (36) найдем (проверьте!)
u=−

x5
,
10

v=

7 8
x ,
160

w=

71 11
x и т.д.
1760

Поэтому формула (34) дает
y=

x 2 α 5 7α 2 8 71α 3 11
− x +
x −
x + ...
2 10
160
1760

В частности, для уравнения (32) получим
y=

7x 8
71x11
x2 x5

+

+ ...
2 100 16 000 1 760 000

Этот ряд прекрасно сходится при x J 1 и неплохо — при 1 < x < 15
, *.
* Замена s = −αxy , v(s) = −αx 3 , которую мы предоставляем читателю, переводит (33)
в уравнение, не содержащее параметра. При s = 1 происходит катастрофа: dy dx = ∞.
Численное интегрирование по методам § VIII. 7 показывает, что v(1) = 1087
, , Поэтому ряд
(34) не может сходиться при x > 3 1087
,
α ; при α = 01
, правая часть равна 2,16.

u′ = xu,

v′ = xv,

w′ = xw −

x 3 u3
, ...
3!

Интегрируя эти уже линейные уравнения с учетом начальных услоD
вий (39), найдем (проверьте!)
x2

u=e 2 ,

3

v = 0,

w=

x2

x2
1
1
(1 − x 2 ) e 2 − e 2 .
12
12

Подстановка этих выражений в (38) дает разложение искомого решеD
ния, пригодное для небольших α . При этом, чем больше x , тем больD
ше коэффициенты и потому тем меньше интервал значений α, при
которых ряд применим.
В более сложных случаях при применении метода малого параметра
часто бывает полезно найти хотя бы первый содержащий параметр
член разложения, так как он дает представление о поведении решения
при небольшом изменении этого параметра.
Подчеркнем в заключение, что на практике, особенно при грубых,
прикидочных расчетах, широко применяется упрощение самого исходD
ного уравнения путем отбрасывания сравнительно малых членов, заD
мены медленно меняющихся коэффициентов на постоянные и т.п.
После такого упрощения может получиться уравнение одного из инD
тегрируемых типов и, интегрируя, мы получим функцию, которая моD
жет считаться приближенным решением исходного, полного уравнеD
ния; во всяком случае, она часто правильно передает характер поведения
точного решения. Найдя это «нулевое приближение», иногда удается

262

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

с его помощью внести поправки, учитывающие упрощение, и тем саD
мым найти «первое приближение» и т.д.
Если уравнение содержит параметры (например, массы, линейные
размеры исследуемых объектов и т.п.), то нужно иметь в виду, что при
одних значениях этих параметров относительно малыми могут быть
одни члены уравнения, а при других значениях — другие, так что упроD
щение будет при разных значениях параметров производиться поDразD
ному. Кроме того, иногда приходится разбивать интервал изменения
независимой переменной на части, на каждой из которых упрощение
проводится поDсвоему.
Особенно полезно такое упрощение уравнения в случаях, когда при
самом выводе (написании) дифференциального уравнения делались
существенные, упрощающие предположения или когда точность, с коD
торой известны рассматриваемые величины, невелика. Например, члеD
ны уравнения, меньшие допускаемой погрешности в других его членах,
надо безусловно отбросить.
Рассмотрим, например, задачу
1
y′′ +
y + 0,2 y 3 = 0,
1 + 0,1x

y(0 ) = 1,

y′(0 ) = 0,

0  x 2.

(40)

Так как коэффициент при у меняется медленно, то заменим его на его
среднее значение
1
= k;
1 + 0,1x

x = 0, k = 1;

x = 2, k =

1
= 0,83;
12
,

k=

1 + 0,83
= 0,92.
2

263

Разница по сравнению с нулевым приближением (41) невелика, так
что вывод в значении отдельных слагаемых в уравнении (40) остается
в силе; в то же время третий член уравнения (40) внес свой вклад в реD
шение. (Для учета непостоянства коэффициента k можно было бы
−1
второй член в уравнении (40) заменить на [11
, + 01
, (x − 1)] y =
1
−1
, (x − 1)] y ≈ 091
, y − 008
, (x − 1)cos 096
, x; однако и это не приD
= [1 + 091
,
11
вело бы к существенной замене решения.)
Подобные рассуждения зачастую не блещут строгостью (и иногда
приводят к ошибкам), однако если они проводятся в соответствии со
здравым смыслом, то все же, и притом довольно часто, дают решение,
которым можно пользоваться на практике.
Упражнения
1. Примените метод последовательных приближений к задаче

dy
= y,
dx

y(0 ) = 1.
2. С помощью вычисления производных найдите разложение по степеням
dy
х решения задачи
= e xy , y(0 ) = 0 с точностью до x 5 .
dx
dy
3. Найдите первые два члена разложения решения задачи
= y 2 + αx ,
dx
y(0 ) = 1 в ряд по степеням α.

Рассмотрим еще один важный метод приближенного решения дифD
ференциальных уравнений на примере линейного уравнения

y′′ + 0,92 y = 0

x&& + ω 2 x = 0,

с решением при данных начальных условиях
(41)

Вид этого приближенного решения подтверждает правомерность отD
брасывания последнего слагаемого в уравнении, так как отношение
третьего члена ко второму получается порядка 02
, y 2 < 02
, и потому
сумма первых двух членов мала по сравнению со вторым, т.е. первый
член должен с ним «почти взаимно уничтожиться».
Внесем поправку на последнее слагаемое, для чего подставим в него
приближенное решение (41), оставив коэффициент осредненным:
y′′ + 0,92 y = −0,2 cos3 0,96 x.

Интегрирование этого уравнения по методу § VII.5 дает при заданных
начальных условиях
y = 099
, cos 096
, x − 008
, x sin 096
, x + 001
, cos 2,88x.

АДИАБАТИЧЕСКОЕ ИЗМЕНЕНИЕ РЕШЕНИЯ

§ 6. Адиабатическое изменение решения

Кроме того, сравнительно малое третье слагаемое отбросим.
Получим уравнение

y = cos 0,96 x.

§ 6]

( x = x( t ),

ω = ω( t )),

(42)

где точкой сверху обозначается производная по времени t, а зависиD
мость ω(t) задана. Это уравнение колебаний осциллятора, параметры
которого с течением времени меняются; например, это может быть маD
ятник, у которого меняется длина подвеса, и т.п.
В общем случае уравнение (42) не интегрируется в квадратурах,
и исследование его довольно сложно. Однако в важном частном случае,
именно, когда коэффициент ω(t) > 0 меняется медленно, такое исслеD
дование можно провести. При этом понятие медленного изменения
уточняется следующим образом. Пусть сначала ω = const; тогда
в § VII.3 мы видели, что ω служит частотой свободных колебаний
осциллятора, а потому у нас имеется естественная мера времени, равD

этих колебаний. Примем, что какаяDлибо величина
ная периоду
ω

262

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

с его помощью внести поправки, учитывающие упрощение, и тем саD
мым найти «первое приближение» и т.д.
Если уравнение содержит параметры (например, массы, линейные
размеры исследуемых объектов и т.п.), то нужно иметь в виду, что при
одних значениях этих параметров относительно малыми могут быть
одни члены уравнения, а при других значениях — другие, так что упроD
щение будет при разных значениях параметров производиться поDразD
ному. Кроме того, иногда приходится разбивать интервал изменения
независимой переменной на части, на каждой из которых упрощение
проводится поDсвоему.
Особенно полезно такое упрощение уравнения в случаях, когда при
самом выводе (написании) дифференциального уравнения делались
существенные, упрощающие предположения или когда точность, с коD
торой известны рассматриваемые величины, невелика. Например, члеD
ны уравнения, меньшие допускаемой погрешности в других его членах,
надо безусловно отбросить.
Рассмотрим, например, задачу
1
y′′ +
y + 0,2 y 3 = 0,
1 + 0,1x

y(0 ) = 1,

y′(0 ) = 0,

0  x 2.

(40)

Так как коэффициент при у меняется медленно, то заменим его на его
среднее значение
1
= k;
1 + 0,1x

x = 0, k = 1;

x = 2, k =

1
= 0,83;
12
,

k=

1 + 0,83
= 0,92.
2

263

Разница по сравнению с нулевым приближением (41) невелика, так
что вывод в значении отдельных слагаемых в уравнении (40) остается
в силе; в то же время третий член уравнения (40) внес свой вклад в реD
шение. (Для учета непостоянства коэффициента k можно было бы
−1
второй член в уравнении (40) заменить на [11
, + 01
, (x − 1)] y =
1
−1
, (x − 1)] y ≈ 091
, y − 008
, (x − 1)cos 096
, x; однако и это не приD
= [1 + 091
,
11
вело бы к существенной замене решения.)
Подобные рассуждения зачастую не блещут строгостью (и иногда
приводят к ошибкам), однако если они проводятся в соответствии со
здравым смыслом, то все же, и притом довольно часто, дают решение,
которым можно пользоваться на практике.
Упражнения
1. Примените метод последовательных приближений к задаче

dy
= y,
dx

y(0 ) = 1.
2. С помощью вычисления производных найдите разложение по степеням
dy
х решения задачи
= e xy , y(0 ) = 0 с точностью до x 5 .
dx
dy
3. Найдите первые два члена разложения решения задачи
= y 2 + αx ,
dx
y(0 ) = 1 в ряд по степеням α.

Рассмотрим еще один важный метод приближенного решения дифD
ференциальных уравнений на примере линейного уравнения

y′′ + 0,92 y = 0

x&& + ω 2 x = 0,

с решением при данных начальных условиях
(41)

Вид этого приближенного решения подтверждает правомерность отD
брасывания последнего слагаемого в уравнении, так как отношение
третьего члена ко второму получается порядка 02
, y 2 < 02
, и потому
сумма первых двух членов мала по сравнению со вторым, т.е. первый
член должен с ним «почти взаимно уничтожиться».
Внесем поправку на последнее слагаемое, для чего подставим в него
приближенное решение (41), оставив коэффициент осредненным:
y′′ + 0,92 y = −0,2 cos3 0,96 x.

Интегрирование этого уравнения по методу § VII.5 дает при заданных
начальных условиях
y = 099
, cos 096
, x − 008
, x sin 096
, x + 001
, cos 2,88x.

АДИАБАТИЧЕСКОЕ ИЗМЕНЕНИЕ РЕШЕНИЯ

§ 6. Адиабатическое изменение решения

Кроме того, сравнительно малое третье слагаемое отбросим.
Получим уравнение

y = cos 0,96 x.

§ 6]

( x = x( t ),

ω = ω( t )),

(42)

где точкой сверху обозначается производная по времени t, а зависиD
мость ω(t) задана. Это уравнение колебаний осциллятора, параметры
которого с течением времени меняются; например, это может быть маD
ятник, у которого меняется длина подвеса, и т.п.
В общем случае уравнение (42) не интегрируется в квадратурах,
и исследование его довольно сложно. Однако в важном частном случае,
именно, когда коэффициент ω(t) > 0 меняется медленно, такое исслеD
дование можно провести. При этом понятие медленного изменения
уточняется следующим образом. Пусть сначала ω = const; тогда
в § VII.3 мы видели, что ω служит частотой свободных колебаний
осциллятора, а потому у нас имеется естественная мера времени, равD

этих колебаний. Примем, что какаяDлибо величина
ная периоду
ω

264

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

p(t) меняется медленно, говорят также — адиабатически, если ее отно$
сительное изменение за этот период мало´, т.е. если
p


 p
ω

или , что то же,

p  ω p .

Этим определением мы будем пользоваться и для случая ω = ω(t); ади$
абатичность изменения ω означает, что ω
  ω2 .
Если ω = const, то общее решение уравнения (42) можно записать в
виде
x = C1 cos ωt + C2 sin ωt = A sin(ωt + ϕ 0 ),

x = A sinϕ,

(43)


= ω.
dt

(44)

где ϕ = ωt + ϕ 0 , и потому

Если теперь ω зависит от t, но меняется медленно, то естественно
считать, что в каждый небольшой промежуток времени колебания
осциллятора являются почти гармоническими с частотой, равной теку$
щему значению ω, и принять, что решение уравнения (42) все равно
имеет вид (43) при условии (44), где, однако, уже A = A(t), ω = ω(t). Из
t

(44) получаем, что ϕ = ∫ ω(t) dt , причем постоянный нижний предел
этого интеграла несуществен.
Пусть не только ω, но и ω
 меняются медленно; тогда естественно
принять, что A и A также меняются медленно. Из (43) получаем
x = A sin ϕ + A cos ϕ ⋅ ω,
 sin ϕ + 2A cos ϕ ⋅ ω − A sin ϕ ⋅ ω2 + A cos ϕ ⋅ ω ,
x = A

и подстановка в (42) дает
(45)

Так как по предположению первый член имеет высший порядок ма$
лости по сравнению со вторым, то второй и третий члены должны вза$
имно уничтожаться. После сокращения на cosϕ получаем
2A ω + Aω = 0,

т.е. 2

dA

ω+ A
= 0,
dt
dt

2

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

dA dω
+
=0
A ω

и после интегрирования находим, что 2ln A + ln ω = lnC , A 2 ω = C . Итак,
мы видим, что в наших предположениях амплитуда колебаний меняется

265

обратно пропорционально корню квадратному из текущего значения
собственной частоты.
Конечно, так как мы в уравнении (45) пренебрегли членом высшего
порядка малости, то и выражение A 2 ω на самом деле не постоянно.
Оно меняется с течением времени, но относительная скорость его из$
менения имеет высший порядок малости по сравнению с относитель$
ной скоростью изменения собственной частоты. Как говорят, величина
A 2 ω является адиабатическим инвариантом.
К аналогичному результату можно прийти из энергетических сооб$
ражений. Энергия осциллятора равна (см. формулу (5))
E=

где A и ϕ 0 — произвольные постоянные. Короче,

 sin ϕ + 2A cos ϕ ⋅ ω + A sin ϕ ⋅ ω = 0.
A

§ 5]

mv2 kx 2 m 2
+
= (x + ω2 x 2 ),
2
2
2

откуда, дифференцируя и пользуясь уравнением (42), получаем при
m = const
m
E = (2xx
 + 2ωω x 2 + 2ω2 xx) = mωω x 2 .
2

(46)

Если ω и ω
 изменяются медленно, то коэффициенты при x 2 в пра$

вых частях на текущем периоде, т.е. на временнo´м интервале длины
ω
являются почти постоянными, и можно произвести осреднение по это$
1 1
му интервалу. Учитывая формулу sin 2 (ωt + ϕ 0 ) = − cos 2(ωt + ϕ 0 ),
2 2
1 2
1 2 2
2
2
получаем, что x = A и аналогично x = ω A . Поэтому после
2
2
осреднения мы получаем
1
E = mω2 A2 ,
2

1
E = mωω A2
2

(47)

(так как E меняется медленно, мы заменили E снова на E). Отсюда
E ω

= , ln E = ln ω + lnC1 , E = C1 ω, т.е. энергия осциллятора прямо про$
E ω
порциональна мгновенному значению его собственной частоты. Подстав$
1
ляя этот результат в первое равенство (47), получаем C1 ω = mω 2 A 2 , т.е.
2
2C1
2
= const, как и выше.
ωA =
m
Интересно, что полученную пропорциональность E  ω легко по$
нять с позиций квантовой механики. Дело в том, что энергия одного
г ⋅ см
кванта равна 2πћω, где ћ ≈ 10 −27
— постоянная Планка; энергия
сек 2
осциллятора, находящегося на n$м уровне (n = 1, 2, 3, ...), равна 2πћωn.

264

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

p(t) меняется медленно, говорят также — адиабатически, если ее отно$
сительное изменение за этот период мало´, т.е. если
p


 p
ω

или , что то же,

p  ω p .

Этим определением мы будем пользоваться и для случая ω = ω(t); ади$
абатичность изменения ω означает, что ω
  ω2 .
Если ω = const, то общее решение уравнения (42) можно записать в
виде
x = C1 cos ωt + C2 sin ωt = A sin(ωt + ϕ 0 ),

x = A sinϕ,

(43)


= ω.
dt

(44)

где ϕ = ωt + ϕ 0 , и потому

Если теперь ω зависит от t, но меняется медленно, то естественно
считать, что в каждый небольшой промежуток времени колебания
осциллятора являются почти гармоническими с частотой, равной теку$
щему значению ω, и принять, что решение уравнения (42) все равно
имеет вид (43) при условии (44), где, однако, уже A = A(t), ω = ω(t). Из
t

(44) получаем, что ϕ = ∫ ω(t) dt , причем постоянный нижний предел
этого интеграла несуществен.
Пусть не только ω, но и ω
 меняются медленно; тогда естественно
принять, что A и A также меняются медленно. Из (43) получаем
x = A sin ϕ + A cos ϕ ⋅ ω,
 sin ϕ + 2A cos ϕ ⋅ ω − A sin ϕ ⋅ ω2 + A cos ϕ ⋅ ω ,
x = A

и подстановка в (42) дает
(45)

Так как по предположению первый член имеет высший порядок ма$
лости по сравнению со вторым, то второй и третий члены должны вза$
имно уничтожаться. После сокращения на cosϕ получаем
2A ω + Aω = 0,

т.е. 2

dA

ω+ A
= 0,
dt
dt

2

ПОСТРОЕНИЕ ПРИБЛИЖЕННЫХ ФОРМУЛ ДЛЯ РЕШЕНИЯ

dA dω
+
=0
A ω

и после интегрирования находим, что 2ln A + ln ω = lnC , A 2 ω = C . Итак,
мы видим, что в наших предположениях амплитуда колебаний меняется

265

обратно пропорционально корню квадратному из текущего значения
собственной частоты.
Конечно, так как мы в уравнении (45) пренебрегли членом высшего
порядка малости, то и выражение A 2 ω на самом деле не постоянно.
Оно меняется с течением времени, но относительная скорость его из$
менения имеет высший порядок малости по сравнению с относитель$
ной скоростью изменения собственной частоты. Как говорят, величина
A 2 ω является адиабатическим инвариантом.
К аналогичному результату можно прийти из энергетических сооб$
ражений. Энергия осциллятора равна (см. формулу (5))
E=

где A и ϕ 0 — произвольные постоянные. Короче,

 sin ϕ + 2A cos ϕ ⋅ ω + A sin ϕ ⋅ ω = 0.
A

§ 5]

mv2 kx 2 m 2
+
= (x + ω2 x 2 ),
2
2
2

откуда, дифференцируя и пользуясь уравнением (42), получаем при
m = const
m
E = (2xx
 + 2ωω x 2 + 2ω2 xx) = mωω x 2 .
2

(46)

Если ω и ω
 изменяются медленно, то коэффициенты при x 2 в пра$

вых частях на текущем периоде, т.е. на временнo´м интервале длины
ω
являются почти постоянными, и можно произвести осреднение по это$
1 1
му интервалу. Учитывая формулу sin 2 (ωt + ϕ 0 ) = − cos 2(ωt + ϕ 0 ),
2 2
1 2
1 2 2
2
2
получаем, что x = A и аналогично x = ω A . Поэтому после
2
2
осреднения мы получаем
1
E = mω2 A2 ,
2

1
E = mωω A2
2

(47)

(так как E меняется медленно, мы заменили E снова на E). Отсюда
E ω

= , ln E = ln ω + lnC1 , E = C1 ω, т.е. энергия осциллятора прямо про$
E ω
порциональна мгновенному значению его собственной частоты. Подстав$
1
ляя этот результат в первое равенство (47), получаем C1 ω = mω 2 A 2 , т.е.
2
2C1
2
= const, как и выше.
ωA =
m
Интересно, что полученную пропорциональность E  ω легко по$
нять с позиций квантовой механики. Дело в том, что энергия одного
г ⋅ см
кванта равна 2πћω, где ћ ≈ 10 −27
— постоянная Планка; энергия
сек 2
осциллятора, находящегося на n$м уровне (n = 1, 2, 3, ...), равна 2πћωn.

266

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Если частота ω меняется медленно, то осциллятор остается все время
на одном и том же уровне, т.е. n = const, откуда и вытекает пропорцио*
нальность E ω. (См. по этому поводу заметку П. Парадоксова «Как
квантовая механика помогает понять выводы классической механи*
ки», Успехи физ. наук, 89, № 4 (1966), стр. 707–709.)
Рассмотрим теперь другой важный частный случай, когда медленно
& на примере уравнения (42) c ω = ω 0 + α sin kt, где
меняется ω, но не ω,
α  ω 0 , а постоянная k имеет тот же порядок, что и ω 0 . В этом слу*
чае при осреднении правой части (46) надо ее предварительно преобра*
зовать по формуле
⎡1 1
⎤ 1
mω 0αk coskt ⋅ A 2 ⎢ − cos2(ω 0 t + ϕ 0 )⎥ = mω 0αk A 2 coskt −
⎣2 2
⎦ 2
1
1
− mω 0αk A 2 cos [(2ω 0 + k )t + 2ϕ 0 ] − mω 0αk A 2 cos [(2ω 0 − k )t + 2ϕ 0 ].
4
4

Теперь может быть два случая. Если k ≠ 2ω 0 , то среднее значение пра*
вой части как среднее значение от суммы чистых гармоник равно нулю,
т.е. E& = 0, E представляет собой адиабатический инвариант. Если же
k = 2ω 0 , то последнее слагаемое в правой части превращается в констан*
1
ту, откуда после осреднения получаем E& = − mω 0 α2ω 0 A2 cos(2ϕ 0 ) =
4
= −α cos(2ϕ 0 )E, т.е. E = Ce − α cos( 2ϕ 0 )⋅ t .
Итак в рассматриваемом случае энергия осциллятора, а с ней и ам*
плитуда колебаний являются экспоненциально возрастающими или за*
тухающими во времени, в зависимости от знака cos2ϕ 0 . Это явление,
аналогичное резонансу (п. VII.5) и проистекающее из*за периодическо*
го изменения параметров осциллятора, называется параметрическим
резонансом (и между прочим, используется при раскачивании качелей).
§ 7. Численное решение дифференциальных уравнений
Часто бывает, что ни точного, ни достаточно удовлетворительного
приближенного решения в виде формулы построить нельзя. Тогда при*
меняется численное решение, при котором искомое частное решение
(при конкретных значениях параметров, если они входят в постановку
задачи) строится в табличном виде. Принцип численного решения
дифференциального уравнения чрезвычайно прост и прямо вытекает
из смысла производной.
dy
Пусть уравнение имеет вид
= f (x, y) и дано начальное условиe
dx
y = y 0 при x = x 0 . Тогда, подставляя значения x 0 , y 0 в функцию
f (x, y), мы найдем величину производной в точке x 0 :
dy
dx

x =x0

= f ( x0 , y0 ).

§ 7]

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

267

Отсюда, считая, что Δx — малая величина, получаем
y( x0 + Δx ) = y( x1 ) = y1 = y0 + Δy = y0 +

dy
dx

x =x0

⋅ Δx = y0 + f ( x0 , y0 ) ⋅ Δx.

Полагая для краткости записи f (x 0 , y 0 ) = f 0 , записываем этот ре*
зультат так:
y1 = y0 + f0 ⋅ Δx.

(48)

Теперь, принимая точку (x 1 ; y 1 ) за исходную, можно точно таким
же методом получить y 2 = y(x 2 ), где x 2 = x 1 + Δx. Таким образом, шаг
за шагом, можно вычислять значения решения у для различных зна*
чений х. Это — метод Эйлера.
Пользуясь таким методом, мы получаем, конечно, не точные, а при*
dy
не
ближенные значения у. Действительно, ведь производная
dx
останется постоянной на промежутке от x = x 0 до x = x 1 . Поэтому,
пользуясь формулой (48), мы допускаем ошибку в определении у,
притом тем большую, чем больше Δx.
Более точно, так как правая часть (48) представляет собой сумму
двух первых членов разложения y(x 0 + Δx) по степеням Δx, то ошиб*
ка формулы (48) имеет порядок (Δx)2 , т.е. не превосходит a(Δx)2 , где
коэффициент а зависит от вида функцииf (x, y).
Пусть необходимо, зная начальное условие y(x 0 ) = y 0 , получить
значение решения при x = x 0 + l , причем l велико, так что при пользо*
вании формулой (48), полагая в ней Δx = l , мы допустим огромную
ошибку. Чтобы отыскать y(x 0 + l ), разобьем промежуток от x = x 0 до
x = x 0 + l на n равных малых промежутков, тогда длина каждого из
l
них есть Δx = . Для получения y(x 0 + l ) нам придется сделать n
n
l
l
шагов, последовательно получая y(x 0 + ), y(x 0 + 2 ), . . . , y(x 0 + l ).
n
n
2
⎛l⎞
На каждом таком шаге ошибка порядка a ⎜ ⎟ , а на всех n шагах
⎝ n⎠
2

al 2
⎛l⎞
ошибка порядка a ⎜ ⎟ n =
. Следовательно, ошибка, возникающая
⎝ n⎠
n
при применении способа Эйлера, обратно пропорциональна числу ша*
гов. Если задана точность ε, то необходимое число шагов n есть вели*
al 2
. Ясно, что чем больше шагов, тем меньше ошибка,
чина порядка
ε
тем точнее найдем мы величину y(x 0 + l ). Однако ошибка убывает
очень медленно при увеличении числа шагов. Поэтому для достижения
заданной точности иногда необходимо очень много шагов.

266

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Если частота ω меняется медленно, то осциллятор остается все время
на одном и том же уровне, т.е. n = const, откуда и вытекает пропорцио*
нальность E ω. (См. по этому поводу заметку П. Парадоксова «Как
квантовая механика помогает понять выводы классической механи*
ки», Успехи физ. наук, 89, № 4 (1966), стр. 707–709.)
Рассмотрим теперь другой важный частный случай, когда медленно
& на примере уравнения (42) c ω = ω 0 + α sin kt, где
меняется ω, но не ω,
α  ω 0 , а постоянная k имеет тот же порядок, что и ω 0 . В этом слу*
чае при осреднении правой части (46) надо ее предварительно преобра*
зовать по формуле
⎡1 1
⎤ 1
mω 0αk coskt ⋅ A 2 ⎢ − cos2(ω 0 t + ϕ 0 )⎥ = mω 0αk A 2 coskt −
⎣2 2
⎦ 2
1
1
− mω 0αk A 2 cos [(2ω 0 + k )t + 2ϕ 0 ] − mω 0αk A 2 cos [(2ω 0 − k )t + 2ϕ 0 ].
4
4

Теперь может быть два случая. Если k ≠ 2ω 0 , то среднее значение пра*
вой части как среднее значение от суммы чистых гармоник равно нулю,
т.е. E& = 0, E представляет собой адиабатический инвариант. Если же
k = 2ω 0 , то последнее слагаемое в правой части превращается в констан*
1
ту, откуда после осреднения получаем E& = − mω 0 α2ω 0 A2 cos(2ϕ 0 ) =
4
= −α cos(2ϕ 0 )E, т.е. E = Ce − α cos( 2ϕ 0 )⋅ t .
Итак в рассматриваемом случае энергия осциллятора, а с ней и ам*
плитуда колебаний являются экспоненциально возрастающими или за*
тухающими во времени, в зависимости от знака cos2ϕ 0 . Это явление,
аналогичное резонансу (п. VII.5) и проистекающее из*за периодическо*
го изменения параметров осциллятора, называется параметрическим
резонансом (и между прочим, используется при раскачивании качелей).
§ 7. Численное решение дифференциальных уравнений
Часто бывает, что ни точного, ни достаточно удовлетворительного
приближенного решения в виде формулы построить нельзя. Тогда при*
меняется численное решение, при котором искомое частное решение
(при конкретных значениях параметров, если они входят в постановку
задачи) строится в табличном виде. Принцип численного решения
дифференциального уравнения чрезвычайно прост и прямо вытекает
из смысла производной.
dy
Пусть уравнение имеет вид
= f (x, y) и дано начальное условиe
dx
y = y 0 при x = x 0 . Тогда, подставляя значения x 0 , y 0 в функцию
f (x, y), мы найдем величину производной в точке x 0 :
dy
dx

x =x0

= f ( x0 , y0 ).

§ 7]

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

267

Отсюда, считая, что Δx — малая величина, получаем
y( x0 + Δx ) = y( x1 ) = y1 = y0 + Δy = y0 +

dy
dx

x =x0

⋅ Δx = y0 + f ( x0 , y0 ) ⋅ Δx.

Полагая для краткости записи f (x 0 , y 0 ) = f 0 , записываем этот ре*
зультат так:
y1 = y0 + f0 ⋅ Δx.

(48)

Теперь, принимая точку (x 1 ; y 1 ) за исходную, можно точно таким
же методом получить y 2 = y(x 2 ), где x 2 = x 1 + Δx. Таким образом, шаг
за шагом, можно вычислять значения решения у для различных зна*
чений х. Это — метод Эйлера.
Пользуясь таким методом, мы получаем, конечно, не точные, а при*
dy
не
ближенные значения у. Действительно, ведь производная
dx
останется постоянной на промежутке от x = x 0 до x = x 1 . Поэтому,
пользуясь формулой (48), мы допускаем ошибку в определении у,
притом тем большую, чем больше Δx.
Более точно, так как правая часть (48) представляет собой сумму
двух первых членов разложения y(x 0 + Δx) по степеням Δx, то ошиб*
ка формулы (48) имеет порядок (Δx)2 , т.е. не превосходит a(Δx)2 , где
коэффициент а зависит от вида функцииf (x, y).
Пусть необходимо, зная начальное условие y(x 0 ) = y 0 , получить
значение решения при x = x 0 + l , причем l велико, так что при пользо*
вании формулой (48), полагая в ней Δx = l , мы допустим огромную
ошибку. Чтобы отыскать y(x 0 + l ), разобьем промежуток от x = x 0 до
x = x 0 + l на n равных малых промежутков, тогда длина каждого из
l
них есть Δx = . Для получения y(x 0 + l ) нам придется сделать n
n
l
l
шагов, последовательно получая y(x 0 + ), y(x 0 + 2 ), . . . , y(x 0 + l ).
n
n
2
⎛l⎞
На каждом таком шаге ошибка порядка a ⎜ ⎟ , а на всех n шагах
⎝ n⎠
2

al 2
⎛l⎞
ошибка порядка a ⎜ ⎟ n =
. Следовательно, ошибка, возникающая
⎝ n⎠
n
при применении способа Эйлера, обратно пропорциональна числу ша*
гов. Если задана точность ε, то необходимое число шагов n есть вели*
al 2
. Ясно, что чем больше шагов, тем меньше ошибка,
чина порядка
ε
тем точнее найдем мы величину y(x 0 + l ). Однако ошибка убывает
очень медленно при увеличении числа шагов. Поэтому для достижения
заданной точности иногда необходимо очень много шагов.

268

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Приближенное значение для у, даваемое формулой (48), будем на*
зывать первым приближением (y I ), так что y I = y 0 + f 0 Δx. Для полу*
чения более точного второго приближения будем брать среднее
арифметическое производной в начале и в конце промежутка, вычис*
ляя производную в конце промежутка при помощи первого приближе*
ния y I .Таким образом,
yII = y0 +

1 ⎛ dy

2 ⎜⎝ dx

x =x0
y = y0

+

dy
dx



x = x 0 + Δx ⎟

y = yI


Δx,

или
yII = y0 +

1
[ f ( x0 , y0 ) + f ( x0 + Δx, yI )] Δx =
2
= y0 +

1
[ f0 + f ( x0 + Δx, y0 + f0 Δx )] Δx.
2

Можно показать, что величина y II имеет ошибку порядка b(Δx) 3 ,
где b — постоянная, зависящая от вида f (x, y). Поэтому полная ошиб*
3
bl 3
⎛l⎞
ка на n шагах в определении y(x 0 + l ) будет ε = b ⎜ ⎟ ⋅ n = 2 , а чис*
⎝ n⎠
n
ло шагов n, необходимое для достижения заданной точности ε, есть
bl 3
. В этом случае ошибка обратно пропорцио*
величина порядка
ε
нальна квадрату числа шагов, т.е. с ростом числа шагов убывает значи*
тельно быстрее, нежели при пользовании первым приближением y I .
Отметим, однако, что при нахождении y II нужно на каждом шаге
вычислять f (x, y) два раза, в то время как при нахождении y I на од*
ном шаге нужно вычислять лишь одно значение f (x, y). В самом деле,
действуя по способу Эйлера, мы, начиная расчет от точки (x 0 ; y 0 ), на*
ходим y I (x 1 ) = y 0 + f 0 ⋅ Δx, затем вычисляем f (x 1 , y I (x 1 )) и перехо*
дим к следующему шагу.
Если же мы хотим отыскивать второе приближение, то схема такова.
Сперва находим y I (x 1 ) = y 0 + f 0 ⋅ Δx, затем определяем f (x 1 , y I (x 1 )) и
f0 =

1
[ f ( x0 , y0 ) + f ( x1 , yI ( x1 ))].
2

После этого мы находим y II (x 1 ) = y 0 + f 0 ⋅ Δx и, наконец,
f (x 1 , y II (x 1 )). Только теперь все приготовлено для перехода к следую*
щему шагу. Такую схему вычислений называют схемой с пересчетом,
потому что величина f (x, y) на каждом шаге пересчитывается, заме*
няется более надежной величиной f (x, y).
Вычисление значений f (x, y) является, как правило, наиболее тру*
доемкой операцией (остальные операции—умножение на Δx, сложе*

§ 7]

269

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

ние — делаются гораздо быстрее), так что затрата труда на n шагов
в схеме c пересчетом равносильна затрате труда на 2n шагов в схеме
для определения y I . Однако, несмотря на это, если требуется высокая
точность, т.е. если ε весьма мало´, то схема с пересчетом выгоднее, так
bl 3
al 2
, если ε малo´.´
как 2

ε
ε
Схема с пересчетом имеет еще одно преимущество. В этой схеме
есть хороший контроль правильности вычислений и выбора величины
Δx, которую называют шагом: ясно, что расчет хорош лишь до тех пор,
пока значения f (x, y) и f (x, y) мало отличаются.
Рассмотрим пример. Пусть y есть решение уравнения y ′ = x 2 − y 2
с начальным условием y = 0 при x = −1. Определим значение реше*
ния при x = 0. Воспользуемся схемой c пересчетом, взяв шаг Δx = 01
,.
Вычисления сведены в таблицу 5. Во втором и третьем столбцах
таблицы в скобках вписаны промежуточные результаты, а под ними —
результаты пересчета. В последнем столбце таблицы выписаны значе*
ния у, верные с точностью до четырех знаков после запятой. Сравни*
вая их c теми, которые мы получили, видим, что во всех найденных
значениях три знака после запятой верны.
Таблица 5
x

y

f = y′

–1,0

0,0000
(0,1000)
0,0900
(0,1702)
0,1606
(0,2220)
0,2133
(0,2577)
0,2502
(0,2799)
0,2736
(0,2911)
0,2861
(0,2939)
0,2902
(0,2908)
0,2883
(0,2840)
0,2826
(0,2756)
0,2753

1,0000
(0,8000)
0,8019
(0,6110)
0,6142
(0,4407)
0,4444
(0,2936)
0,2974
(0,1717)
0,1752
(0,0753)
0,0782
(0,0036)
0,0058
(–0,0446)
–0,0699
(–0,0706)
–0,0699
(–0,0760)
–0,0758

–0,9
–0,8
–0,7
–0,6
–0,5
–0,4
–0,3
–0,2
–0,1
0,0

f

yточное
0,0000

0,9000
0,0900
0,7064
0,1607
0,5274
0,2135
0,3690
0,2504
0,2345
0,2738
0,1252
0,2862
0,0409
0,2902
–0,0194
0,2882
–0,0586
0,2823
–0,0730
0,2749

268

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Приближенное значение для у, даваемое формулой (48), будем на*
зывать первым приближением (y I ), так что y I = y 0 + f 0 Δx. Для полу*
чения более точного второго приближения будем брать среднее
арифметическое производной в начале и в конце промежутка, вычис*
ляя производную в конце промежутка при помощи первого приближе*
ния y I .Таким образом,
yII = y0 +

1 ⎛ dy

2 ⎜⎝ dx

x =x0
y = y0

+

dy
dx



x = x 0 + Δx ⎟

y = yI


Δx,

или
yII = y0 +

1
[ f ( x0 , y0 ) + f ( x0 + Δx, yI )] Δx =
2
= y0 +

1
[ f0 + f ( x0 + Δx, y0 + f0 Δx )] Δx.
2

Можно показать, что величина y II имеет ошибку порядка b(Δx) 3 ,
где b — постоянная, зависящая от вида f (x, y). Поэтому полная ошиб*
3
bl 3
⎛l⎞
ка на n шагах в определении y(x 0 + l ) будет ε = b ⎜ ⎟ ⋅ n = 2 , а чис*
⎝ n⎠
n
ло шагов n, необходимое для достижения заданной точности ε, есть
bl 3
. В этом случае ошибка обратно пропорцио*
величина порядка
ε
нальна квадрату числа шагов, т.е. с ростом числа шагов убывает значи*
тельно быстрее, нежели при пользовании первым приближением y I .
Отметим, однако, что при нахождении y II нужно на каждом шаге
вычислять f (x, y) два раза, в то время как при нахождении y I на од*
ном шаге нужно вычислять лишь одно значение f (x, y). В самом деле,
действуя по способу Эйлера, мы, начиная расчет от точки (x 0 ; y 0 ), на*
ходим y I (x 1 ) = y 0 + f 0 ⋅ Δx, затем вычисляем f (x 1 , y I (x 1 )) и перехо*
дим к следующему шагу.
Если же мы хотим отыскивать второе приближение, то схема такова.
Сперва находим y I (x 1 ) = y 0 + f 0 ⋅ Δx, затем определяем f (x 1 , y I (x 1 )) и
f0 =

1
[ f ( x0 , y0 ) + f ( x1 , yI ( x1 ))].
2

После этого мы находим y II (x 1 ) = y 0 + f 0 ⋅ Δx и, наконец,
f (x 1 , y II (x 1 )). Только теперь все приготовлено для перехода к следую*
щему шагу. Такую схему вычислений называют схемой с пересчетом,
потому что величина f (x, y) на каждом шаге пересчитывается, заме*
няется более надежной величиной f (x, y).
Вычисление значений f (x, y) является, как правило, наиболее тру*
доемкой операцией (остальные операции—умножение на Δx, сложе*

§ 7]

269

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

ние — делаются гораздо быстрее), так что затрата труда на n шагов
в схеме c пересчетом равносильна затрате труда на 2n шагов в схеме
для определения y I . Однако, несмотря на это, если требуется высокая
точность, т.е. если ε весьма мало´, то схема с пересчетом выгоднее, так
bl 3
al 2
, если ε малo´.´
как 2

ε
ε
Схема с пересчетом имеет еще одно преимущество. В этой схеме
есть хороший контроль правильности вычислений и выбора величины
Δx, которую называют шагом: ясно, что расчет хорош лишь до тех пор,
пока значения f (x, y) и f (x, y) мало отличаются.
Рассмотрим пример. Пусть y есть решение уравнения y ′ = x 2 − y 2
с начальным условием y = 0 при x = −1. Определим значение реше*
ния при x = 0. Воспользуемся схемой c пересчетом, взяв шаг Δx = 01
,.
Вычисления сведены в таблицу 5. Во втором и третьем столбцах
таблицы в скобках вписаны промежуточные результаты, а под ними —
результаты пересчета. В последнем столбце таблицы выписаны значе*
ния у, верные с точностью до четырех знаков после запятой. Сравни*
вая их c теми, которые мы получили, видим, что во всех найденных
значениях три знака после запятой верны.
Таблица 5
x

y

f = y′

–1,0

0,0000
(0,1000)
0,0900
(0,1702)
0,1606
(0,2220)
0,2133
(0,2577)
0,2502
(0,2799)
0,2736
(0,2911)
0,2861
(0,2939)
0,2902
(0,2908)
0,2883
(0,2840)
0,2826
(0,2756)
0,2753

1,0000
(0,8000)
0,8019
(0,6110)
0,6142
(0,4407)
0,4444
(0,2936)
0,2974
(0,1717)
0,1752
(0,0753)
0,0782
(0,0036)
0,0058
(–0,0446)
–0,0699
(–0,0706)
–0,0699
(–0,0760)
–0,0758

–0,9
–0,8
–0,7
–0,6
–0,5
–0,4
–0,3
–0,2
–0,1
0,0

f

yточное
0,0000

0,9000
0,0900
0,7064
0,1607
0,5274
0,2135
0,3690
0,2504
0,2345
0,2738
0,1252
0,2862
0,0409
0,2902
–0,0194
0,2882
–0,0586
0,2823
–0,0730
0,2749

270

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 7]

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

271

s = x − xk −1 .

Для этого уравнения легко найти точное решение. В самом деле,
y
dy x
1
1
,
откуда
. Ясно,
dx
=
= ∫ dx, или 1 − = x − 1, что дает y =

2
2
y
2− x
y
1 y
1
что у неограниченно возрастает при приближении х к 2. Если бы мы
решали это уравнение численно, то, конечно, и при x = 2 получили бы
вполне определенное, хотя, может быть, и очень большое значение у.
Значение аргумента x = 2, при приближении к которому решение
неограниченно возрастает, мы отыскали только благодаря тому, что
смогли написать искомое решение в явном виде. Однако многие урав*
нения не имеют такого решения. Как же, решая уравнение численно,
найти то значение х, при приближении к которому решение неограни*
ченно возрастает?
Как быть, например, с уравнением Риккати

Интегрирование этого равенства от x = x k до x = x k +1 , т.е. от s = h
до s = 2h, дает (проверьте!)

dy
= ϕ ( x ) ⋅ y 2 + ψ ( x ),
dx

Метод пересчета поддается дальнейшему уточнению, результатом
которого являются широко применяемые сейчас в вычислительной
практике методы РунгеКутта и Милна, которые можно найти в кур*
сах численных методов. Распространен также метод Адамса, основан*
ный на применении конечных разностей (§ II. 1). Изложим этот метод
в несколько упрощенном варианте (обычно он доводится до третьих
разностей, но мы ограничимся вторыми). Мы исходим из формулы
Ньютона (II.5), примененной к производной от искомого решения
y ′(x), причем вместо k мы возьмем k − 1

⎞ h − s δ 2 y′ h − s ⎛ h − s ⎞
k −1
+
− 1⎟ ,
y′( x ) = y′k + ⎜⎜ −δy′ 1 ⎟⎟

k− ⎠

2
h
h ⎝ h

2

xk +1

h

∫ y′( x ) dx = yk + 1 − yk = y′k h + δy′k − 1 2 + δ

xk

2

y′k −1

2

5
h,
12

т.е.


1
5
yk + 1 = yk + ⎜⎜ y′k + δy′ 1 + δ 2 y′k −1 ⎟⎟ h.
k

2
12


2

(49)

Эта формула применяется следующим образом. Сначала каким*либо
способом (например, с помощью формулы Тейлора, § 5, или с помощью
метода пересчета) находим значения y 1 = y(x 0 + h) и y 2 = y(x 0 + 2h).
Затем вычисляем соответствующие значения
y′0 = f ( x0 , y0 ),

y1′ = f ( x1 , y1 ) = f ( x0 + h, y1 ),

y′2 = f ( x2 , y2 ),

dy

которое при произвольных ϕ(x) и ψ(x) точно решить нельзя?*
1
Введем новую искомую функцию z = . Тогда при интересующем нас зна*
y
dz
1 dy
чении х будет z = 0. Заметим, что
. Разделим уравнение (50) на
=− 2
dx
y dx
ψ(x)
dz
1 dy
= −ϕ (x) − z 2 ⋅ ψ(x).
= −ϕ (x) − 2 , или
−y 2 , получим − 2
dx
dx
y
y
Решая численно последнее уравнение, мы найдем значение х, при
котором z = 0.
Изложенные способы численного решения дифференциальных
уравнений легко переносятся на случай системы двух или большего
числа уравнений. Покажем это на примере системы двух уравнений

с помощью которых находим
δy′1 = y1′ − y0 ,
2

dy
= f ( x, y, z ),
dx
dz
= ϕ ( x, y, z ).
dx

δy′ 1 = y′2 − y1′ , δ 2 y1′ = δy′ 1 − δy′1 .
1

2

1

2

2

Далее, полагая в формуле (49) k = 2, вычисляем y 3 , а с его помощью
y′3 = f ( x3 , y3 ),

δy′ 1 = y′3 − y′2 , δ 2 y′2 = δy′ 1 − δy′ 1 .
2

2

2

2

1

2

Затем, полагая в формуле (49) k = 3, вычисляем y 4 , далее с его по*
мощью y 4′ = f (x 4 , y 4 ) и т.д.
Особая осторожность при численном решении дифференциальных
уравнений нужна в том случае, когда искомая функция может неогра*
dy
ниченно возрастать. Пусть, например, нам дано уравнение
= y2
dx
и начальное условие y = 1 при x = 1.

(50)


⎪⎪


⎪⎭

Пусть даны начальные условия y = y 0 , z = z 0 при x = x 0 . Положим
f (x 0 , y 0 , z 0 ) = f 0 , ϕ(x 0 , y 0 , z 0 ) = ϕ 0 . Тогда первое приближение есть
yI ( x1 ) = yI ( x0 + Δx ) = y0 + f0 ⋅ Δx,
z I ( x1 ) = z I ( x0 + Δx ) = z 0 + ϕ 0 ⋅ Δx.

* Только что рассмотренное уравнение
ψ(x ) ≡ 0.

dy
= y 2 получается из (50) при ϕ(x ) ≡ 1,
dx

270

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 7]

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

271

s = x − xk −1 .

Для этого уравнения легко найти точное решение. В самом деле,
y
dy x
1
1
,
откуда
. Ясно,
dx
=
= ∫ dx, или 1 − = x − 1, что дает y =

2
2
y
2− x
y
1 y
1
что у неограниченно возрастает при приближении х к 2. Если бы мы
решали это уравнение численно, то, конечно, и при x = 2 получили бы
вполне определенное, хотя, может быть, и очень большое значение у.
Значение аргумента x = 2, при приближении к которому решение
неограниченно возрастает, мы отыскали только благодаря тому, что
смогли написать искомое решение в явном виде. Однако многие урав*
нения не имеют такого решения. Как же, решая уравнение численно,
найти то значение х, при приближении к которому решение неограни*
ченно возрастает?
Как быть, например, с уравнением Риккати

Интегрирование этого равенства от x = x k до x = x k +1 , т.е. от s = h
до s = 2h, дает (проверьте!)

dy
= ϕ ( x ) ⋅ y 2 + ψ ( x ),
dx

Метод пересчета поддается дальнейшему уточнению, результатом
которого являются широко применяемые сейчас в вычислительной
практике методы РунгеКутта и Милна, которые можно найти в кур*
сах численных методов. Распространен также метод Адамса, основан*
ный на применении конечных разностей (§ II. 1). Изложим этот метод
в несколько упрощенном варианте (обычно он доводится до третьих
разностей, но мы ограничимся вторыми). Мы исходим из формулы
Ньютона (II.5), примененной к производной от искомого решения
y ′(x), причем вместо k мы возьмем k − 1

⎞ h − s δ 2 y′ h − s ⎛ h − s ⎞
k −1
+
− 1⎟ ,
y′( x ) = y′k + ⎜⎜ −δy′ 1 ⎟⎟

k− ⎠

2
h
h ⎝ h

2

xk +1

h

∫ y′( x ) dx = yk + 1 − yk = y′k h + δy′k − 1 2 + δ

xk

2

y′k −1

2

5
h,
12

т.е.


1
5
yk + 1 = yk + ⎜⎜ y′k + δy′ 1 + δ 2 y′k −1 ⎟⎟ h.
k

2
12


2

(49)

Эта формула применяется следующим образом. Сначала каким*либо
способом(например, с помощью формулы Тейлора, § 5, или с помощью
метода пересчета) находим значения y 1 = y(x 0 + h) и y 2 = y(x 0 + 2h).
Затем вычисляем соответствующие значения
y′0 = f ( x0 , y0 ),

y1′ = f ( x1 , y1 ) = f ( x0 + h, y1 ),

y′2 = f ( x2 , y2 ),

dy

которое при произвольных ϕ(x) и ψ(x) точно решить нельзя?*
1
Введем новую искомую функцию z = . Тогда при интересующем нас зна*
y
dz
1 dy
чении х будет z = 0. Заметим, что
. Разделим уравнение (50) на
=− 2
dx
y dx
ψ(x)
dz
1 dy
= −ϕ (x) − z 2 ⋅ ψ(x).
= −ϕ (x) − 2 , или
−y 2 , получим − 2
dx
dx
y
y
Решая численно последнее уравнение, мы найдем значение х, при
котором z = 0.
Изложенные способы численного решения дифференциальных
уравнений легко переносятся на случай системы двух или большего
числа уравнений. Покажем это на примере системы двух уравнений

с помощью которых находим
δy′1 = y1′ − y0 ,
2

dy
= f ( x, y, z ),
dx
dz
= ϕ ( x, y, z ).
dx

δy′ 1 = y′2 − y1′ , δ 2 y1′ = δy′ 1 − δy′1 .
1

2

1

2

2

Далее, полагая в формуле (49) k = 2, вычисляем y 3 , а с его помощью
y′3 = f ( x3 , y3 ),

δy′ 1 = y′3 − y′2 , δ 2 y′2 = δy′ 1 − δy′ 1 .
2

2

2

2

1

2

Затем, полагая в формуле (49) k = 3, вычисляем y 4 , далее с его по*
мощью y 4′ = f (x 4 , y 4 ) и т.д.
Особая осторожность при численном решении дифференциальных
уравнений нужна в том случае, когда искомая функция может неогра*
dy
ниченно возрастать. Пусть, например, нам дано уравнение
= y2
dx
и начальное условие y = 1 при x = 1.

(50)


⎪⎪


⎪⎭

Пусть даны начальные условия y = y 0 , z = z 0 при x = x 0 . Положим
f (x 0 , y 0 , z 0 ) = f 0 , ϕ(x 0 , y 0 , z 0 ) = ϕ 0 . Тогда первое приближение есть
yI ( x1 ) = yI ( x0 + Δx ) = y0 + f0 ⋅ Δx,
z I ( x1 ) = z I ( x0 + Δx ) = z 0 + ϕ 0 ⋅ Δx.

* Только что рассмотренное уравнение
ψ(x ) ≡ 0.

dy
= y 2 получается из (50) при ϕ(x ) ≡ 1,
dx

272

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Для получения второго приближения находим, используя первое приближение, значения производных в конце промежутка, т.е. при
x 1 = x 0 + Δx ; получаем
dy
dx

x = x 0 + Δx

dz
dx

x = x 0 + Δx

§ 7]

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

2. Если правая часть не зависит от t, т.е. уравнение (45) имеет вид
d2 x
dx
= ϕ(x). В этом случае положим v = , тогда
2
dt
dt
d 2 x dv dv dx
dv 1 d (v2 )
.
=
=

=
v
=
dx 2 dx
dt 2 dt dx dt

= fI = f (x 0 + Δx , yI , zI ),
= ϕI = ϕ(x 0 + Δx , yI , zI ),

Уравнение перепишется так:

Затем определяем средние величины
1
f = ( f0 + fI ),
2

zII = z 0 + ϕ ⋅ Δx .

Наконец, получив yII и z II , мы пересчитаем значения производных
при x = x 0 + Δx :
dy
dx

x = x 0 + Δx

dz
dx

x = x 0 + Δx

v=

dx
= 2∫ ϕ(x ) dx .
dt

Мы получили уравнение с разделяющимися переменными.
Однако в случае, когда правая часть зависит и от х и от t, ни один
из этих способов применить нельзя, так что приходится решать уравнеdx
ние численно. Прежде всего, положив
= v, заменим (51) системой
dt
уравнений первого порядка
dx
= v,
dt
dv
= ϕ (x , t).
dt

= fII = f (x 0 + Δx , yII , zII ),
= ϕII = ϕ(x 0 + Δx , yII , zII ).

Уравнение второго и более высоких порядков можно, как было показано в § 2, свести к системе уравнений первого порядка. Поэтому изложенные приемы численного решения применимы и для уравнений
выше первого порядка.
Отметим один частный случай. Пусть рассматривается уравнение
d2x
= ϕ(x , t).
dt 2

1 d(v 2 )
= ϕ(x), откуда
2 dx

v2 = 2∫ ϕ(x ) dx ,

1
ϕ = (ϕ 0 + ϕI ).
2

Второе приближение есть
yII = y0 + f ⋅ Δx ,

273

(51)

В отличие от общего случая уравнения второго порядка здесь правая
dx
часть не содержит
*.
dt
Уравнение (51) допускает решение в аналитическом виде в двух
следующих случаях.
1. Если правая часть ϕ(x ,t) не зависит oт x. Тогда (45) принимает
d2 x
dx
вид
= ϕ(t) dt ; интегрируя еще раз, найдем x (t).
= ϕ(t), откуда
2
dt ∫
dt

* Такое уравнение описывает, например, движение тела под действием силы, зависящей от положения тела и от времени, при отсутствии трения.







(52)

Система (52) обладает следующей особенностью: правая часть первого уравнения системы не содержит х, а правая часть второго уравнения системы не содержит v. Благодаря этому можно предложить очень
удобную схему вычислений.
dx
Пусть даны начальные условия x = x 0 ,
= v = v 0 при t = t 0 . Выdt
берем шаг Δt, т.е. будем находить значения решения при следующих
значениях аргумента: t1 = t 0 + Δt , t 2 = t 0 + 2 Δt , t 3 = t 0 + 3 Δt и т.д.
Значения аргумента t 0 , t1 , t 2 , t 3 , . . . будем называть целыми,
а значения t 1 , t1 1 , t 2 1 , . . . — полуцелыми. Будем вычислять зна2
2
2
dx
чения v =
для полуцелых значений аргумента, а значения х для
dt
целых значений аргумента. Тогда последовательность действий такоΔt
ва. Зная x 0 и v 0 , мы находим v 1 по формуле v 1 = v 0 + ϕ 0 ⋅ , где
2
2
2
положено ϕ 0 = ϕ (x 0 ,t 0 ). Затем определяем
x 1 = x 0 + v 1 ⋅ Δt ,
2
ϕ1 = ϕ(x 1 ,t1 ) и v1 1 = v 1 + ϕ1 ⋅ Δt . Дальше процесс повторяется:
2
2
x 2 = x 1 + v1 1 ⋅ Δt , ϕ 2 = ϕ(x 2 ,t 2 ), v 2 1 = v1 1 + ϕ 2 ⋅ Δt и т.д.
2

2

2

Вычисления удобно располагать в виде следующей таблицы.

272

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Для получения второго приближения находим, используя первое приближение, значения производных в конце промежутка, т.е. при
x 1 = x 0 + Δx ; получаем
dy
dx

x = x 0 + Δx

dz
dx

x = x 0 + Δx

§ 7]

ЧИСЛЕННОЕ РЕШЕНИЕ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ

2. Если правая часть не зависит от t, т.е. уравнение (45) имеет вид
d2 x
dx
= ϕ(x). В этом случае положим v = , тогда
2
dt
dt
d 2 x dv dv dx
dv 1 d (v2 )
.
=
=

=
v
=
dx 2 dx
dt 2 dt dx dt

= fI = f (x 0 + Δx , yI , zI ),
= ϕI = ϕ(x 0 + Δx , yI , zI ),

Уравнение перепишется так:

Затем определяем средние величины
1
f = ( f0 + fI ),
2

zII = z 0 + ϕ ⋅ Δx .

Наконец, получив yII и z II , мы пересчитаем значения производных
при x = x 0 + Δx :
dy
dx

x = x 0 + Δx

dz
dx

x = x 0 + Δx

v=

dx
= 2∫ ϕ(x ) dx .
dt

Мы получили уравнение с разделяющимися переменными.
Однако в случае, когда правая часть зависит и от х и от t, ни один
из этих способов применить нельзя, так что приходится решать уравнеdx
ние численно. Прежде всего, положив
= v, заменим (51) системой
dt
уравнений первого порядка
dx
= v,
dt
dv
= ϕ (x , t).
dt

= fII = f (x 0 + Δx , yII , zII ),
= ϕII = ϕ(x 0 + Δx , yII , zII ).

Уравнение второго и более высоких порядков можно, как было показано в § 2, свести к системе уравнений первого порядка. Поэтому изложенные приемы численного решения применимы и для уравнений
выше первого порядка.
Отметим один частный случай. Пусть рассматривается уравнение
d2x
= ϕ(x , t).
dt 2

1 d(v 2 )
= ϕ(x), откуда
2 dx

v2 = 2∫ ϕ(x ) dx ,

1
ϕ = (ϕ 0 + ϕI ).
2

Второе приближение есть
yII = y0 + f ⋅ Δx ,

273

(51)

В отличие от общего случая уравнения второго порядка здесь правая
dx
часть не содержит
*.
dt
Уравнение (51) допускает решение в аналитическом виде в двух
следующих случаях.
1. Если правая часть ϕ(x ,t) не зависит oт x. Тогда (45) принимает
d2 x
dx
вид
= ϕ(t) dt ; интегрируя еще раз, найдем x (t).
= ϕ(t), откуда
2
dt ∫
dt

* Такое уравнение описывает, например, движение тела под действием силы, зависящей от положения тела и от времени, при отсутствии трения.







(52)

Система (52) обладает следующей особенностью: правая часть первого уравнения системы не содержит х, а правая часть второго уравнения системы не содержит v. Благодаря этому можно предложить очень
удобную схему вычислений.
dx
Пусть даны начальные условия x = x 0 ,
= v = v 0 при t = t 0 . Выdt
берем шаг Δt, т.е. будем находить значения решения при следующих
значениях аргумента: t1 = t 0 + Δt , t 2 = t 0 + 2 Δt , t 3 = t 0 + 3 Δt и т.д.
Значения аргумента t 0 , t1 , t 2 , t 3 , . . . будем называть целыми,
а значения t 1 , t1 1 , t 2 1 , . . . — полуцелыми. Будем вычислять зна2
2
2
dx
чения v =
для полуцелых значений аргумента, а значения х для
dt
целых значений аргумента. Тогда последовательность действий такоΔt
ва. Зная x 0 и v 0 , мы находим v 1 по формуле v 1 = v 0 + ϕ 0 ⋅ , где
2
2
2
положено ϕ 0 = ϕ (x 0 ,t 0 ). Затем определяем
x 1 = x 0 + v 1 ⋅ Δt ,
2
ϕ1 = ϕ(x 1 ,t1 ) и v1 1 = v 1 + ϕ1 ⋅ Δt . Дальше процесс повторяется:
2
2
x 2 = x 1 + v1 1 ⋅ Δt , ϕ 2 = ϕ(x 2 ,t 2 ), v 2 1 = v1 1 + ϕ 2 ⋅ Δt и т.д.
2

2

2

Вычисления удобно располагать в виде следующей таблицы.

274

[Гл. VIII

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

Таблица 6
t

x

ϕ(x , t)

t0
t1
t12
t1 1
t22
t2 1
2
t3
t3 1
t4 2

x0

ϕ0

x1

ϕ1 = ϕ(x1, t1)

x2

ϕ2 = ϕ(x2 , t2 )

x3

ϕ3

x4

ϕ4

v=

dx
dt

v0
v1

2

v1 1

2

v2 1

2

v3 1

2

Таким образом, при переходе, например, от x 1 к x 2 мы пользуемся значением производной v1 1 соответствующим середине проме2
жутка. Благодаря этому точность
способа такого же порядка, как
точность второго приближения в обычном способе. (Ошибка на каждом шаге порядка (Δt) 3 .) Поэтому при затраченной работе такой же,
как и при пользовании первым приближением, мы получаем лучшую
точность за счет разумного построения схемы вычислений.
Отметим еще раз, что такая схема возможна лишь благодаря указанным нами особенностям системы (52).
Упражнения
1. Составьте таблицу значений функции y = e x , решая численно уравнение y ′ = y с начальным условием y = 1 при x = 0.
Получите значения e x при x = 01
, ; 0,2; 0,3 и т.д. через 0,1 до x = 1. Вычисления ведите по первому приближению с четырьмя знаками после запятой.
Затем возьмите шаг Δx = 005
, и пользуйтесь схемой с пересчетом. Результаты
сравните с табличными.
dy
2. Пусть y(x ) есть решение уравнения
= x 2 + y2 с начальным условием
dx
y = 05
, при x = 0. Найдите y(05
, ).
Решите задачу двумя способами:
а) считайте по первому приближению с шагом Δx = 0025
, ;
б) считайте по второму приближению с шагом Δx = 005
, . Сравните результаты*.
3. Пусть тело массы m движется под действием силы f (t) = at(θ − t) и испытывает сопротивление среды, пропорциональное скорости (коэффициент
пропорциональности равен k).
Пусть в начальный момент времени скорость тела была равна 0. Составьте
дифференциальное уравнение и решите его численно для случая m = 10 г,

* Дифференциальные уравнения задач 2 и 5 нельзя решить аналитически.

§ 8]

КРАЕВЫЕ ЗАДАЧИ

275

г ⋅ см
г
, θ = 20 с, k = 1 . Определите скорость тела через 1,5 сек после начасм
с4
ла движения.
У к а з а н и е. Воспользуйтесь схемой с пересчетом, взяв Δt = 005
, . Вычисления ведите с тремя знаками после запятой.
4. Составьте таблицу значений функции y = sin x , решая численно уравнеdy
ние y ′′ + y = 0 с начальными условиями y = 0,
= 1 при x = 0. Получите знаdx
чения при х = 0,1; 0,2; 0,3 и т.д. через 0,1 до х = 1. Пользуйтесь схемой с
пересчетом, взяв шаг Δx = 01
, . Сравните результаты с табличными. Вычисления ведите с тремя знаками после запятой.
d2x
5. Составьте таблицу значений решения уравнения
= t + x 2 с начальdt 2
dx
ными условиями x = 0,
= 1 при t = 0. Таблицу составьте от t = 0 до t = 05
,.
dt
Возьмите шаг Δt = 01
, и считайте по схеме с полуцелыми значениями аргумента с тремя знаками после запятой.

a =5

§ 8. Краевые задачи
Общее решение дифференциального уравнения n-го порядка содержит n произвольных постоянных, т.е. обладает n степенями свободы (см. § IV.8). Чтобы выделить из общего решения какое-либо
частное, мы до сих пор пользовались начальными условиями, согласно
которым искомая функция и ее производные задаются при одном значении аргумента. Это особенно естественно, если независимой переменной служит время, т.е. если изучается развитие некоторого
процесса: тогда начальные условия просто служат математической записью начального состояния процесса. Именно поэтому применяются
наименования начальные условия, начальная задача и в случае, если независимая переменная имеет другой физический смысл. Однако бывают задачи с иной постановкой, например, такие, в которых имеются два
равноправных «узловых» значения независимой переменной, при которых задается искомая функция. Так, при рассмотрении отклонения
y(x) струны, закрепленной на концах x = a и x = b, на искомую
функцию y(x) накладываются условия y(a) = 0, y(b) = 0. Имеются
и другие способы выделения частного решения из общего, которые
встречаются в практических задачах. Все эти способы объединяет то,
что количество дополнительных равенств, накладываемых на искомое
решение, должно равняться числу степеней свободы в общем решении
рассматриваемого уравнения, т.е. порядку этого уравнения.
В дальнейшем мы рассмотрим решение уравнения
y ′′ + p(x )y ′ + q(x )y = f (x ) (a  x b)

(53)

274

[Гл. VIII

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

Таблица 6
t

x

ϕ(x , t)

t0
t1
t12
t1 1
t22
t2 1
2
t3
t3 1
t4 2

x0

ϕ0

x1

ϕ1 = ϕ(x1, t1)

x2

ϕ2 = ϕ(x2 , t2 )

x3

ϕ3

x4

ϕ4

v=

dx
dt

v0
v1

2

v1 1

2

v2 1

2

v3 1

2

Таким образом, при переходе, например, от x 1 к x 2 мы пользуемся значением производной v1 1 соответствующим середине проме2
жутка. Благодаря этому точность
способа такого же порядка, как
точность второго приближения в обычном способе. (Ошибка на каждом шаге порядка (Δt) 3 .) Поэтому при затраченной работе такой же,
как и при пользовании первым приближением, мы получаем лучшую
точность за счет разумного построения схемы вычислений.
Отметим еще раз, что такая схема возможна лишь благодаря указанным нами особенностям системы (52).
Упражнения
1. Составьте таблицу значений функции y = e x , решая численно уравнение y ′ = y с начальным условием y = 1 при x = 0.
Получите значения e x при x = 01
, ; 0,2; 0,3 и т.д. через 0,1 до x = 1. Вычисления ведите по первому приближению с четырьмя знаками после запятой.
Затем возьмите шаг Δx = 005
, и пользуйтесь схемой с пересчетом. Результаты
сравните с табличными.
dy
2. Пусть y(x ) есть решение уравнения
= x 2 + y2 с начальным условием
dx
y = 05
, при x = 0. Найдите y(05
, ).
Решите задачу двумя способами:
а) считайте по первому приближению с шагом Δx = 0025
, ;
б) считайте по второму приближению с шагом Δx = 005
, . Сравните результаты*.
3. Пусть тело массы m движется под действием силы f (t) = at(θ − t) и испытывает сопротивление среды, пропорциональное скорости (коэффициент
пропорциональности равен k).
Пусть в начальный момент времени скорость тела была равна 0. Составьте
дифференциальное уравнение и решите его численно для случая m = 10 г,

* Дифференциальные уравнения задач 2 и 5 нельзя решить аналитически.

§ 8]

КРАЕВЫЕ ЗАДАЧИ

275

г ⋅ см
г
, θ = 20 с, k = 1 . Определите скорость тела через 1,5 сек после начасм
с4
ла движения.
У к а з а н и е. Воспользуйтесь схемой с пересчетом, взяв Δt = 005
, . Вычисления ведите с тремя знаками после запятой.
4. Составьте таблицу значений функции y = sin x , решая численно уравнеdy
ние y ′′ + y = 0 с начальными условиями y = 0,
= 1 при x = 0. Получите знаdx
чения при х = 0,1; 0,2; 0,3 и т.д. через 0,1 до х = 1. Пользуйтесь схемой с
пересчетом, взяв шаг Δx = 01
, . Сравните результаты с табличными. Вычисления ведите с тремя знаками после запятой.
d2x
5. Составьте таблицу значений решения уравнения
= t + x 2 с начальdt 2
dx
ными условиями x = 0,
= 1 при t = 0. Таблицу составьте от t = 0 до t = 05
,.
dt
Возьмите шаг Δt = 01
, и считайте по схеме с полуцелыми значениями аргумента с тремя знаками после запятой.

a =5

§ 8. Краевые задачи
Общее решение дифференциального уравнения n-го порядка содержит n произвольных постоянных, т.е. обладает n степенями свободы (см. § IV.8). Чтобы выделить из общего решения какое-либо
частное, мы до сих пор пользовались начальными условиями, согласно
которым искомая функция и ее производные задаются при одном значении аргумента. Это особенно естественно, если независимой переменной служит время, т.е. если изучается развитие некоторого
процесса: тогда начальные условия просто служат математической записью начального состояния процесса. Именно поэтому применяются
наименования начальные условия, начальная задача и в случае, если независимая переменная имеет другой физический смысл. Однако бывают задачи с иной постановкой, например, такие, в которых имеются два
равноправных «узловых» значения независимой переменной, при которых задается искомая функция. Так, при рассмотрении отклонения
y(x) струны, закрепленной на концах x = a и x = b, на искомую
функцию y(x) накладываются условия y(a) = 0, y(b) = 0. Имеются
и другие способы выделения частного решения из общего, которые
встречаются в практических задачах. Все эти способы объединяет то,
что количество дополнительных равенств, накладываемых на искомое
решение, должно равняться числу степеней свободы в общем решении
рассматриваемого уравнения, т.е. порядку этого уравнения.
В дальнейшем мы рассмотрим решение уравнения
y ′′ + p(x )y ′ + q(x )y = f (x ) (a  x b)

(53)

276

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

при дополнительных условиях
y( a ) = α 1 ,

y(b ) = α 2 ,

(54)

хотя все полученные общие выводы справедливы для линейных диф$
ференциальных уравнений любого порядка n при линейных допол$
нительных условиях любого вида. Условия вида (54), наложенные на
концах интервала, на котором строится решение, называются краевы
ми условиями, а задача о решении дифференциального уравнения при
заданных краевых условиях называется краевой задачей.
В гл. VII (§§ 2, 3 и 5) мы видели, что общее решение линейного не$
однородного уравнения (53) имеет следующую структуру:
y = Y ( x ) + C1 y1 ( x ) + C 2 y2 ( x );

щее решение получится, если к этому частному решению прибавить
общее решение соответствующей однородной задачи.
При решении начальной задачи (так называемой задачи Коши, т.е.
задачи с начальными условиями) всегда имеет место основной случай,
так как такое решение всегда существует и единственно. При решении
краевой задачи может представиться и особый случай.
Например, рассмотрим задачу
π

y′′ + y = 0 0  x   ,

2

y(0) = α 1 ,

 π
y  = α 2.
 2

В силу § VII.3 общее решение уравнения имеет вид
y = C1 cos x + C 2 sin x.

(57)

Подставляя граничные условия, получим
C1 = α 1 ,

C2 = α 2.

Значит, получаем при любых α 1 , α 2 вполне определенное решение
y = α 1 cos x + α 2 sin x.

(56)

При решении этой системы двух алгебраических уравнений первой
степени с двумя неизвестными могут представиться два случая (см. §3).
1. О с н о в н о й с л у ч а й: определитель системы отличен от нуля.
В этом случае система (56) имеет вполне определенное решение, и по$
тому уравнение (53) при условиях (54) имеет одно и только одно реше$
ние при любом неоднородном члене f (x) и любых числах α 1 , α 2 .
2. О с о б ы й с л у ч а й: определитель системы равен нулю. В этом
случае система (56), как правило, противоречива, но при некоторых
правых частях она имеет бесконечное количество решений. Значит, и
уравнение (53) при условиях (54) при произвольном выборе функции
f (x) и чисел α 1 , α 2 , как правило, не имеет ни одного решения; однако
при некоторых таких выборах задача имеет бесконечное количество ре$
шений. Например, можно проверить, что если f (x) и α 1 уже выбра$
ны, то бесконечное количество решений получится лишь при одном
значении α 2 , а при остальных значениях задача не будет иметь ни од$
ного решения.
Подчеркнем, что то, какой именно случай имеет место, зависит от
вида левых частей уравнения (53) и условий (54),
Согласно § 3, для того чтобы имел место основной случай, необхо$
димо и достаточно, чтобы соответствующая однородная задача (в кото$
рой положено f (x) ≡ 0, α 1 = α 2 = 0) имела только нулевое решение.
В особом случае однородная задача имеет бесконечное количество ре$
шений, а если неоднородная задача имеет хотя бы одно решение, то об$

277

КРАЕВЫЕ ЗАДАЧИ

(55)

здесь Y (x) — некоторое частное решение уравнения (53), y 1 и y 2 —
два независимых решения соответствующего однородного уравнения,
а C1 и C2 — произвольные постоянные. Подставляя формулу (55)
в условия (54), получим два соотношения для нахождения C1 и C2 :
C1 y1 ( a ) + C 2 y2 ( a ) = α 1 − Y ( a ), 

C1 y1 (b ) + C 2 y2 (b ) = α 2 − Y (b ). 

§ 8]

Это — основной случай.
Для задачи
y′′ + y = 0

(0  x  π),

y(0) = α 1 ,

y( π ) = α 2

(58)

подстановка граничных условий в то же общее решение (57) даст
C1 = α 1 ,

−C1 = α 2 ,

C1 = −α 2 .

т.е.

Таким образом, если α 1 ≠ −α 2 , то задача (58) не имеет ни одного реше$
ния. Если же α 1 = −α 2 , то эта задача имеет решение
y = α 1 cos x + C 2 sin x,

в котором C2 совершенно произвольно, т.е. мы имеем бесконечное
число решений. Это — особый случай.
Рассмотрим, наконец, задачу с параметром λ = const
y′′ + λy = f ( x ) (0  x  l ),

y(0) = α 1 ,

y(l ) = α 2 ,

(59)

причем будем считать сначала, что λ > 0. Тогда независимыми решени$
ями соответствующего однородного дифференциального уравнения
служат функции y 1 (x) = cos λ x, y 2 (x) = sin λ x и определитель
системы (56) равен
y1 (0 ) y2 (0 )
1
=
y1 ( l ) y2 ( l )
cos λ l

0
sin λ l

= sin λ l .

276

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

при дополнительных условиях
y( a ) = α 1 ,

y(b ) = α 2 ,

(54)

хотя все полученные общие выводы справедливы для линейных диф$
ференциальных уравнений любого порядка n при линейных допол$
нительных условиях любого вида. Условия вида (54), наложенные на
концах интервала, на котором строится решение, называются краевы
ми условиями, а задача о решении дифференциального уравнения при
заданных краевых условиях называется краевой задачей.
В гл. VII (§§ 2, 3 и 5) мы видели, что общее решение линейного не$
однородного уравнения (53) имеет следующую структуру:
y = Y ( x ) + C1 y1 ( x ) + C 2 y2 ( x );

щее решение получится, если к этому частному решению прибавить
общее решение соответствующей однородной задачи.
При решении начальной задачи (так называемой задачи Коши, т.е.
задачи с начальными условиями) всегда имеет место основной случай,
так как такое решение всегда существует и единственно. При решении
краевой задачи может представиться и особый случай.
Например, рассмотрим задачу
π

y′′ + y = 0 0  x   ,

2

y(0) = α 1 ,

 π
y  = α 2.
 2

В силу § VII.3 общее решение уравнения имеет вид
y = C1 cos x + C 2 sin x.

(57)

Подставляя граничные условия, получим
C1 = α 1 ,

C2 = α 2.

Значит, получаем при любых α 1 , α 2 вполне определенное решение
y = α 1 cos x + α 2 sin x.

(56)

При решении этой системы двух алгебраических уравнений первой
степени с двумя неизвестными могут представиться два случая (см. §3).
1. О с н о в н о й с л у ч а й: определитель системы отличен от нуля.
В этом случае система (56) имеет вполне определенное решение, и по$
тому уравнение (53) при условиях (54) имеет одно и только одно реше$
ние при любом неоднородном члене f (x) и любых числах α 1 , α 2 .
2. О с о б ы й с л у ч а й: определитель системы равен нулю. В этом
случае система (56), как правило, противоречива, но при некоторых
правых частях она имеет бесконечное количество решений. Значит, и
уравнение (53) при условиях (54) при произвольном выборе функции
f (x) и чисел α 1 , α 2 , как правило, не имеет ни одного решения; однако
при некоторых таких выборах задача имеет бесконечное количество ре$
шений. Например, можно проверить, что если f (x) и α 1 уже выбра$
ны, то бесконечное количество решений получится лишь при одном
значении α 2 , а при остальных значениях задача не будет иметь ни од$
ного решения.
Подчеркнем, что то, какой именно случай имеет место, зависит от
вида левых частей уравнения (53) и условий (54),
Согласно § 3, для того чтобы имел место основной случай, необхо$
димо и достаточно, чтобы соответствующая однородная задача (в кото$
рой положено f (x) ≡ 0, α 1 = α 2 = 0) имела только нулевое решение.
В особом случае однородная задача имеет бесконечное количество ре$
шений, а если неоднородная задача имеет хотя бы одно решение, то об$

277

КРАЕВЫЕ ЗАДАЧИ

(55)

здесь Y (x) — некоторое частное решение уравнения (53), y 1 и y 2 —
два независимых решения соответствующего однородного уравнения,
а C1 и C2 — произвольные постоянные. Подставляя формулу (55)
в условия (54), получим два соотношения для нахождения C1 и C2 :
C1 y1 ( a ) + C 2 y2 ( a ) = α 1 − Y ( a ), 

C1 y1 (b ) + C 2 y2 (b ) = α 2 − Y (b ). 

§ 8]

Это — основной случай.
Для задачи
y′′ + y = 0

(0  x  π),

y(0) = α 1 ,

y( π ) = α 2

(58)

подстановка граничных условий в то же общее решение (57) даст
C1 = α 1 ,

−C1 = α 2 ,

C1 = −α 2 .

т.е.

Таким образом, если α 1 ≠ −α 2 , то задача (58) не имеет ни одного реше$
ния. Если же α 1 = −α 2 , то эта задача имеет решение
y = α 1 cos x + C 2 sin x,

в котором C2 совершенно произвольно, т.е. мы имеем бесконечное
число решений. Это — особый случай.
Рассмотрим, наконец, задачу с параметром λ = const
y′′ + λy = f ( x ) (0  x  l ),

y(0) = α 1 ,

y(l ) = α 2 ,

(59)

причем будем считать сначала, что λ > 0. Тогда независимыми решени$
ями соответствующего однородного дифференциального уравнения
служат функции y 1 (x) = cos λ x, y 2 (x) = sin λ x и определитель
системы (56) равен
y1 (0 ) y2 (0 )
1
=
y1 ( l ) y2 ( l )
cos λ l

0
sin λ l

= sin λ l .

278

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Приравнивая его нулю, получим значения
2

 π
λ =  ,
l

2

 2π 
  ,
 l 

2

 3π 
  , ...,
 l 

(60)

при которых для задачи (59) имеет место особый случай, т.е. нарушает$
ся либо существование, либо единственность решения.
Набор значений параметра, входящего в формулировку задачи, при
которых задача в том или ином смысле вырождается (т.е. теряет ка$
кие$либо весьма существенные свойства, приобретая качественно иные),
называется спектром этой задачи. Мы предоставляем читателю прове$
рить, что при λ 0 для задачи (59) всегда имеет место основной случай,
и тем самым набор значений (60) представляет собой весь ее спектр.
Спектр (60) задачи (59) можно получить также несколько иным, по
существу равносильным методом. Как было сказано, особый случай
для краевой задачи характеризуется тем, что соответствующая одно$
родная задача
y′′ + λy = 0,

y(0 ) = 0,

y( l ) = 0

может иметь ненулевое решение. Общее решение этого дифференци$
ального уравнения имеет вид
y = C1 cos λ x + C 2 sin λ x = C ( D cos λ x + sin λ x ),

где обозначено C = C2 , D =

C1
. Применение граничных условий дает
C2

C ( D cos λ 0 + sin λ 0 ) = 0,

C ( D cos λ l + sin λ l ) = 0.

Мы видим, что постоянная С остается произвольной, тогда как для
нахождения двух постоянных D и λ остается два уравнения
D cos λ 0 + sin λ 0 = 0,

D cos λ l + sin λ l ) = 0.

Отсюда получаем
D = 0,

sin λ l = 0,

λ l = kπ

(k = 1, 2, . . .),

и мы приходим к тем же значениям (60) для λ.
Полученный результат имеет интересное приложение к исследованию
устойчивости упругого стержня при его сжа$
тии. Пусть однородный (одинаковый по
всей длине) упругий стержень расположен
вдоль оси х и сжимается вдоль нее си$
лой Р, причем оба конца стержня удержива$
ются на оси х, но могут свободно вращаться
вокруг точек закрепления (рис. 96, а). Тогда
при достижении силой некоторого крити$
Рис. 96.

§ 8]

КРАЕВЫЕ ЗАДАЧИ

279

ческого значения Pкр стержень изгибается, принимая положение, изобра$
женное на рис. 96, б. Если обозначить через у поперечное отклонение
точки стержня от ее исходного положения, то, как доказывается в курсах
сопротивления материалов, функция y(x) с достаточной точностью
удовлетворяет дифференциальному уравнению и краевым условиям:
y′′ +

P
y = 0,
EJ

y(0 ) = y( l ) = 0;

(61)

здесь E и J — так называемые «модуль Юнга» материала стержня и «мо$
мент инерции» поперечного сечения стержня. Как вытекает из (60), при
P  π
Pкр стержень должен опять выпрямиться. Однако это не так. Урав$
нение (61) описывает отклонение стержня точно лишь в пределе при
малых отклонениях, а анализ более точного уравнения, справедливого
при любых отклонениях (оно оказывается нелинейным), показывает,
что при переходе P через Pкр наряду с неустойчивой прямолинейной
возникает искривленная форма равновесия, которая и является устой$
чивой. С ростом P кривизна этой формы быстро возрастает, и стер$
жень разрушается.
К решению неоднородного уравнения при однородных краевых
условиях
y′′ + p( x ) y′ + q( x ) y = f ( x ) ( a  x b ), 

y( a ) = 0, y(b ) = 0


(63)

* Подразумеваются такие внешние воздействия, которые стремятся отклонить стер$
жень от прямолинейного состояния, например малая сила, направленная перпендику$
лярно стержню.

278

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Приравнивая его нулю, получим значения
2

 π
λ =  ,
l

2

 2π 
  ,
 l 

2

 3π 
  , ...,
 l 

(60)

при которых для задачи (59) имеет место особый случай, т.е. нарушает$
ся либо существование, либо единственность решения.
Набор значений параметра, входящего в формулировку задачи, при
которых задача в том или ином смысле вырождается (т.е. теряет ка$
кие$либо весьма существенные свойства, приобретая качественно иные),
называется спектром этой задачи. Мы предоставляем читателю прове$
рить, что при λ 0 для задачи (59) всегда имеет место основной случай,
и тем самым набор значений (60) представляет собой весь ее спектр.
Спектр (60) задачи (59) можно получить также несколько иным, по
существу равносильным методом. Как было сказано, особый случай
для краевой задачи характеризуется тем, что соответствующая одно$
родная задача
y′′ + λy = 0,

y(0 ) = 0,

y( l ) = 0

может иметь ненулевое решение. Общее решение этого дифференци$
ального уравнения имеет вид
y = C1 cos λ x + C 2 sin λ x = C ( D cos λ x + sin λ x ),

где обозначено C = C2 , D =

C1
. Применение граничных условий дает
C2

C ( D cos λ 0 + sin λ 0 ) = 0,

C ( D cos λ l + sin λ l ) = 0.

Мы видим, что постоянная С остается произвольной, тогда как для
нахождения двух постоянных D и λ остается два уравнения
D cos λ 0 + sin λ 0 = 0,

D cos λ l + sin λ l ) = 0.

Отсюда получаем
D = 0,

sin λ l = 0,

λ l = kπ

(k = 1, 2, . . .),

и мы приходим к тем же значениям (60) для λ.
Полученный результат имеет интересное приложение к исследованию
устойчивости упругого стержня при его сжа$
тии. Пусть однородный (одинаковый по
всей длине) упругий стержень расположен
вдоль оси х и сжимается вдоль нее си$
лой Р, причем оба конца стержня удержива$
ются на оси х, но могут свободно вращаться
вокруг точек закрепления (рис. 96, а). Тогда
при достижении силой некоторого крити$
Рис. 96.

§ 8]

КРАЕВЫЕ ЗАДАЧИ

279

ческого значения Pкр стержень изгибается, принимая положение, изобра$
женное на рис. 96, б. Если обозначить через у поперечное отклонение
точки стержня от ее исходного положения, то, как доказывается в курсах
сопротивления материалов, функция y(x) с достаточной точностью
удовлетворяет дифференциальному уравнению и краевым условиям:
y′′ +

P
y = 0,
EJ

y(0 ) = y( l ) = 0;

(61)

здесь E и J — так называемые «модуль Юнга» материала стержня и «мо$
мент инерции» поперечного сечения стержня. Как вытекает из (60), при
P  π
Pкр стержень должен опять выпрямиться. Однако это не так. Урав$
нение (61) описывает отклонение стержня точно лишь в пределе при
малых отклонениях, а анализ более точного уравнения, справедливого
при любых отклонениях (оно оказывается нелинейным), показывает,
что при переходе P через Pкр наряду с неустойчивой прямолинейной
возникает искривленная форма равновесия, которая и является устой$
чивой. С ростом P кривизна этой формы быстро возрастает, и стер$
жень разрушается.
К решению неоднородного уравнения при однородных краевых
условиях
y′′ + p( x ) y′ + q( x ) y = f ( x ) ( a  x b ), 

y( a ) = 0, y(b ) = 0


(63)

* Подразумеваются такие внешние воздействия, которые стремятся отклонить стер$
жень от прямолинейного состояния, например малая сила, направленная перпендику$
лярно стержню.

280

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

в основном (неособом) случае можно применить функцию Грина
(§ VI.2), так как ясно, что при сложении правых частей решения также
складываются. В соответствии с § VI.2, если через G(x; ξ) обозначить
решение задачи (63), в которой вместо f (x) взята дельта$функция
δ(x − ξ), то при произвольной функции f (x) решение задачи (63) по$
лучится по формуле

§ 9]

ние задачи (65) при любой функции f (x):
l

x

l

y = ∫ G ( x; ξ ) f ( ξ ) dξ = ∫ G ( x; ξ ) f ( ξ ) dξ + ∫ G ( x; ξ ) f ( ξ ) dξ =
0

0

0

=−

b

y( x ) = ∫ f ( ξ ) G ( x; ξ ) dξ.

(64)

y′′ = f ( x ) (0  x  l ),

y(0 ) = y( l ) = 0.

(65)

Если взамен f (x) поставить δ(x − ξ), то при 0 x  ξ и при ξ 0. Этот случай
представляет меньший интерес.
Упражнение
Рассмотрите поведение решения задачи λy′′ − y = 1, y( −1) = y(1) = 0 при
λ → +0.

§ 10. Подобие явлений
Два или несколько явлений называются в физике (химии, технике,
социологии и т.д.) подобными, если они различаются только масштаба$
ми. Например, подобными будут процессы изменения тока в цепи по
законам, изображенным на рис. 99: в обоих случаях ток в течение неко$
торого времени равномерно нарастает, начиная от нулевого значения,
затем в течение такого же времени остается постоянным, после чего
скачком спадает до нуля. Таким образом, если выбрать в качестве ха
рактерного времени t x (принимаемого в данном процессе за эталон
для сравнения) время нарастания тока, в качестве характерного тока

Рис. 99.

j x — максимальный ток, а отсчет времени производить от начала нарас$
тания, после чего обозначить
t = t x~t ,

~
j = jx j ,

где ~t и ~j — безразмерные время и сила тока, то закон зависимости
~j (~t ), изображенный на рис. 100, для обоих процессов будет одинако$
вым. Отметим, что графики рис. 99 в смыс$
ле элементарной геометрии, конечно,
подобными не будут, так как при переходе
от одного графика к другому углы меняют$
ся и длины не пропорциональны. Однако
если по осям откладываются величины
разной размерности, то нас никогда не ин$
Рис. 100.
тересуют углы и длины отрезков, не парал$
лельных осям координат. Например, на рис. 99 расстояние некоторой
точки от начала координат по правилам аналитической геометрии рав$
но t 2 + j 2 , но это выражение бессмысленно с точки зрения размер$
ности и потому никогда не может встретиться.
Если подобны зависимости j(t), то подобны и другие зависимости,
t

такие, например, как

∫ j(t) dt

— зависимость величины протекшего за$

ряда от времени, Rj 2 — зависимость мощности тока от времени и т.д.
Однако представим себе, что в цепи имеется устройство, которое вклю$
чается, когда сила тока достигает определенного значения j 0 ; работа
такого устройства описывается функцией e( j − j 0 ), где е — единич$
ная функция (§ VI.3). Ясно, что по отношению к такому устройству по$
добия, вообще говоря, не будет. Таким образом, необходимо говорить
не вообще о подобии явлений, а об их подобии но отношению к тем или
иным их характеристикам.
Как узнать, подобны ли два явления? Если характеристики, по от$
ношению к которым рассматривается подобие, получаются из решения
некоторых уравнений, то надо посмотреть, можно ли сделать линейные
преобразования величин, входящих в эти уравнения (т.е. замены вида
x → a x x~ + bx , означающие изменение масштаба и начала отсчета), так,

284

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

чтобы уравнения для обоих случаев стали одинаковыми. Конечно, если
речь идет о дифференциальных уравнениях, то после преобразования
должны совпасть и начальные условия, которые также нужны для
определения решения. Равносильный способ: если уравнения для двух
явлений можно с помощью линейных преобразований привести к од$
ному и тому же «эталонному» виду, то явления подобны.
Приведем пример. Пусть рассматриваются вынужденные колеба$
ния линейного осциллятора без трения (§ VII.5), определенные урав$
нением
m

d 2x
+ kx = A sin ωt
dt 2

(69)

и начальными условиями
x

t =0

= x0 ,

dx
dt

t =0

= 0.

(70)

В этой задаче пять параметров: m, k, A, ω, x 0 . Чтобы выяснить, когда
при различных комбинациях этих параметров колебания будут подо$
бными, примем 1 ω и x 0 ≠ 0 за характерные время и длину и обозна$
1
чим t = ~t , x = x 0 x~. После перехода к безразмерным переменным ~t, x~
ω
и простых преобразований мы получим дифференциальное уравнение
и начальные условия в виде
d 2 x~
k ~
A
+
sin ~t ,
x=
dt~ 2 mω 2
x 0 mω 2

x~

~t = 0

= 1,

dx~
dt~

~t = 0

= 0.

(71)

285

ПОДОБИЕ ЯВЛЕНИЙ

Решение эталонной задачи (71) имеет вид x~ = ϕ (~t ; I 1 , I 2 ), где кон$
кретный вид функции ϕ легко получить по методу § VII.5. Возвраща$
ясь к исходным переменным, получаем закон колебаний

k
A 
x = x0ϕ ωt;
,
.
mω 2 x 0 mω 2 


Во многих случаях критерии подобия можно установить непосред$
ственно из соображений размерности. Так, в разобранной задаче при$
мем за основные размерности массы М, времени Т и длины L. Тогда
размерности параметров задачи будут равны [m] = M , k = MT −2 ,
[A] = MT −2 L, [ω] = T −1 , [x 0 ] = L (проверьте!). Из этих параметров
можно составить только одну безразмерную комбинацию, не содержа$
щую начальных данных, а именно I 1 . (Конечно, величины I 12 , I 1−1 2 и
т.п. также будут безразмерными, но они не дадут новых, независимых
критериев подобия.) Другой безразмерной комбинацией, содержащей
начальные данные, является I 2 . Нетрудно проверить — это мы пред$
оставляем читателю, — что любую безразмерную комбинацию вида
I 1b I 2c , т.е.
m a k b A c w d x 0e можно представить следующим образом:
в данной задаче критериев подобия, независимых от I 1 и I 2 , нет.
Рассмотрим еще один пример. Пусть шарик массы m подвешен на
нити длины l и колеблется с частотой ν и максимальным углом α
отклонения от вертикали; при этом сопротивлением воздуха, массой
нити и другими усложняющими факторами будем пренебрегать. Ясно,
что между указанными параметрами и ускорением тяготения g име$
ется одно соотношение: например, можно задать m, l, g и α произ$
вольно, тогда ν определяется однозначно. Напишем размерности всех
параметров: [m] = M , l = L, [ν] = T −1 , [α] = 1, [ g ] = LT −2 . Здесь по$
лной системой безразмерных критериев будет S = lν2 g −1 и α; а так
как между ними должно быть соотношение, то S должно зависеть
только от α, откуда

[]

[]

Таким образом, если у одного осциллятора значения
k
A
, I2 =
I1 =
mω 2
x 0 mω 2

§ 10]

(72)

будут теми же, что у другого, то эталонные задачи (71) для них будут
одинаковыми, т.е. соответствующие колебания — подобными. Нетруд$
но проверить, что величины I 1 и I 2 безразмерны. (Применив ре$
зультаты § VII.5, легко получить формулы I 1 = ω 20 ω 2 , I 2 = x своб x 0 ,
где ω 0 — собственная частота осциллятора, а x своб — амплитуда коле$
баний свободной массы m под действием силы A sinωt.) Такие безраз$
мерные величины, совпадение которых обеспечивает подобие явлений,
принято называть критериями подобия. Итак, в рассматриваемой зада$
че имеется два критерия (72), из которых только I 1 определяется па$
раметрами осциллятора, тогда как совпадение I 2 можно обеспечить
за счет подбора начальных условий. (В предыдущих рассуждениях был
исключен случай x 0 = 0. Мы предоставляем читателю убедиться, что
в этом случае единственным критерием подобия, будет I 1 .)

S

1

2

1

= l 2 νg

−1

2

= f (α ),

т.е. ν =

g
f(α ).
l

(73)

Функцию f (α) можно получить либо численно, с помощью интег$
рирования соответствующего дифференциального уравнения, либо
экспериментально, с помощью измерения ν при заданных значениях
остальных параметров. Так как S выражается через α, то α в данной
задаче является единственным критерием подобия.
Как видим, простые соображения размерности дали возможность
получить важные сведения о колебаниях. Конечно, это только самые
простые примеры приложения теории подобия и размерности, которая
сейчас широко применяется в различных разделах физики. Упомянем
несколько книг, содержащих изложение этой теории и ее приложений:

284

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

чтобы уравнения для обоих случаев стали одинаковыми. Конечно, если
речь идет о дифференциальных уравнениях, то после преобразования
должны совпасть и начальные условия, которые также нужны для
определения решения. Равносильный способ: если уравнения для двух
явлений можно с помощью линейных преобразований привести к од$
ному и тому же «эталонному» виду, то явления подобны.
Приведем пример. Пусть рассматриваются вынужденные колеба$
ния линейного осциллятора без трения (§ VII.5), определенные урав$
нением
m

d 2x
+ kx = A sin ωt
dt 2

(69)

и начальными условиями
x

t =0

= x0 ,

dx
dt

t =0

= 0.

(70)

В этой задаче пять параметров: m, k, A, ω, x 0 . Чтобы выяснить, когда
при различных комбинациях этих параметров колебания будут подо$
бными, примем 1 ω и x 0 ≠ 0 за характерные время и длину и обозна$
1
чим t = ~t , x = x 0 x~. После перехода к безразмерным переменным ~t, x~
ω
и простых преобразований мы получим дифференциальное уравнение
и начальные условия в виде
d 2 x~
k ~
A
+
sin ~t ,
x=
dt~ 2 mω 2
x 0 mω 2

x~

~t = 0

= 1,

dx~
dt~

~t = 0

= 0.

(71)

285

ПОДОБИЕ ЯВЛЕНИЙ

Решение эталонной задачи (71) имеет вид x~ = ϕ (~t ; I 1 , I 2 ), где кон$
кретный вид функции ϕ легко получить по методу § VII.5. Возвраща$
ясь к исходным переменным, получаем закон колебаний

k
A 
x = x0ϕ ωt;
,
.
mω 2 x 0 mω 2 


Во многих случаях критерии подобия можно установить непосред$
ственно из соображений размерности. Так, в разобранной задаче при$
мем за основные размерности массы М, времени Т и длины L. Тогда
размерности параметров задачи будут равны [m] = M , k = MT −2 ,
[A] = MT −2 L, [ω] = T −1 , [x 0 ] = L (проверьте!). Из этих параметров
можно составить только одну безразмерную комбинацию, не содержа$
щую начальных данных, а именно I 1 . (Конечно, величины I 12 , I 1−1 2 и
т.п. также будут безразмерными, но они не дадут новых, независимых
критериев подобия.) Другой безразмерной комбинацией, содержащей
начальные данные, является I 2 . Нетрудно проверить — это мы пред$
оставляем читателю, — что любую безразмерную комбинацию вида
I 1b I 2c , т.е.
m a k b A c w d x 0e можно представить следующим образом:
в данной задаче критериев подобия, независимых от I 1 и I 2 , нет.
Рассмотрим еще один пример. Пусть шарик массы m подвешен на
нити длины l и колеблется с частотой ν и максимальным углом α
отклонения от вертикали; при этом сопротивлением воздуха, массой
нити и другими усложняющими факторами будем пренебрегать. Ясно,
что между указанными параметрами и ускорением тяготения g име$
ется одно соотношение: например, можно задать m, l, g и α произ$
вольно, тогда ν определяется однозначно. Напишем размерности всех
параметров: [m] = M , l = L, [ν] = T −1 , [α] = 1, [ g ] = LT −2 . Здесь по$
лной системой безразмерных критериев будет S = lν2 g −1 и α; а так
как между ними должно быть соотношение, то S должно зависеть
только от α,откуда

[]

[]

Таким образом, если у одного осциллятора значения
k
A
, I2 =
I1 =
mω 2
x 0 mω 2

§ 10]

(72)

будут теми же, что у другого, то эталонные задачи (71) для них будут
одинаковыми, т.е. соответствующие колебания — подобными. Нетруд$
но проверить, что величины I 1 и I 2 безразмерны. (Применив ре$
зультаты § VII.5, легко получить формулы I 1 = ω 20 ω 2 , I 2 = x своб x 0 ,
где ω 0 — собственная частота осциллятора, а x своб — амплитуда коле$
баний свободной массы m под действием силы A sinωt.) Такие безраз$
мерные величины, совпадение которых обеспечивает подобие явлений,
принято называть критериями подобия. Итак, в рассматриваемой зада$
че имеется два критерия (72), из которых только I 1 определяется па$
раметрами осциллятора, тогда как совпадение I 2 можно обеспечить
за счет подбора начальных условий. (В предыдущих рассуждениях был
исключен случай x 0 = 0. Мы предоставляем читателю убедиться, что
в этом случае единственным критерием подобия, будет I 1 .)

S

1

2

1

= l 2 νg

−1

2

= f (α ),

т.е. ν =

g
f(α ).
l

(73)

Функцию f (α) можно получить либо численно, с помощью интег$
рирования соответствующего дифференциального уравнения, либо
экспериментально, с помощью измерения ν при заданных значениях
остальных параметров. Так как S выражается через α, то α в данной
задаче является единственным критерием подобия.
Как видим, простые соображения размерности дали возможность
получить важные сведения о колебаниях. Конечно, это только самые
простые примеры приложения теории подобия и размерности, которая
сейчас широко применяется в различных разделах физики. Упомянем
несколько книг, содержащих изложение этой теории и ее приложений:

286

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

П.В. Б р и д ж м е н, Анализ размерностей, ОНТИ, 1934; Л.И. С е д о в,
Методы подобия и размерности в механике, «Наука», изд. 6, 1967;
Д.А. Ф р а н к : К а м е н е ц к и й, Диффузия и теплопередача в химичес:
кой кинетике, изд. 2, «Наука», 1967. Начиная с некоторого уровня, ма:
тематическая теория тесно переплетается здесь с физикой и
развивается в различных областях физики по:разному.
На подобии явлений основано моделирование, при котором поведение
какого:либо объекта выясняется на его модели, подобной в указанном
выше смысле. Например, чтобы выяснить, с какой частотой будет при за:
данном α качаться маятник на Луне, можно измерить частоту при том
же α в земных условиях, после чего произвести пересчет по формуле
ν1 : ν 2 =

g1
:
l1

g2
l2

§ 11]

Методы приближенного вычисления, описываемые в этой книге,
расчитаны на ручной счет с помощью обычного инженерного кальку:
лятора или простого карандаша. Однако во многих случаях весьма по:
лезным оказывается применение компьютера, что во многих случаях
во много раз повышает скорость, надежность и точность вычислений,
а в более сложных случаях впервые создает возможность для самих этих
вычислений. Это делает привлечение компьютеров к любым сколько:ни:
будь громоздким вычислениям (в частности, к численному решению
дифференциальных уравнений) крайне желательным.
Конечно, не следует впадать в крайность и думать, что применение
компьютеров делает излишним получение аналитических (точных, при:
ближенных, асимптотических) формул и методов и «ручной» счет.
Аналитические решения, когда они возможны, часто обладают неоцени:
мым преимуществом из:за своей компактности, особенно если задача
включает параметры или решение получается как функция нескольких
независимых переменных. Асимптотические формулы действуют в слу:
чаях, когда применение численных методов вообще становится затрудни:
тельным. «Ручной» счет из:за своей мобильности наиболее приспособлен
к выполнению прикидочных расчетов, которые следует производить как
можно чаще, в том числе и при подготовке более объемных вычислений.
Таким образом, применение компьютеров призвано н е з а м е н и т ь дру:
гие плодотворные математические методы, а с о ч е т а т ь с я с ними, су:
щественно расширяя возможности приложения математики.
При решении на компьютере задачи, уже сформулированной мате:
матически, обычно наиболее ответственным пунктом является подго:
товка задачи к программированию. Бывает не так:то просто выбрать

287

метод, чтобы он давал надежный результат и был посилен компьютеру,
имеющемуся в Вашем распоряжении, — а ведь компьютеры мощны, но
далеко не всесильны! При такой подготовке зачастую приходится зна:
чительно перестраивать «математическую психологию», воспитанную
на «ручных» методах.
Например, в «докомпьютерную» эру считалось само собой разуме:
ющимся, что если в нелинейном дифференциальном уравнении воз:
можно с помощью некоторой подстановки понизить порядок, то это
следует сделать. Например, для решения уравнения
y′′ = f ( y, y′ ) ( y = y( x ))

(74)

рекомендовалась такая процедура: рассматривать зависимость y ′ = p
dy ′ dp dy
dp
от у, откуда y ′′ =
=
= p , и уравнение (74) принимает вид
dx dy dx
dy

вытекающей из соотношения (73).
§ 11. Применяйте компьютеры!

ПРИМЕНЯЙТЕ КОМПЬЮТЕРЫ!

p

dp
= f ( y, p ) ( p = p( y )),
dy

(75)

т.е. получается уравнение 1:го порядка. Если нам удастся его проинтег:
рировать, т.е. найти общее решение p = ϕ(y; C1 ), то дальше пишем
p=

dy
= ϕ( y; C1 ),
dx

откуда
dy
= dx
ϕ( y; C1 )

и

dy

∫ ϕ( y; C1 ) = x + C 2 .

(76)

Такая процедура иногда приводит к цели, особенно при аналитичес:
ком исследовании решения, однако для численного решения, особенно
на компьютере, она обычно оказывается нецелесообразной. В самом
деле, нам придется численно решать уравнение (75) (а если оно будет ре:
шено в квадратурах, то вычислять соответствующие интегралы), затем
вычислять интеграл (76) и, наконец, обращать полученную зависи:
мость x(y). Но гораздо проще — как для составления таблицы значений
частного решения, так и для сводных таблиц общего решения — н е п о с:
р е д с т в е н н о численно интегрировать уравнение (74), без понижения
его порядка. Так и надо поступать при работе на компьютере.
Таким образом, надо уметь хотя бы совсем грубо оценивать объем
вычислительной работы, необходимой для доведения решения задачи
до конца.
Другой пример. Сама постановка задачи §§ I.2 и III.4 о приближен:
ном вычислении сумм с помощью интегралов была, конечно, вызвана
потребностями «ручного» счета. При таком счете приведенные прибли:
женные формулы и методы их уточнения оказываются весьма полезны:
ми. Однако при применении компьютера в большинстве случаев более
эффективным оказывается непосредственное суммирование членов.

286

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

П.В. Б р и д ж м е н, Анализ размерностей, ОНТИ, 1934; Л.И. С е д о в,
Методы подобия и размерности в механике, «Наука», изд. 6, 1967;
Д.А. Ф р а н к : К а м е н е ц к и й, Диффузия и теплопередача в химичес:
кой кинетике, изд. 2, «Наука», 1967. Начиная с некоторого уровня, ма:
тематическая теория тесно переплетается здесь с физикой и
развивается в различных областях физики по:разному.
На подобии явлений основано моделирование, при котором поведение
какого:либо объекта выясняется на его модели, подобной в указанном
выше смысле. Например, чтобы выяснить, с какой частотой будет при за:
данном α качаться маятник на Луне, можно измерить частоту при том
же α в земных условиях, после чего произвести пересчет по формуле
ν1 : ν 2 =

g1
:
l1

g2
l2

§ 11]

Методы приближенного вычисления, описываемые в этой книге,
расчитаны на ручной счет с помощью обычного инженерного кальку:
лятора или простого карандаша. Однако во многих случаях весьма по:
лезным оказывается применение компьютера, что во многих случаях
во много раз повышает скорость, надежность и точность вычислений,
а в более сложных случаях впервые создает возможность для самих этих
вычислений. Это делает привлечение компьютеров к любым сколько:ни:
будь громоздким вычислениям (в частности, к численному решению
дифференциальных уравнений) крайне желательным.
Конечно, не следует впадать в крайность и думать, что применение
компьютеров делает излишним получение аналитических (точных, при:
ближенных, асимптотических) формул и методов и «ручной» счет.
Аналитические решения, когда они возможны, часто обладают неоцени:
мым преимуществом из:за своей компактности, особенно если задача
включает параметры или решение получается как функция нескольких
независимых переменных. Асимптотические формулы действуют в слу:
чаях, когда применение численных методов вообще становится затрудни:
тельным. «Ручной» счет из:за своей мобильности наиболее приспособлен
к выполнению прикидочных расчетов, которые следует производить как
можно чаще, в том числе и при подготовке более объемных вычислений.
Таким образом, применение компьютеров призвано н е з а м е н и т ь дру:
гие плодотворные математические методы, а с о ч е т а т ь с я с ними, су:
щественно расширяя возможности приложения математики.
При решении на компьютере задачи, уже сформулированной мате:
матически, обычно наиболее ответственным пунктом является подго:
товка задачи к программированию. Бывает не так:то просто выбрать

287

метод, чтобы он давал надежный результат и был посилен компьютеру,
имеющемуся в Вашем распоряжении, — а ведь компьютеры мощны, но
далеко не всесильны! При такой подготовке зачастую приходится зна:
чительно перестраивать «математическую психологию», воспитанную
на «ручных» методах.
Например, в «докомпьютерную» эру считалось само собой разуме:
ющимся, что если в нелинейном дифференциальном уравнении воз:
можно с помощью некоторой подстановки понизить порядок, то это
следует сделать. Например, для решения уравнения
y′′ = f ( y, y′ ) ( y = y( x ))

(74)

рекомендовалась такая процедура: рассматривать зависимость y ′ = p
dy ′ dp dy
dp
от у, откуда y ′′ =
=
= p , и уравнение (74) принимает вид
dx dy dx
dy

вытекающей из соотношения (73).
§ 11. Применяйте компьютеры!

ПРИМЕНЯЙТЕ КОМПЬЮТЕРЫ!

p

dp
= f ( y, p ) ( p = p( y )),
dy

(75)

т.е. получается уравнение 1:го порядка. Если нам удастся его проинтег:
рировать, т.е. найти общее решение p = ϕ(y; C1 ), то дальше пишем
p=

dy
= ϕ( y; C1 ),
dx

откуда
dy
= dx
ϕ( y; C1 )

и

dy

∫ ϕ( y; C1 ) = x + C 2 .

(76)

Такая процедура иногда приводит к цели, особенно при аналитичес:
ком исследовании решения, однако для численного решения, особенно
на компьютере, она обычно оказывается нецелесообразной. В самом
деле, нам придется численно решать уравнение (75) (а если оно будет ре:
шено в квадратурах, то вычислять соответствующие интегралы), затем
вычислять интеграл (76) и, наконец, обращать полученную зависи:
мость x(y). Но гораздо проще — как для составления таблицы значений
частного решения, так и для сводных таблиц общего решения — н е п о с:
р е д с т в е н н о численно интегрировать уравнение (74), без понижения
его порядка. Так и надо поступать при работе на компьютере.
Таким образом, надо уметь хотя бы совсем грубо оценивать объем
вычислительной работы, необходимой для доведения решения задачи
до конца.
Другой пример. Сама постановка задачи §§ I.2 и III.4 о приближен:
ном вычислении сумм с помощью интегралов была, конечно, вызвана
потребностями «ручного» счета. При таком счете приведенные прибли:
женные формулы и методы их уточнения оказываются весьма полезны:
ми. Однако при применении компьютера в большинстве случаев более
эффективным оказывается непосредственное суммирование членов.

288

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Но и здесь нельзя действовать вслепую! Допустим, что мы хотим
вычислить сумму бесконечного ряда
S=

1
1
1
+
+ ... + 2 + ...
12 2 2
n

Уверовав во всесилие компьютера, можно было бы попытаться подсчиты:
вать и складывать члены ряда, пока они не обратятся в машинный нуль, т.е.
не станут равными нулю после округления, необходимого для записи чис:
–50
ла, после чего частичные суммы ряда перестанут возрастать. Приняв 10
за машинный нуль, получаем, что вычисления прекратятся при
1
< 10 −50 ,
n2

т.е. n > 10 25 .

Ошибка при этом, как видно из § III.4, будет близка к 1 n, т.е. будет на
двадцать пять порядков выше последних слагаемых.
Конечно, так вычислять нельзя. Результат получится гораздо быс:
трее и точнее, например, если просуммировать 1000 первых членов
ряда, а остаток заменить на интеграл по методу § III.4; при этом точ:
ность результата можно установить, повторив вычисление для 2000
членов. А еще лучше посмотреть сначала справочник И.С. Градштейна
и И.М. Рыжика, где вы найдете, что S = π 2 6, а значение π 2 может с
большой точностью вычислить сам компьютер. (Конечно, тут нам про:
сто повезло, так как числовые ряды редко «сворачиваются» в конечные
выражения через известные константы.)
Вычисления на компьютере в принципе дискретны. Поэтому при
ориентировке на компьютере надо, формулируя задачу в виде диффе:
ренциального или интегрального уравнения, думать о том, как выгля:
дит эта задача и метод ее решения на дискретном языке. Для уравнений
с более чем одним независимым переменным это вызывает разнообраз:
ные осложнения, многие из которых еще не преодолены.
Особого внимания требуют задачи, содержащие параметры. Пусть,
например, мы хотим составить таблицу, по которой можно было бы ре:
шать полное кубическое уравнение
ax 3 + bx 2 + cx + d = 0.

(77)

Если допустить, что каждый из параметров а, b, с, d может прини:
мать 50 значений — а это не так уж много, — то всего получится
504 ≈ 6 ⋅ 10 6 комбинаций этих значений. Отпечатанная таблица займет
около 100 томов по 500 страниц и Вы проклянете тот час, когда Вам
пришла в голову идея заняться этой задачей.
Кстати, характерной чертой многих людей, только что освоивших
технику работы на компьютере и пораженных его мощностью, являет:
ся стремление получить как можно большее количество численных ре:
зультатов, на основе наивного принципа «чем больше результатов, тем
больше информации, т.е. тем больше пользы». Но часто эти люди ока:

§ 11]

ПРИМЕНЯЙТЕ КОМПЬЮТЕРЫ!

289

зываются потом подавленными морем цифр, причем проблема извле:
чения полезного вывода из этого моря может оказаться более сложной,
чем исходная задача. Положение здесь напоминает известную средне:
вековую легенду об ученике волшебника, который в отсутствие учите:
ля вызвал джинна и велел ему носить воду, но не смог его остановить
вовремя и в результате чуть не утонул. Поэтому весьма актуальным яв:
ляется один из основных тезисов, неоднократно подчеркиваемый из:
вестным американским вычислителем Р. Х е м м и н г о м в его книге
«Численные методы» (русский перевод, Физматлит, М., 1968):
«Прежде чем решать задачу, подумай, что делать с ее решением».
Вернемся к уравнению (77). На самом деле положение не так уж пе:
чально. Прежде всего поделим обе части уравнения на а:
x3 +

b 2 c
d
x + x + = 0.
a
a
a

Затем сделаем подстановку x = y + α, подобрав α так, чтобы уничто:
b
жить член с неизвестной во второй степени. Это даст α = − , и мы
3a
приходим к уравнению (проверьте!)
y 3 + py + q = 0,

где

p=

c b2
,

a 3a 2

q=

d
bc
2b 3
− 2 +
a 3a
27 a 3

Сделаем, наконец, подстановку y = βz ; это даст
β 3 z 3 + pβz + q = 0,

т.е.

z3 +

p
q
z + 3 = 0.
β2
β

Выбрав β = 3 q , мы приходим к уравнению
z 3 + rz + 1 = 0,

где

r = pq −2 3 .

(78)

Идея этих преобразований ясна: мы последовательно уменьшали
число параметров в уравнении, дойдя в итоге до уравнения (78) с еди:
нственным параметром r, представляющим собой комбинацию исход:
ных параметров. Для вычисления значения r по этим параметрам
требуются простые арифметические действия и таблица кубических
корней. Таблицу значений решений уравнения (78) в зависимости от
е д и н с т в е н н о г о параметра r уже нетрудно составить с помощью
компьютера, даже если этому параметру придать не 50, а 5000 значе:
ний. По решению z легко найти решение х:
x = βz + α = [(27 a 3 d − 9 abc + 2b 3 )1 3 z − b] / 3 a .

Как видим, решение получится в виде двух таблиц с одним входом
каждая (таблиц кубических корней и z (r)), что, конечно, несравненно
проще, чем одна таблица с четырьмя входами.
Проблема уменьшения числа параметров может возникнуть и при
решении дифференциального уравнения, содержащего параметры.

288

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Но и здесь нельзя действовать вслепую! Допустим, что мы хотим
вычислить сумму бесконечного ряда
S=

1
1
1
+
+ ... + 2 + ...
12 2 2
n

Уверовав во всесилие компьютера, можно было бы попытаться подсчиты:
вать и складывать члены ряда, пока они не обратятся в машинный нуль, т.е.
не станут равными нулю после округления, необходимого для записи чис:
–50
ла, после чего частичные суммы ряда перестанут возрастать. Приняв 10
за машинный нуль, получаем, что вычисления прекратятся при
1
< 10 −50 ,
n2

т.е. n > 10 25 .

Ошибка при этом, как видно из § III.4, будет близка к 1 n, т.е. будет на
двадцать пять порядков выше последних слагаемых.
Конечно, так вычислять нельзя. Результат получится гораздо быс:
трее и точнее, например, если просуммировать 1000 первых членов
ряда, а остаток заменить на интеграл по методу § III.4; при этом точ:
ность результата можно установить, повторив вычисление для 2000
членов. А еще лучше посмотреть сначала справочник И.С. Градштейна
и И.М. Рыжика, где вы найдете, что S = π 2 6, а значение π 2 может с
большой точностью вычислить сам компьютер. (Конечно, тут нам про:
сто повезло, так как числовые ряды редко «сворачиваются» в конечные
выражения через известные константы.)
Вычисления на компьютере в принципе дискретны. Поэтому при
ориентировке на компьютере надо, формулируя задачу в виде диффе:
ренциального или интегрального уравнения, думать о том, как выгля:
дит эта задача и метод ее решения на дискретном языке. Для уравнений
с более чем одним независимым переменным это вызывает разнообраз:
ные осложнения, многие из которых еще не преодолены.
Особого внимания требуют задачи, содержащие параметры. Пусть,
например, мы хотим составить таблицу, по которой можно было бы ре:
шать полное кубическое уравнение
ax 3 + bx 2 + cx + d = 0.

(77)

Если допустить, что каждый из параметров а, b, с, d может прини:
мать 50 значений — а это не так уж много, — то всего получится
504 ≈ 6 ⋅ 10 6 комбинаций этих значений. Отпечатанная таблица займет
около 100 томов по 500 страниц и Вы проклянете тот час, когда Вам
пришла в голову идея заняться этой задачей.
Кстати, характерной чертой многих людей, только что освоивших
технику работы на компьютере и пораженных его мощностью, являет:
ся стремление получить как можно большее количество численных ре:
зультатов, на основе наивного принципа «чем больше результатов, тем
больше информации, т.е. тем больше пользы». Но часто эти люди ока:

§ 11]

ПРИМЕНЯЙТЕ КОМПЬЮТЕРЫ!

289

зываются потом подавленными морем цифр, причем проблема извле:
чения полезного вывода из этого моря может оказаться более сложной,
чем исходная задача. Положение здесь напоминает известную средне:
вековую легенду об ученике волшебника, который в отсутствие учите:
ля вызвал джинна и велел ему носить воду, но не смог его остановить
вовремя и в результате чуть не утонул. Поэтому весьма актуальным яв:
ляется один из основных тезисов, неоднократно подчеркиваемый из:
вестным американским вычислителем Р. Х е м м и н г о м в его книге
«Численные методы» (русский перевод, Физматлит, М., 1968):
«Прежде чем решать задачу, подумай, что делать с ее решением».
Вернемся к уравнению (77). На самом деле положение не так уж пе:
чально. Прежде всего поделим обе части уравнения на а:
x3 +

b 2 c
d
x + x + = 0.
a
a
a

Затем сделаем подстановку x = y + α, подобрав α так, чтобы уничто:
b
жить член с неизвестной во второй степени. Это даст α = − , и мы
3a
приходим к уравнению (проверьте!)
y 3 + py + q = 0,

где

p=

c b2
,

a 3a 2

q=

d
bc
2b 3
− 2 +
a 3a
27 a 3

Сделаем, наконец, подстановку y = βz ; это даст
β 3 z 3 + pβz + q = 0,

т.е.

z3 +

p
q
z + 3 = 0.
β2
β

Выбрав β = 3 q , мы приходим к уравнению
z 3 + rz + 1 = 0,

где

r = pq −2 3 .

(78)

Идея этих преобразований ясна: мы последовательно уменьшали
число параметров в уравнении, дойдя в итоге до уравнения (78) с еди:
нственным параметром r, представляющим собой комбинацию исход:
ных параметров. Для вычисления значения r по этим параметрам
требуются простые арифметические действия и таблица кубических
корней. Таблицу значений решений уравнения (78) в зависимости от
е д и н с т в е н н о г о параметра r уже нетрудно составить с помощью
компьютера, даже если этому параметру придать не 50, а 5000 значе:
ний. По решению z легко найти решение х:
x = βz + α = [(27 a 3 d − 9 abc + 2b 3 )1 3 z − b] / 3 a .

Как видим, решение получится в виде двух таблиц с одним входом
каждая (таблиц кубических корней и z (r)), что, конечно, несравненно
проще, чем одна таблица с четырьмя входами.
Проблема уменьшения числа параметров может возникнуть и при
решении дифференциального уравнения, содержащего параметры.

290

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Один из таких примеров был рассмотрен в § 10, где задача о решении
уравнения (69) с начальными условиями (70), содержащая пять пара:
метров (если учесть, что само решение представляет собой функцию t,
то получаем, что для представления этого решения требуется таблица
с шестью входами!), была с помощью преобразований подобия сведена
к задаче (71) с двумя параметрами (72).
В качестве другого примера рассмотрим решение уравнения (74)
без параметров при произвольных начальных данных
y( x0 ) = y0 ,

§ 11]

ПРИМЕНЯЙТЕ КОМПЬЮТЕРЫ!

20 значений, то избавление от него означает уменьшение вычислительной
работы и объема итоговых таблиц в 20 раз. Во:вторых, получающиеся по:
сле преобразования задачи комбинации параметров часто имеют глубо:
кий смысл, связанный с физической картиной явления.
Иногда при применении компьютера оказывается целесообразным
принципиально менять известную ранее методику решения задач.
Например, при вычислении интеграла
I=

y′( x0 ) = y′0 .

Здесь, по первому впечатлению, для представления решения требуется
таблица с четырьмя входами, так как параметры x 0 , y 0 , y 0′ и незави:
симое переменное х могут принимать произвольные значения. Одна:
ко число входов легко уменьшить до трех. В самом деле, уравнение (74)
не содержит х, т.е. инвариантно относительно преобразования
x → x + const. Поэтому наряду с решением y = g (x) уравнение (74)
при любом С имеет решение y = g (x + C). Но это значит, что решение
у зависит не от х и x 0 в отдельности, а от комбинации x − x 0 :
y = ψ( x − x0 ; y0 , y′0 ).

(79)

Таким образом, достаточно составить таблицу с т р е м я входами
y = ψ(x; y 0 , y 0′ ) для решения уравнения (74) при x 0 = 0; после этого
при любом x 0 можно найти решение по формуле (79).
В последнем примере уменьшение числа входов в полной таблице
решения получилось в результате указания группы преобразований
x → x + C, относительно которой рассматриваемое уравнение остается
инвариантным (о понятии группы преобразований см. в § XIV.4). Это
означает также, что совокупность графиков всех решений инвариантна
относительно переносов вдоль оси х: каждый такой график после пе:
реноса перейдет в график какого:либо иного решения; интересно, что
к этому выводу мы приходим на основании анализа самого уравнения,
не зная решений!
Оказывается, что знание непрерывной группы преобразований (т.е.
преобразований, зависящих от одного или нескольких непрерывных
параметров), оставляющих заданное дифференциальное уравнение
инвариантным, всегда дает возможность понизить число входов в по:
лной таблице его решения. К сожалению, такие группы удается обнару:
жить далеко не всегда, однако иногда они подсказываются
физическими соображениями (как группа сдвигов во времени для ав:
тономной системы).
Не жалейте времени на уменьшение числа параметров в задаче! Преж:
де всего это уменьшает объем вычислительной работы и делает результа:
ты вычисления более обозримыми: например, если параметр принимает

291

∫ f(M ) d Ω

(Ω )

по области (Ω) высокой размерности и сложной формы оказывается
полезным не применение квадратурных формул типа формулы
Симпсона (§ I.1), а следущий метод, основанный на подходе к интегра:
лу как к среднему арифметическому значению функции. Именно, в об:
ласти (Ω) наугад выбираются точки M 1 , M 2 , . . . , M N (для этого в
компьютере имеются датчики случайных чисел, принимаемых за коор:
динаты этих точек), после чего полагается
I≈

1
f ( M1 ) + f ( M 2 ) + ... + f ( M N ) .
N

[

]

При большом N — а компьютер может это обеспечить — точность этой
формулы оказывается практически приемлемой. Этот метод является
одним из простейших проявлений общего специфически машинного
метода МонтеКарло*, в котором искомая величина представляется
в виде среднего значения некоторой случайной величины (§ XIII.7),
а это среднее значение заменяется средним арифметическим реализа:
ций этой величины при большом числе независимых испытаний.
Вопросом принципиальной важности при работе на компьютере
оказывается влияние ошибок округления. Когда в длинных цепочках
вычислений последующие выкладки все время опираются на результа:
ты предыдущих, ошибки округления могут разрастаться до такой сте:
пени, что начиная с некоторого момента мы будем иметь дело с одними
лишь ошибками.
Приведем яркий пример такого эффекта, заимствованный из инте:
ресной книги И. Б а б у ш к и, Э. В и т а с е к а и М. П р а г е р а «Числен:
ные процессы решения дифференциальных уравнений» (русский
перевод, «Мир», М., 1969). При вычислении интеграла
1

In =

1 n x
x e dx
e ∫0

( n = 0, 1, 2, ... )

(80)

* Назван по имени города, печально знаменитого своей рулеткой — учреждением, де:
ятельность которого полностью основана на независимых случайных испытаниях.

290

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

Один из таких примеров был рассмотрен в § 10, где задача о решении
уравнения (69) с начальными условиями (70), содержащая пять пара:
метров (если учесть, что само решение представляет собой функцию t,
то получаем, что для представления этого решения требуется таблица
с шестью входами!), была с помощью преобразований подобия сведена
к задаче (71) с двумя параметрами (72).
В качестве другого примера рассмотрим решение уравнения (74)
без параметров при произвольных начальных данных
y( x0 ) = y0 ,

§ 11]

ПРИМЕНЯЙТЕ КОМПЬЮТЕРЫ!

20 значений, то избавление от него означает уменьшение вычислительной
работы и объема итоговых таблиц в 20 раз. Во:вторых, получающиеся по:
сле преобразования задачи комбинации параметров часто имеют глубо:
кий смысл, связанный с физической картиной явления.
Иногда при применении компьютера оказывается целесообразным
принципиально менять известную ранее методику решения задач.
Например, при вычислении интеграла
I=

y′( x0 ) = y′0 .

Здесь, по первому впечатлению, для представления решения требуется
таблица с четырьмя входами, так как параметры x 0 , y 0 , y 0′ и незави:
симое переменное х могут принимать произвольные значения. Одна:
ко число входов легко уменьшить до трех. В самом деле, уравнение (74)
не содержит х, т.е. инвариантно относительно преобразования
x → x + const. Поэтому наряду с решением y = g (x) уравнение (74)
при любом С имеет решение y = g (x + C). Но это значит, что решение
у зависит не от х и x 0 в отдельности, а от комбинации x − x 0 :
y = ψ( x − x0 ; y0 , y′0 ).

(79)

Таким образом, достаточно составить таблицу с т р е м я входами
y = ψ(x; y 0 , y 0′ ) для решения уравнения (74) при x 0 = 0; после этого
при любом x 0 можно найти решение по формуле (79).
В последнем примере уменьшение числа входов в полной таблице
решения получилось в результате указания группы преобразований
x → x + C, относительно которой рассматриваемое уравнение остается
инвариантным (о понятии группы преобразований см. в § XIV.4). Это
означает также, что совокупность графиков всех решений инвариантна
относительно переносов вдоль оси х: каждый такой график после пе:
реноса перейдет в график какого:либо иного решения; интересно, что
к этому выводу мы приходим на основании анализа самого уравнения,
не зная решений!
Оказывается, что знание непрерывной группы преобразований (т.е.
преобразований, зависящих от одного или нескольких непрерывных
параметров), оставляющих заданное дифференциальное уравнение
инвариантным, всегда дает возможность понизить число входов в по:
лной таблице его решения. К сожалению, такие группы удается обнару:
жить далеко не всегда, однако иногда они подсказываются
физическими соображениями (как группа сдвигов во времени для ав:
тономной системы).
Не жалейте времени на уменьшение числа параметров в задаче! Преж:
де всего это уменьшает объем вычислительной работы и делает результа:
ты вычисления более обозримыми: например, если параметр принимает

291

∫ f(M ) d Ω

(Ω )

по области (Ω) высокой размерности и сложной формы оказывается
полезным не применение квадратурных формул типа формулы
Симпсона (§ I.1), а следущий метод, основанный на подходе к интегра:
лу как к среднему арифметическому значению функции. Именно, в об:
ласти (Ω) наугад выбираются точки M 1 , M 2 , . . . , M N (для этого в
компьютере имеются датчики случайных чисел, принимаемых за коор:
динаты этих точек), после чего полагается
I≈

1
f ( M1 ) + f ( M 2 ) + ... + f ( M N ) .
N

[

]

При большом N — а компьютер может это обеспечить — точность этой
формулы оказывается практически приемлемой. Этот метод является
одним из простейших проявлений общего специфически машинного
метода МонтеКарло*, в котором искомая величина представляется
в виде среднего значения некоторой случайной величины (§ XIII.7),
а это среднее значение заменяется средним арифметическим реализа:
ций этой величины при большом числе независимых испытаний.
Вопросом принципиальной важности при работе на компьютере
оказывается влияние ошибок округления. Когда в длинных цепочках
вычислений последующие выкладки все время опираются на результа:
ты предыдущих, ошибки округления могут разрастаться до такой сте:
пени, что начиная с некоторого момента мы будем иметь дело с одними
лишь ошибками.
Приведем яркий пример такого эффекта, заимствованный из инте:
ресной книги И. Б а б у ш к и, Э. В и т а с е к а и М. П р а г е р а «Числен:
ные процессы решения дифференциальных уравнений» (русский
перевод, «Мир», М., 1969). При вычислении интеграла
1

In =

1 n x
x e dx
e ∫0

( n = 0, 1, 2, ... )

(80)

* Назван по имени города, печально знаменитого своей рулеткой — учреждением, де:
ятельность которого полностью основана на независимых случайных испытаниях.

292

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

легко с помощью интегрирования по частям установить, что
I n = 1 − nI n −1 ( n = 1, 2, 3, ... ).

(81)

Кроме того,
1

I0 =

1 x
1
1
e dx = ( e − 1) = 1 − = 0,632.
e ∫0
e
e

(82)

Формулы (81) и (82) дают возможность последовательно вычислять
I 1 = 1 − 1I 0 , I 2 = 1 − 2I 1 и т.д. Приведем соответствующие результаты
I nI вычисления этих значений с тремя знаками после запятой:
n

0

1

2

3

4

5

6

7

I nI

0,632

0,368

0,264

0,208

0,168

0,160

0,040

8

0,720 –4,760

Результаты становятся явно нелепыми, так как из (80) непосредствен:
но видно, что I 0 > I 1 > I 2 > ... > 0.
Причины ошибки здесь ясны: при вычислении I nI первоначальная
погрешность округления I 0 множится на 1⋅ 2 ⋅ 3 ... n, а так как точное
значение I n ограничено (и даже стремится к нулю при n → ∞), то от:
носительная погрешность стремительно возрастает. Вычисления
с большим числом знаков, свойственные компьютеру, несколько помо:
гают, но ненадолго: так, при вычислениях с девятью значащими цифра:
ми результаты становятся нелепыми, начиная с n = 14. Пользой
повторного счета, с другим числом десятичных знаков, является то, что
мы узнаем, насколько надежными были наши вычисления.
В то же время вычисления нетрудно перестроить так, чтобы по:
грешности не разрастались, а уменьшались. Для этого достаточно соот:
ношение (81), заменив n на n + 1, переписать в виде
In =

1
(1 − I n + 1 ),
n+1

после чего вычислять I n от бо´льших n к меньшим, положив некото:
рое «отправное» I n просто равным нулю. Так, положив I 10 = 0, мы по:
лучим значения
n

9

I nII

0,100

8

7

0,100 0,112

6

5

0,127

0,146

4

3

2

0,171 0,207 0,264

1

0

0,368 0,632

Более точные вычисления показывают, что I 9 = 0092
, , I 8 = 0101
, , тогда
как все остальные цифры верные.
При вычислении интегралов и решении дифференциальных уравне:
ний из:за влияния ошибок округления порой получается парадокс:
с целью увеличить точность результата мы измельчаем шаги, но если при:
меняемый метод неустойчив, то из:за увеличения числа действий ошибки

ОТВЕТЫ И РЕШЕНИЯ

293

округления начинают сказываться сильнее и итоговая погрешность воз:
растает. Об этом необходимо помнить при работе на компьютере.
Итак, пользуйтесь компьютерами! Проводите вычисления по своим
задачам сами, не поручайте это другим*. Вычислитель, недостаточно
знакомый со спецификой задачи (если только он не является равноп:
равным соавтором), будет проводить много лишней работы, не сможет
вовремя перестроиться, сойти с неправильного пути, применить физи:
ческую интуицию и грубые прикидки, что неизбежно скажется на
результате.
И наконец, помните еще один основной тезис, подчеркиваемый
Р. Х е м м и н г о м в его книге, указанной на стр. 289:
«Цель расчетов — понимание, а не числа».
Все результаты вычислений должны быть физически осмыслены,
они должны выявить тенденции, влияния, а венцом работы должно
быть создание интерполяционной приближенной теории с коэффици:
ентами, полученными из точных расчетов. Пусть этот идеал не всегда
достижим, но давайте стремиться к идеалу!
Упражнение
Укажите число входов, необходимых при составлении таблицы общего ре:
шения уравнения y′′′ = f ( x, y′′ ).

ОТВЕТЫ И РЕШЕНИЯ
§ 1
Седло; узел; центр.
§ 2
( y2 + z 2 )
= 2 dx, откуда y 2 + z 2 = Ce 2 x . Отсюда видно,
y2 + z 2
что при x → ∞ все частные решения (кроме нулевого) уходят в бесконечность,
а при x → −∞ они стремятся к нулю.
yy′ + zz′ = y 2 + z 2 ,

§ 3
1. Если a ≠ 6, система имеет ровно одно решение. При a = 6, b ≠ 9 система
несовместна. При a = 6, b = 9 система имеет бесконечное количество реше:
3−t
ний: x = t, y =
(при любом t).
2
2. p1 = 1, λ 1 = 1, μ1 = 3; p2 = 6, λ 2 = 1, μ 2 = −2; x = C1 e t + C 2 e 6 t ,
y = 3C1 e t − 2C 2 e 6 t .
* Как говорилось в популярной в свое время песне, надо
«Задачи решать самому,
И это серьезное дело
Нельзя поручать никому».
Там это было сказано по поводу любви, но не в меньшей степени это относится к вычис:
лительной работе по реальным задачам.

292

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

легко с помощью интегрирования по частям установить, что
I n = 1 − nI n −1 ( n = 1, 2, 3, ... ).

(81)

Кроме того,
1

I0 =

1 x
1
1
e dx = ( e − 1) = 1 − = 0,632.
e ∫0
e
e

(82)

Формулы (81) и (82) дают возможность последовательно вычислять
I 1 = 1 − 1I 0 , I 2 = 1 − 2I 1 и т.д. Приведем соответствующие результаты
I nI вычисления этих значений с тремя знаками после запятой:
n

0

1

2

3

4

5

6

7

I nI

0,632

0,368

0,264

0,208

0,168

0,160

0,040

8

0,720 –4,760

Результаты становятся явно нелепыми, так как из (80) непосредствен:
но видно, что I 0 > I 1 > I 2 > ... > 0.
Причины ошибки здесь ясны: при вычислении I nI первоначальная
погрешность округления I 0 множится на 1⋅ 2 ⋅ 3 ... n, а так как точное
значение I n ограничено (и даже стремится к нулю при n → ∞), то от:
носительная погрешность стремительно возрастает. Вычисления
с большим числом знаков, свойственные компьютеру, несколько помо:
гают, но ненадолго: так, при вычислениях с девятью значащими цифра:
ми результаты становятся нелепыми, начиная с n = 14. Пользой
повторного счета, с другим числом десятичных знаков, является то, что
мы узнаем, насколько надежными были наши вычисления.
В то же время вычисления нетрудно перестроить так, чтобы по:
грешности не разрастались, а уменьшались. Для этого достаточно соот:
ношение (81), заменив n на n + 1, переписать в виде
In =

1
(1 − I n + 1 ),
n+1

после чего вычислять I n от бо´льших n к меньшим, положив некото:
рое «отправное» I n просто равным нулю. Так, положив I 10 = 0, мы по:
лучим значения
n

9

I nII

0,100

8

7

0,100 0,112

6

5

0,127

0,146

4

3

2

0,171 0,207 0,264

1

0

0,368 0,632

Более точные вычисления показывают, что I 9 = 0092
, , I 8 = 0101
, , тогда
как все остальные цифры верные.
При вычислении интегралов и решении дифференциальных уравне:
ний из:за влияния ошибок округления порой получается парадокс:
с целью увеличить точность результата мы измельчаем шаги, но если при:
меняемый метод неустойчив, то из:за увеличения числа действий ошибки

ОТВЕТЫ И РЕШЕНИЯ

293

округления начинают сказываться сильнее и итоговая погрешность воз:
растает. Об этом необходимо помнить при работе на компьютере.
Итак, пользуйтесь компьютерами! Проводите вычисления по своим
задачам сами, не поручайте это другим*. Вычислитель, недостаточно
знакомый со спецификой задачи (если только он не является равноп:
равным соавтором), будет проводить много лишней работы, не сможет
вовремя перестроиться, сойти с неправильного пути, применить физи:
ческую интуицию и грубые прикидки, что неизбежно скажется на
результате.
И наконец, помните еще один основной тезис, подчеркиваемый
Р. Х е м м и н г о м в его книге, указанной на стр. 289:
«Цель расчетов — понимание, а не числа».
Все результаты вычислений должны быть физически осмыслены,
они должны выявить тенденции, влияния, а венцом работы должно
быть создание интерполяционной приближенной теории с коэффици:
ентами, полученными из точных расчетов. Пусть этот идеал не всегда
достижим, но давайте стремиться к идеалу!
Упражнение
Укажите число входов, необходимых при составлении таблицы общего ре:
шения уравнения y′′′ = f ( x, y′′ ).

ОТВЕТЫ И РЕШЕНИЯ
§ 1
Седло; узел; центр.
§ 2
( y2 + z 2 )
= 2 dx, откуда y 2 + z 2 = Ce 2 x . Отсюда видно,
y2 + z 2
что при x → ∞ все частные решения (кроме нулевого) уходят в бесконечность,
а при x → −∞ они стремятся к нулю.
yy′ + zz′ = y 2 + z 2 ,

§ 3
1. Если a ≠ 6, система имеет ровно одно решение. При a = 6, b ≠ 9 система
несовместна. При a = 6, b = 9 система имеет бесконечное количество реше:
3−t
ний: x = t, y =
(при любом t).
2
2. p1 = 1, λ 1 = 1, μ1 = 3; p2 = 6, λ 2 = 1, μ 2 = −2; x = C1 e t + C 2 e 6 t ,
y = 3C1 e t − 2C 2 e 6 t .
* Как говорилось в популярной в свое время песне, надо
«Задачи решать самому,
И это серьезное дело
Нельзя поручать никому».
Там это было сказано по поводу любви, но не в меньшей степени это относится к вычис:
лительной работе по реальным задачам.

294

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 4
Равновесие в точке (0; 0) устойчивое; в точках (1; –1) и (–1; 1) неустойчивое.
§ 5
x2
x2
x3
; y3 ( x ) = 1 + x +
; ...
+
2
2 2 ⋅3
В пределе получаем точное решение y = e x , разложенное в ряд по степеням х.
x3 x5
2. y = x +
+
+ ...
3
6
2
1
x (6 − 8 x + 3 x 2 )
3. y =
+
α + ...
1− x
12(1 − x )2

ОТВЕТЫ И РЕШЕНИЯ

§ 8
1. Пусть λ > 0. Тогда y1 ( x ) = cos λ x, y2 ( x ) = sin λ x и определитель сис:
темы, аналогичной (56), равен
y 1(0)
y 1′ (l )

1. y0 ( x ) = 1; y1 ( x ) = 1 + x; y2 ( x ) = 1 + x +

§ 7
1. Приводим результаты вычислений по первому приближению, по второ:
му приближению и точные значения:
x

yпо первому

yпо второму

yточн.

0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0

1,0000
1,1000
1,2100
1,3310
1,4641
1,6105
1,7716
1,9488
2,1437
2,3581
2,5939

1,0000
1,1051
1,2212
1,3496
1,4915
1,6483
1,8216
2,0131
2,2248
2,4587
2,7172

1,0000
1,1052
1,2214
1,3499
1,4918
1,6487
1,8221
2,0138
2,2255
2,4596
2,7183

0,0

0,1

0,2

0,6

0,7

0,3

0,4

0,5

0,390

0,480

0,565 0,645

0,718 0,784 0,842

yточн.

0,000

0,100 0,199

0,296

0,389

0,479

0,565 0,644

0,717 0,783 0,842

0,2

0,3

0,4

0,5

x

0,000

0,100

0,201

0,305

0,412

0,525

λ x

λ l

λ l =−

, y2 ( x ) = e

+e





⎧ − cos ξ sin x

2. В данной задаче G ( x; ξ ) = ⎨
⎪ − sin ξ cos x

дачи имеет вид

λ x

π
+ kπ ,
2
, опре:

λ l⎞

⎟ < 0, т.е. в нуль


не обращается. При λ = 0 будет y1 = 1, y2 = x, определитель равен

1 0
= 1.
0 1

(0  x  ξ ),
π ⎞ Отсюда решение за:

⎜ ξ x  ⎟ .

2⎠

x

π
2

0

x

e

0,9

1,0

λ

λ



x



1

+e

1

e

0,296

0,1

(2k − 1)2 π 2
(k = 1, 2, ... ). Если λ < 0, то y1 ( x ) = e
4l 2
1
1

делитель равен
λ l
− λ l = − λ ⎜e

λe
− λe

λ=

y = −1 +

0,100 0,199

0,0

cos λ l = 0, т.е.

Отсюда спектр определяется из равенства

x

0,000

t

0
= λ cos λ l .
λ cos λ l

§ 9
Решение имеет вид

yприбл.

5. Приводим таблицу значений решения

0,8

y 2 (0)
1
=
y 2′ (l )
− λ sin λ l

y = − cos x ∫ sin ξ f (ξ) dξ − sin x ∫ cos ξ f (ξ) dξ.

2. По первому способу y(0,5 ) = 0,7081; по второму — 0,7161.
dv
3. Дифференциальное уравнение имеет вид
= 0,5 t (20 − t ) − 0,2 v. Ско:
dt
см
рость через 1,5 с после начала движения равна 9,682
.
с
4. Приводим результаты вычислений и точные значения
x

295

+e

λ

.

λ

При λ → +0 оно стремится к решению вырожденного уравнения, т.е. к y = −1
для всех х между –1 и 1. Вблизи обоих концов возникает пограничный
слой, ширина которого асимптотически при λ → 0 равна λ .
§ 11
Если z = ϕ( x; x0 , z 0 ) — решение уравнения z′ = f ( x, z ) при начальном
условии z( x0 ) = z 0 , то решение заданного уравнения при начальных условиях
y( x0 ) = y0 , y′( x0 ) = y′0 , y′′( x0 ) = y′′0 имеет вид
y = y 0 + y 0′ (x − x 0 ) +

x

s

x0

x0

∫ ds ∫ ϕ (σ; x 0 , y 0′′ ) dσ = y 0 +

т.е. достаточна таблица с тремя входами для ψ.

y 0′′(x − x 0 ) + ψ(x ; x 0 , y 0′′),

294

ДАЛЬНЕЙШИЕ СВЕДЕНИЯ О ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЯХ

[Гл. VIII

§ 4
Равновесие в точке (0; 0) устойчивое; в точках (1; –1) и (–1; 1) неустойчивое.
§ 5
x2
x2
x3
; y3 ( x ) = 1 + x +
; ...
+
2
2 2 ⋅3
В пределе получаем точное решение y = e x , разложенное в ряд по степенямх.
x3 x5
2. y = x +
+
+ ...
3
6
2
1
x (6 − 8 x + 3 x 2 )
3. y =
+
α + ...
1− x
12(1 − x )2

ОТВЕТЫ И РЕШЕНИЯ

§ 8
1. Пусть λ > 0. Тогда y1 ( x ) = cos λ x, y2 ( x ) = sin λ x и определитель сис:
темы, аналогичной (56), равен
y 1(0)
y 1′ (l )

1. y0 ( x ) = 1; y1 ( x ) = 1 + x; y2 ( x ) = 1 + x +

§ 7
1. Приводим результаты вычислений по первому приближению, по второ:
му приближению и точные значения:
x

yпо первому

yпо второму

yточн.

0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0

1,0000
1,1000
1,2100
1,3310
1,4641
1,6105
1,7716
1,9488
2,1437
2,3581
2,5939

1,0000
1,1051
1,2212
1,3496
1,4915
1,6483
1,8216
2,0131
2,2248
2,4587
2,7172

1,0000
1,1052
1,2214
1,3499
1,4918
1,6487
1,8221
2,0138
2,2255
2,4596
2,7183

0,0

0,1

0,2

0,6

0,7

0,3

0,4

0,5

0,390

0,480

0,565 0,645

0,718 0,784 0,842

yточн.

0,000

0,100 0,199

0,296

0,389

0,479

0,565 0,644

0,717 0,783 0,842

0,2

0,3

0,4

0,5

x

0,000

0,100

0,201

0,305

0,412

0,525

λ x

λ l

λ l =−

, y2 ( x ) = e

+e





⎧ − cos ξ sin x

2. В данной задаче G ( x; ξ ) = ⎨
⎪ − sin ξ cos x

дачи имеет вид

λ x

π
+ kπ ,
2
, опре:

λ l⎞

⎟ < 0, т.е. в нуль


не обращается. При λ = 0 будет y1 = 1, y2 = x, определитель равен

1 0
= 1.
0 1

(0  x  ξ ),
π ⎞ Отсюда решение за:

⎜ ξ x  ⎟ .

2⎠

x

π
2

0

x

e

0,9

1,0

λ

λ



x



1

+e

1

e

0,296

0,1

(2k − 1)2 π 2
(k = 1, 2, ... ). Если λ < 0, то y1 ( x ) = e
4l 2
1
1

делитель равен
λ l
− λ l = − λ ⎜e

λe
− λe

λ=

y = −1 +

0,100 0,199

0,0

cos λ l = 0, т.е.

Отсюда спектр определяется из равенства

x

0,000

t

0
= λ cos λ l .
λ cos λ l

§ 9
Решение имеет вид

yприбл.

5. Приводим таблицу значений решения

0,8

y 2 (0)
1
=
y 2′ (l )
− λ sin λ l

y = − cos x ∫ sin ξ f (ξ) dξ − sin x ∫ cos ξ f (ξ) dξ.

2. По первому способу y(0,5 ) = 0,7081; по второму — 0,7161.
dv
3. Дифференциальное уравнение имеет вид
= 0,5 t (20 − t ) − 0,2 v. Ско:
dt
см
рость через 1,5 с после начала движения равна 9,682
.
с
4. Приводим результаты вычислений и точные значения
x

295

+e

λ

.

λ

При λ → +0 оно стремится к решению вырожденного уравнения, т.е. к y = −1
для всех х между –1 и 1. Вблизи обоих концов возникает пограничный
слой, ширина которого асимптотически при λ → 0 равна λ .
§ 11
Если z = ϕ( x; x0 , z 0 ) — решение уравнения z′ = f ( x, z ) при начальном
условии z( x0 ) = z 0 , то решение заданного уравнения при начальных условиях
y( x0 ) = y0 , y′( x0 ) = y′0 , y′′( x0 ) = y′′0 имеет вид
y = y 0 + y 0′ (x − x 0 ) +

x

s

x0

x0

∫ ds ∫ ϕ (σ; x 0 , y 0′′ ) dσ = y 0 +

т.е. достаточна таблица с тремя входами для ψ.

y 0′′(x − x 0 ) + ψ(x ; x 0 , y 0′′),

§ 1]

ГЛАВА IX
ВЕКТОРЫ
В физике мы часто встречаемся с векторами, т.е. с величинами, ко
торые характеризуются не только числовым значением, но и направле
нием. Примерами таких величин могут служить отрезок, соединяющий
начало координат с данной точкой; скорость движения материальной
точки; сила, действующая на тело.
Если тело движется по определенной линии, например по прямому
рельсовому пути, то положение тела можно определять расстоянием от
определенной точки данной линии, измеренным вдоль этой линии.
Вдоль заданной линии движение возможно лишь в двух направлениях,
которые можно различать, приписывая одному направлению знак
плюс, а противоположному — знак минус.
Если же нам известно, что тело движется по плоскости или в про
странстве, то мы не сможем указать положение тела в данный момент
времени, если задано только расстояние тела от определенной точки;
необходимо задать еще направление линии, соединяющей тело с этой
точкой (началом координат). Точно так же, задавая скорость тела, надо
указывать ее величину и направление. Величины, имеющие направле
ние, называются векторами. Мы будем обозначать их полужирным
шрифтом или буквами со стрелкой наверху. В отличие от векторов, ве
личины, не имеющие направления и полностью определяющиеся сво
им числовым значением в выбранной системе единиц, называют
скалярами. Примерами скаляров служат масса тела, его энергия, темпе
ратура тела в какойлибо точке. Пока мы не рассматривали векторов,
специальное слово «скаляр» можно было не вводить в употребление.
Векторы можно рассматривать в трехмерном пространстве или на
плоскости (т.е. в «двумерном пространстве»).
Если отвлечься от направления векторной величины, то можно по
льзоваться модулем этой величины. Модуль — это положительный
скаляр, имеющий размерность рассматриваемой величины. Например,
для вектора F силы в 5 н, имеющего определенное направление, моду
лем (он обозначается через F или F) будет 5 н, F = 5 н.
Два вектора считаются равными, если они имеют равные модули, па
раллельны и направлены в одну и ту же сторону. Это значит, что каждый
вектор можно, не меняя его, перенести поступательно (параллельно

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

297

самому себе) в любое место, т.е. начало этого вектора может находиться
где угодно. Таким образом, задать вектор — это значит задать его мо
дуль и направление.
Вектор геометрически изображают отрезком, направление которого
отмечается стрелкой. Конечно, для этого надо условиться о масштабе
(например, указать, что сила в 1 н изображается отрезком в 3 см и т.п.).
Лишь векторную величину, имеющую размерность длины, можно изо
бразить без этого условия, т.е. в масштабе 1 : 1. Поэтому, например,
о векторе перемещения можно сказать, что, отложенный от точки A
пространства, он достигнет точки В, тогда как для вектора силы такое
утверждение бессмысленно.
§ 1. Линейные действия над векторами
К линейным действиям над векторами относятся сложение (и свя
занное с ним вычитание) и умножение вектора на скаляр. (Сложение
вектора со скаляром так же нелепо, как сложение секунд и сантимет
ров.) Величина может называться векторной, только если эти действия
осуществляются по описываемым ниже правилам.
B
b

b

a

a

b
a+

c
C

A

d

a

b
Рис. 101.

D

0
Рис. 102.

Сложение двух векторов выполняется по хорошо известному из
школьного курса физики и показанному на рис. 101 правилу паралле
лограмма. При этом, конечно, для нахождения суммы достаточно по
строить только один из показанных на рис. 101 треугольников. Отсюда
легко получить правило сложения нескольких векторов: на рис. 102

OB = a + b,

→ →
→ →
OC = OB + c = a + b + c, OD = OC + d = a + b + c + d.

(В трехмерном случае векторы а, b, с, d не обязаны лежать в одной
плоскости!) Таким образом, сумма нескольких векторов изображается
отрезком, замыкающим ломаную, звеньями которой служат векторысла
гаемые; направление этого замыкающего вектора берется от начала
первого слагаемого вектора к концу последнего.

§ 1]

ГЛАВА IX
ВЕКТОРЫ
В физике мы часто встречаемся с векторами, т.е. с величинами, ко
торые характеризуются не только числовым значением, но и направле
нием. Примерами таких величин могут служить отрезок, соединяющий
начало координат с данной точкой; скорость движения материальной
точки; сила, действующая на тело.
Если тело движется по определенной линии, например по прямому
рельсовому пути, то положение тела можно определять расстоянием от
определенной точки данной линии, измеренным вдоль этой линии.
Вдоль заданной линии движение возможно лишь в двух направлениях,
которые можно различать, приписывая одному направлению знак
плюс, а противоположному — знак минус.
Если же нам известно, что тело движется по плоскости или в про
странстве, то мы не сможем указать положение тела в данный момент
времени, если задано только расстояние тела от определенной точки;
необходимо задать еще направление линии, соединяющей тело с этой
точкой (началом координат). Точно так же, задавая скорость тела, надо
указывать ее величину и направление. Величины, имеющие направле
ние, называются векторами. Мы будем обозначать их полужирным
шрифтом или буквами со стрелкой наверху. В отличие от векторов, ве
личины, не имеющие направления и полностью определяющиеся сво
им числовым значением в выбранной системе единиц, называют
скалярами. Примерами скаляров служат масса тела, его энергия, темпе
ратура тела в какойлибо точке. Пока мы не рассматривали векторов,
специальное слово «скаляр» можно было не вводить в употребление.
Векторы можно рассматривать в трехмерном пространстве или на
плоскости (т.е. в «двумерном пространстве»).
Если отвлечься от направления векторной величины, то можно по
льзоваться модулем этой величины. Модуль — это положительный
скаляр, имеющий размерность рассматриваемой величины. Например,
для вектора F силы в 5 н, имеющего определенное направление, моду
лем (он обозначается через F или F) будет 5 н, F = 5 н.
Два вектора считаются равными, если они имеют равные модули, па
раллельны и направлены в одну и ту же сторону. Это значит, что каждый
вектор можно, не меняя его, перенести поступательно (параллельно

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

297

самому себе) в любое место, т.е. начало этого вектора может находиться
где угодно. Таким образом, задать вектор — это значит задать его мо
дуль и направление.
Вектор геометрически изображают отрезком, направление которого
отмечается стрелкой. Конечно, для этого надо условиться о масштабе
(например, указать, что сила в 1 н изображается отрезком в 3 см и т.п.).
Лишь векторную величину, имеющую размерность длины, можно изо
бразить без этого условия, т.е. в масштабе 1 : 1. Поэтому, например,
о векторе перемещения можно сказать, что, отложенный от точки A
пространства, он достигнет точки В, тогда как для вектора силы такое
утверждение бессмысленно.
§ 1. Линейные действия над векторами
К линейным действиям над векторами относятся сложение (и свя
занное с ним вычитание) и умножение вектора на скаляр. (Сложение
вектора со скаляром так же нелепо, как сложение секунд и сантимет
ров.) Величина может называться векторной, только если эти действия
осуществляются по описываемым ниже правилам.
B
b

b

a

a

b
a+

c
C

A

d

a

b
Рис. 101.

D

0
Рис. 102.

Сложение двух векторов выполняется по хорошо известному из
школьного курса физики и показанному на рис. 101 правилу паралле
лограмма. При этом, конечно, для нахождения суммы достаточно по
строить только один из показанных на рис. 101 треугольников. Отсюда
легко получить правило сложения нескольких векторов: на рис. 102

OB = a + b,

→ →
→ →
OC = OB + c = a + b + c, OD = OC + d = a + b + c + d.

(В трехмерном случае векторы а, b, с, d не обязаны лежать в одной
плоскости!) Таким образом, сумма нескольких векторов изображается
отрезком, замыкающим ломаную, звеньями которой служат векторысла
гаемые; направление этого замыкающего вектора берется от начала
первого слагаемого вектора к концу последнего.

298

ВЕКТОРЫ

[Гл. IX


Изменив на рис. 102 направление вектора OD на противополож
ное, мы приходим к следующему интересному выводу. Если векторы
образуют замкнутый многоугольник, т.е. каждый следующий вектор
приложен началом к концу предыдущего, а конец последнего совпадает
с началом первого, то сумма всех этих векторов равна нульвектору 0,
т.е. вектору, конец которого совпадает с его началом. Модуль нульвек
тора равен нулю, а направление не определено.
Отметим, что векторы нельзя соединять друг с другом знаком нера
венства, в частности, не бывает положительных и отрицательных век
торов.
Умножение вектора на скаляр (в частности, на число) получается в
результате естественного обобщения сложения и вычитания векторов.
Так, под вектором 3F понимается сумма F+F+F ; из построения ясно,
что этот вектор направлен так же, как F, но в три раза длиннее. Под
вектором (−1)F = − F понимается вектор, который в сумме с F дает
0; ясно, что этот вектор направлен противоположно вектору F и имеет
тот же модуль, что F. Обобщая эти определения, под λF (где λ —
любой скаляр) понимают вектор, модуль которого равен λ F , при
чем λF пapaллелен F и направлен в ту же сторону, что F, если λ > 0,
и в противоположную, если λ < 0. (При λ < 0 иногда говорят, что век
торы λF и F антипараллельны.)
При линейных действиях над векторами выполняются все обычные
правила элементарной математики. Например, можно слагаемое а в од
ной части равенства заменить на −a в другой, т.е. перенести слагаемое
с изменением перед ним знака из одной части равенства в другую; обе
части векторного равенства можно помножить или разделить на один и
тот же скаляр по обычным правилам и т.п.
Всякое выражение вида λa+μb+ ... +ξd, где λ, μ, . . ., ξ — некоторые
скаляры, называется линейной комбинацией векторов a, b, . . . , d. За
данные векторы называются линейно зависи
мыми, если какойлибо из этих векторов
c
b
является линейной комбинацией остальных; в
μb
противном случае эти векторы называются
линейно независимыми (между собой).
λa
0
Линейная зависимость для двух векторов
a
означает их параллельность (продумайте
это!). Если взять на плоскости любые два не
Рис. 103.
параллельных вектора a и b, то какой угод
но третий вектор c в этой же плоскости можно «разложить по
векторам a и b», т.е. представить в виде линейной комбинации
(рис. 103).
c = λa + μb.

(1)

§ 1]

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

299

Поэтому на плоскости можно указать два линейно независимых векто
ра, но всякие три вектора уже линейно зависимы. Разложение (1) часто
применяется в механике и других дисциплинах (разложение силы по
двум направлениям и т.п.), причем каждое из слагаемых λa и μb на
зывается составляющей (компонентой) вектора c, а совокупность век
торов a, b называется базисом.
Подобным образом в пространстве можно указать уже три линейно
независимых вектора (любые три вектора, не параллельные одной
плоскости). Их можно принять за базис, т.е. по ним можно разложить
какой угодно четвертый вектор, а потому в пространстве любые четыре
вектора линейно зависимы. Различие с утверждениями предыдущего
абзаца связано с тем, что плоскость двумерна, а пространство трехмер
но. Если в nмерном пространстве (§ IV.8) ввести понятие вектора, то
там базис будет состоять уже из n векторов (см. § 6).
Наиболее широко применяются базисы, состоящие из единичных
(т.е. с безразмерным модулем, равным 1) взаимно перпендикулярных
векторов; такие базисы называются декартовыми или евклидовыми.
Векторы, образующие декартов базис, обычно обозначаются i, j (на
плоскости) и i, j, k (в пространстве); таким образом, аналогично (1)
можно написать разложение любого вектора
a = a xi + a y j

на плоскости и
a = a xi + a y j + a z k

в пространстве, где a x , a y , a z — коэффициенты разложения.
Легко выяснить геометрический
смысл этих коэффициентов, называе
мых декартовыми координатами век
тора а; при этом будем для
определенности говорить о векторах
на плоскости, так как в пространстве
получаются совершенно аналогичные
результаты. Выберем на плоскости
произвольно точку О, которую назо
вем началом координат, и проведем че
рез нее оси параллельно векторам
Рис. 104.
выбранного базиса; эти оси обозначим
соответственно буквами х и у (рис. 104). Мы получим декартову
систему координат, в которой положение каждой точки A на плос
кости определяется координатами (x A ; y A ). Из рис. 104 мы видим, что

для вектора a = AB будет
a x = xB − xA ,

a y = yB − yA .

298

ВЕКТОРЫ

[Гл. IX


Изменив на рис. 102 направление вектора OD на противополож
ное, мы приходим к следующему интересному выводу. Если векторы
образуют замкнутый многоугольник, т.е. каждый следующий вектор
приложен началом к концу предыдущего, а конец последнего совпадает
с началом первого, то сумма всех этих векторов равна нульвектору 0,
т.е. вектору, конец которого совпадает с его началом. Модуль нульвек
тора равен нулю, а направление не определено.
Отметим, что векторы нельзя соединять друг с другом знаком нера
венства, в частности, не бывает положительных и отрицательных век
торов.
Умножение вектора на скаляр (в частности, на число) получается в
результате естественного обобщения сложения и вычитания векторов.
Так, под вектором 3F понимается сумма F+F+F ; из построения ясно,
что этот вектор направлен так же, как F, но в три раза длиннее. Под
вектором (−1)F = − F понимается вектор, который в сумме с F дает
0; ясно, что этот вектор направлен противоположно вектору F и имеет
тот же модуль, что F. Обобщая эти определения, под λF (где λ —
любой скаляр) понимают вектор, модуль которого равен λ F , при
чем λF пapaллелен F и направлен в ту же сторону, что F, если λ > 0,
и в противоположную, если λ < 0. (При λ < 0 иногда говорят, что век
торы λF и F антипараллельны.)
При линейных действиях над векторами выполняются все обычные
правила элементарной математики. Например, можно слагаемое а в од
ной части равенства заменить на −a в другой, т.е. перенести слагаемое
с изменением перед ним знака из одной части равенства в другую; обе
части векторного равенства можно помножить или разделить на один и
тот же скаляр по обычным правилам и т.п.
Всякое выражение вида λa+μb+ ... +ξd, где λ, μ, . . ., ξ — некоторые
скаляры, называется линейной комбинацией векторов a, b, . . . , d. За
данные векторы называются линейно зависи
мыми, если какойлибо из этих векторов
c
b
является линейной комбинацией остальных; в
μb
противном случае эти векторы называются
линейно независимыми (между собой).
λa
0
Линейная зависимость для двух векторов
a
означает их параллельность (продумайте
это!). Если взять на плоскости любые два не
Рис. 103.
параллельных вектора a и b, то какой угод
но третий вектор c в этой же плоскости можно «разложить по
векторам a и b», т.е. представить в виде линейной комбинации
(рис. 103).
c = λa + μb.

(1)

§ 1]

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

299

Поэтому на плоскости можно указать два линейно независимых векто
ра, но всякие три вектора уже линейно зависимы. Разложение (1) часто
применяется в механике и других дисциплинах (разложение силы по
двум направлениям и т.п.), причем каждое из слагаемых λa и μb на
зывается составляющей (компонентой) вектора c, а совокупность век
торов a, b называется базисом.
Подобным образом в пространстве можно указать уже три линейно
независимых вектора (любые три вектора, не параллельные одной
плоскости). Их можно принять за базис, т.е. по ним можно разложить
какой угодно четвертый вектор, а потому в пространстве любые четыре
вектора линейно зависимы. Различие с утверждениями предыдущего
абзаца связано с тем, что плоскость двумерна, а пространство трехмер
но. Если в nмерном пространстве (§ IV.8) ввести понятие вектора, то
там базис будет состоять уже из n векторов (см. § 6).
Наиболее широко применяются базисы, состоящие из единичных
(т.е. с безразмерным модулем, равным 1) взаимно перпендикулярных
векторов; такие базисы называются декартовыми или евклидовыми.
Векторы, образующие декартов базис, обычно обозначаются i, j (на
плоскости) и i, j, k (в пространстве); таким образом, аналогично (1)
можно написать разложение любого вектора
a = a xi + a y j

на плоскости и
a = a xi + a y j + a z k

в пространстве, где a x , a y , a z — коэффициенты разложения.
Легко выяснить геометрический
смысл этих коэффициентов, называе
мых декартовыми координатами век
тора а; при этом будем для
определенности говорить о векторах
на плоскости, так как в пространстве
получаются совершенно аналогичные
результаты. Выберем на плоскости
произвольно точку О, которую назо
вем началом координат, и проведем че
рез нее оси параллельно векторам
Рис. 104.
выбранного базиса; эти оси обозначим
соответственно буквами х и у (рис. 104). Мы получим декартову
систему координат, в которой положение каждой точки A на плос
кости определяется координатами (x A ; y A ). Из рис. 104 мы видим, что

для вектора a = AB будет
a x = xB − xA ,

a y = yB − yA .

300

ВЕКТОРЫ

[Гл. IX


Разность x B − x A называется также проекцией вектора AB на ось х.

Вообще, проекцией пр l a вектора a = AB на какую"либо ось l (т.е. на
прямую, для которой указано, какое из двух ее направлений принято за

положительное) называется модуль вектора A ′ B ′, определенного
основаниями перпендикуляров (рис. 105), опущенных из точек А и B
на ось l; причем этот модуль берется со знаком «+» или «–» в зависи"

мости от того, пройдет ли вектор A ′ B ′ в положительном или отрица"
тельном направлении оси l. Аналогично определяется проекция
одного вектора на другой; в этом случае перпендикуляры опускаются
на этот другой вектор или на его продолжение.
B
l
a
A

90°
~ ~a
a
α

§ 2]

СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ ВЕКТОРОВ

301

Это условие можно записать в виде векторного равенства
G = λF ,

где λ — какой"то скаляр, или в проекциях на оси координат
G x = λFx ,

G y = λF y ,

G z = λF z .

Выражая из каждого равенства λ и приравнивая результаты, прихо"
дим к требуемому условию
Gx G y G z
.
=
=
Fx F y F z

Это условие состоит из двух равенств, а так как вектор определяется
тремя, то при выборе вектора, параллельного данному, остается еще
одна степень свободы — модуль. (Выведите эти равенства геометричес"
ки, исходя из свойств подобия треугольников.)
В заключение подчеркнем, что вектор a полностью характеризует"
ся своими декартовыми проекциями a x a y , a z , только если декартов
базис i, j, k зафиксирован. Если выбрать этот базис по"другому, т.е.
если повернуть оси координат, то тот же вектор будет иметь другие
проекции (координаты). Мы поговорим об этом подробнее в § 5.
Упражнения

Рис. 106.

Рис. 105.

Таким образом, декартовы координаты вектора — это его проекции
на базисные векторы:
a x = пр x a = пр i a,

a y = пр y a = пр j a,

a z = пр z a = пр k a.

Подчеркнем, что проекция вектора — скаляр. Ее физическая раз"
мерность такая же, как размерность проецируемого вектора. Из рис.
106 сразу следует простая формула для вычисления проекции:

пр i a = a cosα = a cos(a, l ).

(2)

Отсюда вытекает, в частности, широко применяемая в математике
формула для декартова разложения единичного вектора е:



e = exi + e y j + e z k = cos(e, x )i + cos(e, y ) j + cos(e, z ) k.

Применение декартовых проекций дает возможность вместо гео"
метрических построений пользоваться формулами и вычислениями,
что обычно оказывается проще. Получим в качестве примера условие
параллельности двух векторов, заданных своими разложениями
F = Fxi + F y j + F z k,

G = G xi + G y j + G z k.




1. Пусть OA = a, OB = b. Найдите вектор OC , где С — середина отрез"
ка АВ.

2. В тех же условиях найдите вектор OD, где D делит отрезок АВ в отно"
шении λ :1.
3. Начало вектора в точке А (2; 3), конец его в точке В (–1; 4). Разложите
этот вектор по единичным векторам координатных осей.

§ 2. Скалярное произведение векторов
Скалярным произведением двух векторов называется скаляр, рав"
ный произведению модуля одного вектора на проекцию на него другого
вектора. Скалярное произведение векторов a и b обозначается так:
a ⋅ b или (a, b). Таким образом, a ⋅ b = a пр a b, а если воспользоваться
формулой (2) для вычисления проекции, мы получим

a ⋅ b = a пр a b = a b cos(a, b ).

(3)

Отсюда сразу видно, что скалярное произведение не зависит от по"
рядка сомножителей: a ⋅ b = b ⋅ a. Кроме того, видно, что для ненулевых
векторов a и b скалярное произведение a ⋅ b будет положительным,
отрицательным или равным нулю в соответствии с тем, будет ли угол

300

ВЕКТОРЫ

[Гл. IX


Разность x B − x A называется также проекцией вектора AB на ось х.

Вообще, проекцией пр l a вектора a = AB на какую"либо ось l (т.е. на
прямую, для которой указано, какое из двух ее направлений принято за

положительное) называется модуль вектора A ′ B ′, определенного
основаниями перпендикуляров (рис. 105), опущенных из точек А и B
на ось l; причем этот модуль берется со знаком «+» или «–» в зависи"

мости от того, пройдет ли вектор A ′ B ′ в положительном или отрица"
тельном направлении оси l. Аналогично определяется проекция
одного вектора на другой; в этом случае перпендикуляры опускаются
на этот другой вектор или на его продолжение.
B
l
a
A

90°
~ ~a
a
α

§ 2]

СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ ВЕКТОРОВ

301

Это условие можно записать в виде векторного равенства
G = λF ,

где λ — какой"то скаляр, или в проекциях на оси координат
G x = λFx ,

G y = λF y ,

G z = λF z .

Выражая из каждого равенства λ и приравнивая результаты, прихо"
дим к требуемому условию
Gx G y G z
.
=
=
Fx F y F z

Это условие состоит из двух равенств, а так как вектор определяется
тремя, то при выборе вектора, параллельного данному, остается еще
одна степень свободы — модуль. (Выведите эти равенства геометричес"
ки, исходя из свойств подобия треугольников.)
В заключение подчеркнем, что вектор a полностью характеризует"
ся своими декартовыми проекциями a x a y , a z , только если декартов
базис i, j, k зафиксирован. Если выбрать этот базис по"другому, т.е.
если повернуть оси координат, то тот же вектор будет иметь другие
проекции (координаты). Мы поговорим об этом подробнее в § 5.
Упражнения

Рис. 106.

Рис. 105.

Таким образом, декартовы координаты вектора — это его проекции
на базисные векторы:
a x = пр x a = пр i a,

a y = пр y a = пр j a,

a z = пр z a = пр k a.

Подчеркнем, что проекция вектора — скаляр. Ее физическая раз"
мерность такая же, как размерность проецируемого вектора. Из рис.
106 сразу следует простая формула для вычисления проекции:

пр i a = a cosα = a cos(a, l ).

(2)

Отсюда вытекает, в частности, широко применяемая в математике
формула для декартова разложения единичного вектора е:



e = exi + e y j + e z k = cos(e, x )i + cos(e, y ) j + cos(e, z ) k.

Применение декартовых проекций дает возможность вместо гео"
метрических построений пользоваться формулами и вычислениями,
что обычно оказывается проще. Получим в качестве примера условие
параллельности двух векторов, заданных своими разложениями
F = Fxi + F y j + F z k,

G = G xi + G y j + G z k.




1. Пусть OA = a, OB = b. Найдите вектор OC , где С — середина отрез"
ка АВ.

2. В тех же условиях найдите вектор OD, где D делит отрезок АВ в отно"
шении λ :1.
3. Начало вектора в точке А (2; 3), конец его в точке В (–1; 4). Разложите
этот вектор по единичным векторам координатных осей.

§ 2. Скалярное произведение векторов
Скалярным произведением двух векторов называется скаляр, рав"
ный произведению модуля одного вектора на проекцию на него другого
вектора. Скалярное произведение векторов a и b обозначается так:
a ⋅ b или (a, b). Таким образом, a ⋅ b = a пр a b, а если воспользоваться
формулой (2) для вычисления проекции, мы получим

a ⋅ b = a пр a b = a b cos(a, b ).

(3)

Отсюда сразу видно, что скалярное произведение не зависит от по"
рядка сомножителей: a ⋅ b = b ⋅ a. Кроме того, видно, что для ненулевых
векторов a и b скалярное произведение a ⋅ b будет положительным,
отрицательным или равным нулю в соответствии с тем, будет ли угол

302

ВЕКТОРЫ

[Гл. IX

между векторами a и b острым, тупым или прямым. Особенно важно
запомнить равенство
a ⋅ b = 0,

2

a ⋅ a = a a cos 0 = a .

Важным примером скалярного произведения является работа, кото
рую совершает сила F на прямолинейном пути S. Если тело движется
по прямой и сила направлена по этой же прямой, работа равна произве
дению силы на путь. Если же направление силы не совпадает с направле
нием движения, то работа равна произведению пути на величину
составляющей силы, действующей вдоль направления движения, т.е.
где θ — угол между направлениями силы и перемещения. Таким обра
зом, работа равна скалярному произведению силы на путь. Частный слу
чай, когда сила действует вдоль направления движения, охватывается
этой формулой. При этом если направление силы совпадает с направле
нием движения, то θ = 0, cosθ = 1, A = S F , работа положительна.
Если же сила направлена противоположно движению, то θ = π,
cosθ = −1, A = − S F , работа отрицательна.
Отметим еще следующие свойства скалярного произведения:
(a + b ) ⋅ c = a ⋅ c+b ⋅ c.

i ⋅ i = j ⋅ j = k ⋅ k = 1,

i ⋅ j = j ⋅ k = k ⋅i = 0


e′ ⋅ e′′ = cos (e′, e′′ ).

Выведем теперь важную формулу, позволяющую вычислить ска
лярное произведение, если известны проекции перемножаемых векто
ров в некотором декартовом базисе i, j, k (§1):
b = bxi + b y j + b z k.

a ⋅ b = a xbx + a yb y + a z b z

(4)

(5)

(проверьте!). Как мы уже отмечали в конце § 1, при повороте осей коор
динат проекции векторов a и b на оси координат, вообще говоря, ме
няются; однако правая часть (5) остается неизменной (инвариантной),
так как она равна левой, а определение скалярного произведения было
дано независимо от расположения осей координат.
Если в формуле (5) положить b = a, мы получим выражение для
квадрата модуля вектора через его декартовы координаты:
2

a ⋅ a = a = a x2 + a 2y + a 2z .
2

= a 2x + a 2y . Эта формула рав

носильна теореме Пифагора, а предыдущая — аналогу теоремы Пифа
гора для пространства (квадрат диагонали прямоугольного параллеле
пипеда равен сумме квадратов трех его ребер).
Упражнения
1. Два вектора единичной длины образуют угол ϕ = 30 o . Найдите их ска
лярное произведение.
2. Найдите скалярное произведение векторов, изображенных на рис. 107.
3. Вычислите угол θ между векторами
F = 3i + j

Мы не станем останавливаться на простом доказательстве этих
свойств; желающие могут провести его самостоятельно, исходя из
определения скалярного произведения. Эти свойства дают возмож
ность при действиях со скалярным произведением пользоваться обыч
ными правилами алгебры, помня, однако, что скалярно перемножать
можно т о л ь к о д в а вектора.
Применяются также следующие формулы, проверить которые мы
предоставляем читателю: если e, e ′, e ′′ — единичные векторы, то

a = a xi + a y j + a z k,

303

Если учесть, что

Для вектора на плоскости получаем a

A = S Fs = S F cos θ = S ⋅ F ,

a ⋅ e = пр e a,

СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ ВЕКТОРОВ

(почему?), то, подставляя вместо a и b их разложения (4), получим

как необходимое и достаточное условие перпендикулярности векторов
a и b. Частным случаем является также скалярное произведение век
тора самого на себя (скалярный квадрат вектора):

( λa) ⋅ b = λ (a ⋅ b ),

§ 2]

и

G = − 3 i + j.

4. Докажите, что векторы, имеющие начало
в точке A( −1; 1), а концы в точках B(1; 2 ) и
C(0; − 1) соответственно, перпендикулярны.
5. Параллелограмм ABCD построен на век


торах AB = F и AD = G. Выразив диагонали


→ →
AC и DB через F и G и рассматривая AC ⋅ AC
Рис. 107.
→ →
и DB⋅ DB, докажите теорему: сумма квадратов
диагоналей параллелограмма равна сумме квадратов всех его сторон.
6. В кубе со стороной а найдите длину диагоналей (внутренних!); углы
между диагоналями; проекции сторон на диагонали.
7. Правильный тетраэдр со стороной а расположен так, что одна из его
вершин находится в начале координат, другая — на положительной полуоси х,
третья — в первой четверти плоскости ху. Найдите координаты всех вершин
и центра тетраэдра; угол между прямыми, идущими из центра к вершинам.

302

ВЕКТОРЫ

[Гл. IX

между векторами a и b острым, тупым или прямым. Особенно важно
запомнить равенство
a ⋅ b = 0,

2

a ⋅ a = a a cos 0 = a .

Важным примером скалярного произведения является работа, кото
рую совершает сила F на прямолинейном пути S. Если тело движется
по прямой и сила направлена по этой же прямой, работа равна произве
дению силы на путь. Если же направление силы не совпадает с направле
нием движения, то работа равна произведению пути на величину
составляющей силы, действующей вдоль направления движения, т.е.
где θ — угол между направлениями силы и перемещения. Таким обра
зом, работа равна скалярному произведению силы на путь. Частный слу
чай, когда сила действует вдоль направления движения, охватывается
этой формулой. При этом если направление силы совпадает с направле
нием движения, то θ = 0, cosθ = 1, A = S F , работа положительна.
Если же сила направлена противоположно движению, то θ = π,
cosθ = −1, A = − S F , работа отрицательна.
Отметим еще следующие свойства скалярного произведения:
(a + b ) ⋅ c = a ⋅ c+b ⋅ c.

i ⋅ i = j ⋅ j = k ⋅ k = 1,

i ⋅ j = j ⋅ k = k ⋅i = 0


e′ ⋅ e′′ = cos (e′, e′′ ).

Выведем теперь важную формулу, позволяющую вычислить ска
лярное произведение, если известны проекции перемножаемых векто
ров в некотором декартовом базисе i, j, k (§1):
b = bxi + b y j + b z k.

a ⋅ b = a xbx + a yb y + a z b z

(4)

(5)

(проверьте!). Как мы уже отмечали в конце § 1, при повороте осей коор
динат проекции векторов a и b на оси координат, вообще говоря, ме
няются; однако правая часть (5) остается неизменной (инвариантной),
так как она равна левой, а определение скалярного произведения было
дано независимо от расположения осей координат.
Если в формуле (5) положить b = a, мы получим выражение для
квадрата модуля вектора через его декартовы координаты:
2

a ⋅ a = a = a x2 + a 2y + a 2z .
2

= a 2x + a 2y . Эта формула рав

носильна теореме Пифагора, а предыдущая — аналогу теоремы Пифа
гора для пространства (квадрат диагонали прямоугольного параллеле
пипеда равен сумме квадратов трех его ребер).
Упражнения
1. Два вектора единичной длины образуют угол ϕ = 30 o . Найдите их ска
лярное произведение.
2. Найдите скалярное произведение векторов, изображенных на рис. 107.
3. Вычислите угол θ между векторами
F = 3i + j

Мы не станем останавливаться на простом доказательстве этих
свойств; желающие могут провести его самостоятельно, исходя из
определения скалярного произведения. Эти свойства дают возмож
ность при действиях со скалярным произведением пользоваться обыч
ными правилами алгебры, помня, однако, что скалярно перемножать
можно т о л ь к о д в а вектора.
Применяются также следующие формулы, проверить которые мы
предоставляем читателю: если e, e ′, e ′′ — единичные векторы, то

a = a xi + a y j + a z k,

303

Если учесть, что

Для вектора на плоскости получаем a

A = S Fs = S F cos θ = S ⋅ F ,

a ⋅ e = пр e a,

СКАЛЯРНОЕ ПРОИЗВЕДЕНИЕ ВЕКТОРОВ

(почему?), то, подставляя вместо a и b их разложения (4), получим

как необходимое и достаточное условие перпендикулярности векторов
a и b. Частным случаем является также скалярное произведение век
тора самого на себя (скалярный квадрат вектора):

( λa) ⋅ b = λ (a ⋅ b ),

§ 2]

и

G = − 3 i + j.

4. Докажите, что векторы, имеющие начало
в точке A( −1; 1), а концы в точках B(1; 2 ) и
C(0; − 1) соответственно, перпендикулярны.
5. Параллелограмм ABCD построен на век


торах AB = F и AD = G. Выразив диагонали


→ →
AC и DB через F и G и рассматривая AC ⋅ AC
Рис. 107.
→ →
и DB⋅ DB, докажите теорему: сумма квадратов
диагоналей параллелограмма равна сумме квадратов всех его сторон.
6. В кубе со стороной а найдите длину диагоналей (внутренних!); углы
между диагоналями; проекции сторон на диагонали.
7. Правильный тетраэдр со стороной а расположен так, что одна из его
вершин находится в начале координат, другая — на положительной полуоси х,
третья — в первой четверти плоскости ху. Найдите координаты всех вершин
и центра тетраэдра; угол между прямыми, идущими из центра к вершинам.

304

ВЕКТОРЫ

[Гл. IX

§ 3. Производная от вектора

A( t + dt ) − A( t )
.
dt

(6)

(Более строго, в правой части надо поставить знак предельного перехо
да при dt → 0.)
Формулу (6) можно переписать и так:
dA
dt,
A( t + dt ) = A( t ) +
dt

где B(t 0 ) =

dA
dt

, D(t 0 ) =

d2 A

d
A( t + dt ) ⋅ B( t + dt ) − A ⋅ B
.
(A ⋅ B) =
dt
dt

dA ⎞ ⎛
dB ⎞

dt⎟ ⋅ ⎜ B( t ) +
dt⎟ − A( t ) ⋅ B( t )
⎜ A( t ) +



d
dt
dt ⎠
,
(A ⋅ B) =
dt
dt

или
⎛ dB ⎞
⎛ dA dB ⎞
⎛ dA ⎞
A ⋅ B + dt ⎜ A ⋅

⋅ B⎟ + ( dt )2 ⎜
⎟ + dt ⎜
⎟ − A⋅B


⎝ dt dt ⎠


d
dt
dt
.
(A ⋅ B) =
dt
dt

Пренебрегая членом, содержащим dt 2 , окончательно получаем
d
dB dA
(A ⋅ B) = A ⋅
+
⋅ B.
dt
dt
dt

(8)

Таким образом, формула имеет такой же вид, как формула для произ
водной от произведения двух скалярных функций.
Положив, в частности, в формуле (8) A = B, получим

1
( t − t 0 )2 + ...,
2

и т.д.
dt 2 t = t 0
Ясно, что при весьма малом dt точки M 2 и M 1 линии ( L) весь
dA
ма близки, так что вектор
направлен по касательной к ней.
dt
Если C — постоянный вектор, то C (t + dt) − C (t) = 0, так что в этом
dC
случае
= 0.
dt
Пользуясь определением производной, легко доказать две следую
щие формулы:
dA (t)
dA2 (t)
d
1.
, где a1 , a2 — посто
+ a2
a1 A1 (t) + a2 A2 (t)] = a1 1
[
dt
dt
dt
янные скаляры.
t = t0

df
df
d
dA
d
f (t) A(t)] =
A(t) + f (t) . В частности,
f (t)C ] =
C,
[
[
dt
dt
dt
dt
dt
если вектор C — постоянный. Таким образом, мы видим, что произ
водная от вектора вида f (t)C оказывается параллельной самому это
му вектору (тогда как из рис. 108 видно, что в общем случае это не так).
Найдем производную от скалярного произведения. Пусть A и B —
два переменных вектора. Согласно определению производной

(7)

с точностью до малых высшего порядка. Как и в случае обычных функ
ций, можно написать ряд Тейлора
A( t ) = A( t 0 ) + B( t 0 )( t − t 0 ) + D( t 0 )

305

Пользуясь формулой (7), находим

Это отношение также есть вектор. (Вектор A(t + dt) − A(t) изобража
ется на рис. 108 отрезком M 1 M 2 .) Оно является производной вектора
dA
, так что
A(t) по переменной t и потому обозначается через
dt
dA A( t + dt ) − A( t )
.
=
dt
dt

ПРОИЗВОДНАЯ ОТ ВЕКТОРА

2.

Найдем производную от вектора, зависящего от некоторой пере
менной, например от времени t, по этой переменной.
Будем откладывать вектор A(t) от неко
торой определенной точки О. Тогда конец век
тора при изменении t начертит линию
( L) (рис. 108).
Возьмем весьма малое dt и составим от
ношение
Рис. 108.

§ 3]

d
dA dA
dA
.
(A ⋅ A) = A ⋅
+
⋅ A = 2A ⋅
dt
dt
dt
dt

Однако A ⋅ A = A

2

и потому

(9)

d A
d
. Приравнивая эти
( A ⋅ A) = 2 A
dt
dt

результаты, получаем
dA
d A
d A A ⋅ dt
dA
, т.е.
.
= A⋅
=
A
dt
dt
dt
A

(10)

Отсюда легко вывести, в частности, что если вектор A(t) имеет посто
dA
пер
янный модуль, а изменяется лишь его направление, то вектор
dt
d A
пендикулярен вектору A. В самом деле, тогда A = const, т.е.
= 0,
dt

304

ВЕКТОРЫ

[Гл. IX

§ 3. Производная от вектора

A( t + dt ) − A( t )
.
dt

(6)

(Более строго, в правой части надо поставить знак предельного перехо
да при dt → 0.)
Формулу (6) можно переписать и так:
dA
dt,
A( t + dt ) = A( t ) +
dt

где B(t 0 ) =

dA
dt

, D(t 0 ) =

d2 A

d
A( t + dt ) ⋅ B( t + dt ) − A ⋅ B
.
(A ⋅ B) =
dt
dt

dA ⎞ ⎛
dB ⎞

dt⎟ ⋅ ⎜ B( t ) +
dt⎟ − A( t ) ⋅ B( t )
⎜ A( t ) +



d
dt
dt ⎠
,
(A ⋅ B) =
dt
dt

или
⎛ dB ⎞
⎛ dA dB ⎞
⎛ dA ⎞
A ⋅ B + dt ⎜ A ⋅

⋅ B⎟ + ( dt )2 ⎜
⎟ + dt ⎜
⎟ − A⋅B


⎝ dt dt ⎠


d
dt
dt
.
(A ⋅ B) =
dt
dt

Пренебрегая членом, содержащим dt 2 , окончательно получаем
d
dB dA
(A ⋅ B) = A ⋅
+
⋅ B.
dt
dt
dt

(8)

Таким образом, формула имеет такой же вид, как формула для произ
водной от произведения двух скалярных функций.
Положив, в частности, в формуле (8) A = B, получим

1
( t − t 0 )2 + ...,
2

и т.д.
dt 2 t = t 0
Ясно, что при весьма малом dt точки M 2 и M 1 линии ( L) весь
dA
ма близки, так что вектор
направлен по касательной к ней.
dt
Если C — постоянный вектор, то C (t + dt) − C (t) = 0, так что в этом
dC
случае
= 0.
dt
Пользуясь определением производной, легко доказать две следую
щие формулы:
dA (t)
dA2 (t)
d
1.
, где a1 , a2 — посто
+ a2
a1 A1 (t) + a2 A2 (t)] = a1 1
[
dt
dt
dt
янные скаляры.
t = t0

df
df
d
dA
d
f (t) A(t)] =
A(t) + f (t) . В частности,
f (t)C ] =
C,
[
[
dt
dt
dt
dt
dt
если вектор C — постоянный. Таким образом, мы видим, что произ
водная от вектора вида f (t)C оказывается параллельной самому это
му вектору (тогда как из рис. 108 видно, что в общем случае это не так).
Найдем производную от скалярного произведения. Пусть A и B —
два переменных вектора. Согласно определению производной

(7)

с точностью до малых высшего порядка. Как и в случае обычных функ
ций, можно написать ряд Тейлора
A( t ) = A( t 0 ) + B( t 0 )( t − t 0 ) + D( t 0 )

305

Пользуясь формулой (7), находим

Это отношение также есть вектор. (Вектор A(t + dt) − A(t) изобража
ется на рис. 108 отрезком M 1 M 2 .) Оно является производной вектора
dA
, так что
A(t) по переменной t и потому обозначается через
dt
dA A( t + dt ) − A( t )
.
=
dt
dt

ПРОИЗВОДНАЯ ОТ ВЕКТОРА

2.

Найдем производную от вектора, зависящего от некоторой пере
менной, например от времени t, по этой переменной.
Будем откладывать вектор A(t) от неко
торой определенной точки О. Тогда конец век
тора при изменении t начертит линию
( L) (рис. 108).
Возьмем весьма малое dt и составим от
ношение
Рис. 108.

§ 3]

d
dA dA
dA
.
(A ⋅ A) = A ⋅
+
⋅ A = 2A ⋅
dt
dt
dt
dt

Однако A ⋅ A = A

2

и потому

(9)

d A
d
. Приравнивая эти
( A ⋅ A) = 2 A
dt
dt

результаты, получаем
dA
d A
d A A ⋅ dt
dA
, т.е.
.
= A⋅
=
A
dt
dt
dt
A

(10)

Отсюда легко вывести, в частности, что если вектор A(t) имеет посто
dA
пер
янный модуль, а изменяется лишь его направление, то вектор
dt
d A
пендикулярен вектору A. В самом деле, тогда A = const, т.е.
= 0,
dt

306

ВЕКТОРЫ

[Гл. IX

dA
= 0, а равенство нулю скалярного
dt
dA
произведения означает, что A и
перпендикулярны.
dt
и в силу последней формулы A ⋅

Упражнение
Найдите угол, который составляет винтовая линия x = R cos ωt, y = R sin ωt,
z = vt с ее осью (осью z).

§ 4]

u=

dr
,
dt

a=

du d 2r
.
=
dt dt 2

в начале координат).
Подобным образом, из (9) получается формула
d
2
u = 2(a ⋅ u).
dt

m(a ⋅ u) = F ⋅ u.

Пользуясь формулой (11), получим

r = xi + yj + zk.

В этом равенстве х, у, z — это проекции, которые при движении точки
изменяются со временем, а векторы i, j, k — постоянные.
Поэтому
dx
dy
dz
dr d
= ( xi + yj + zk ) = i +
j+
k.
dt
dt
dt
dt dt

Следовательно, проекции вектора скорости u на оси координат равны
производным от соответствующих проекций вектора r:
ux =

dx
,
dt

uy =

dy
dz
, uz = .
dt
dt

dux d 2 x
= 2,
dt
dt

ay =

du y
dt

=

d 2y
,
dt 2

az =

m⋅

1 d
2
u = F ⋅ u,
2 dt

или
d ⎛ m 2⎞
⎜ u ⎟ = F ⋅ u.

dt ⎝ 2

(12)

Покажем, что величина F ⋅ u есть мощность силы F. В самом деле,
за время dt точка перемещается на dr , при этом производитсяработа
F ⋅ dr . Отношение этой работы ко времени dt, равное
F ⋅ dr
dr
=F ⋅
= F ⋅ u,
dt
dt

Точно так же для ускорения получаем
ax =

(11)

Из формулы (11) следует, что величина скорости постоянна в двух слу
чаях: если равно нулю ускорение, либо если ускорение не равно нулю,
но направлено перпендикулярно скорости.
Уравнение движения материальной точки имеет вид ma = F ,
где m — масса точки, F —сила, действующая на точку. (Второй закон
Ньютона.) Умножим обе части этого уравнения скалярно на вектор
скорости u. Получим

Запишем вектор r через единичные векторы координатных осей:

u=

307

С помощью последней формулы легко найти, в частности, условие,
при котором расстояние, точки от начала координат не изменяется,
т.е. r ≡ const. Именно, так будет в следующих двух случаях. Вопер
вых, если u = 0 (в этом случае точка не движется), и, вовторых, если
в каждый момент времени скорость u перпендикулярна векто
ру r (в этом случае тело движется по сфере радиуса r с центром

§ 4. Движение материальной точки
При движении материальной точки в пространстве зависимости
между положением точки, ее скоростью и ускорением являются соот
ношениями между векторами. Пусть положение точки характеризует
ся вектором r , проведенным из начала координат в эту точку,
скорость — вектором u, ускорение — вектором a. Тогда из определе
ния производной немедленно вытекает

ДВИЖЕНИЕ МАТЕРИАЛЬНОЙ ТОЧКИ

du z d 2 z
= 2.
dt
dt

В силу формулы (10) скорость изменения расстояния r точки от
начала координат равна

есть работа, производимая в единицу времени, т.е. мощность.
m 2
Если обозначить
u = T , то уравнение (12) принимает вид
2
t2
dT
= F ⋅ u, откуда T2 − T1 = ∫ F ⋅ u dt (справа стоит работа силы F).
dt
t
1

d r
=
dt

dr
dt = r ⋅ u.
r
r

r⋅

Таким образом, из второго закона Ньютона следует, что существует
определенная величина Т, выражающаяся через массу и скорость дви
жущейся точки и притом такая, что увеличение Т в процессе движе
ния как раз равно работе внешней силы F. Это и служит обоснованием

306

ВЕКТОРЫ

[Гл. IX

dA
= 0, а равенство нулю скалярного
dt
dA
произведения означает, что A и
перпендикулярны.
dt
и в силу последней формулы A ⋅

Упражнение
Найдите угол, который составляет винтовая линия x = R cos ωt, y = R sin ωt,
z = vt с ее осью (осью z).

§ 4]

u=

dr
,
dt

a=

du d 2r
.
=
dt dt 2

в начале координат).
Подобным образом, из (9) получается формула
d
2
u = 2(a ⋅ u).
dt

m(a ⋅ u) = F ⋅ u.

Пользуясь формулой (11), получим

r = xi + yj + zk.

В этом равенстве х, у, z — это проекции, которые при движении точки
изменяются со временем, а векторы i, j, k — постоянные.
Поэтому
dx
dy
dz
dr d
= ( xi + yj + zk ) = i +
j+
k.
dt
dt
dt
dt dt

Следовательно, проекции вектора скорости u на оси координат равны
производным от соответствующих проекций вектора r:
ux =

dx
,
dt

uy =

dy
dz
, uz = .
dt
dt

dux d 2 x
= 2,
dt
dt

ay =

du y
dt

=

d 2y
,
dt 2

az =

m⋅

1 d
2
u = F ⋅ u,
2 dt

или
d ⎛ m 2⎞
⎜ u ⎟ = F ⋅ u.

dt ⎝ 2

(12)

Покажем, что величина F ⋅ u есть мощность силы F. В самом деле,
за время dt точка перемещается на dr , при этом производится работа
F ⋅ dr . Отношение этой работы ко времени dt, равное
F ⋅ dr
dr
=F ⋅
= F ⋅ u,
dt
dt

Точно так же для ускорения получаем
ax =

(11)

Из формулы (11) следует, что величина скорости постоянна в двух слу
чаях: если равно нулю ускорение, либо если ускорение не равно нулю,
но направлено перпендикулярно скорости.
Уравнение движения материальной точки имеет вид ma = F ,
где m — масса точки, F —сила, действующая на точку. (Второй закон
Ньютона.) Умножим обе части этого уравнения скалярно на вектор
скорости u. Получим

Запишем вектор r через единичные векторы координатных осей:

u=

307

С помощью последней формулы легко найти, в частности, условие,
при котором расстояние, точки от начала координат не изменяется,
т.е. r ≡ const. Именно, так будет в следующих двух случаях. Вопер
вых, если u = 0 (в этом случае точка не движется), и, вовторых, если
в каждый момент времени скорость u перпендикулярна векто
ру r (в этом случае тело движется по сфере радиуса r с центром

§ 4. Движение материальной точки
При движении материальной точки в пространстве зависимости
между положением точки, ее скоростью и ускорением являются соот
ношениями между векторами. Пусть положение точки характеризует
ся вектором r , проведенным из начала координат в эту точку,
скорость — вектором u, ускорение — вектором a. Тогда из определе
ния производной немедленно вытекает

ДВИЖЕНИЕ МАТЕРИАЛЬНОЙ ТОЧКИ

du z d 2 z
= 2.
dt
dt

В силу формулы (10) скорость изменения расстояния r точки от
начала координат равна

есть работа, производимая в единицу времени, т.е. мощность.
m 2
Если обозначить
u = T , то уравнение (12) принимает вид
2
t2
dT
= F ⋅ u, откуда T2 − T1 = ∫ F ⋅ u dt (справа стоит работа силы F).
dt
t
1

d r
=
dt

dr
dt = r ⋅ u.
r
r

r⋅

Таким образом, из второго закона Ньютона следует, что существует
определенная величина Т, выражающаяся через массу и скорость дви
жущейся точки и притом такая, что увеличение Т в процессе движе
ния как раз равно работе внешней силы F. Это и служит обоснованием

308

ВЕКТОРЫ

[Гл. IX

того, что величину Т называют кинетической энергией движущейся
материальной точки.
Иногда в качестве параметра, определяющего положение движу
щейся точки вдоль траектории, берут длину s дуги, отсчитываемую
вдоль траектории от некоторого начала отсчета, т.е. полагают r = r ( s).
Так как отношение длины бесконечно малой дуги к стягивающей ее
хорде стремится к единице (в силу того, что такая дуга почти не успева
ет изменить свое направление, т.е. «искривиться»), то при Δs → 0
Δr
→ 1,
Δs

т.е.

Δr
dr
= lim
= 1.
ds
Δs

(13)

Поэтому производная dr ds представляет собой единичный вектор,
направленный по касательной к траектории. Этот вектор принято об
означать буквой b, откуда
u=

dr dr ds
=
= bu = ub,
dt ds dt

(14)

где обозначено u = u .
Из формулы (13) вытекает также выражение для дифференциала
дуги в декартовых координатах
ds = dr = d ( xi + yj + zk ) = dxi + dyj + dzk = dx 2 + dy 2 + dz 2 .


⊥ b. Таким образом, прямая
ds
pp (рис. 109), проведенная через некоторую текущую точку M траек
тории ( L) параллельно db ds, бу
дет служить нормалью к ( L), т.е.
перпендикуляром к касательной
l l в точке M. Чтобы отличить ее
от остальных нормалей (а в каж
дой точке линии в пространстве
можно провести к ней бесконечное
число нормалей, которые заполня
ют «нормальную плоскость»), ее
называют главной нормалью в точ
Рис. 109.
ке M к линии ( L). Длина вектора
db ds называется кривизной линии ( L) в точке M и обозначается
буквой k, т.е.
Так как b( s) = 1 = const, то (см. § 3)

db
= k,
ds

db
= kn,
ds

где n — единичный вектор главной нормали (см. рис. 109).

§ 4]

ДВИЖЕНИЕ МАТЕРИАЛЬНОЙ ТОЧКИ

309

Из рис. 110 виден геометрический
смысл кривизны:
k=

db
Δb
BC
α
= lim
= lim
= lim ,
ds
Δs
Δs
Δs

где α — угол между касательными
к ( L) в близких точках В и С; в по
Рис. 110.
следнем переходе мы заменили отре
зок ВС на дугу окружности единично
го радиуса. Таким образом, кривизна есть скорость поворота касатель
ной в расчете на единицу длины пройденного пути. Отсюда видно,
в частности, что во всех точках окружности радиуса R кривизна
k = 1 R (об этом говорилось в ВМ, § III.5, при рассмотрении понятия
db
, а с ним
кривизны плоской кривой). Заодно видно, что вектор b ′s =
ds
и n направлены в ту сторону, куда кривая заворачивает.
Дифференцируя формулу (14) по t, получим
a=

db ds du
db du
d 2r du
=
b+u =
b+u
=
b + u 2kn.
ds dt dt
dt dt
dt 2 dt

(15)

Эта формула широко применяется в физике, так как она дает разложе
ние вектора ускорения на «тангенциальную» (т.е. направленную по ка
сательной) и нормальную составляющие; последняя, как видим,
направлена именно по главной нормали.
Таким образом, вектор а, будучи отложен от точки М, обязательно
лежит в плоскости, проходящей через касательную и главную нормаль,
проведенные в этой точке; эта плоскость называется соприкасающейся
плоскостью к линии ( L) в точке М. Можно доказать, что это не что
иное, как плоскость, проходящая через три точки линии ( L), располо
женные в бесконечной близости от М. (Подобно тому как касатель
ная — это прямая, проведенная через две бесконечно близкие точки
линии.)
Из формулы (15) вытекают важные выводы о силах, действующих
на точку в процессе движения. Подставим в формулу второго закона
Ньютона F = ma выражение для a из (15). Мы видим, что действую
щая сила имеет тангенциальную составляющую
du
b
dt

(16)

Fn = Fnn = mu 2kn,

(17)

F b = Fb b = m

и нормальную составляющую

308

ВЕКТОРЫ

[Гл. IX

того, что величину Т называют кинетической энергией движущейся
материальной точки.
Иногда в качестве параметра, определяющего положение движу
щейся точки вдоль траектории, берут длину s дуги, отсчитываемую
вдоль траектории от некоторого начала отсчета, т.е. полагают r = r ( s).
Так как отношение длины бесконечно малой дуги к стягивающей ее
хорде стремится к единице (в силу того, что такая дуга почти не успева
ет изменить свое направление, т.е. «искривиться»), то при Δs → 0
Δr
→ 1,
Δs

т.е.

Δr
dr
= lim
= 1.
ds
Δs

(13)

Поэтому производная dr ds представляет собой единичный вектор,
направленный по касательной к траектории. Этот вектор принято об
означать буквой b, откуда
u=

dr dr ds
=
= bu = ub,
dt ds dt

(14)

где обозначено u = u .
Из формулы (13) вытекает также выражение для дифференциала
дуги в декартовых координатах
ds = dr = d ( xi + yj + zk ) = dxi + dyj + dzk = dx 2 + dy 2 + dz 2 .


⊥ b. Таким образом, прямая
ds
pp (рис. 109), проведенная через некоторую текущую точку M траек
тории ( L) параллельно db ds, бу
дет служить нормалью к ( L), т.е.
перпендикуляром к касательной
l l в точке M. Чтобы отличить ее
от остальных нормалей (а в каж
дой точке линии в пространстве
можно провести к ней бесконечное
число нормалей, которые заполня
ют «нормальную плоскость»), ее
называют главной нормалью в точ
Рис. 109.
ке M к линии ( L). Длина вектора
db ds называется кривизной линии ( L) в точке M и обозначается
буквой k, т.е.
Так как b( s) = 1 = const, то (см. § 3)

db
= k,
ds

db
= kn,
ds

где n — единичный вектор главной нормали (см. рис. 109).

§ 4]

ДВИЖЕНИЕ МАТЕРИАЛЬНОЙ ТОЧКИ

309

Из рис. 110 виден геометрический
смысл кривизны:
k=

db
Δb
BC
α
= lim
= lim
= lim ,
ds
Δs
Δs
Δs

где α — угол между касательными
к ( L) в близких точках В и С; в по
Рис. 110.
следнем переходе мы заменили отре
зок ВС на дугу окружности единично
го радиуса. Таким образом, кривизна есть скорость поворота касатель
ной в расчете на единицу длины пройденного пути. Отсюда видно,
в частности, что во всех точках окружности радиуса R кривизна
k = 1 R (об этом говорилось в ВМ, § III.5, при рассмотрении понятия
db
, а с ним
кривизны плоской кривой). Заодно видно, что вектор b ′s =
ds
и n направлены в ту сторону, куда кривая заворачивает.
Дифференцируя формулу (14) по t, получим
a=

db ds du
db du
d 2r du
=
b+u =
b+u
=
b + u 2kn.
ds dt dt
dt dt
dt 2 dt

(15)

Эта формула широко применяется в физике, так как она дает разложе
ние вектора ускорения на «тангенциальную» (т.е. направленную по ка
сательной) и нормальную составляющие; последняя, как видим,
направлена именно по главной нормали.
Таким образом, вектор а, будучи отложен от точки М, обязательно
лежит в плоскости, проходящей через касательную и главную нормаль,
проведенные в этой точке; эта плоскость называется соприкасающейся
плоскостью к линии ( L) в точке М. Можно доказать, что это не что
иное, как плоскость, проходящая через три точки линии ( L), располо
женные в бесконечной близости от М. (Подобно тому как касатель
ная — это прямая, проведенная через две бесконечно близкие точки
линии.)
Из формулы (15) вытекают важные выводы о силах, действующих
на точку в процессе движения. Подставим в формулу второго закона
Ньютона F = ma выражение для a из (15). Мы видим, что действую
щая сила имеет тангенциальную составляющую
du
b
dt

(16)

Fn = Fnn = mu 2kn,

(17)

F b = Fb b = m

и нормальную составляющую

310

ВЕКТОРЫ

[Гл. IX

направленную по главной нормали к траектории. Соприкасающаяся
плоскость к траектории в ее некоторой точке — это плоскость векторов
u и F в этой точке.
Из формулы (16) получаем
uF τ = um

du d ⎛ mu 2 ⎞ dT
,
= ⎜
⎟=
dt dt ⎝ 2 ⎠ dt

откуда приращение кинетической энергии равно
t2

s2

t1

s1

Мы видим, что работу производит лишь тангенциальная составляю
щая силы. Нормальная же составляющая (она называется также цен
тростремительной силой) не меняет скорости движения точки, но
порождает искривление траектории, причем кривизна согласно (17)
равна
Fn
.
mu 2

Упражнение

при этом подразумевается, что по повторяющемуся индексу произво
дится суммирование в соответствии с размерностью пространства — так,
для трехмерного пространства j = 1, 2, 3. Такой индекс является немым,
т.е. может быть обозначен любой буквой: α i j e j = α ik e k = α ii ′ e i ′ и т.д.
Умножив обе части (19) скалярно на e j , получим, что α i j = e i′ ⋅ e j .
Аналогично, из формул e i = β i j e ′j , выражающих старый базис через
новый, получаем, что β i j = e i ⋅ e ′j . Но это значит, что β i j = α ji , т.е. ста
рый базис выражается через новый по формулам
(20)

(Это равенство можно переписать в виде e j = α i j e i′, так что получает
ся, что в равенстве (19), связывающем декартовы базисы, можно про
сто «переставить» множитель α i j из одной части в другую.)
Если подставить выражения (20) в (18) и обозначить через a i′ про
екции вектора a в базисе e i′, мы получим
a = ∑ a i ei = ∑ a i ∑ α j ie′j = ∑ α j i a ie′j .
i

i

i, j

j

a = ∑ α i j a j e′i = ∑ ( ∑ α i j a j ) e′i = ∑ a ′ie′i ,
i, j

i

j

§ 5. Понятие о тензорах
Мы уже подчеркивали в конце § 1, что если характеризовать вектор
тройкой его декартовых проекций, то надо иметь в виду, что эта тройка
существенно зависит от выбора декартова базиса. Рассмотрим этот
вопрос подробно. Будем обозначать векторы базиса буквами e1 , e2 , e 3 ,
а проекции вектора a —символами a1 , a2 , a 3 , так что
(18)

Допустим теперь, что выбран новый декартов базис e1′ , e2′ , e 3′ , вы
ражающийся через старый по формулам
3

e′i = α i1e1 + α i 2e2 + α i 3e3 = ∑ α i je j (i = 1, 2, 3 ).
j =1

В тензорной алгебре принято писать более коротко:
(19)

i

откуда
a ′i = α i j a j .

Найдите кривизну винтовой линии из упражнения к § 3.

e′i = α i je j ;

311

Меняя обозначения i ↔ j, получим

Напомним, что размерность кривизн (см −1 ) обратна размерности
длины.

a = a1e1 + a 2e2 + a 3e3 .

ПОНЯТИЕ О ТЕНЗОРАХ

ei = α jie′j .

T2 − T1 = ∫ uF τ dt = ∫ F τ ds.

k=

§ 5]

(21)

Сравнивая с (19), мы видим, что проекции любого вектора преобразу
ются по тем же формулам, что и базисные векторы.
Конечно, в предыдущих рассуждениях под a не обязательно пони
мать «геометрический» вектор, т.е. направленный отрезок на плоскос
ти или в пространстве. Это может быть вектор силы или скорости и т.д.;
во всех случаях его проекции преобразуются по формулам (21). Нет
рудно проверить, что и обратно, каждую тройку величин, приобретаю
щих определенные значения только после указания декартова базиса и
преобразующихся по формулам (21) при замене (19) этого базиса,
можно истолковать как тройку координат некоторого вектора, т.е. счи
тать, что такая тройка определяет некоторый вектор. (В то же время
вряд ли полезно истолковывать л ю б у ю тройку величин как вектор.
Например, при изучении потока газа можно рассматривать тройку ве
личин — температуру ϑ, давление р и плотность ρ, характеризующих
состояние газа в некоторой точке пространства. Однако истолковывать
такую тройку как вектор нецелесообразно, так как повороты базиса
в пространстве не сказываются на значениях величин, составляющих
тройку. Три скаляра не составляют вектор.)

310

ВЕКТОРЫ

[Гл. IX

направленную по главной нормали к траектории. Соприкасающаяся
плоскость к траектории в ее некоторой точке — это плоскость векторов
u и F в этой точке.
Из формулы (16) получаем
uF τ = um

du d ⎛ mu 2 ⎞ dT
,
= ⎜
⎟=
dt dt ⎝ 2 ⎠ dt

откуда приращение кинетической энергии равно
t2

s2

t1

s1

Мы видим, что работу производит лишь тангенциальная составляю
щая силы. Нормальная же составляющая (она называется также цен
тростремительной силой) не меняет скорости движения точки, но
порождает искривление траектории, причем кривизна согласно (17)
равна
Fn
.
mu 2

Упражнение

при этом подразумевается, что по повторяющемуся индексу произво
дится суммирование в соответствии с размерностью пространства — так,
для трехмерного пространства j = 1, 2, 3. Такой индекс является немым,
т.е. может быть обозначен любой буквой: α i j e j = α ik e k = α ii ′ e i ′ и т.д.
Умножив обе части (19) скалярно на e j , получим, что α i j = e i′ ⋅ e j .
Аналогично, из формул e i = β i j e ′j , выражающих старый базис через
новый, получаем, что β i j = e i ⋅ e ′j . Но это значит, что β i j = α ji , т.е. ста
рый базис выражается через новый по формулам
(20)

(Это равенство можно переписать в виде e j = α i j e i′, так что получает
ся, что в равенстве (19), связывающем декартовы базисы, можно про
сто «переставить» множитель α i j из одной части в другую.)
Если подставить выражения (20) в (18) и обозначить через a i′ про
екции вектора a в базисе e i′, мы получим
a = ∑ a i ei = ∑ a i ∑ α j ie′j = ∑ α j i a ie′j .
i

i

i, j

j

a = ∑ α i j a j e′i = ∑ ( ∑ α i j a j ) e′i = ∑ a ′ie′i ,
i, j

i

j

§ 5. Понятие о тензорах
Мы уже подчеркивали в конце § 1, что если характеризовать вектор
тройкой его декартовых проекций, то надо иметь в виду, что эта тройка
существенно зависит от выбора декартова базиса. Рассмотрим этот
вопрос подробно. Будем обозначать векторы базиса буквами e1 , e2 , e 3 ,
а проекции вектора a —символами a1 , a2 , a 3 , так что
(18)

Допустим теперь, что выбран новый декартов базис e1′ , e2′ , e 3′ , вы
ражающийся через старый по формулам
3

e′i = α i1e1 + α i 2e2 + α i 3e3 = ∑ α i je j (i = 1, 2, 3 ).
j =1

В тензорной алгебре принято писать более коротко:
(19)

i

откуда
a ′i = α i j a j .

Найдите кривизну винтовой линии из упражнения к § 3.

e′i = α i je j ;

311

Меняя обозначения i ↔ j, получим

Напомним, что размерность кривизн (см −1 ) обратна размерности
длины.

a = a1e1 + a 2e2 + a 3e3 .

ПОНЯТИЕ О ТЕНЗОРАХ

ei = α jie′j .

T2 − T1 = ∫ uF τ dt = ∫ F τ ds.

k=

§ 5]

(21)

Сравнивая с (19), мы видим, что проекции любого вектора преобразу
ются по тем же формулам, что и базисные векторы.
Конечно, в предыдущих рассуждениях под a не обязательно пони
мать «геометрический» вектор, т.е. направленный отрезок на плоскос
ти или в пространстве. Это может быть вектор силы или скорости и т.д.;
во всех случаях его проекции преобразуются по формулам (21). Нет
рудно проверить, что и обратно, каждую тройку величин, приобретаю
щих определенные значения только после указания декартова базиса и
преобразующихся по формулам (21) при замене (19) этого базиса,
можно истолковать как тройку координат некоторого вектора, т.е. счи
тать, что такая тройка определяет некоторый вектор. (В то же время
вряд ли полезно истолковывать л ю б у ю тройку величин как вектор.
Например, при изучении потока газа можно рассматривать тройку ве
личин — температуру ϑ, давление р и плотность ρ, характеризующих
состояние газа в некоторой точке пространства. Однако истолковывать
такую тройку как вектор нецелесообразно, так как повороты базиса
в пространстве не сказываются на значениях величин, составляющих
тройку. Три скаляра не составляют вектор.)

312

ВЕКТОРЫ

[Гл. IX

Бывают величины, преобразующиеся при замене (19) базиса по бо
лее сложному закону, чем (21). Важный пример таких величин получа
ется при рассмотрении линейного отображения пространства в себя.
Говорят, что задано такое отображение Т, если каждому вектору a по
ставлен в соответствие вектор Ta (того же пространства), причем сум
ме прообразов соответствует сумма образов, т.е. T (a + b) = Ta + Tb,
T (λa) = λTa. Примерами линейных отображений могут служить
поворот пространства вокруг некоторой точки, равномерное сжатие
его к некоторой плоскости, прямой или точке и т. д. (продумайте это!).
Чтобы охарактеризовать такое отображение числами, выберем в
пространстве базис e i и разложим каждый из векторов Te i по этому
базису:
Tei = p jie j

(22)

(обратите внимание на порядок индексов). Знание девяти коэффициен
тов pi j позволяет найти образ b = Ta любого вектора (18). В самом деле,
b = ∑ bi ei = T ( ∑ a iei ) = ∑ a i p jie j = ∑ a j pije j ,
i

i

i, j

i, j

откуда bi = pi j a j .
Набор коэффициентов pi j , зависящих от двух индексов, часто за
писывают в виде матрицы, т.е. таблицы
⎛ p11

( pi j ) = ⎜ p21

⎝ p31

p12
p22
p32

p13 ⎞

p23 ⎟ .

p33 ⎠

ПОНЯТИЕ О ТЕНЗОРАХ

313

Перепишем формулы (21) и (23), изменив обозначения индексов:
a ′i ′ = α i ′i a i ,

p′i ′j ′ = α i ′iα j ′j pi j .

Мы видим, что эти формулы имеют общую структуру. Обобщая, мы
приходим к закону преобразования величин q i j... l , зависящих от m
индексов i, j, . . . , l, каждый из которых принимает значения 1, 2, 3
(для трехмерного пространства) или 1, 2 (для плоскости):
qi ′ j ′ ...l ′ = α i ′iα j ′j ... α l ′l qi j

... l

.

(24)

Если величины q i j... l принимают определенные значения только по
сле указания декартова базиса и преобразуются по формулам (24)
(в правой части стоит mкратная сумма!) при замене (19) этого базиса,
то говорят, что величины q i j... l образуют тензор ранга m. Таким обра
зом, набор проекций вектора образует тензор 1го ранга, набор коэффи
циентов линейного отображения — тензор 2го ранга (этот набор
коэффициентов в каждом базисе свой, но определяет одно и то же ото
бражение, не зависящее от выбора базиса). Отметим, что с точки зре
ния приведенного определения тензором ранга 0 надо считать
величину, принимающую в выбранных единицах измерения числовое
значение и инвариантную относительно замены базиса, т.е. скаляр.
К понятию тензора возможен также следующий подход. Рассмот
рим для определенности тензор 2го ранга, т.е. набор величин pi j , пре
образующихся при замене (19) базиса по формулам (23), и сопоставим
этому набору формальное выражение
3

P=

Посмотрим теперь, как изменятся коэффициенты pi j при перехо
де к новому базису e i′. Так как в силу (22) pi j = Te j ⋅ e i , то, учитывая
формулы (19), получим
p′i j = Te′j ⋅ e′i = α j l Tel ⋅ α ikek = α ikα j l pkl .

§ 5]

(23)

Отсюда, в частности, легко показать, что сумма pii при таком пере
ходе остается инвариантной, т.е. она представляет собой скаляр. В са
мом деле,
p′ii = α i kα i l pk l = e′i ⋅ ekα i l pk l = ek ⋅ (e′iα i l ) pk l = ek ⋅ el pk l = pi i .

В рассмотренном примере величины pi j были безразмерными.
Можно проверить, что, и обратно, каждый набор безразмерных вели
чин pi j , преобразующихся по формулам (23) при замене (19) декарто
ва базиса, можно истолковать как матрицу некоторого линейного
отображения пространства в себя. В § XI.5 будут приведены примеры
размерных величин, имеющих иной физический смысл, но также пре
образующихся по формулам (23) при замене базиса.

∑ pi jeiej .

(25)

i , j =1

При этом тензорное произведение e i e j (не путать со скалярным про
изведением e i ⋅ e j !) не сводится к какомулибо более простому объек
ту — скаляру или вектору. Перестановка множителей в тензорном
произведении невозможна, т.е. e i e j ≠ e j e i , но в тензорном произведе
нии сумм можно раскрывать скобки по обычным правилам, следя за
порядком сомножителей, например:
(2e1 + e2 − e3 )(e1 + 3e3 ) = 2e1e1 + 6e1e3 + e2e1 + 3e2e3 − e3e1 − 3e3e3 .

В новом базисе e i′ взамен (25) надо написать выражение
P′ = ∑ p′i je′ie′j .
i, j

Однако с учетом формул (23) и (20) получим
P′ =



⎞⎛



∑ α i kα j l pk l e′ie′j = ∑ pk l ⎜⎝ ∑ α i ke′i ⎟⎠ ⎜⎜⎝ ∑ α j l e′j ⎟⎟⎠ = ∑ pk l ekel = P.

i, j, k , l

k, l

i

j

k, l

312

ВЕКТОРЫ

[Гл. IX

Бывают величины, преобразующиеся при замене (19) базиса по бо
лее сложному закону, чем (21). Важный пример таких величин получа
ется при рассмотрении линейного отображения пространства в себя.
Говорят, что задано такое отображение Т, если каждому вектору a по
ставлен в соответствие вектор Ta (того же пространства), причем сум
ме прообразов соответствует сумма образов, т.е. T (a + b) = Ta + Tb,
T (λa) = λTa. Примерами линейных отображений могут служить
поворот пространства вокруг некоторой точки, равномерное сжатие
его к некоторой плоскости, прямой или точке и т. д. (продумайте это!).
Чтобы охарактеризовать такое отображение числами, выберем в
пространстве базис e i и разложим каждый из векторов Te i по этому
базису:
Tei = p jie j

(22)

(обратите внимание на порядок индексов). Знание девяти коэффициен
тов pi j позволяет найти образ b = Ta любого вектора (18). В самом деле,
b = ∑ bi ei = T ( ∑ a iei ) = ∑ a i p jie j = ∑ a j pije j ,
i

i

i, j

i, j

откуда bi = pi j a j .
Набор коэффициентов pi j , зависящих от двух индексов, часто за
писывают в виде матрицы, т.е. таблицы
⎛ p11

( pi j ) = ⎜ p21

⎝ p31

p12
p22
p32

p13 ⎞

p23 ⎟ .

p33 ⎠

ПОНЯТИЕ О ТЕНЗОРАХ

313

Перепишем формулы (21) и (23), изменив обозначения индексов:
a ′i ′ = α i ′i a i ,

p′i ′j ′ = α i ′iα j ′j pi j .

Мы видим, что эти формулы имеют общую структуру. Обобщая, мы
приходим к закону преобразования величин q i j... l , зависящих от m
индексов i, j, . . . , l, каждый из которых принимает значения 1, 2, 3
(для трехмерного пространства) или 1, 2 (для плоскости):
qi ′ j ′ ...l ′ = α i ′iα j ′j ... α l ′l qi j

... l

.

(24)

Если величины q i j... l принимают определенные значения только по
сле указания декартова базиса и преобразуются по формулам (24)
(в правой части стоит mкратная сумма!) при замене (19) этого базиса,
то говорят, что величины q i j... l образуют тензор ранга m. Таким обра
зом, набор проекций вектора образует тензор 1го ранга, набор коэффи
циентов линейного отображения — тензор 2го ранга (этот набор
коэффициентов в каждом базисе свой, но определяет одно и то же ото
бражение, не зависящее от выбора базиса). Отметим, что с точки зре
ния приведенного определения тензором ранга 0 надо считать
величину, принимающую в выбранных единицах измерения числовое
значение и инвариантную относительно замены базиса, т.е. скаляр.
К понятию тензора возможен также следующий подход. Рассмот
рим для определенности тензор 2го ранга, т.е. набор величин pi j , пре
образующихся при замене (19) базиса по формулам (23), и сопоставим
этому набору формальное выражение
3

P=

Посмотрим теперь, как изменятся коэффициенты pi j при перехо
де к новому базису e i′. Так как в силу (22) pi j = Te j ⋅ e i , то, учитывая
формулы (19), получим
p′i j = Te′j ⋅ e′i = α j l Tel ⋅ α ikek = α ikα j l pkl .

§ 5]

(23)

Отсюда, в частности, легко показать, что сумма pii при таком пере
ходе остается инвариантной, т.е. она представляет собой скаляр. В са
мом деле,
p′ii = α i kα i l pk l = e′i ⋅ ekα i l pk l = ek ⋅ (e′iα i l ) pk l = ek ⋅ el pk l = pi i .

В рассмотренном примере величины pi j были безразмерными.
Можно проверить, что, и обратно, каждый набор безразмерных вели
чин pi j , преобразующихся по формулам (23) при замене (19) декарто
ва базиса, можно истолковать как матрицу некоторого линейного
отображения пространства в себя. В § XI.5 будут приведены примеры
размерных величин, имеющих иной физический смысл, но также пре
образующихся по формулам (23) при замене базиса.

∑ pi jeiej .

(25)

i , j =1

При этом тензорное произведение e i e j (не путать со скалярным про
изведением e i ⋅ e j !) не сводится к какомулибо более простому объек
ту — скаляру или вектору. Перестановка множителей в тензорном
произведении невозможна, т.е. e i e j ≠ e j e i , но в тензорном произведе
нии сумм можно раскрывать скобки по обычным правилам, следя за
порядком сомножителей, например:
(2e1 + e2 − e3 )(e1 + 3e3 ) = 2e1e1 + 6e1e3 + e2e1 + 3e2e3 − e3e1 − 3e3e3 .

В новом базисе e i′ взамен (25) надо написать выражение
P′ = ∑ p′i je′ie′j .
i, j

Однако с учетом формул (23) и (20) получим
P′ =



⎞⎛



∑ α i kα j l pk l e′ie′j = ∑ pk l ⎜⎝ ∑ α i ke′i ⎟⎠ ⎜⎜⎝ ∑ α j l e′j ⎟⎟⎠ = ∑ pk l ekel = P.

i, j, k , l

k, l

i

j

k, l

314

ВЕКТОРЫ

[Гл. IX

Итак, выражение (25) — оно и называется тензором — инвариантно от
носительно замены декартова базиса. Аналогично вводится понятие
тензора любого ранга, причем тензор 1го ранга ∑ a i e i есть вектор.
i

Тензоры, тензорная алгебра и тензорный анализ (в котором изуча
ются правила дифференцирования тензоров) играют в современной
физике очень важную роль. В тензорных терминах формулируются
основные законы теории упругости, электродинамики и оптики ани
зотропной среды и т.д. Это дает возможность не связывать рассмотре
ние с какойто одной, искусственно выбранной системой координат, не
оправданной существом исследования. Отметим, что во многих случаях
оказывается недостаточным ограничиваться декартовыми базисами;
тогда приходится изменить определение тензора так, чтобы он оставал
ся инвариантным при переходе к любому, не обязательно декартову ба
зису. Мы не будем рассматривать здесь это измененное определение.
А. Эйнштейн применил тензорный анализ к электродинамике и тео
рии тяготения, чем привлек к тензорам широкое внимание физиков и
математиков. В его небольшой книге «Сущность теории относитель
ности» содержится лучшее краткое изложение теории тензоров.
Упражнение
Напишите матрицы линейных отображений плоскости в себя, описанных
на рис. 111. Укажите, во что переходит квадрат при различном направлении его
сторон.

§ 6]

МНОГОМЕРНОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО

315

ния линейных действий. Рассмотрим сначала первый подход, причем
для определенности будем говорить о четырехмерном пространстве
(общий случай рассматривается аналогично).
Как мы видели, точкой в четырехмерном пространстве можно счи
тать просто набор четырех чисел (x 1 ; x 2 ; x 3 ; x 4 ). Единичный вектор e1
первой координатной оси (оси x 1 ) надо представлять себе как отрезок с
началом в начале координат (0; 0; 0; 0) и концом в точке (1; 0; 0; 0).
Впрочем, исходя из возможности переносить любой вектор параллельно
самому себе, e1 можно рассматривать как отрезок с началом в любой
точке (x 1 ; x 2 ; x 3 ; x 4 ) и концом в точке (x 1 + 1; x 2 ; x 3 ; x 4 ). Аналогично
вводятся единичные векторы e 2 , e 3 , e 4 других трех координатных
осей. Рассматривая линейную комбинацию этих четырех векторов
x = x1e1 + x2e2 + x 3e3 + x 4e4 ,

(26)

мы получаем вектор, ведущий из начала координат в точку (x 1 ; x 2 ; x 3 ;
x 4 ), т.е. радиусвектор этой точки. Вектор х можно откладывать не от
начала координат, а от любой другой точки; во всяком случае, коэффи
циенты x 1 , x 2 , x 3 , x 4 в формуле (26) — это проекции вектора х на
оси координат.
Действия над четырехмерными векторами осуществляются по тем
же формальным правилам, что и над двумерными и трехмерными. На
иболее просто рассматривать векторы разложенными по осям коорди
нат, т.е. представленными в виде (26). Если наряду с вектором (26) мы
имеем вектор y = y1 e1 + y2 e 2 + y 3 e 3 + y 4 e 4 , то
x+y = (x1 + y1)e1 + (x2 + y2 )e2 + (x 3 + y3 )e3 + (x 4 + y4 )e4 ,
λx = λx1e1 + λx2e2 + λx 3e3 + λx 4e4 (λ — скаляр),
x ⋅ y = x1y1 + x2 y2 + x 3 y3 + x 4 y4 .

Рис. 111.

§ 6. Многомерное векторное пространство
В § IV.8 мы видели, что к понятию многомерного пространства мож
но подойти двояко: либо исходя из числовой схемы, либо же исходя из
рассмотрения системы со многими степенями свободы. Аналогичные
подходы возможны к понятию многомерного векторного пространства,
которые выделяются из общих пространств возможностью выполне

(27)

Можно проверить, что все основные свойства, описанные выше для дву
мерных и трехмерных векторов, сохраняют силу и для четырехмерных
векторов. Однако некоторого внимания требуют свойства, связанные с
понятием линейной зависимости (§ 1). Дело в том, что в четырехмерном
пространстве возможны плоскости двух «сортов» — двумерные и трех
мерные. Двумерная плоскость получается, если взять два линейно неза
висимых (т.е. непараллельных) вектора, а затем их всевозможные
линейные комбинации отложить от какойлибо фиксированной точки,
например от начала координат. Если это проделать с тремя линейно не
зависимыми векторами, то получится трехмерная плоскость (говорят
также «трехмерная гиперплоскость») в четырехмерном пространстве.
Если же взять четыре линейно независимых вектора (т.е. не параллель
ных одной трехмерной плоскости), то их линейные комбинации запол
нят все пространство, т.е. по ним можно разложить любой пятый вектор.

314

ВЕКТОРЫ

[Гл. IX

Итак, выражение (25) — оно и называется тензором — инвариантно от
носительно замены декартова базиса. Аналогично вводится понятие
тензора любого ранга, причем тензор 1го ранга ∑ a i e i есть вектор.
i

Тензоры, тензорная алгебра и тензорный анализ (в котором изуча
ются правила дифференцирования тензоров) играют в современной
физике очень важную роль. В тензорных терминах формулируются
основные законы теории упругости, электродинамики и оптики ани
зотропной среды и т.д. Это дает возможность не связывать рассмотре
ние с какойто одной, искусственно выбранной системой координат, не
оправданной существом исследования. Отметим, что во многих случаях
оказывается недостаточным ограничиваться декартовыми базисами;
тогда приходится изменить определение тензора так, чтобы он оставал
ся инвариантным при переходе к любому, не обязательно декартову ба
зису. Мы не будем рассматривать здесь это измененное определение.
А. Эйнштейн применил тензорный анализ к электродинамике и тео
рии тяготения, чем привлек к тензорам широкое внимание физиков и
математиков. В его небольшой книге «Сущность теории относитель
ности» содержится лучшее краткое изложение теории тензоров.
Упражнение
Напишите матрицы линейных отображений плоскости в себя, описанных
на рис. 111. Укажите, во что переходит квадрат при различном направлении его
сторон.

§ 6]

МНОГОМЕРНОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО

315

ния линейных действий. Рассмотрим сначала первый подход, причем
для определенности будем говорить о четырехмерном пространстве
(общий случай рассматривается аналогично).
Как мы видели, точкой в четырехмерном пространстве можно счи
тать просто набор четырех чисел (x 1 ; x 2 ; x 3 ; x 4 ). Единичный вектор e1
первой координатной оси (оси x 1 ) надо представлять себе как отрезок с
началом в начале координат (0; 0; 0; 0) и концом в точке (1; 0; 0; 0).
Впрочем, исходя из возможности переносить любой вектор параллельно
самому себе, e1 можно рассматривать как отрезок с началом в любой
точке (x 1 ; x 2 ; x 3 ; x 4 ) и концом в точке (x 1 + 1; x 2 ; x 3 ; x 4 ). Аналогично
вводятся единичные векторы e 2 , e 3 , e 4 других трех координатных
осей. Рассматривая линейную комбинацию этих четырех векторов
x = x1e1 + x2e2 + x 3e3 + x 4e4 ,

(26)

мы получаем вектор, ведущий из начала координат в точку (x 1 ; x 2 ; x 3 ;
x 4 ), т.е. радиусвектор этой точки. Вектор х можно откладывать не от
начала координат, а от любой другой точки; во всяком случае, коэффи
циенты x 1 , x 2 , x 3 , x 4 в формуле (26) — это проекции вектора х на
оси координат.
Действия над четырехмерными векторами осуществляются по тем
же формальным правилам, что и над двумерными и трехмерными. На
иболее просто рассматривать векторы разложенными по осям коорди
нат, т.е. представленными в виде (26). Если наряду с вектором (26) мы
имеем вектор y = y1 e1 + y2 e 2 + y 3 e 3 + y 4 e 4 , то
x+y = (x1 + y1)e1 + (x2 + y2 )e2 + (x 3 + y3 )e3 + (x 4 + y4 )e4 ,
λx = λx1e1 + λx2e2 + λx 3e3 + λx 4e4 (λ — скаляр),
x ⋅ y = x1y1 + x2 y2 + x 3 y3 + x 4 y4 .

Рис. 111.

§ 6. Многомерное векторное пространство
В § IV.8 мы видели, что к понятию многомерного пространства мож
но подойти двояко: либо исходя из числовой схемы, либо же исходя из
рассмотрения системы со многими степенями свободы. Аналогичные
подходы возможны к понятию многомерного векторного пространства,
которые выделяются из общих пространств возможностью выполне

(27)

Можно проверить, что все основные свойства, описанные выше для дву
мерных и трехмерных векторов, сохраняют силу и для четырехмерных
векторов. Однако некоторого внимания требуют свойства, связанные с
понятием линейной зависимости (§ 1). Дело в том, что в четырехмерном
пространстве возможны плоскости двух «сортов» — двумерные и трех
мерные. Двумерная плоскость получается, если взять два линейно неза
висимых (т.е. непараллельных) вектора, а затем их всевозможные
линейные комбинации отложить от какойлибо фиксированной точки,
например от начала координат. Если это проделать с тремя линейно не
зависимыми векторами, то получится трехмерная плоскость (говорят
также «трехмерная гиперплоскость») в четырехмерном пространстве.
Если же взять четыре линейно независимых вектора (т.е. не параллель
ных одной трехмерной плоскости), то их линейные комбинации запол
нят все пространство, т.е. по ним можно разложить любой пятый вектор.

316

ВЕКТОРЫ

[Гл. IX

Таким образом, в четырехмерном пространстве любые четыре линейно
независимых вектора можно принять за базис (ср. § 1).
Рассмотрим теперь другой подход к понятию многомерного вектор
ного пространства. Будем исходить из некоторой совокупности R ка
кихто объектов, над которыми можно, оставаясь в рамках R,
производить линейные действия, т. е. складывать друг с другом и умно
жать на скаляры (вещественные числа). Кроме того, требуется, чтобы
при этих действиях соблюдались те же свойства, которые были указа
ны в § 1 для линейных действий над векторами на плоскости или в про
странстве. В этом случае R называется линейным (или векторным)
пространством, а составляющие его объекты называются (обобщенны
ми) векторами.
Основной числовой характеристикой заданного векторного прост
ранства является максимально возможное число линейно независи
мых векторов, называемое также размерностью этого пространства.
Например, если пространство R четырехмерно, то это означает, что
в нем можно указать такие четыре линейно независимых вектора
a1 , a2 , a 3 , a4 , что любой другой вектор х из R можно представить
в виде
x = λ 1a1 + λ 2a2 + λ 3a3 + λ 4a4 .

(28)

Таким образом, эти векторы a1 , a2 , a 3 , a4 можно в R принять за ба
зис. Так как для разных векторов х коэффициенты разложения в (28)
могут принимать всевозможные значения, то при выборе векто
ра х в пространстве R имеется четыре степени свободы, т.е. простра
нство R оказывается четырехмерным и в смысле § IV.8.
Может оказаться, что в рассматриваемом линейном пространстве
можно указать как угодно большое число линейно независимых векто
ров. Такое пространство называется бесконечномерным; пример беско
нечномерного пространства мы рассмотрим в § XIV.7.
Если в конечномерном линейном пространстве введено понятие
скалярного произведения, удовлетворяющее описанным в § 2 свой
ствам обычного скалярного произведения, то это пространство называ
ется евклидовым. В евклидовом пространстве естественно вводятся
понятия модуля вектора (по формуле x = x ⋅ x ), единичного векто
ра, ортогональности векторов (если x ⋅ y = 0). В евклидовом простра
нстве обычно выбирается не какой угодно базис, а ортогональный
базис, т.е., например, для четырехмерного случая совокупность четы
рех взаимно ортогональных векторов a1 , a2 , a 3 , a4 . В этом случае ко
эффициенты разложения (28) любого вектора х легко найти
следующим образом: помножим обе части равенства (28) скалярно на
какойто из векторов a j , что даст
x ⋅ a j = λ j (a j ⋅ a j );

§ 6]

МНОГОМЕРНОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО

317

остальные слагаемые в правой части пропадают в силу условия ортого
нальности. Отсюда
λj =

x ⋅ aj
aj ⋅ aj

( j = 1, 2, 3, 4 ).

(29)

Наличие скалярного произведения делает возможными повороты
в линейном пространстве, которое приобретает свойство изотропии
(равноправия направлений); при этом векторное пространство стано
вится существенно более полноценным. Вернемся к упомянутой в § 5
характеристике состояния газа в точке с помощью величин ϑ, p, ρ.
Над приращениями этих величин можно производить линейные дей
ствия, т.е. тройки таких приращений образуют трехмерное линейное
пространство. Однако в этом пространстве нет скалярного произведе
ния и поворотов, т.е. оно не является евклидовым, чем и объясняется
его неполноценность*.
Упомянем еще о псевдоевклидовых пространствах, в которых квад
рат модуля вектора (скалярное произведение его самого на себя) может
быть положительным, отрицательным или равным нулю. Именно та
ким в силу теории относительности является четырехмерное простра
нство х, у, z, t декартовых координат и времени. В псевдоевклидо
вом пространстве возможны повороты, хотя и не все направления в нем
оказываются равноправными.
До сих пор мы считали, что скаляры — это произвольные вещес
твенные числа; в этом случае линейное пространство называется ве
щественным. Рассматриваются также комплексные линейные простра
нства, в которых в качестве скаляров можно брать произвольные
комплексные числа. Тогда при определении евклидова пространства
имеется новый момент: именно, требуется, чтобы
( y, x ) = ( x, y )*,

(30)

т.е. чтобы при перестановке сомножителей в скалярном произведении
оно заменялось на комплексно сопряженное число. Однако если в фор
муле (30) положить y = x, то мы получим, что скалярный квадрат лю
бого вектора представляет собой число вещественное (и даже, как
можно проверить, положительное, так что модуль вектора можно нахо
дить по той же формуле, что и раньше, и этот модуль оказывается поло
жительным). Кроме того, при вынесении скалярного множителя за
знак скалярного произведения пользуются следующими формулами:
( λx, y ) = λ ( x, y ),

( x, λy ) = λ *( x, y ).

* Не надо путать эту «неевклидовость» с так называемой неевклидовой геометрией,
которая к теории линейных пространств не имеет отношения.

316

ВЕКТОРЫ

[Гл. IX

Таким образом, в четырехмерном пространстве любые четыре линейно
независимых вектора можно принять за базис (ср. § 1).
Рассмотрим теперь другой подход к понятию многомерного вектор
ного пространства. Будем исходить из некоторой совокупности R ка
кихто объектов, над которыми можно, оставаясь в рамках R,
производить линейные действия, т. е. складывать друг с другом и умно
жать на скаляры (вещественные числа).Кроме того, требуется, чтобы
при этих действиях соблюдались те же свойства, которые были указа
ны в § 1 для линейных действий над векторами на плоскости или в про
странстве. В этом случае R называется линейным (или векторным)
пространством, а составляющие его объекты называются (обобщенны
ми) векторами.
Основной числовой характеристикой заданного векторного прост
ранства является максимально возможное число линейно независи
мых векторов, называемое также размерностью этого пространства.
Например, если пространство R четырехмерно, то это означает, что
в нем можно указать такие четыре линейно независимых вектора
a1 , a2 , a 3 , a4 , что любой другой вектор х из R можно представить
в виде
x = λ 1a1 + λ 2a2 + λ 3a3 + λ 4a4 .

(28)

Таким образом, эти векторы a1 , a2 , a 3 , a4 можно в R принять за ба
зис. Так как для разных векторов х коэффициенты разложения в (28)
могут принимать всевозможные значения, то при выборе векто
ра х в пространстве R имеется четыре степени свободы, т.е. простра
нство R оказывается четырехмерным и в смысле § IV.8.
Может оказаться, что в рассматриваемом линейном пространстве
можно указать как угодно большое число линейно независимых векто
ров. Такое пространство называется бесконечномерным; пример беско
нечномерного пространства мы рассмотрим в § XIV.7.
Если в конечномерном линейном пространстве введено понятие
скалярного произведения, удовлетворяющее описанным в § 2 свой
ствам обычного скалярного произведения, то это пространство называ
ется евклидовым. В евклидовом пространстве естественно вводятся
понятия модуля вектора (по формуле x = x ⋅ x ), единичного векто
ра, ортогональности векторов (если x ⋅ y = 0). В евклидовом простра
нстве обычно выбирается не какой угодно базис, а ортогональный
базис, т.е., например, для четырехмерного случая совокупность четы
рех взаимно ортогональных векторов a1 , a2 , a 3 , a4 . В этом случае ко
эффициенты разложения (28) любого вектора х легко найти
следующим образом: помножим обе части равенства (28) скалярно на
какойто из векторов a j , что даст
x ⋅ a j = λ j (a j ⋅ a j );

§ 6]

МНОГОМЕРНОЕ ВЕКТОРНОЕ ПРОСТРАНСТВО

317

остальные слагаемые в правой части пропадают в силу условия ортого
нальности. Отсюда
λj =

x ⋅ aj
aj ⋅ aj

( j = 1, 2, 3, 4 ).

(29)

Наличие скалярного произведения делает возможными повороты
в линейном пространстве, которое приобретает свойство изотропии
(равноправия направлений); при этом векторное пространство стано
вится существенно более полноценным. Вернемся к упомянутой в § 5
характеристике состояния газа в точке с помощью величин ϑ, p, ρ.
Над приращениями этих величин можно производить линейные дей
ствия, т.е. тройки таких приращений образуют трехмерное линейное
пространство. Однако в этом пространстве нет скалярного произведе
ния и поворотов, т.е. оно не является евклидовым, чем и объясняется
его неполноценность*.
Упомянем еще о псевдоевклидовых пространствах, в которых квад
рат модуля вектора (скалярное произведение его самого на себя) может
быть положительным, отрицательным или равным нулю. Именно та
ким в силу теории относительности является четырехмерное простра
нство х, у, z, t декартовых координат и времени. В псевдоевклидо
вом пространстве возможны повороты, хотя и не все направления в нем
оказываются равноправными.
До сих пор мы считали, что скаляры — это произвольные вещес
твенные числа; в этом случае линейное пространство называется ве
щественным. Рассматриваются также комплексные линейные простра
нства, в которых в качестве скаляров можно брать произвольные
комплексные числа. Тогда при определении евклидова пространства
имеется новый момент: именно, требуется, чтобы
( y, x ) = ( x, y )*,

(30)

т.е. чтобы при перестановке сомножителей в скалярном произведении
оно заменялось на комплексно сопряженное число. Однако если в фор
муле (30) положить y = x, то мы получим, что скалярный квадрат лю
бого вектора представляет собой число вещественное (и даже, как
можно проверить, положительное, так что модуль вектора можно нахо
дить по той же формуле, что и раньше, и этот модуль оказывается поло
жительным). Кроме того, при вынесении скалярного множителя за
знак скалярного произведения пользуются следующими формулами:
( λx, y ) = λ ( x, y ),

( x, λy ) = λ *( x, y ).

* Не надо путать эту «неевклидовость» с так называемой неевклидовой геометрией,
которая к теории линейных пространств не имеет отношения.

318

ВЕКТОРЫ

[Гл. IX

ОТВЕТЫ И РЕШЕНИЯ

319

Простейший пример четырехмерного комплексного евклидова
пространства — это пространство, рассмотренное в начале этого параг
рафа, где, однако, числа x 1 , x 2 , x 3 , x 4 надо считать комплексными,
а взамен формулы (27) надо воспользоваться формулой
x ⋅ y = x1 y1* + x2 y2* + x3 y3* + x4 y4* .
Упражнения
1. Укажите формулу для модуля вектора (26).
2. Проверьте, что радиусывекторы точек (1; 1; 1; − 1), (1; 1; − 1; 1) и
(0; 0; 1; 1) взаимно перпендикулярны; постройте четвертый (не нулевой) век
тор, перпендикулярный этим трем.

§ 1

a+b
a + λb
1.
. 2.
. 3. AB = −3i + j.
2
1+ λ
§ 2
1.
2.
3.
4.
5.

3
.
2
Из рисунка видно, что Fx = 1, F y = 3, G x = 3, G y = 1. Поэтому F ⋅ G = 6.
cosθ = −1 2, θ = 120 o .


→ →
AB = 2i + j, AC = i − 2 j, поэтому AB ⋅ AC = 2 − 2 = 0.


AC = F + G, DB = F − G, откуда
AC 2 + DB2 = ( F + G ) ⋅ ( F + G ) + ( F − G ) ⋅ ( F − G ) =
= 2 F ⋅ F + 2G ⋅ G = AB2 + BC 2 + CD 2 + DA 2 .



6. Расположим оси координат, как на рис. 112. Тогда OA = ai, OB = aj,


OC = ak. Длины всех диагоналей одинаковы; например, OD = ai+aj+ak,

7. Обозначим точки, упомянутые в формулировке задачи, как на рис. 113.
Ясно, что О имеет координаты (0; 0; 0 ), а A( a ; 0; 0 ). Пусть В имеет коорди
→ →
a2
наты ( xB ; yB ; 0 ), а C ( xC ; yC ; zC ). Тогда OB = a , OB⋅ OA = a ⋅ a ⋅ cos 60 o = , т.е.
2
→ → a2
a2
a
a 3
2
2
2
. Далее, OC = a , OC ⋅ OA = ,
xB + yB = a , xB a = , откуда xB = , yB =
2
2
2
2
→ → a2
a2
a
a
a 3 a2
2
2
2
2
OC ⋅ OB = , т.е. xC + yC + zC = a , xC a = , xC + yC
= , откуда xC = ,
2
2
2
2
2
2
a
2
, zC =
yC =
a.
3
2 3
Так как точка D, в силу соображений симметрии, расположена точно под С,
⎛a a

то обозначим ее координаты через ⎜ ;
; z ⎟ . Приравнивая длины векто
⎝ 2 2 3 D⎠
2

2
2


⎛ 2

⎛ a ⎞
⎛ a⎞
2
ров DC и DO, получим ⎜
a − zD ⎟ = ⎜ ⎟ + ⎜
⎟ + z D , откуда z D =
⎝ 2⎠
⎝2 3⎠
⎝ 3


=



a ⎛ zC ⎞
a
a
a
j−
k, то искомый
⎜ = ⎟ . Наконец, так как DC k, а DO = − i −
2 2 3
2 6 ⎝ 4⎠
2 6

угол можно найти по формуле

k ⋅ DO
=
cos α =
k ⋅ DO

OD = a 2 + a 2 + a 2 = 3 a = 1,73 a . Углы между диагоналями также одинаковы;


например, угол между OD и CE = ai+aj − ak вычисляется по формуле
cos ϑ =

→ →
1
OD⋅ CE
a2
=
= ,
OD ⋅ CE
3a⋅ 3a 3

т.е. ϑ = 70 o32′.

И проекции сторон на диагонали одинаковы; например, проекция стороны ОА
→ →
OA⋅ OD
a2
a
на диагональ OD равна
=
=
= 0,58 a .
OD
3a
3

Рис. 113.

Рис. 112.

ОТВЕТЫ И РЕШЕНИЯ

a
1
2 6
=− ,
3
a2 a2 a2
+
+
4
12 24


откуда α = 109 o28′.
§ 3
Радиусвектор точки винтовой линии равен r = xi + yj + zk = R cos ωt i +
+ R sin ωt j + vt k. Отсюда
dr
= −Rω sin ωt i + Rω cos ωt j + v k.
dt

(31)

318

ВЕКТОРЫ

[Гл. IX

ОТВЕТЫ И РЕШЕНИЯ

319

Простейший пример четырехмерного комплексного евклидова
пространства — это пространство, рассмотренное в начале этого параг
рафа, где, однако, числа x 1 , x 2 , x 3 , x 4 надо считать комплексными,
а взамен формулы (27) надо воспользоваться формулой
x ⋅ y = x1 y1* + x2 y2* + x3 y3* + x4 y4* .
Упражнения
1. Укажите формулу для модуля вектора (26).
2. Проверьте, что радиусывекторы точек (1; 1; 1; − 1), (1; 1; − 1; 1) и
(0; 0; 1; 1) взаимно перпендикулярны; постройте четвертый (не нулевой) век
тор, перпендикулярный этим трем.

§ 1

a+b
a + λb
1.
. 2.
. 3. AB = −3i + j.
2
1+ λ
§ 2
1.
2.
3.
4.
5.

3
.
2
Из рисунка видно, что Fx = 1, F y = 3, G x = 3, G y = 1. Поэтому F ⋅ G = 6.
cosθ = −1 2, θ = 120 o .


→ →
AB = 2i + j, AC = i − 2 j, поэтому AB ⋅ AC = 2 − 2 = 0.


AC = F + G, DB = F − G, откуда
AC 2 + DB2 = ( F + G ) ⋅ ( F + G ) + ( F − G ) ⋅ ( F − G ) =
= 2 F ⋅ F + 2G ⋅ G = AB2 + BC 2 + CD 2 + DA 2 .



6. Расположим оси координат, как на рис. 112. Тогда OA = ai, OB = aj,


OC = ak. Длины всех диагоналей одинаковы; например, OD = ai+aj+ak,

7. Обозначим точки, упомянутые в формулировке задачи, как на рис. 113.
Ясно, что О имеет координаты (0; 0; 0 ), а A( a ; 0; 0 ). Пусть В имеет коорди
→ →
a2
наты ( xB ; yB ; 0 ), а C ( xC ; yC ; zC ). Тогда OB = a , OB⋅ OA = a ⋅ a ⋅ cos 60 o = , т.е.
2
→ → a2
a2
a
a 3
2
2
2
. Далее, OC = a , OC ⋅ OA = ,
xB + yB = a , xB a = , откуда xB = , yB =
2
2
2
2
→ → a2
a2
a
a
a 3 a2
2
2
2
2
OC ⋅ OB = , т.е. xC + yC + zC = a , xC a = , xC + yC
= , откуда xC = ,
2
2
2
2
2
2
a
2
, zC =
yC =
a.
3
2 3
Так как точка D, в силу соображений симметрии, расположена точно под С,
⎛a a

то обозначим ее координаты через ⎜ ;
; z ⎟ . Приравнивая длины векто
⎝ 2 2 3 D⎠
2

2
2


⎛ 2

⎛ a ⎞
⎛ a⎞
2
ров DC и DO, получим ⎜
a − zD ⎟ = ⎜ ⎟ + ⎜
⎟ + z D , откуда z D =
⎝ 2⎠
⎝2 3⎠
⎝ 3


=



a ⎛ zC ⎞
a
a
a
j−
k, то искомый
⎜ = ⎟ . Наконец, так как DC k, а DO = − i −
2 2 3
2 6 ⎝ 4⎠
2 6

угол можно найти по формуле

k ⋅ DO
=
cos α =
k ⋅ DO

OD = a 2 + a 2 + a 2 = 3 a = 1,73 a . Углы между диагоналями также одинаковы;


например, угол между OD и CE = ai+aj − ak вычисляется по формуле
cos ϑ =

→ →
1
OD⋅ CE
a2
=
= ,
OD ⋅ CE
3a⋅ 3a 3

т.е. ϑ = 70 o32′.

И проекции сторон на диагонали одинаковы; например, проекция стороны ОА
→ →
OA⋅ OD
a2
a
на диагональ OD равна
=
=
= 0,58 a .
OD
3a
3

Рис. 113.

Рис. 112.

ОТВЕТЫ И РЕШЕНИЯ

a
1
2 6
=− ,
3
a2 a2 a2
+
+
4
12 24


откуда α = 109 o28′.
§ 3
Радиусвектор точки винтовой линии равен r = xi + yj + zk = R cos ωt i +
+ R sin ωt j + vt k. Отсюда
dr
= −Rω sin ωt i + Rω cos ωt j + v k.
dt

(31)

320

ВЕКТОРЫ

[Гл. IX

Так как этот вектор направлен по касательной, то остается найти его угол ϑ
с вектором k:
dr
⋅k
v
.
cos ϑ = dt
=
2 2
dr
R ω + v2
k
dt
§ 4
В силу (31) ds = dr = − Rω sin ωt i + Rω cos ωt j+v k dt = R 2ω 2 + v 2 dt.
Поэтому

ГЛАВА X
ТЕОРИЯ ПОЛЯ*
§ 1. Введение

dr −Rω sin ωt i + Rω cos ωt j+v k
,
b=
=
ds
R 2ω 2 + v 2
k=


dτ dt
Rω 2
.
=
= 2 2
ds
dt ds R ω + v 2

§ 5
⎛k 0⎞
⎛k 0⎞
⎛ cos α
а) ⎜
⎟ ; б) ⎜
⎟ ; в) ⎜
⎝ sin α
⎝0 1⎠
⎝ 0 k⎠

− sin α ⎞
⎛ 1 k⎞
⎛ −1 0⎞
⎟ ; д) ⎜
⎟.
⎟ ; г) ⎜
⎝ 0 1⎠
cos α ⎠
⎝0 1⎠

В примерах б), в) и д) каждый квадрат переходит снова в квадрат. В приме$
рах а) и г) из квадрата получится, вообще говоря, косоугольный параллелог$
рамм. Если стороны квадрата параллельны осям координат в случае а) или
k
k2
имеют угловой коэффициент ±
+ 1 в случае г), то получится прямоу$
2
4
гольник. Если из указанного положения повернуть квадрат на 45°, то получит$
ся ромб.
§ 6
1. x12 + x22 + x32 + x42 .
2. Перпендикулярность проверяется с помощью формулы (27), так как
скалярное произведение любой пары векторов оказывается равным нулю.
Если четвертый вектор имеет проекции x1 , x2 , x3 , x4 , то из условия перпенди$
кулярности получаем x1 + x2 + x3 − x4 = 0, x1 + x2 − x3 + x4 = 0, x3 + x4 = 0, от$
куда легко выводится, что x3 = x4 = 0, x1 + x2 = 0. Таким образом, можно
принять проекции четвертого вектора равными 1, –1, 0, 0.

Говорят, что в пространстве задано поле некоторой величины, если
в каждой точке пространства (или некоторой его области, т.е. части)
определено значение этой величины. Например, при рассмотрении по$
тока газа приходится исследовать температурное поле (в каждой точке
температура имеет определенное значение), поле плотностей, поле дав$
лений, поле скоростей и т.д. Поле может быть скалярным или вектор
ным в зависимости от характера исследуемой величины: например,
поля температур, давлений или плотностей являются скалярными,
а поля скоростей или сил — векторными. Поле может быть стационар
ным (установившимся), если оно не меняется с течением времени в каж$
дой точке пространства, или нестационарным (неустановившимся),
если такое изменение имеет место.
Обозначим рассматриваемую (для определенности, скалярную) ве$
личину буквой u и введем в пространство декартову систему коорди$
нат х, у, z. Заданием этих координат определяется точка в простра$
нстве и тем самым соответствующее значение u = u(x, y, z ). (Если поле
нестационарное, то u = u(x, y, z , t), где t — время; однако при этом мы
рассматриваем время не как равноправную четвертую координату,
а скорее как некоторый дополнительный параметр, так что дальней$
шие построения будут относиться к любому, но фиксированному мо$
менту времени.) Таким образом, с формальной точки зрения стацио$
нарное поле — это просто функция трех переменных х, у, z. Однако
надо иметь в виду, что координаты в пространстве можно ввести
по$разному. При этом выражение u(x, y, z ) будет изменяться; но в лю$
бой данной точке М значение u, конечно, не зависит от выбора систе$
мы координат. Поэтому часто говорят, что u представляет собой
функцию точки, u = u(M ), так как задание точки М полностью опре$
деляет соответствующее значение u, т.е. значение величины u в точ$
ке М. Функция точки при рассмотрений поля является первичной по
* Эта глава является непосредственным продолжением предыдущей и существенно
опирается на материал §§ IX. 1–2. Применяются также понятия кратного интеграла
(§ IV.7) и функции Грина (§ VI.2).

320

ВЕКТОРЫ

[Гл. IX

Так как этот вектор направлен по касательной, то остается найти его угол ϑ
с вектором k:
dr
⋅k
v
.
cos ϑ = dt
=
2 2
dr
R ω + v2
k
dt
§ 4
В силу (31) ds = dr = − Rω sin ωt i + Rω cos ωt j+v k dt = R 2ω 2 + v 2 dt.
Поэтому

ГЛАВА X
ТЕОРИЯ ПОЛЯ*
§ 1. Введение

dr −Rω sin ωt i + Rω cos ωt j+v k
,
b=
=
ds
R 2ω 2 + v 2
k=


dτ dt
Rω 2
.
=
= 2 2
ds
dt ds R ω + v 2

§ 5
⎛k 0⎞
⎛k 0⎞
⎛ cos α
а) ⎜
⎟ ; б) ⎜
⎟ ; в) ⎜
⎝ sin α
⎝0 1⎠
⎝ 0 k⎠

− sin α ⎞
⎛ 1 k⎞
⎛ −1 0⎞
⎟ ; д) ⎜
⎟.
⎟ ; г) ⎜
⎝ 0 1⎠
cos α ⎠
⎝0 1⎠

В примерах б), в) и д) каждый квадрат переходит снова в квадрат. В приме$
рах а) и г) из квадрата получится, вообще говоря, косоугольный параллелог$
рамм. Если стороны квадрата параллельны осям координат в случае а) или
k
k2
имеют угловой коэффициент ±
+ 1 в случае г), то получится прямоу$
2
4
гольник. Если из указанного положения повернуть квадрат на 45°, то получит$
ся ромб.
§ 6
1. x12 + x22 + x32 + x42 .
2. Перпендикулярность проверяется с помощью формулы (27), так как
скалярное произведение любой пары векторов оказывается равным нулю.
Если четвертый вектор имеет проекции x1 , x2 , x3 , x4 , то из условия перпенди$
кулярности получаем x1 + x2 + x3 − x4 = 0, x1 + x2 − x3 + x4 = 0, x3 + x4 = 0, от$
куда легко выводится, что x3 = x4 = 0, x1 + x2 = 0. Таким образом, можно
принять проекции четвертого вектора равными 1, –1, 0, 0.

Говорят, что в пространстве задано поле некоторой величины, если
в каждой точке пространства (или некоторой его области, т.е. части)
определено значение этой величины. Например, при рассмотрении по$
тока газа приходится исследовать температурное поле (в каждой точке
температура имеет определенное значение), поле плотностей, поле дав$
лений, поле скоростей и т.д. Поле может быть скалярным или вектор
ным в зависимости от характера исследуемой величины: например,
поля температур, давлений или плотностей являются скалярными,
а поля скоростей или сил — векторными. Поле может быть стационар
ным (установившимся), если оно не меняется с течением времени в каж$
дой точке пространства, или нестационарным (неустановившимся),
если такое изменение имеет место.
Обозначим рассматриваемую (для определенности, скалярную) ве$
личину буквой u и введем в пространство декартову систему коорди$
нат х, у, z. Заданием этих координат определяется точка в простра$
нстве и тем самым соответствующее значение u = u(x, y, z ). (Если поле
нестационарное, то u = u(x, y, z , t), где t — время; однако при этом мы
рассматриваем время не как равноправную четвертую координату,
а скорее как некоторый дополнительный параметр, так что дальней$
шие построения будут относиться к любому, но фиксированному мо$
менту времени.) Таким образом, с формальной точки зрения стацио$
нарное поле — это просто функция трех переменных х, у, z. Однако
надо иметь в виду, что координаты в пространстве можно ввести
по$разному. При этом выражение u(x, y, z ) будет изменяться; но в лю$
бой данной точке М значение u, конечно, не зависит от выбора систе$
мы координат. Поэтому часто говорят, что u представляет собой
функцию точки, u = u(M ), так как задание точки М полностью опре$
деляет соответствующее значение u, т.е. значение величины u в точ$
ке М. Функция точки при рассмотрений поля является первичной по
* Эта глава является непосредственным продолжением предыдущей и существенно
опирается на материал §§ IX. 1–2. Применяются также понятия кратного интеграла
(§ IV.7) и функции Грина (§ VI.2).

322

ТЕОРИЯ ПОЛЯ

[Гл. X

отношению к функции координат, так как поле имеет смысл и может
быть исследовано без всяких систем координат.
Если исследуемая величина по своему смыслу задана в плоскости,
то соответствующее поле называется плоским; такие поля получаются,
например, при исследовании тепловых процессов в пластинке, толщи(
ной которой мы пренебрегаем.
Если поле величины u пространственное, но в некоторой декарто(
вой системе координат x, y, z эта величина оказывается не зависящей
от z, то поле называется плоскопараллельным. В таком случае часто бы(
вает возможным отвлечься от координаты z, рассматривая поле
в плоскости x, y (т.е. рассматривать вместо плоскопараллельного
поля — плоское) и помня о том, что во всех параллельных плоскостях
поле имеет в точности тот же вид, т.е. на перпендикулярах к этим плос(
костям все величины, характеризующие поле, постоянны.
Упражнение
Пусть величина u имеет в некоторой декартовой системе координат выра(
жение u = x 2 + y 2 + 2 yz + z 2 . Докажите, что эта величина образует плоскопа(
раллельное поле.
У к а з а н и е. Поверните систему координат на 45° вокруг оси х.

§ 2. Скалярное поле и градиент
Будем для простоты считать, что в пространстве задана декартова
система координат x, y, z , и рассмотрим стационарное скалярное поле
u = u(x, y, z ). Пусть, кроме того, в пространстве
дана некоторая точка М. Из нее можно выходить
по всевозможным направлениям; на рис. 114 по(
казано одно из таких направлений l. Производ(
ной от u по направлению l называется ско(
рость изменения поля в этом направлении
в расчете на единицу длины:
Рис. 114.

du
u( N ) − u( M )
Δu
= lim
= lim
N

M
Δ
s

0
dl
MN
Δs

.
l

Рассуждая так же, как при выводе формулы (IV.5), получим
du ∂u dx ∂u dy ∂u dz
.
=
+
+
dl ∂x dl ∂y dt ∂z dl

Правую часть удобно представить в виде скалярного произведения
двух векторов (см. формулу (IX.5))
∂u
∂u ⎞ ⎛ dx
du ⎛ ∂u
dy
dz ⎞
j+
k⎟ ⋅ ⎜ i +
j+
k⎟ .
=⎜ i+
∂y
∂z ⎠ ⎝ dl
dl ⎝ ∂x
dl
dl ⎠

§ 2]

СКАЛЯРНОЕ ПОЛЕ И ГРАДИЕНТ

323

Первый из них называется градиентом поля u и обозначается
grad u =

∂u
∂u
∂u
i+
j+
k;
∂x
∂y
∂z

(1)

его физический смысл будет показан несколько позже. Второй вектор
dx
dy
dz
d ( xi + yj + zk ) dr
i+
j+
k=
=

dl
dl
dl
dl
dl

— это единичный вектор направления l (см. § IX.4). Таким образом,
du
= grad u ⋅ τ.
dl

(2)

Первый множитель в правой части, при заданном поле u, зависит
лишь от выбора точки М; второй множитель зависит лишь от направ(
ления l.
Так как скалярное произведение какого(либо вектора на единичный
вектор равно просто проекции первого вектора на второй, то формулу
(2) можно переписать в виде
du
= gradl u
dl

(3)

(это обозначение для проекции градиента на направление l).
Пусть заданы поле u и точка М; поставим вопрос: по какому на(
правлению l производная du dl самая большая? Согласно формуле
(3) этот вопрос сводится к следующему: на
какое направление проекция вектора grad u
самая большая? Очевидно, что любой вектор
при проецировании на различные направле(
ния дает самую большую проекцию, равную
его длине, при проецировании на его со(
бственное направление. Таким образом, век(
тор grad u в точке М указывает в сторону
наибыстрейшего возрастания поля u, при(
чем эта наибыстрейшая скорость, отнесен(
Рис. 115.
ная к единице длины, равна grad u ; чем
поле меняется быстрее, тем grad u длиннее. На рис. 115 показаны век(
торы градиента температуры в отдельных точках проводника тепла, по(
догреваемого изнутри (из заштрихованной зоны) и охлаждаемого сна(
ружи. Градиент температуры направлен «к печке».
Полученный физический смысл градиента показывает также, что
градиент инвариантно связан с рассматриваемым полем, т.е. остается
неизменным (инвариантным) при замене декартовых осей (этого не
было видно из его определения (1), данного в «неинвариантной» фор(
ме, «привязанной» к какой(то одной системе координат). Более того,

322

ТЕОРИЯ ПОЛЯ

[Гл. X

отношению к функции координат, так как поле имеет смысл и может
быть исследовано без всяких систем координат.
Если исследуемая величина по своему смыслу задана в плоскости,
то соответствующее поле называется плоским; такие поля получаются,
например, при исследовании тепловых процессов в пластинке, толщи(
ной которой мы пренебрегаем.
Если поле величины u пространственное, но в некоторой декарто(
вой системе координат x, y, z эта величина оказывается не зависящей
от z, то поле называется плоскопараллельным. В таком случае часто бы(
вает возможным отвлечься от координаты z, рассматривая поле
в плоскости x, y (т.е. рассматривать вместо плоскопараллельного
поля — плоское) и помня о том, что во всех параллельных плоскостях
поле имеет в точности тот же вид, т.е. на перпендикулярах к этим плос(
костям все величины, характеризующие поле, постоянны.
Упражнение
Пусть величина u имеет в некоторой декартовой системе координат выра(
жение u = x 2 + y 2 + 2 yz + z 2 . Докажите, что эта величина образует плоскопа(
раллельное поле.
У к а з а н и е. Поверните систему координат на 45° вокруг оси х.

§ 2. Скалярное поле и градиент
Будем для простоты считать, что в пространстве задана декартова
система координат x, y, z , и рассмотрим стационарное скалярное поле
u = u(x, y, z ). Пусть, кроме того, в пространстве
дана некоторая точка М. Из нее можно выходить
по всевозможным направлениям; на рис. 114 по(
казано одно из таких направлений l. Производ(
ной от u по направлению l называется ско(
рость изменения поля в этом направлении
в расчете на единицу длины:
Рис. 114.

du
u( N ) − u( M )
Δu
= lim
= lim
N

M
Δ
s

0
dl
MN
Δs

.
l

Рассуждая так же, как при выводе формулы (IV.5), получим
du ∂u dx ∂u dy ∂u dz
.
=
+
+
dl ∂x dl ∂y dt ∂z dl

Правую часть удобно представить в виде скалярного произведения
двух векторов (см. формулу (IX.5))
∂u
∂u ⎞ ⎛ dx
du ⎛ ∂u
dy
dz ⎞
j+
k⎟ ⋅ ⎜ i +
j+
k⎟ .
=⎜ i+
∂y
∂z ⎠ ⎝ dl
dl ⎝ ∂x
dl
dl ⎠

§ 2]

СКАЛЯРНОЕ ПОЛЕ И ГРАДИЕНТ

323

Первый из них называется градиентом поля u и обозначается
grad u =

∂u
∂u
∂u
i+
j+
k;
∂x
∂y
∂z

(1)

его физический смысл будет показан несколько позже. Второй вектор
dx
dy
dz
d ( xi + yj + zk ) dr
i+
j+
k=
=

dl
dl
dl
dl
dl

— это единичный вектор направления l (см. § IX.4). Таким образом,
du
= grad u ⋅ τ.
dl

(2)

Первый множитель в правой части, при заданном поле u, зависит
лишь от выбора точки М; второй множитель зависит лишь от направ(
ления l.
Так как скалярное произведение какого(либо вектора на единичный
вектор равно просто проекции первого вектора на второй, то формулу
(2) можно переписать в виде
du
= gradl u
dl

(3)

(это обозначение для проекции градиента на направление l).
Пусть заданы поле u и точка М; поставим вопрос: по какому на(
правлению l производная du dl самая большая? Согласно формуле
(3) этот вопрос сводится к следующему: на
какое направление проекция вектора grad u
самая большая? Очевидно, что любой вектор
при проецировании на различные направле(
ния дает самую большую проекцию, равную
его длине, при проецировании на его со(
бственное направление. Таким образом, век(
тор grad u в точке М указывает в сторону
наибыстрейшего возрастания поля u, при(
чем эта наибыстрейшая скорость, отнесен(
Рис. 115.
ная к единице длины, равна grad u ; чем
поле меняется быстрее, тем grad u длиннее. На рис. 115 показаны век(
торы градиента температуры в отдельных точках проводника тепла, по(
догреваемого изнутри (из заштрихованной зоны) и охлаждаемого сна(
ружи. Градиент температуры направлен «к печке».
Полученный физический смысл градиента показывает также, что
градиент инвариантно связан с рассматриваемым полем, т.е. остается
неизменным (инвариантным) при замене декартовых осей (этого не
было видно из его определения (1), данного в «неинвариантной» фор(
ме, «привязанной» к какой(то одной системе координат). Более того,

324

ТЕОРИЯ ПОЛЯ

[Гл. X

если задано поле u, то в каждой точке пространства можно найти на(
правление и скорость наибыстрейшего возрастания поля u; так можно
найти вектор grad u, не прибегая к координатам и к заданию u(x, y, z ).
Итак, градиент скалярного поля образует вполне определенное вектор(
ное поле.
Аналогичное требование инвариантности ставится для всех основ(
ных понятий теории поля. Как мы говорили в § IX.5, при замене осей
декартовой системы координат хотя векторы и остаются неизменны(
ми, инвариантными, но их проекции меняются. Таким образом, если
какое(либо понятие теории векторного поля сформулировано с по(
мощью координат и проекций этого поля, то это понятие должно удов(
летворять требованию инвариантности относительно изменения этих
координат и проекций при повороте осей координат. Так будет, в час(
тности, если формулировка выражена в терминах скаляров, векторов
и тензоров (§ IX.5).
Отметим, что производные u x′ , u ′y и u ′z также являются произ(
водными по направлению: например, u x′ — это производная по на(
правлению оси x.
Градиент поля u(x, y, z ) тесно связан с поверхностями уровня этого
поля, т.е. поверхностями, на которых поле имеет постоянное значение,
u(x, y, z ) = const; в зависимости от
физического смысла поля они могут
называться изотермическими, изоба(
рическими и т.п. поверхностями.
Именно, в каждой точке М градиент
поля нормален (т.е. перпендикулярен
касательной плоскости) поверхности
Рис. 116.
уровня, проходящей через М.
Действительно (рис. 116), если ΔC малo´, то вблизи М поверхности
u = C и u = C + ΔC можно считать почти плоскими и
du Δu ΔC
,

=
dl Δl
Δl

(4)

где Δl — расстояние между поверхностями по направлению l. Но
du
ясно, что Δl будет самым малым, а потому производная
— самой
dl
большой, если l направлено по нормали к поверхности. Отсюда и сле(
дует наше утверждение.
Все понятия, введенные для пространственного поля, переносятся
с соответствующими упрощениями на плоские поля (см. § 1). Так, гра(
∂u
∂u
диент поля u(x, y), вычисляемый по формуле grad u =
i+
j,
∂x
∂y
представляет собой вектор, лежащий в плоскости х, у. В каждой точке

§ 2]

СКАЛЯРНОЕ ПОЛЕ И ГРАДИЕНТ

325

градиент поля нормален линии уровня поля, т.е. линии u(x, y) = const,
проходящей через эту точку (рис. 117). При этом из формулы (4) вид(
но, что модуль градиента обратно пропорци(
онален расстоянию между линиями уровня.
Там, где линии уровня сближаются, гради(
ент увеличивается (сравните, например,
градиент поля в точках А и В на рис. 117).
Вычислим в качестве примера градиент
центрально(симметричного поля u = f (r),
где r = x 2 + y 2 + z 2 . В этом случае значе(
ние u зависит только от расстояния точки
Рис. 117.
до начала координат, а потому поверхностя(
ми уровня служат сферы с центром в начале координат. Если взять две
сферы, радиусы которых отличаются на dr, то значения функции f на
них будут отличаться на df. Поэтому скорость изменения поля попе(
df
, а потому
рек поверхностей уровня (т.е. вдоль радиусов) равна
dr
grad u ( r ) =

df r df 0
= r .
dr r dr

(5)

Здесь r — радиус(вектор, проведенный из начала координат в любую
r
текущую точку (x; y; z ); r = r ; r 0 = — вектор единичной длины,
r
направленный вдоль r .
Получим формулу (5) другим способом, опираясь на выражение
градиента в координатной форме (1). Имеем
∂u df ∂r df
=
=
∂x dr ∂x dr

Аналогично

x
x2 + y2 + z 2

=

df x
.
dr r

∂u df y ∂u df z
,
, откуда
=
=
∂y dr r ∂z dr r

grad u =

df 1
df x
df y
df z
df 1
i+
j+
k=
⋅ ( xi + yj + zk ) =
r.
dr r
dr r
dr r
dr r
dr r

df
1 df
— скаляр, то мы видим, что при
> 0 векторы
dr
r dr
grad u всюду продолжают соответствующие векторы r (как колючки
df
у свернувшегося ежа), а если
< 0, то векторы grad u всюду обраще(
dr
ны к началу координат.
Так как

324

ТЕОРИЯ ПОЛЯ

[Гл. X

если задано поле u, то в каждой точке пространства можно найти на(
правление и скорость наибыстрейшего возрастания поля u; так можно
найти вектор grad u, не прибегая к координатам и к заданию u(x, y, z ).
Итак, градиент скалярного поля образует вполне определенное вектор(
ное поле.
Аналогичное требование инвариантности ставится для всех основ(
ных понятий теории поля. Как мы говорили в § IX.5, при замене осей
декартовой системы координат хотя векторы и остаются неизменны(
ми, инвариантными, но их проекции меняются. Таким образом, если
какое(либо понятие теории векторного поля сформулировано с по(
мощью координат и проекций этого поля, то это понятие должно удов(
летворять требованию инвариантности относительно изменения этих
координат и проекций при повороте осей координат. Так будет, в час(
тности, если формулировка выражена в терминах скаляров, векторов
и тензоров (§ IX.5).
Отметим, что производные u x′ , u ′y и u ′z также являются произ(
водными по направлению: например, u x′ — это производная по на(
правлению оси x.
Градиент поля u(x, y, z ) тесно связан с поверхностями уровня этого
поля, т.е. поверхностями, на которых поле имеет постоянное значение,
u(x, y, z ) = const; в зависимости от
физического смысла поля они могут
называться изотермическими, изоба(
рическими и т.п. поверхностями.
Именно, в каждой точке М градиент
поля нормален (т.е. перпендикулярен
касательной плоскости) поверхности
Рис. 116.
уровня, проходящей через М.
Действительно (рис. 116), если ΔC малo´, то вблизи М поверхности
u = C и u = C + ΔC можно считать почти плоскими и
du Δu ΔC
,

=
dl Δl
Δl

(4)

где Δl — расстояние между поверхностями по направлению l. Но
du
ясно, что Δl будет самым малым, а потому производная
— самой
dl
большой, если l направлено по нормали к поверхности. Отсюда и сле(
дует наше утверждение.
Все понятия, введенные для пространственного поля, переносятся
с соответствующими упрощениями на плоские поля (см. § 1). Так, гра(
∂u
∂u
диент поля u(x, y), вычисляемый по формуле grad u =
i+
j,
∂x
∂y
представляет собой вектор, лежащий в плоскости х, у. В каждой точке

§ 2]

СКАЛЯРНОЕ ПОЛЕ И ГРАДИЕНТ

325

градиент поля нормален линии уровня поля, т.е. линии u(x, y) = const,
проходящей через эту точку (рис. 117). При этом из формулы (4) вид(
но, что модуль градиента обратно пропорци(
онален расстоянию между линиями уровня.
Там, где линии уровня сближаются, гради(
ент увеличивается (сравните, например,
градиент поля в точках А и В на рис. 117).
Вычислим в качестве примера градиент
центрально(симметричного поля u = f (r),
где r = x 2 + y 2 + z 2 . В этом случае значе(
ние u зависит только от расстояния точки
Рис. 117.
до начала координат, а потому поверхностя(
ми уровня служат сферы с центром в начале координат. Если взять две
сферы, радиусы которых отличаются на dr, то значения функции f на
них будут отличаться на df. Поэтому скорость изменения поля попе(
df
, а потому
рек поверхностей уровня (т.е. вдоль радиусов) равна
dr
grad u ( r ) =

df r df 0
= r .
dr r dr

(5)

Здесь r — радиус(вектор, проведенный из начала координат в любую
r
текущую точку (x; y; z ); r = r ; r 0 = — вектор единичной длины,
r
направленный вдоль r .
Получим формулу (5) другим способом, опираясь на выражение
градиента в координатной форме (1). Имеем
∂u df ∂r df
=
=
∂x dr ∂x dr

Аналогично

x
x2 + y2 + z 2

=

df x
.
dr r

∂u df y ∂u df z
,
, откуда
=
=
∂y dr r ∂z dr r

grad u =

df 1
df x
df y
df z
df 1
i+
j+
k=
⋅ ( xi + yj + zk ) =
r.
dr r
dr r
dr r
dr r
dr r

df
1 df
— скаляр, то мы видим, что при
> 0 векторы
dr
r dr
grad u всюду продолжают соответствующие векторы r (как колючки
df
у свернувшегося ежа), а если
< 0, то векторы grad u всюду обраще(
dr
ны к началу координат.
Так как

326

ТЕОРИЯ ПОЛЯ

[Гл. X

Упражнения
1. Найдите производную от поля u = xy − z 2 в точке M(2; 1; − 3 ) по на
правлению вектора a = i + 3 k.
k
k
2. Найдите градиент поля u = 1 + 2 , где k1 , k2 = const, а r1 , r2 — расстоя
r1 r2
ния от некоторых фиксированных точек M1 , M 2 .

§ 3]

ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ И CИЛА

327

где F τ означает проекцию вектора F на τ, т.е. «тангенциальную»
проекцию вектора F. С другой стороны, если написать в декартовых
координатах х, у, z
F = Fxi + F y j + F z k,

r = xi + yj + zk,

откуда dr = dxi + dyj + dzk, и вспомнить выражение (IX.5) для скаляр
ного произведения в декартовых проекциях, получим

§ 3. Потенциальная энергия и cила
Предположим, что на тело*, произвольно перемещающееся в про
странстве, действует сила F, зависящая лишь от положения тела. Дру
гими словами, в каждой точке М пространства определен соотве
тствующий вектор силы F = F (M ), который образует, таким образом,
векторное силовое поле. При перемещении тела эта сила производит ра
боту, которая тратится на изменение кинетической энергии тела или на
преодоление сопротивления какихто внешних сил.
Легко подсчитать работу, которую производит сила F на заданном
пути тела. В самом деле, при бесконечно малом перемещении dr силу
можно считать постоянной и потому соответствующая работа равна
(см. § IX.2) скалярному произведению
Суммируя такие элементарные работы, получаем общую работу, про
изводимую силой F, когда тело проходит некоторый путь ( L),

∫ F ⋅ dr .

(6)

(L )

Такой интеграл, взятый вдоль линии ( L), называется линейным. Что
бы его вычислить, должны быть заданы не только поле F и линия ( L),
но и направление, в котором эта линия проходит; как говорят, ли
ния ( L) должна быть ориентирована. Если линия ( L) разомкнута, то
для ее ориентации можно просто указать, какая из двух граничных точек
считается ее началом, а какая — концом, т.е. указать пределы интегриро
вания. Эта ориентация существенна, так как если в том же поле ту же ли
нию проходить в противоположном направлении, то dr заменится
на –dr , в результате чего А заменится на –А, работа изменит знак.
Выражение (6) линейного интеграла можно записать в других полез
ных формах. Если вспомнить, что dr = τ ds, где τ — единичный вектор
касательной к ( L), a ds — дифференциал длины дуги, то получим
A=

∫ F ⋅ τ ds = ∫ F τ

(L )

∫ ( Fx dx + F y dy + F z dz ).

(L )

Работу силы можно выразить и как интеграл по времени; если зада
но движение тела, т.е. задана функция r (t), то и сила, действующая на
тело, оказывается сложной функцией времени
F = F (r ) = F [r ( t )] = F ( t ).

Работу силы за время dt можно выразить через скорость v, где v =

dr
;
dt

так как dr = v dt, из формулы (6) получаем


A = ∫ F ( t ) ⋅ v( t ) dt,

dA = F ⋅ dr.

A=

A=

ds,

(L )

* Подразумевается, что размеры тела очень малы; такие тела иногда называют матери
альнымии точками.



где t н и t к — моменты начала и конца движения.
Таким образом, величина F ⋅ v — скалярное произведение силы на
скорость — равна работе, отнесенной к единице времени; как известно,
она носит специальное название «мощность».
Мы рассматриваем в этом параграфе силу, зависящую только от по
ложения тела. Зависимость силы, действующей на тело, от времени яв
ляется результатом перемещения тела. В этом случае можно утверждать,
что работа А при перемещении по данному пути в действительности
не зависит от скорости тела, не зависит от вида функций v(t) и r (t),
а зависит только от траектории, по которой перемещается тело, несмот
ря на то, что v(t) в явном виде входит множителем в подынтегральное
выражение для А. Дело в том, что при изменении функции v(t) меня
ется и r (t); следовательно, меняется и вид F(t) при данном
F = F (r ) = F (x, y, z ); меняются и пределы интегрирования t н и t к , от
вечающие заданным начальной и конечной точкам пути, r (t н ) = r н ,
r (t к ) = r к .
Для целого ряда физических силовых полей F оказывается, что
если тело обходит замкнутый контур, то суммарная работа силы F при
этом равняется нулю; другими словами, если на одном участке контура
сила производит некоторую работу, то на остальной его части тело дви
жется против действия силы и возвращает накопленную энергию

326

ТЕОРИЯ ПОЛЯ

[Гл. X

Упражнения
1. Найдите производную от поля u = xy − z 2 в точке M(2; 1; − 3 ) по на
правлению вектора a = i + 3 k.
k
k
2. Найдите градиент поля u = 1 + 2 , где k1 , k2 = const, а r1 , r2 — расстоя
r1 r2
ния от некоторых фиксированных точек M1 , M 2 .

§ 3]

ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ И CИЛА

327

где F τ означает проекцию вектора F на τ, т.е. «тангенциальную»
проекцию вектора F. С другой стороны, если написать в декартовых
координатах х, у, z
F = Fxi + F y j + F z k,

r = xi + yj + zk,

откуда dr = dxi + dyj + dzk, и вспомнить выражение (IX.5) для скаляр
ного произведения в декартовых проекциях, получим

§ 3. Потенциальная энергия и cила
Предположим, что на тело*, произвольно перемещающееся в про
странстве, действует сила F, зависящая лишь от положения тела. Дру
гими словами, в каждой точке М пространства определен соотве
тствующий вектор силы F = F (M ), который образует, таким образом,
векторное силовое поле. При перемещении тела эта сила производит ра
боту, которая тратится на изменение кинетической энергии тела или на
преодоление сопротивления какихто внешних сил.
Легко подсчитать работу, которую производит сила F на заданном
пути тела. В самом деле, при бесконечно малом перемещении dr силу
можно считать постоянной и потому соответствующая работа равна
(см. § IX.2) скалярному произведению
Суммируя такие элементарные работы, получаем общую работу, про
изводимую силой F, когда тело проходит некоторый путь ( L),

∫ F ⋅ dr .

(6)

(L )

Такой интеграл, взятый вдоль линии ( L), называется линейным. Что
бы его вычислить, должны быть заданы не только поле F и линия ( L),
но и направление, в котором эта линия проходит; как говорят, ли
ния ( L) должна быть ориентирована. Если линия ( L) разомкнута, то
для ее ориентации можно просто указать, какая из двух граничных точек
считается ее началом, а какая — концом, т.е. указать пределы интегриро
вания. Эта ориентация существенна, так как если в том же поле ту же ли
нию проходить в противоположном направлении, то dr заменится
на –dr , в результате чего А заменится на –А, работа изменит знак.
Выражение (6) линейного интеграла можно записать в других полез
ных формах. Если вспомнить, что dr = τ ds, где τ — единичный вектор
касательной к ( L), a ds — дифференциал длины дуги, то получим
A=

∫ F ⋅ τ ds = ∫ F τ

(L )

∫ ( Fx dx + F y dy + F z dz ).

(L )

Работу силы можно выразить и как интеграл по времени; если зада
но движение тела, т.е. задана функция r (t), то и сила, действующая на
тело, оказывается сложной функцией времени
F = F (r ) = F [r ( t )] = F ( t ).

Работу силы за время dt можно выразить через скорость v, где v =

dr
;
dt

так как dr = v dt, из формулы (6) получаем


A = ∫ F ( t ) ⋅ v( t ) dt,

dA = F ⋅ dr.

A=

A=

ds,

(L )

* Подразумевается, что размеры тела очень малы; такие тела иногда называют матери
альнымии точками.



где t н и t к — моменты начала и конца движения.
Таким образом, величина F ⋅ v — скалярное произведение силы на
скорость — равна работе, отнесенной к единице времени; как известно,
она носит специальное название «мощность».
Мы рассматриваем в этом параграфе силу, зависящую только от по
ложения тела. Зависимость силы, действующей на тело, от времени яв
ляется результатом перемещения тела. В этом случае можно утверждать,
что работа А при перемещении по данному пути в действительности
не зависит от скорости тела, не зависит от вида функций v(t) и r (t),
а зависит только от траектории, по которой перемещается тело, несмот
ря на то, что v(t) в явном виде входит множителем в подынтегральное
выражение для А. Дело в том, что при изменении функции v(t) меня
ется и r (t); следовательно, меняется и вид F(t) при данном
F = F (r ) = F (x, y, z ); меняются и пределы интегрирования t н и t к , от
вечающие заданным начальной и конечной точкам пути, r (t н ) = r н ,
r (t к ) = r к .
Для целого ряда физических силовых полей F оказывается, что
если тело обходит замкнутый контур, то суммарная работа силы F при
этом равняется нулю; другими словами, если на одном участке контура
сила производит некоторую работу, то на остальной его части тело дви
жется против действия силы и возвращает накопленную энергию

328

ТЕОРИЯ ПОЛЯ

[Гл. X

полю. Так ведут себя гравитационное поле (поле тяготения), электро(
статическое и многие другие поля. Математически это означает, что

∫ F ⋅ dr = 0

(7)

(L )

для любой замкнутой линии ( L), где под



понимается линейный ин(

теграл по замкнутому контуру. Такой интеграл называется еще цирку
ляцией; итак, мы предполагаем, что циркуляция силы F по любому
замкнутому контуру равна нулю.
Предположение (7) можно равносильным образом сформулиро(
вать так: работа (6) силы F по любому разомкнутому контуру ( L) за(
висит только от положения начала и конца этой линии, но не зависит от
вида самой линии. В самом деле, пусть условие (7) выполнено, а линии
( L1 ) и ( L2 ) имеют общие начало М и конец N, и пусть работа силы
F вдоль ( L1 ) равна A1 , а вдоль ( L2 ) равна A2 . Образуем замкнутый
контур, пройдя от М к N по ( L1 ), а затем от N к М по ( L2 ). Тогда
в силу сказанного выше работа силы F по такому контуру равна
A1 − A2 . С другой стороны, в силу условия (7) получаем A1 − A2 = 0, от(
куда A1 = A2 . Мы предоставляем читателю доказать аналогичным об(
разом, что, обратно, из последнего равенства вытекает условие (7).
В предположении (7) можно ввести понятие потенциальной энер(
гии тела, т.е. энергии, зависящей от положения тела (это понятие для
одномерного движения было подробно рассмотрено в ВМ, гл. VI).
Именно, значение потенциальной энергии U в любой точке M, по
определению, равно работе, которую совершает сила F, когда тело пе(
ремещается из точки M в некоторую фиксированную точку M 0 .
(В конкретных задачах точка M 0 часто выбирается на бесконечности,
так что речь идет о работе, совершаемой, когда тело удаляется на беско(
нечность; для этого указанная работа должна быть конечной и не зави(
сеть от способа такогоудаления.) Другими словами,
U( M ) =

∫ F ⋅ dr .

§ 3]

ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ И CИЛА

При определении потенциальной энергии имеется некоторый про(
извол в выборе точки M 0 , т.е. точки, в которой потенциальная энергия
полагается равной нулю. Посмотрим, что получится, если заменить M 0
~ . Так как работа U~(M ), совершае(
на какую(нибудь другую точку M
0
~
мая при перемещении из M в M 0 , равна работе U(M), совершаемой
при перемещении из M в M 0 , плюс работа, совершаемая при переме(
~ , то U~(M ) отличается от U(M) на постоянное
щении из M 0 в M
0
слагаемое. Итак, потенциальная энергия определена с точностью до по(
стоянного слагаемого. Однако этот произвол не сказывается на разности
значений потенциальной энергии в двух точках, т.е. он пропадает при под(
счете работы, совершаемой при перемещении из одной точки в другую.
Мы доказали существование потенциальной энергии в силовом
поле, т.е. потенциальность этого поля, исходя из условия (7) равенства
нулю работы по любому замкнутому контуру. Легко проверить, что
и обратно, если потенциальная энергия существует, то при подсчете ра(
боты, совершаемой полем при перемещении тела из точки M в точку
N , существенно только положение этих точек, но сам путь, по которому
перемещается тело, роли не играет, так как эта работа равна
U (M ) − U (N ). А мы видели, что это равносильно условию (7).
Формула (8) определяет потенциальную энергию, если задано си(
ловое поле. Получим обратную формулу, выражающую поле через по(
тенциальную энергию. Допустим, что тело совершило бесконечно
малое перемещение dr = dxi + dyj + dzk. Тогда сила F = Fx i + F y j +
+F z k совершит элементарную работу
dA = F ⋅ dr = Fx dx + F y dy + F z dz.

С другой стороны, эта работа равна
⎛ ∂U
∂U
∂U ⎞
dA = − dU = − ⎜
dx +
dy +
dz⎟ .
⎝ ∂x
∂y
∂z ⎠

Сравнивая обе формулы, находим

(8)
Fx = −

MM 0

При этом выбор конкретного пути, ведущего из M в M 0 , несущес(
твенен.
С помощью потенциальной энергии легко выразить работу, совер(
шаемую силой F, когда тело перемещается из любой точки M 1 в лю(
бую другую точку M 2 . Именно, если при таком перемещении пройти
через M 0 (что возможно, так как выбор пути не сказывается на рабо(
те) и рассмотреть работу на этапах от M 1 до M 0 и от M 0 до M 2 , то
мы получаем, что рассматриваемая работа равна U (M 1 ) − U (M 2 ). Итак,
работа, совершаемая полем, равна уменьшению потенциальной энер(
гии тела.

329

∂U
,
∂x

Fy = −

∂U
,
∂y

Fz = −

∂U
,
∂z

откуда
F = F xi + F y j + F z k = −

∂U
∂U
∂U
i−
j−
k = − grad U
∂x
∂y
∂z

(9)

(см. § 2).
Пусть частица массы m движется под действием заданного поля
сил F = −gradU. Тогда согласно § IX.4 приращение кинетической энер(
гии равно

328

ТЕОРИЯ ПОЛЯ

[Гл. X

полю. Так ведут себя гравитационное поле (поле тяготения), электро(
статическое и многие другие поля. Математически это означает, что

∫ F ⋅ dr = 0

(7)

(L )

для любой замкнутой линии ( L), где под



понимается линейный ин(

теграл по замкнутому контуру. Такой интеграл называется еще цирку
ляцией; итак, мы предполагаем, что циркуляция силы F по любому
замкнутому контуру равна нулю.
Предположение (7) можно равносильным образом сформулиро(
вать так: работа (6) силы F по любому разомкнутому контуру ( L) за(
висит только от положения начала и конца этой линии, но не зависит от
вида самой линии. В самом деле, пусть условие (7) выполнено, а линии
( L1 ) и ( L2 ) имеют общие начало М и конец N, и пусть работа силы
F вдоль ( L1 ) равна A1 , а вдоль ( L2 ) равна A2 . Образуем замкнутый
контур, пройдя от М к N по ( L1 ), а затем от N к М по ( L2 ). Тогда
в силу сказанного выше работа силы F по такому контуру равна
A1 − A2 . С другой стороны, в силу условия (7) получаем A1 − A2 = 0, от(
куда A1 = A2 . Мы предоставляем читателю доказать аналогичным об(
разом, что, обратно, из последнего равенства вытекает условие (7).
В предположении (7) можно ввести понятие потенциальной энер(
гии тела, т.е. энергии, зависящей от положения тела (это понятие для
одномерного движения было подробно рассмотрено в ВМ, гл. VI).
Именно, значение потенциальной энергии U в любой точке M, по
определению, равно работе, которую совершает сила F, когда тело пе(
ремещается из точки M в некоторую фиксированную точку M 0 .
(В конкретных задачах точка M 0 часто выбирается на бесконечности,
так что речь идет о работе, совершаемой, когда тело удаляется на беско(
нечность; для этого указанная работа должна быть конечной и не зави(
сеть от способа такого удаления.) Другими словами,
U( M ) =

∫ F ⋅ dr .

§ 3]

ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ И CИЛА

При определении потенциальной энергии имеется некоторый про(
извол в выборе точки M 0 , т.е. точки, в которой потенциальная энергия
полагается равной нулю. Посмотрим, что получится, если заменить M 0
~ . Так как работа U~(M ), совершае(
на какую(нибудь другую точку M
0
~
мая при перемещении из M в M 0 , равна работе U(M), совершаемой
при перемещении из M в M 0 , плюс работа, совершаемая при переме(
~ , то U~(M ) отличается от U(M) на постоянное
щении из M 0 в M
0
слагаемое. Итак, потенциальная энергия определена с точностью до по(
стоянного слагаемого. Однако этот произвол не сказывается на разности
значений потенциальной энергии в двух точках, т.е. он пропадает при под(
счете работы, совершаемой при перемещении из одной точки в другую.
Мы доказали существование потенциальной энергии в силовом
поле, т.е. потенциальность этого поля, исходя из условия (7) равенства
нулю работы по любому замкнутому контуру. Легко проверить, что
и обратно, если потенциальная энергия существует, то при подсчете ра(
боты, совершаемой полем при перемещении тела из точки M в точку
N , существенно только положение этих точек, но сам путь, по которому
перемещается тело, роли не играет, так как эта работа равна
U (M ) − U (N ). А мы видели, что это равносильно условию (7).
Формула (8) определяет потенциальную энергию, если задано си(
ловое поле. Получим обратную формулу, выражающую поле через по(
тенциальную энергию. Допустим, что тело совершило бесконечно
малое перемещение dr = dxi + dyj + dzk. Тогда сила F = Fx i + F y j +
+F z k совершит элементарную работу
dA = F ⋅ dr = Fx dx + F y dy + F z dz.

С другой стороны, эта работа равна
⎛ ∂U
∂U
∂U ⎞
dA = − dU = − ⎜
dx +
dy +
dz⎟ .
⎝ ∂x
∂y
∂z ⎠

Сравнивая обе формулы, находим

(8)
Fx = −

MM 0

При этом выбор конкретного пути, ведущего из M в M 0 , несущес(
твенен.
С помощью потенциальной энергии легко выразить работу, совер(
шаемую силой F, когда тело перемещается из любой точки M 1 в лю(
бую другую точку M 2 . Именно, если при таком перемещении пройти
через M 0 (что возможно, так как выбор пути не сказывается на рабо(
те) и рассмотреть работу на этапах от M 1 до M 0 и от M 0 до M 2 , то
мы получаем, что рассматриваемая работа равна U (M 1 ) − U (M 2 ). Итак,
работа, совершаемая полем, равна уменьшению потенциальной энер(
гии тела.

329

∂U
,
∂x

Fy = −

∂U
,
∂y

Fz = −

∂U
,
∂z

откуда
F = F xi + F y j + F z k = −

∂U
∂U
∂U
i−
j−
k = − grad U
∂x
∂y
∂z

(9)

(см. § 2).
Пусть частица массы m движется под действием заданного поля
сил F = −gradU. Тогда согласно § IX.4 приращение кинетической энер(
гии равно

330

ТЕОРИЯ ПОЛЯ
s

[Гл. X

s

ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ И CИЛА

1

Значит,
mv 22
mv 2
+ U 2 = 1 + U1 ,
2
2

т.е. величина полной энергии частицы

dr = dxi + dyj + dzk

mv 2
E=
+U
2

и

в процессе движения остается постоянной. Как видим, полная энергия
представляет собой сумму кинетической и потенциальной энергий.
(Для одномерного движения аналогичное рассмотрение приведено
в ВМ, § VI.8.)
Рассмотрим в качестве примера притяжение по закону Ньютона, т.е.
случай, когда на тело действует сила, направленная к некоторой фик(
сированной точке О (за которую мы примем начало координат) и об(
ратно пропорциональная квадрату расстояния от этой точки. Так как
r
вектор − направлен к началу координат и имеет единичную длину,
r
то рассматриваемое силовое поле имеет вид
F =−

k r
r
= −k 3 ,
2
r
r r

(10)

где k — коэффициент пропорциональности. В силу центральной сим(
метрии силы легко убедиться*, что и потенциальная энергия имеет вид
U = f (r). Но тогда в силу формул (9) и (5) получаем
F = − grad U = −

df r
.
dr r

Сравнивая эту формулу с (10), получаем
df k
= ,
dr r 2

откуда U = f ( r ) = −

331

Иногда возникает задача о построении векторных линий силового
поля F или, как говорят короче, силовых линий поля F. Так называют(
ся линии, идущие в каждой своей точке вдоль поля, т.е. касающиеся в
каждой своей точке вектора поля F. Задача о построении таких линий
легко сводится к задаче об интегрировании системы дифференциаль(
ных уравнений: надо ввести в пространстве декартовы координаты
х, у, z, после чего записать условие параллельности векторов

2
2
mv 22 mv12
dU
ds = U1 − U 2 .

= ∫ F τ ds = − ∫
2
2
ds
s
s
1

§ 3]

k
r

(11)

с точностью до произвольного постоянного слагаемого. Таким образом,
ньютоново силовое поле потенциально, и его потенциал определяется
по формуле (11). Эта формула дает потенциал, нормированный (нор
мировкой называется выбор из равноправных объектов какого(то одно(
го) условием обращения в нуль на бесконечности.

F = Fx ( x, y, z )i + F y ( x, y, z ) j + F z ( x, y, z )k

(см. конец § IX. 1):
dx
dy
dz
.
=
=
Fx ( x, y, z ) F y ( x, y, z ) F z ( x, y, z )

(12)

Здесь мы пользуемся тем, что вектор dr идет как раз по касательной
к линии (см. § IX. 4). Уравнения (12) образуют систему дифференци(
альных уравнений векторных линий поля F, записанную в «симмет(
ричной форме», в которой все три координаты выступают как
dy
dz
и
и перейти к системе
равноправные. Отсюда легко выразить
dx
dx
из двух дифференциальных уравнений относительно y(x) и z (x), за(
писанной в обычной форме (§ VIII. 2).
Как ясно из геометрического смысла (и подробно разбиралось в тео(
рии дифференциальных уравнений), через каждую точку проходит
ровно одна силовая линия; таким образом, все пространство (или часть
его, в которой задано силовое поле) заполняется силовыми линиями.
Для ньютонова поля силовые линии суть лучи, выходящие из цен(
тра притяжения, т.е. из точки О. Они не пересекаются нигде, кроме са(
мой точки О, которая является особой точкой системы дифференци(
альных уравнений (ср. конец § 2).
В § 2 мы видели, что в каждой точке вектор gradU нормален к повер(
хности U = const, проходящей через эту точку. Поэтому из формулы (9)
следует, что силовые линии в каждой своей точке нормальны к эквипо(
тенциальным поверхностям. Это, впрочем, ясно и из того, что наибольшая
работа на единицу длины пройденного пути производится, если тело пе(
ремещается нормально к поверхностям равного потенциала, а с другой
стороны, так будет, если тело перемещается вдоль силовых линий.
Упражнение

* Рассмотрите перемещение тела по сфере с центром в точке О, когда r = const. Ра(
бота силы при таком перемещении равна нулю.

Пусть плоское силовое поле имеет потенциал U = αxy ( α = const). Найди(
те само поле и его силовые линии.

330

ТЕОРИЯ ПОЛЯ
s

[Гл. X

s

ПОТЕНЦИАЛЬНАЯ ЭНЕРГИЯ И CИЛА

1

Значит,
mv 22
mv 2
+ U 2 = 1 + U1 ,
2
2

т.е. величина полной энергии частицы

dr = dxi + dyj + dzk

mv 2
E=
+U
2

и

в процессе движения остается постоянной. Как видим, полная энергия
представляет собой сумму кинетической и потенциальной энергий.
(Для одномерного движения аналогичное рассмотрение приведено
в ВМ, § VI.8.)
Рассмотрим в качестве примера притяжение по закону Ньютона, т.е.
случай, когда на тело действует сила, направленная к некоторой фик(
сированной точке О (за которую мы примем начало координат) и об(
ратно пропорциональная квадрату расстояния от этой точки. Так как
r
вектор − направлен к началу координат и имеет единичную длину,
r
то рассматриваемое силовое поле имеет вид
F =−

k r
r
= −k 3 ,
2
r
r r

(10)

где k — коэффициент пропорциональности. В силу центральной сим(
метрии силы легко убедиться*, что и потенциальная энергия имеет вид
U = f (r). Но тогда в силу формул (9) и (5) получаем
F = − grad U = −

df r
.
dr r

Сравнивая эту формулу с (10), получаем
df k
= ,
dr r 2

откуда U = f ( r ) = −

331

Иногда возникает задача о построении векторных линий силового
поля F или, как говорят короче, силовых линий поля F. Так называют(
ся линии, идущие в каждой своей точке вдоль поля, т.е. касающиеся в
каждой своей точке вектора поля F. Задача о построении таких линий
легко сводится к задаче об интегрировании системы дифференциаль(
ных уравнений: надо ввести в пространстве декартовы координаты
х, у, z, после чего записать условие параллельности векторов

2
2
mv 22 mv12
dU
ds = U1 − U 2 .

= ∫ F τ ds = − ∫
2
2
ds
s
s
1

§ 3]

k
r

(11)

с точностью до произвольного постоянного слагаемого. Таким образом,
ньютоново силовое поле потенциально, и его потенциал определяется
по формуле (11). Эта формула дает потенциал, нормированный (нор
мировкой называется выбор из равноправных объектов какого(то одно(
го) условием обращения в нуль на бесконечности.

F = Fx ( x, y, z )i + F y ( x, y, z ) j + F z ( x, y, z )k

(см. конец § IX. 1):
dx
dy
dz
.
=
=
Fx ( x, y, z ) F y ( x, y, z ) F z ( x, y, z )

(12)

Здесь мы пользуемся тем, что вектор dr идет как раз по касательной
к линии (см. § IX. 4). Уравнения (12) образуют систему дифференци(
альных уравнений векторных линий поля F, записанную в «симмет(
ричной форме», в которой все три координаты выступают как
dy
dz
и
и перейти к системе
равноправные. Отсюда легко выразить
dx
dx
из двух дифференциальных уравнений относительно y(x) и z (x), за(
писанной в обычной форме (§ VIII. 2).
Как ясно из геометрического смысла (и подробно разбиралось в тео(
рии дифференциальных уравнений), через каждую точку проходит
ровно одна силовая линия; таким образом, все пространство (или часть
его, в которой задано силовое поле) заполняется силовыми линиями.
Для ньютонова поля силовые линии суть лучи, выходящие из цен(
тра притяжения, т.е. из точки О. Они не пересекаются нигде, кроме са(
мой точки О, которая является особой точкой системы дифференци(
альных уравнений (ср. конец § 2).
В § 2 мы видели, что в каждой точке вектор gradU нормален к повер(
хности U = const, проходящей через эту точку. Поэтому из формулы (9)
следует, что силовые линии в каждой своей точке нормальны к эквипо(
тенциальным поверхностям. Это, впрочем, ясно и из того, что наибольшая
работа на единицу длины пройденного пути производится, если тело пе(
ремещается нормально к поверхностям равного потенциала, а с другой
стороны, так будет, если тело перемещается вдоль силовых линий.
Упражнение

* Рассмотрите перемещение тела по сфере с центром в точке О, когда r = const. Ра(
бота силы при таком перемещении равна нулю.

Пусть плоское силовое поле имеет потенциал U = αxy ( α = const). Найди(
те само поле и его силовые линии.

332

ТЕОРИЯ ПОЛЯ

[Гл. X

§ 4. Поле скорости и поток
Пусть рассматривается стационарное течение газа или жидкости.
В любой точке М скорость частицы газа имеет вполне определенное
значение v = v(M ), т.е. мы имеем векторное поле скорости.
Рассмотрим траекторию ( L) какой(либо частицы или, как говорят,
линию тока. Хорошо известно (см., например, § IX.4), что в каждой точ(
ке ( L) вектор скорости v касателен к ( L). Значит, для поля скорости
векторными линиями (§ 3) служат линии тока. Дифференциальные
уравнения для них, аналогичные (12), легко получить непосредствен(
но, если из равенств
dx
= vx ,
dt

dy
= v y,
dt

dz
= vz
dt

§ 4]

ПОЛЕ СКОРОСТИ И ПОТОК

333

v n dσ. Суммируя эти объемы для всех элементов, получим, что через
всю поверхность (σ) за единицу времени проходит объем
Q=

∫ v n dσ

(13)

( σ)

изнутри наружу. Такой интеграл от нормальной проекции называется
потоком вектора v через поверхность (σ)*.
В гидродинамике наряду с полем скорости v часто пользуются по(
лем «массовой скорости» ρv, где ρ — плотность газа в данной точке.
Рассуждая в точности, как выше, легко доказать, что поток

∫ ρv n dσ

( σ)

выразить dt и приравнять полученные результаты.
Перейдем теперь к очень важному для дальнейшего понятию пото(
ка вектора через поверхность. Допустим, что в пространстве мыслен(
но выбрана некоторая замкнутая или незамкнутая «ориентирован(
ная» поверхность (σ). Поверхность называется ориентированной,
если указано, какая ее сторона считается наружной, а какая внутрен(
ней. Такую ориентацию можно осуществить двумя способами
(рис. 118).

Рис. 118.

Рис. 119.

Подсчитаем объем газа, проносимого через (σ) за единицу времени
изнутри наружу. Найдем сначала объем, проносимый за малое время dt
через элемент поверхности (dσ) (рис. 119). Это объем косого цилин(
дрика с основанием dσ и образующей v dt. Высота цилиндрика равна
проекции образующей на перпендикуляр к основанию, т.е. равна v n dt,
где v n — проекция вектора скорости v на единичный вектор n
внешней (т.е. направленной во внешнюю сторону) нормали к повер(
хности. Таким образом, объем цилиндрика равен v n dt dσ.
Если за время dt через элемент поверхности (dσ) проходит объем
v n dt dσ, то за единицу времени через тот же элемент пройдет объем

этого вектора через любую ориентированную поверхность (σ) равен
массе (а не объему, как раньше!) газа, проносимого за единицу времени
через (σ) изнутри наружу.
Поток, очевидно, есть величина скалярная. Он существенно зави(
сит от ориентации поверхности (σ): если изменить эту ориентацию на
противоположную, то в формуле (13) v n , a с ней и Q поменяют знак.
(Впрочем, это ясно и из указанного нами смысла интеграла (13).) Если
поверхность (σ) расположена так, что линии тока пересекают ее всю(
ду изнутри наружу, то Q > 0, а еели всюду снаружи внутрь, то Q < 0;
если же линии тока частично пересекают (σ) изнутри наружу, а час(
тично снаружи внутрь, то поток равен сумме положительной и отрица(
тельной величин (каких?) и может оказаться положительным,
отрицательным или равным нулю. Всегда равен нулю поток вектора
скорости через поверхность, целиком заполненную линиями тока (т.е.
через каждую точку которой проходит линия тока, целиком лежащая
на этой поверхности)**.
Поток (13) иногда записывают в другой фор(
ме. Если дана ориентированная плоская пло(
щадка (σ), то ей принято ставить в соответ(
ствие вектор a, направленный перпендику(
лярно (σ) от внутренней стороны к наружной
(рис. 120), причем модуль этого вектора берется
равным площади (σ). Так поступают в случае,
Рис. 120.
если существенны только площадь (σ) и ее на(
правление в пространстве, но конкретная форма (σ) (т.е. будет ли это
круг, или прямоугольник и т.д.) не играет роли. При таком обозначении
* Интеграл (13) — это частный случай интеграла по поверхности, о котором мы гово(
рили в § IV.7.
** Говоря наглядно, это — поверхность, вдоль которой скользит газ при своем движении.

332

ТЕОРИЯ ПОЛЯ

[Гл. X

§ 4. Поле скорости и поток
Пусть рассматривается стационарное течение газа или жидкости.
В любой точке М скорость частицы газа имеет вполне определенное
значение v = v(M ), т.е. мы имеем векторное поле скорости.
Рассмотрим траекторию ( L) какой(либо частицы или, как говорят,
линию тока. Хорошо известно (см., например, § IX.4), что в каждой точ(
ке ( L) вектор скорости v касателен к ( L). Значит, для поля скорости
векторными линиями (§ 3) служат линии тока. Дифференциальные
уравнения для них, аналогичные (12), легко получить непосредствен(
но, если из равенств
dx
= vx ,
dt

dy
= v y,
dt

dz
= vz
dt

§ 4]

ПОЛЕ СКОРОСТИ И ПОТОК

333

v n dσ. Суммируя эти объемы для всех элементов, получим, что через
всю поверхность (σ) за единицу времени проходит объем
Q=

∫ v n dσ

(13)

( σ)

изнутри наружу. Такой интеграл от нормальной проекции называется
потоком вектора v через поверхность (σ)*.
В гидродинамике наряду с полем скорости v часто пользуются по(
лем «массовой скорости» ρv, где ρ — плотность газа в данной точке.
Рассуждая в точности, как выше, легко доказать, что поток

∫ ρv n dσ

( σ)

выразить dt и приравнять полученные результаты.
Перейдем теперь к очень важному для дальнейшего понятию пото(
ка вектора через поверхность. Допустим, что в пространстве мыслен(
но выбрана некоторая замкнутая или незамкнутая «ориентирован(
ная» поверхность (σ). Поверхность называется ориентированной,
если указано, какая ее сторона считается наружной, а какая внутрен(
ней. Такую ориентацию можно осуществить двумя способами
(рис. 118).

Рис. 118.

Рис. 119.

Подсчитаем объем газа, проносимого через (σ) за единицу времени
изнутри наружу. Найдем сначала объем, проносимый за малое время dt
через элемент поверхности (dσ) (рис. 119). Это объем косого цилин(
дрика с основанием dσ и образующей v dt. Высота цилиндрика равна
проекции образующей на перпендикуляр к основанию, т.е. равна v n dt,
где v n — проекция вектора скорости v на единичный вектор n
внешней (т.е. направленной во внешнюю сторону) нормали к повер(
хности. Таким образом, объем цилиндрика равен v n dt dσ.
Если за время dt через элемент поверхности (dσ) проходит объем
v n dt dσ, то за единицу времени через тот же элемент пройдет объем

этого вектора через любую ориентированную поверхность (σ) равен
массе (а не объему, как раньше!) газа, проносимого за единицу времени
через (σ) изнутри наружу.
Поток, очевидно, есть величина скалярная. Он существенно зави(
сит от ориентации поверхности (σ): если изменить эту ориентацию на
противоположную, то в формуле (13) v n , a с ней и Q поменяют знак.
(Впрочем, это ясно и из указанного нами смысла интеграла (13).) Если
поверхность (σ) расположена так, что линии тока пересекают ее всю(
ду изнутри наружу, то Q > 0, а еели всюду снаружи внутрь, то Q < 0;
если же линии тока частично пересекают (σ) изнутри наружу, а час(
тично снаружи внутрь, то поток равен сумме положительной и отрица(
тельной величин (каких?) и может оказаться положительным,
отрицательным или равным нулю. Всегда равен нулю поток вектора
скорости через поверхность, целиком заполненную линиями тока (т.е.
через каждую точку которой проходит линия тока, целиком лежащая
на этой поверхности)**.
Поток (13) иногда записывают в другой фор(
ме. Если дана ориентированная плоская пло(
щадка (σ), то ей принято ставить в соответ(
ствие вектор a, направленный перпендику(
лярно (σ) от внутренней стороны к наружной
(рис. 120), причем модуль этого вектора берется
равным площади (σ). Так поступают в случае,
Рис. 120.
если существенны только площадь (σ) и ее на(
правление в пространстве, но конкретная форма (σ) (т.е. будет ли это
круг, или прямоугольник и т.д.) не играет роли. При таком обозначении
* Интеграл (13) — это частный случай интеграла по поверхности, о котором мы гово(
рили в § IV.7.
** Говоря наглядно, это — поверхность, вдоль которой скользит газ при своем движении.

334

ТЕОРИЯ ПОЛЯ

[Гл. X

вектор dσ пойдет по n (см. рис. 119) и можно написать v n dσ =
= v ⋅ dσ (см. формулу (IX.3)). Таким образом,
Q=

∫ v n dσ = ∫ v ⋅ dσ.

( σ)

(14)

( σ)

Поток вектора v через поверхность (σ) иначе называется коли(
чеством векторных линий (т.е. линий тока), пересекающих (σ) изнут(
ри наружу. Это название условное, так как указанное количество имеет
размерность и, как правило, получается дробным, но из(за своей на(
глядности широко применяется. Надо иметь в виду, что это «количес(
тво» понимается в алгебраическом смысле, так что если часть (σ)
пересекается линиями изнутри наружу, а другая часть — снаружи
внутрь, то оно может быть любого знака (и даже равным нулю) в зави(
симости от того, какую часть пересекает больше линий.
Приведем простые примеры подсчета потока. Пусть сначала
поле v постоянное (однородное, одинаковое во всех точках), а повер(
хность (σ) плоская. Тогда из формулы (14) вытекает, что
Q = v n σ = v ⋅ a.

(15)

Пусть поле v пропорционально радиусу(вектору r , т.е. v=kr (k —
коэффициент пропорциональности), а (σ) — сфера с центром в начале
координат, ориентированная естественным образом (к началу коорди(
нат обращена ее внутренняя сторона). Тогда v n = v r = kr, и так как
r = const на (σ), то

( σ)

Рассмотрим, наконец, общее центрально(симметричное поле в про(
странстве, определенное формулой
v = f(r ) r

0

⎛ 0 r⎞
⎜r = ⎟ ,

r⎠

(16)

где r — радиус(вектор текущей точки, а r — его длина, так что r 0 —
это единичный вектор, идущий по радиусу(вектору и указывающий на(
правление поля. Тогда поток поля через сферу радиуса r с центром
в начале координат равен
Q = Q ( r ) = ∫ v n dσ = ∫ f ( r ) dσ = f ( r ) 4 πr 2 .

ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ, ЕГО ПОТЕНЦИАЛ И ПОТОК

(17)

Из формулы (15) вытекает интересное следствие. Рассмотрим неко(
торый замкнутый многогранник (рис. 121); ориентируем его грани так,
чтобы одна из граней (на рис. 121 (σ)) была «замыкающей» для сово(
купности остальных граней. Тогда ясно, что если этот многогранник

335

мысленно помещен в однородное поле скорости
v, то поток через (σ) равен алгебраической сум(
ме потоков через остальные грани: Q =
= Q 1 + Q 2 + Q 3 . Отсюда
v ⋅ a = v ⋅ a1 + v ⋅ a 2 + v ⋅ a 3 = v ⋅ ( a1 + a 2 + a 3 ),

и в силу произвольности v

Рис. 121.

a = a1 + a 2 + a 3 .

(18)

Итак, вектор замыкающей площадки равен сумме векторов «составля(
ющих» площадок, т.е. площадки можно складывать, как векторы. Мы
существенно пользовались тем, что площадки изображаются вектора(
ми именно так, как показано на рис. 120, что и является одним из важ(
ных доводов в пользу разумности такого изображения.
К этому вопросу возможен иной подход. Ориентируем все грани
многогранника рис. 121 «естественным» образом, так, чтобы векторы
a i и a смотрели наружу. Тогда в формулу (18) вместо a i надо подста(
вить –a i и, перенеся все слагаемые в левую часть, получим
a 1 + a 2 + a 3 + a = 0. Это соотношение вполне аналогично хорошо извес(
тному из векторной алгебры правилу о равенстве нулю суммы векторов,
образующих замкнутый многоугольник (см. § IX.1). Этим также под(
тверждается закономерность изображения площадок векторами.
В пределе из многоугольника можно получить любую замкнутую
линию ( L), а из многогранника — любую замкнутую поверхность (σ);
таким образом, мы приходим к равенствам ∫ dr = 0, ∫ da = 0 (первое
( L)

Q = ∫ kr dσ = kr ∫ dσ = krσ = 4 πkr 3 .
( σ)

§ 5]

( σ)

очевидно), где кружок у знака интеграла (его выписывать необяза(
тельно) подчеркивает, что интеграл берется по замкнутой линии или
поверхности.
Упражнение
Рассмотрите общее осесимметричное поле в пространстве, определенное

ρ ⎞
формулой v = f ( ρ , z ) ρ 0 ⎜ρ 0 = ⎟ , где ρ — вектор, идущий из точки (0; 0; z)
ρ ⎠

в точку (х; у; z). Чему равен поток этого поля через поверхность прямого круго(
вого цилиндра радиуса ρ с осью z? Чему равен этот поток в частном случае
плоскопараллельного поля?

§ 5. Электростатическое поле, его потенциал и поток
Хорошо известно, что заряд, помещенный в пространство, порождает
электрическое поле, которое можно проанализировать на основе зако(
на Кулона. Мы будем для простоты считать пространство пустым (ва(
куум) и рассмотрим сначала поле от заряда q, помещенного в начале

334

ТЕОРИЯ ПОЛЯ

[Гл. X

вектор dσ пойдет по n (см. рис. 119) и можно написать v n dσ =
= v ⋅ dσ (см. формулу (IX.3)). Таким образом,
Q=

∫ v n dσ = ∫ v ⋅ dσ.

( σ)

(14)

( σ)

Поток вектора v через поверхность (σ) иначе называется коли(
чеством векторных линий (т.е. линий тока), пересекающих (σ) изнут(
ри наружу. Это название условное, так как указанное количество имеет
размерность и, как правило, получается дробным, но из(за своей на(
глядности широко применяется. Надо иметь в виду, что это «количес(
тво» понимается в алгебраическом смысле, так что если часть (σ)
пересекается линиями изнутри наружу, а другая часть — снаружи
внутрь, то оно может быть любого знака (и даже равным нулю) в зави(
симости от того, какую часть пересекает больше линий.
Приведем простые примеры подсчета потока. Пусть сначала
поле v постоянное (однородное, одинаковое во всех точках), а повер(
хность (σ) плоская. Тогда из формулы (14) вытекает, что
Q = v n σ = v ⋅ a.

(15)

Пусть поле v пропорционально радиусу(вектору r , т.е. v=kr (k —
коэффициент пропорциональности), а (σ) — сфера с центром в начале
координат, ориентированная естественным образом (к началу коорди(
нат обращена ее внутренняя сторона). Тогда v n = v r = kr, и так как
r = const на (σ), то

( σ)

Рассмотрим, наконец, общее центрально(симметричное поле в про(
странстве, определенное формулой
v = f(r ) r

0

⎛ 0 r⎞
⎜r = ⎟ ,

r⎠

(16)

где r — радиус(вектор текущей точки, а r — его длина, так что r 0 —
это единичный вектор, идущий по радиусу(вектору и указывающий на(
правление поля. Тогда поток поля через сферу радиуса r с центром
в начале координат равен
Q = Q ( r ) = ∫ v n dσ = ∫ f ( r ) dσ = f ( r ) 4 πr 2 .

ЭЛЕКТРОСТАТИЧЕСКОЕ ПОЛЕ, ЕГО ПОТЕНЦИАЛ И ПОТОК

(17)

Из формулы (15) вытекает интересное следствие. Рассмотрим неко(
торый замкнутый многогранник (рис. 121); ориентируем его грани так,
чтобы одна из граней (на рис. 121 (σ)) была «замыкающей» для сово(
купности остальных граней. Тогда ясно, что если этот многогранник

335

мысленно помещен в однородное поле скорости
v, то поток через (σ) равен алгебраической сум(
ме потоков через остальные грани: Q =
= Q 1 + Q 2 + Q 3 . Отсюда
v ⋅ a = v ⋅ a1 + v ⋅ a 2 + v ⋅ a 3 = v ⋅ ( a1 + a 2 + a 3 ),

и в силу произвольности v

Рис. 121.

a = a1 + a 2 + a 3 .

(18)

Итак, вектор замыкающей площадки равен сумме векторов «составля(
ющих» площадок, т.е. площадки можно складывать, как векторы. Мы
существенно пользовались тем, что площадки изображаются вектора(
ми именно так, как показано на рис. 120, что и является одним из важ(
ных доводов в пользу разумности такого изображения.
К этому вопросу возможен иной подход. Ориентируем все грани
многогранника рис. 121 «естественным» образом, так, чтобы векторы
a i и a смотрели наружу. Тогда в формулу (18) вместо a i надо подста(
вить –a i и, перенеся все слагаемые в левую часть, получим
a 1 + a 2 + a 3 + a = 0. Это соотношение вполне аналогично хорошо извес(
тному из векторной алгебры правилу о равенстве нулю суммы векторов,
образующих замкнутый многоугольник (см. § IX.1). Этим также под(
тверждается закономерность изображения площадок векторами.
В пределе из многоугольника можно получить любую замкнутую
линию ( L), а из многогранника — любую замкнутую поверхность (σ);
таким образом, мы приходим к равенствам ∫ dr = 0, ∫ da = 0 (первое
( L)

Q = ∫ kr dσ = kr ∫ dσ = krσ = 4 πkr 3 .
( σ)

§ 5]

( σ)

очевидно), где кружок у знака интеграла (его выписывать необяза(
тельно) подчеркивает, что интеграл берется по замкнутой линии или
поверхности.
Упражнение
Рассмотрите общее осесимметричное поле в пространстве, определенное

ρ ⎞
формулой v = f ( ρ , z ) ρ 0 ⎜ρ 0 = ⎟ , где ρ — вектор, идущий из точки (0; 0; z)
ρ ⎠

в точку (х; у; z). Чему равен поток этого поля через поверхность прямого круго(
вого цилиндра радиуса ρ с осью z? Чему равен этот поток в частном случае
плоскопараллельного поля?

§ 5. Электростатическое поле, его потенциал и поток
Хорошо известно, что заряд, помещенный в пространство, порождает
электрическое поле, которое можно проанализировать на основе зако(
на Кулона. Мы будем для простоты считать пространство пустым (ва(
куум) и рассмотрим сначала поле от заряда q, помещенного в начале

336

ТЕОРИЯ ПОЛЯ

[Гл. X

координат О. Для исследования поля можно в произвольную точку M
поместить пробный единичный заряд и посмотреть, с какой силой поле
на него действует; эта сила E называется напряженностью электри'
ческого поля. Так как в разных точках M напряженность E различ'
ная, то мы имеем векторное поле E = E (M ), представляющее собой, по
существу, частный случай рассмотренного в § 3 силового поля (если
все время иметь в виду, что речь идет о воздействии на пробный еди'
ничный заряд). Закон Кулона по математической формулировке ана'
логичен закону Ньютона, рассмотренному в § 3. Для точечного заряда
q он имеет вид
E=

kq 0 kq
r = 3r
r2
r

⎛ 0 r

⎜ r = — единич ный вектор, идущий вдоль радиуса − вектора ⎟ ; эта


r
формула несколько отличается от (10), так как сила должна быть прямо
пропорциональна q и, кроме того, при q > 0 пробный единичный по'
ложительный заряд не притягивается, а отталкивается. Коэффици'
ент k в последней формуле зависит от выбранной системы единиц,
и мы для простоты положим его равным единице*, т.е. будем писать
E=

q 0 q
r = 3 r.
r2
r

(19)

который связан с полем E соотношением

с другом. (Этот важный факт, означающий независимость действия от'
дельных зарядов, установлен экспериментально.) Но из формулы (20)
легко проверить, что и соответствующие потенциалы складываются
друг с другом. В самом деле, если E = E 1 + E 2 , где
∂ϕ l
∂ϕ l ⎞
⎛ ∂ϕ
E l = − grad ϕ l = − ⎜ l i +
j+
k⎟
⎝ ∂x
∂y
∂z ⎠

( l = 1, 2 ),

то, складывая одноименные проекции, получаем
⎡ ∂(ϕ1 + ϕ 2 )
∂(ϕ1 + ϕ 2 )
∂(ϕ1 + ϕ 2 ) ⎤
E =− ⎢
i+
j+
k ⎥ = − grad(ϕ1 + ϕ 2 ),
∂x
∂y
∂z



т.е. ϕ = ϕ 1 + ϕ 2 служит потенциалом поля E.
Мы видим, что электрическое поле, образованное любой системой
покоящихся зарядов, обладает потенциалом и, кроме того, при изуче'
нии зависимости потенциала от поля имеет место принцип суперпози'
ции (закон линейности, см. § VI.2). Это дает возможность по общему
методу построить потенциал электрического поля, получающегося,
когда заряды распределены в пространстве с некоторой переменной
плотностью ρ. Если плотность имеет вид пространственной дель'
та'функции (см. § VI.3), т.е. если

G(r ; r 0 ) =

(20)

и нормирован условием обращения в нуль на бесконечности. В силу
однородности пространства такой же заряд q, помещенный в точку
M 0 (x 0 ; y 0 ; z 0 ), порождает потенциал (будем писать ϕ(r ) вместо
ϕ(M ), считая r радиусом'вектором точки М)
q
,
r − r0

337

(22)

то соответствующий заряд — это единичный заряд, сосредоточенный
в точке с радиусом'вектором r 0 . Поэтому потенциал, отвечающий
плотности (22), — а он представляет собой функцию Грина в данной за'
даче, — вычисляется по формуле (21) с q = 1, т.е.

q
q
,
ϕ( M ) = =
r OM

ϕ(r ) =

ПОЛЕ СКОРОСТИ И ПОТОК

ρ(r ) = δ(r − r 0 ),

В § 3 мы видели, что такое поле имеет потенциал

E = −grad ϕ

§ 4]

(21)

где r 0 — радиус'вектор точки M 0 **.
Пусть теперь в пространстве имеется система зарядов; тогда элек'
трические поля E, отвечающие этим зарядам, складываются друг

Здесь r 0 определяет точку воздействия, а r — точку наблюдения.
Зная функцию Грина, легко по общему методу § VI.2 получить вы'
ражение для потенциала в случае произвольной плотности ρ(r ):
ϕ (r ) =

∫ G (r i ; r 0 ) ρ(r 0 ) dΩ 0 = ∫

(Ω 0 )

(Ω 0 )

ρ(r 0 )
dΩ 0 ,
r − r0

где интегрирование производится по всей области (Ω 0 ), занятой заря'
дом. В координатной форме то же можно написать так:
ϕ ( x, y, z ) =

∫∫∫

(Ω 0 )

* Это значит, что Е и q выражены в электростатической системе единиц CGSE.
** Не следует путать радиус'вектор r 0 с единичным вектором r 0 .

1
.
r − r0

ϕ( x0 , y0 , z 0 )
2

( x − x0 ) + ( y − y0 )2 + ( z − z 0 )2

dx0 dy0 dz 0 .

(23)

Примеры вычисления потенциала будут рассмотрены ниже, в § 6.

336

ТЕОРИЯ ПОЛЯ

[Гл. X

координат О. Для исследования поля можно в произвольную точку M
поместить пробный единичный заряд и посмотреть, с какой силой поле
на него действует; эта сила E называется напряженностью электри'
ческого поля. Так как в разных точках M напряженность E различ'
ная, то мы имеем векторное поле E = E (M ), представляющее собой, по
существу, частный случай рассмотренного в § 3 силового поля (если
все время иметь в виду, что речь идет о воздействии на пробный еди'
ничный заряд). Закон Кулона по математической формулировке ана'
логичен закону Ньютона, рассмотренному в § 3. Для точечного заряда
q он имеет вид
E=

kq 0 kq
r = 3r
r2
r

⎛ 0 r

⎜ r = — единич ный вектор, идущий вдоль радиуса − вектора ⎟ ; эта


r
формула несколько отличается от (10), так как сила должна быть прямо
пропорциональна q и, кроме того, при q > 0 пробный единичный по'
ложительный заряд не притягивается, а отталкивается. Коэффици'
ент k в последней формуле зависит от выбранной системы единиц,
и мы для простоты положим его равным единице*, т.е. будем писать
E=

q 0 q
r = 3 r.
r2
r

(19)

который связан с полем E соотношением

с другом. (Этот важный факт, означающий независимость действия от'
дельных зарядов, установлен экспериментально.) Но из формулы (20)
легко проверить, что и соответствующие потенциалы складываются
друг с другом. В самом деле, если E = E 1 + E 2 , где
∂ϕ l
∂ϕ l ⎞
⎛ ∂ϕ
E l = − grad ϕ l = − ⎜ l i +
j+
k⎟
⎝ ∂x
∂y
∂z ⎠

( l = 1, 2 ),

то, складывая одноименные проекции, получаем
⎡ ∂(ϕ1 + ϕ 2 )
∂(ϕ1 + ϕ 2 )
∂(ϕ1 + ϕ 2 ) ⎤
E =− ⎢
i+
j+
k ⎥ = − grad(ϕ1 + ϕ 2 ),
∂x
∂y
∂z



т.е. ϕ = ϕ 1 + ϕ 2 служит потенциалом поля E.
Мы видим, что электрическое поле, образованное любой системой
покоящихся зарядов, обладает потенциалом и, кроме того, при изуче'
нии зависимости потенциала от поля имеет место принцип суперпози'
ции (закон линейности, см. § VI.2). Это дает возможность по общему
методу построить потенциал электрического поля, получающегося,
когда заряды распределены в пространстве с некоторой переменной
плотностью ρ. Если плотность имеет вид пространственной дель'
та'функции (см. § VI.3), т.е. если

G(r ; r 0 ) =

(20)

и нормирован условием обращения в нуль на бесконечности. В силу
однородности пространства такой же заряд q, помещенный в точку
M 0 (x 0 ; y 0 ; z 0 ), порождает потенциал (будем писать ϕ(r ) вместо
ϕ(M ), считая r радиусом'вектором точки М)
q
,
r − r0

337

(22)

то соответствующий заряд — это единичный заряд, сосредоточенный
в точке с радиусом'вектором r 0 . Поэтому потенциал, отвечающий
плотности (22), — а он представляет собой функцию Грина в данной за'
даче, — вычисляется по формуле (21) с q = 1, т.е.

q
q
,
ϕ( M ) = =
r OM

ϕ(r ) =

ПОЛЕ СКОРОСТИ И ПОТОК

ρ(r ) = δ(r − r 0 ),

В § 3 мы видели, что такое поле имеет потенциал

E = −grad ϕ

§ 4]

(21)

где r 0 — радиус'вектор точки M 0 **.
Пусть теперь в пространстве имеется система зарядов; тогда элек'
трические поля E, отвечающие этим зарядам, складываются друг

Здесь r 0 определяет точку воздействия, а r — точку наблюдения.
Зная функцию Грина, легко по общему методу § VI.2 получить вы'
ражение для потенциала в случае произвольной плотности ρ(r ):
ϕ (r ) =

∫ G (r i ; r 0 ) ρ(r 0 ) dΩ 0 = ∫

(Ω 0 )

(Ω 0 )

ρ(r 0 )
dΩ 0 ,
r − r0

где интегрирование производится по всей области (Ω 0 ), занятой заря'
дом. В координатной форме то же можно написать так:
ϕ ( x, y, z ) =

∫∫∫

(Ω 0 )

* Это значит, что Е и q выражены в электростатической системе единиц CGSE.
** Не следует путать радиус'вектор r 0 с единичным вектором r 0 .

1
.
r − r0

ϕ( x0 , y0 , z 0 )
2

( x − x0 ) + ( y − y0 )2 + ( z − z 0 )2

dx0 dy0 dz 0 .

(23)

Примеры вычисления потенциала будут рассмотрены ниже, в § 6.

338

ТЕОРИЯ ПОЛЯ

[Гл. X

Рассмотрим теперь поток вектора Е через замкнутую поверхность
(σ), ориентированную «естественным» образом, т.е. так, что ее внутрен(
няя сторона смотрит в конечную область, ограниченную (σ), а внеш(
няя сторона смотрит в бесконечность. В § 4 мы говорили, что такой
поток иначе называется количеством векторных линий (т.е. для поля
Е — «электрических силовых линий»), пересекающих (σ) изнутри на(
ружу. Так как это количество понимается в алгебраическом смысле, т.е.
как разность между числом выходящих линий и числом входящих, то
его же можно понять как количество векторых линий, начинающихся
внутри (σ).
В самом простом случае, когда Е порождается точечным зарядом
q, расположенным в начале координат, а (σ) представляет собой сфе(
ру с центром в начале и радиусом R, поток найти совсем просто. В са(
мом деле, на (σ)
E=

q 0 q
r = 2 n,
R2
R

q
q
dσ = 2
2
R
R
( σ)

( σ)

ПРИМЕРЫ

339

внутри (σ) (т.е. поток вектора E через (σ)), равно 4πq. Другими сло(
вами, для рассматриваемого поля силовые линии при q > 0 начинают(
ся на заряде (причем их количество пропорционально заряду) и уходят
на бесконечность. Если заряд отрицательный, то силовые линии начи(
наются в бесконечности и заканчиваются на заряде.
Пусть теперь внутри замкнутой поверхности (σ) содержится не(
сколько зарядов, например q1 , q2 и q 3 . Тогда соответствующие поля,
а потому и потоки складываются, т.е. суммарный поток через (σ) равен
4πq1 + 4πq2 + 4πq 3 = 4π(q1 + q2 + q 3 ) = 4πq, где q = q1 + q2 + q 3 — сум(
марный заряд, расположенный внутри (σ).
Итак, количество электрических силовых линий, начинающихся в
любом объеме пространства, пропорционально (с коэффициентом про(
порциональности 4π) общему заряду, заключенному в этом объеме. Это
утверждение называется теоремой Гаусса.
§ 6. Примеры

так как на сфере r 0 совпадает с единичным вектором внешней норма(
q
ли n. Но тогда на сфере E n = 2 = const и, по определению (ср. фор(
R
мулу (13)), поток равен

∫ E n dσ = ∫

§ 6]

q

∫ dσ = R 2 4 πR

2

= 4 πq.

(24)

( σ)

Итак, рассматриваемый поток не зависит от радиуса R и прямо про(
порционален величине заряда.
Аналогично (24) доказывается, что поток вектора Е через часть
сферы с центром в точечном заряде (рис. 122) равен ωq, где ω — соот(
ветствующий «телесный угол», т.е. соотве(
тствующая площадь на сфере единичного
радиуса. Но отсюда сразу следует, что для
поля, порожденного точечным зарядом,
электрические силовые линии не могут на(
чинаться или заканчиваться ни в каком об(
ъеме, не содержащем этого заряда (т.е. они
начинаются или заканчивается только на
Рис. 122.
этом заряде). В самом деле, выбрав малый
объем (dΩ), как показано на рис. 122, легко убедиться, что через его
сферические стенки выходит столько же линий, сколько и входит, а че(
рез коническую стенку линии вообще не проходят.
Таким образом, для любой поверхности (σ), содержащей точечный
заряд q внутри себя, количество силовых линий, начинающихся

Поле, созданное точечным зарядом, — наиболее простое электри(
ческое поле. В результате комбинации полей от точечных зарядов, по(
мещенных в различных точках, получаются и другие, более сложные
поля.
Во многих важных случаях поле можно построить с помощью не(
посредственного применения теоремы Гаусса (см. конец § 5). Рассмот(
рим, например, поле, созданное шаром радиуса R 0 , заряженным
с постоянной объемной плотностью ρ. Еслипринять центр шара за на(
чало координат, то в силу сферической симметрии задачи ясно, что на(
пряженность E поля имеет вид
E = F (r ) r 0,

(25)

где F (r) — некоторая скалярная функция. Приравнивая по теореме
Гаусса поток вектора E через сферу радиуса r, вычисленный но фор(
муле (17), заряду внутри этой сферы, умноженному на 4π, получим
⎧ 4 3
4 π πr ρ
( r < R0 ),
⎪ 3
F ( r ) ⋅ 4 πr = ⎨
⎪4 π 4 πR03 ρ = 4 πq ( r > R0 ),
⎩ 3
2

где q — общий заряд шара. Отсюда, находя F(r) и подставляя в (25),
получаем
⎧ ρ 0 4
4 π r r = πρr (внутри шара ),
⎪ 3
3
E =⎨
q
0
⎪ r
(вне шара ).
⎩ r2

338

ТЕОРИЯ ПОЛЯ

[Гл. X

Рассмотрим теперь поток вектора Е через замкнутую поверхность
(σ), ориентированную «естественным» образом, т.е. так, что ее внутрен(
няя сторона смотрит в конечную область, ограниченную (σ), а внеш(
няя сторона смотрит в бесконечность. В § 4 мы говорили, что такой
поток иначе называется количеством векторных линий (т.е. для поля
Е — «электрических силовых линий»), пересекающих (σ) изнутри на(
ружу. Так как это количество понимается в алгебраическом смысле, т.е.
как разность между числом выходящих линий и числом входящих, то
его же можно понять как количество векторых линий, начинающихся
внутри (σ).
В самом простом случае, когда Е порождается точечным зарядом
q, расположенным в начале координат, а (σ) представляет собой сфе(
ру с центром в начале и радиусом R, поток найти совсем просто. В са(
мом деле, на (σ)
E=

q 0 q
r = 2 n,
R2
R

q
q
dσ = 2
2
R
R
( σ)

( σ)

ПРИМЕРЫ

339

внутри (σ) (т.е. поток вектора E через (σ)), равно 4πq. Другими сло(
вами, для рассматриваемого поля силовые линии при q > 0 начинают(
ся на заряде (причем их количество пропорционально заряду) и уходят
на бесконечность. Если заряд отрицательный, то силовые линии начи(
наются в бесконечности и заканчиваются на заряде.
Пусть теперь внутри замкнутой поверхности (σ) содержится не(
сколько зарядов, например q1 , q2 и q 3 . Тогда соответствующие поля,
а потому и потоки складываются, т.е. суммарный поток через (σ) равен
4πq1 + 4πq2 + 4πq 3 = 4π(q1 + q2 + q 3 ) = 4πq, где q = q1 + q2 + q 3 — сум(
марный заряд, расположенный внутри (σ).
Итак, количество электрических силовых линий, начинающихся в
любом объеме пространства, пропорционально (с коэффициентом про(
порциональности 4π) общему заряду, заключенному в этом объеме. Это
утверждение называется теоремой Гаусса.
§ 6. Примеры

так как на сфере r 0 совпадает с единичным вектором внешней норма(
q
ли n. Но тогда на сфере E n = 2 = const и, по определению (ср. фор(
R
мулу (13)), поток равен

∫ E n dσ = ∫

§ 6]

q

∫ dσ = R 2 4 πR

2

= 4 πq.

(24)

( σ)

Итак, рассматриваемый поток не зависит от радиуса R и прямо про(
порционален величине заряда.
Аналогично (24) доказывается, что поток вектора Е через часть
сферы с центром в точечном заряде (рис. 122) равен ωq, где ω — соот(
ветствующий «телесный угол», т.е. соотве(
тствующая площадь на сфере единичного
радиуса. Но отсюда сразу следует, что для
поля, порожденного точечным зарядом,
электрические силовые линии не могут на(
чинаться или заканчиваться ни в каком об(
ъеме, не содержащем этого заряда (т.е. они
начинаются или заканчивается только на
Рис. 122.
этом заряде). В самом деле, выбрав малый
объем (dΩ), как показано на рис. 122, легко убедиться, что через его
сферические стенки выходит столько же линий, сколько и входит, а че(
рез коническую стенку линии вообще не проходят.
Таким образом, для любой поверхности (σ), содержащей точечный
заряд q внутри себя, количество силовых линий, начинающихся

Поле, созданное точечным зарядом, — наиболее простое электри(
ческое поле. В результате комбинации полей от точечных зарядов, по(
мещенных в различных точках, получаются и другие, более сложные
поля.
Во многих важных случаях поле можно построить с помощью не(
посредственного применения теоремы Гаусса (см. конец § 5). Рассмот(
рим, например, поле, созданное шаром радиуса R 0 , заряженным
с постоянной объемной плотностью ρ. Если принять центр шара за на(
чало координат, то в силу сферической симметрии задачи ясно, что на(
пряженность E поля имеет вид
E = F (r ) r 0,

(25)

где F (r) — некоторая скалярная функция. Приравнивая по теореме
Гаусса поток вектора E через сферу радиуса r, вычисленный но фор(
муле (17), заряду внутри этой сферы, умноженному на 4π, получим
⎧ 4 3
4 π πr ρ
( r < R0 ),
⎪ 3
F ( r ) ⋅ 4 πr = ⎨
⎪4 π 4 πR03 ρ = 4 πq ( r > R0 ),
⎩ 3
2

где q — общий заряд шара. Отсюда, находя F(r) и подставляя в (25),
получаем
⎧ ρ 0 4
4 π r r = πρr (внутри шара ),
⎪ 3
3
E =⎨
q
0
⎪ r
(вне шара ).
⎩ r2

340

ТЕОРИЯ ПОЛЯ

[Гл. X

В частности (ср. формулу (19)), вне
шара напряженность поля в точности
такова, как если бы весь заряд был со(
средоточен в центре шара. График мо(
дуля вектора E в зависимости от
радиуса показан на рис. 123 сплошной
линией.
Соответствующий потенциал в силу
Рис. 123.
соображений симметрии имеет вид
U = U (r). Вспомнив формулу (5), получаем, что
⎧ 4
− πρr
dU ⎪ 3
=⎨
dr ⎪ q

⎩ r2

(0  r R0 ),
(R0  r < ∞ ).

§ 6]

ПРИМЕРЫ

т.е. и в этом случае поле таково, как
если бы весь заряд был сосредоточен
в центре. График поля для полого
шара показан на рис. 124. Эти же вы(
воды справедливы для бесконечно
близких R1 и R 0 , т.е. при равномер(
ном распределении заряда на сфере.
Рис. 124.
Рассмотрим в качестве следую(
щего примера заряд, распределенный с постоянной линейной плотнос(
тью μ вдоль бесконечной прямолинейной нити, за которую мы при(
мем ось z. Это поле — плоскопараллельное (§ 1), и его можно получить
в результате суммирования (интегрирования) полей от малых зарядов,
расположенных вдоль нити. Но проще использовать теорему Гаусса.
Заметим, что в силу осевой симметрии задачи, поле должно иметь вид
E = ϕ( _ ) _0 ,

Отсюда
⎧ 2
− πρr 2 + C1
⎪ 3
U =⎨
⎪ q + C2
⎩r

(0  r R0 ),
(R0  r < ∞ ),

где C1 , C2 — некоторые постоянные. Нормируя потенциал условием
U(∞) = 0, получаем, что C2 = 0; а чтобы U (r) было непрерывно при
r = R 0 , должно быть
2
q
q 2
− πρR02 + C1 = 2 , т.е. C1 = 2 + πρR02 .
3
3
R
R

Итак, окончательно

⎪⎪
U =⎨

⎪⎩

341

2
q
πρ(R02 − r 2 ) +
3
R0

(0  r R0 ),

q
r

(R0  r < ∞ ).

Рассмотрим теперь поле от заряда, распределенного с постоянной
плотностью σ между двумя концентрическими сферами радиусов R1 и
R 0 . В силу принципа суперпозиции это поле можно получить как раз(
ность полей, полученных при распределении заряда плотности ρ в шаре
радиуса R 0 и в шаре радиуса R1 . Графики обоих полей показаны на
рис. 123. Мы видим, что внутри полости (т.е. внутри сферы радиуса R1 )
разность равна нулю, т.е. электрического поля нет; другими словами, там
потенциал постоянный. Вне сферы радиуса R 0 поле имеет вид
q0 0
q
q −q
q 0
r − 1 2 r 0 = 0 21 r 0 =
r ,
4 πr 2
4 πr
4 πr
4 πr 2

где _ — это вектор, перпендикулярный нити и направленный от нее
_
в текущую точку (если нить идет по оси z, то _ = xi + yj); _ 0 =

_
единичный вектор (не следует путать вектор _ с объемной плотностью
заряда); ϕ( _ ) — некоторая скалярная функция. Применяя теорему Гаус(
са к цилиндру высоты h и радиуса _ ,
изображенному на рис. 125, получим
ϕ ( _ ) 2 π _ h = 4 πμh

(при этом надо учесть, что поток векто(
ра Е через основания цилиндра равен
нулю, так как электрические силовые
линии идут вдоль этих оснований).

Отсюда имеем ϕ ( _ ) =
, т.е.
_
E=

2μ 0
_ .
_

(26)

Рис. 125.

На рис. 125 показаны соответствующие силовые линии; они начинают(
ся (в случае μ > 0) на заряженной нити и расходятся на бесконечность.
Интересная трудность возникает при вычислении потенциала рас(
сматриваемого поля. Можно было бы попытаться просуммировать по(
тенциалы от элементарных зарядов нити. В силу формулы (21) это
дало бы в некоторой точке M (x; y; z )


ϕ=



−∞



μ dζ
μ dζ
.
=∫
2
xi + yj + zk − ζk −∞
x + y 2 + ( z − ζ )2

(27)

340

ТЕОРИЯ ПОЛЯ

[Гл. X

В частности (ср. формулу (19)), вне
шара напряженность поля в точности
такова, как если бы весь заряд был со(
средоточен в центре шара. График мо(
дуля вектора E в зависимости от
радиуса показан на рис. 123 сплошной
линией.
Соответствующий потенциал в силу
Рис. 123.
соображений симметрии имеет вид
U = U (r). Вспомнив формулу (5), получаем, что
⎧ 4
− πρr
dU ⎪ 3
=⎨
dr ⎪ q

⎩ r2

(0  r R0 ),
(R0  r < ∞ ).

§ 6]

ПРИМЕРЫ

т.е. и в этом случае поле таково, как
если бы весь заряд был сосредоточен
в центре. График поля для полого
шара показан на рис. 124. Эти же вы(
воды справедливы для бесконечно
близких R1 и R 0 , т.е. при равномер(
ном распределении заряда на сфере.
Рис. 124.
Рассмотрим в качестве следую(
щего примера заряд, распределенный с постоянной линейной плотнос(
тью μ вдоль бесконечной прямолинейной нити, за которую мы при(
мем ось z. Это поле — плоскопараллельное (§ 1), и его можно получить
в результате суммирования (интегрирования) полей от малых зарядов,
расположенных вдоль нити. Но проще использовать теорему Гаусса.
Заметим, что в силу осевой симметрии задачи, поле должно иметь вид
E = ϕ( _ ) _0 ,

Отсюда
⎧ 2
− πρr 2 + C1
⎪ 3
U =⎨
⎪ q + C2
⎩r

(0  r R0 ),
(R0  r < ∞ ),

где C1 , C2 — некоторые постоянные. Нормируя потенциал условием
U(∞) = 0, получаем, что C2 = 0; а чтобы U (r) было непрерывно при
r = R 0 , должно быть
2
q
q 2
− πρR02 + C1 = 2 , т.е. C1 = 2 + πρR02 .
3
3
R
R

Итак, окончательно

⎪⎪
U =⎨

⎪⎩

341

2
q
πρ(R02 − r 2 ) +
3
R0

(0  r R0 ),

q
r

(R0  r < ∞ ).

Рассмотрим теперь поле от заряда, распределенного с постоянной
плотностью σ между двумя концентрическими сферами радиусов R1 и
R 0 . В силу принципа суперпозиции это поле можно получить как раз(
ность полей, полученных при распределении заряда плотности ρ в шаре
радиуса R 0 и в шаре радиуса R1 . Графики обоих полей показаны на
рис. 123. Мы видим, что внутри полости (т.е. внутри сферы радиуса R1 )
разность равна нулю, т.е. электрического поля нет; другими словами, там
потенциал постоянный. Вне сферы радиуса R 0 поле имеет вид
q0 0
q
q −q
q 0
r − 1 2 r 0 = 0 21 r 0 =
r ,
4 πr 2
4 πr
4 πr
4 πr 2

где _ — это вектор, перпендикулярный нити и направленный от нее
_
в текущую точку (если нить идет по оси z, то _ = xi + yj); _ 0 =

_
единичный вектор (не следует путать вектор _ с объемной плотностью
заряда); ϕ( _ ) — некоторая скалярная функция. Применяя теорему Гаус(
са к цилиндру высоты h и радиуса _ ,
изображенному на рис. 125, получим
ϕ ( _ ) 2 π _ h = 4 πμh

(при этом надо учесть, что поток векто(
ра Е через основания цилиндра равен
нулю, так как электрические силовые
линии идут вдоль этих оснований).

Отсюда имеем ϕ ( _ ) =
, т.е.
_
E=

2μ 0
_ .
_

(26)

Рис. 125.

На рис. 125 показаны соответствующие силовые линии; они начинают(
ся (в случае μ > 0) на заряженной нити и расходятся на бесконечность.
Интересная трудность возникает при вычислении потенциала рас(
сматриваемого поля. Можно было бы попытаться просуммировать по(
тенциалы от элементарных зарядов нити. В силу формулы (21) это
дало бы в некоторой точке M (x; y; z )


ϕ=



−∞



μ dζ
μ dζ
.
=∫
2
xi + yj + zk − ζk −∞
x + y 2 + ( z − ζ )2

(27)

342

ТЕОРИЯ ПОЛЯ

[Гл. X

Но знаменатель при больших ζ ведет себя, как

ζ 2 = ζ , и потому

интеграл (27) расходится к бесконечности (см. § III.1), т.е. имеет беско(
нечное значение! Ясно, что так найти потенциал нельзя.
Однако вспомним о том, что нас всегда интересует не само значение
потенциала, а производные от него (для нахождения поля Е) или раз(
ность его значений для двух точек. Поэтому ситуация как раз такова,
как описано в § III.6 при рассмотрении расходящегося интеграла, зави(
сящего от параметра (в данном случае имеется три параметра: х, у, z).
Учтем к тому же, что реально нить всегда конечна, т.е. взамен (26) надо
рассмотреть интеграл
N

ϕN =



−N

ПРИМЕРЫ

E x = 2μ

∂P
x
+ N =
2
∂x
x +y

= 2μ

x
μx
+
+
x 2 + y 2 ( N − z + x 2 + y 2 + ( N − z )2 ) x 2 + y 2 + ( N − z )2
+ аналогичный член с N + z;

выражение E y получается заменой х на у;

x 2 + y 2 + ( z − ζ )2
z

−N

N



z

и в первом заменить ζ − z на ζ, а во втором z − ζ на η, после чего полу(
чится (проверьте!)

]+
+ ( N + z ) ]=

∂z

=

−1
2

x + y + ( N − z )2

E x = 2μ

2

= −μ ln( x 2 + y 2 ) + PN ( x, y, z ),

∂PN

(28)

где через PN обозначена сумма «длинных логарифмов». Следова(
тельно, потенциал в фиксированной точке Q (x; y; z ), зависящий от
длины нити, обращается в бесконечность, когда длина нити стремит(
ся к бесконечности. В природе мы никогда не имеем дела с нитями
бесконечной длины с постоянной плотностью заряда на них; для вы(
числения потенциала существенно, что когда длина нити конечна, ве(
личина N, характеризующая длину, входит в ответ, в частности,
и при N → ∞.
Замечательно, что, несмотря на это, поле Е вблизи нити не зависит
от длины нити*.

2

+ аналогичный член с N + z.

Теперь, после дифференцирования, устремим N к бесконечности; при
∂PN ∂PN ∂PN
этом члены
,
,
→ 0, и мы получим простой, не зависящий
∂x
∂y
∂z
от N ответ

ϕ N = −μ ln ( x 2 + y 2 ) + μ ln N − z + x 2 + y 2 + ( N − z )2
x2 + y2

2

Ez =

∫ +∫

343

Точный способ действий заключается в следующем: зафиксируем
какое(то большое, но конечное N и найдем поле по общему правилу (20):

μ dζ

при очень большом N. Этот интеграл удобно разбить на два:

[
+ μ ln[N + z +

§ 6]

x
,
x2 + y2

E y = 2μ

y
,
x2 + y2

E z = 0.

Подробная процедура с получением выражения ϕ для конечного
N, нахождением Е и последующим переходом к пределу при N → ∞
не необходима. Откажемся от нормировки потенциала ϕ условием
ϕ = 0 на бесконечности. Примем за нуль, например, потенциал в точке
x = 1, y = 0, z = 0 и обозначим через Φ нормированный так потенциал.
Он получится добавлением к (28) константы C = C N :
Φ = −μ ln ( x 2 + y 2 ) + PN ( x, y, z ) + C ,

откуда
C = −PN (1, 0, 0 ) = −2μ ln ( N + 1 + N 2 ).

Легко убедиться, что в пределе при N → ∞
PN ( x, y, z ) + C = PN ( x, y, z ) − PN (1, 0, 0 ) → 0,

откуда
* Для того чтобы это утверждение было правильно, нужно выполнение неравенств
x
y
z
,
,
1. Проверьте, что если хотя бы одна из этих величин удовлетворяет обрат(
N N N
x
y
z
ному неравенству, т.е.
1, или
1, или
1, то потенциал и поле близки
N
N
N
к полю конечного заряда, равного 2μN и находящегося в начале координат.

Φ = −μ ln ( x 2 + y 2 ).

Вычисляя E = −grad Φ, получим предыдущий результат. Этот результат
совпадает с тем, что был получен с применением теоремы Гаусса (ср.
формулу (26)). В отличие от потенциала при вычислении поля по теоре(
ме Гаусса можно (и нужно!) сразу рассматривать бесконечную нить.

342

ТЕОРИЯ ПОЛЯ

[Гл. X

Но знаменатель при больших ζ ведет себя, как

ζ 2 = ζ , и потому

интеграл (27) расходится к бесконечности (см. § III.1), т.е. имеет беско(
нечное значение! Ясно, что так найти потенциал нельзя.
Однако вспомним о том, что нас всегда интересует не само значение
потенциала, а производные от него (для нахождения поля Е) или раз(
ность его значений для двух точек. Поэтому ситуация как раз такова,
как описано в § III.6 при рассмотрении расходящегося интеграла, зави(
сящего от параметра (в данном случае имеется три параметра: х, у, z).
Учтем к тому же, что реально нить всегда конечна, т.е. взамен (26) надо
рассмотреть интеграл
N

ϕN =



−N

ПРИМЕРЫ

E x = 2μ

∂P
x
+ N =
2
∂x
x +y

= 2μ

x
μx
+
+
x 2 + y 2 ( N − z + x 2 + y 2 + ( N − z )2 ) x 2 + y 2 + ( N − z )2
+ аналогичный член с N + z;

выражение E y получается заменой х на у;

x 2 + y 2 + ( z − ζ )2
z

−N

N



z

и в первом заменить ζ − z на ζ, а во втором z − ζ на η, после чего полу(
чится (проверьте!)

]+
+ ( N + z ) ]=

∂z

=

−1
2

x + y + ( N − z )2

E x = 2μ

2

= −μ ln( x 2 + y 2 ) + PN ( x, y, z ),

∂PN

(28)

где через PN обозначена сумма «длинных логарифмов». Следова(
тельно, потенциал в фиксированной точке Q (x; y; z ), зависящий от
длины нити, обращается в бесконечность, когда длина нити стремит(
ся к бесконечности. В природе мы никогда не имеем дела с нитями
бесконечной длины с постоянной плотностью заряда на них; для вы(
числения потенциала существенно, что когда длина нити конечна, ве(
личина N, характеризующая длину, входит в ответ, в частности,
и при N → ∞.
Замечательно, что, несмотря на это, поле Е вблизи нити не зависит
от длины нити*.

2

+ аналогичный член с N + z.

Теперь, после дифференцирования, устремим N к бесконечности; при
∂PN ∂PN ∂PN
этом члены
,
,
→ 0, и мы получим простой, не зависящий
∂x
∂y
∂z
от N ответ

ϕ N = −μ ln ( x 2 + y 2 ) + μ ln N − z + x 2 + y 2 + ( N − z )2
x2 + y2

2

Ez =

∫ +∫

343

Точный способ действий заключается в следующем: зафиксируем
какое(то большое, но конечное N и найдем поле по общему правилу (20):

μ dζ

при очень большом N. Этот интеграл удобно разбить на два:

[
+ μ ln[N + z +

§ 6]

x
,
x2 + y2

E y = 2μ

y
,
x2 + y2

E z = 0.

Подробная процедура с получением выражения ϕ для конечного
N, нахождением Е и последующим переходом к пределу при N → ∞
не необходима. Откажемся от нормировки потенциала ϕ условием
ϕ = 0 на бесконечности. Примем за нуль, например, потенциал в точке
x = 1, y = 0, z = 0 и обозначим через Φ нормированный так потенциал.
Он получится добавлением к (28) константы C = C N :
Φ = −μ ln ( x 2 + y 2 ) + PN ( x, y, z ) + C ,

откуда
C = −PN (1, 0, 0 ) = −2μ ln ( N + 1 + N 2 ).

Легко убедиться, что в пределе при N → ∞
PN ( x, y, z ) + C = PN ( x, y, z ) − PN (1, 0, 0 ) → 0,

откуда
* Для того чтобы это утверждение было правильно, нужно выполнение неравенств
x
y
z
,
,
1. Проверьте, что если хотя бы одна из этих величин удовлетворяет обрат(
N N N
x
y
z
ному неравенству, т.е.
1, или
1, или
1, то потенциал и поле близки
N
N
N
к полю конечного заряда, равного 2μN и находящегося в начале координат.

Φ = −μ ln ( x 2 + y 2 ).

Вычисляя E = −grad Φ, получим предыдущий результат. Этот результат
совпадает с тем, что был получен с применением теоремы Гаусса (ср.
формулу (26)). В отличие от потенциала при вычислении поля по теоре(
ме Гаусса можно (и нужно!) сразу рассматривать бесконечную нить.

344

ТЕОРИЯ ПОЛЯ

[Гл. X

Поле можно найти также интегрированием — сложением элементар(
ных полей dE зарядов dq = μ dζ, расположенных на элементе нити. Так
как Е есть вектор, то нужно отдельно складывать компоненты
dE x =

dE y =

[x

x dq

[x

2

2

2

+ y + ( z − ζ)
μx dζ

2

2

2

+ y + ( z − ζ)

]

]

3 2

3 2

,

=

[x

μx dζ
2

dE z =

+ y + ( z − ζ )2

[x

2

]

3 2

μ( z − ζ ) dζ
2

+ y 2 + ( z − ζ )2

,

]

3 2

.

Соответствующие интегралы сходятся, так как при больших ζ подын(
−3
−2
или ζ . Поэтому можно сра(
тегральная функция убывает как ζ
зу брать интегралы в пределах от ζ = −∞ до ζ = ∞ (см. упражнение 1).
Рассмотрим, наконец, поле, порожденное зарядом, равномерно рас(
пределенным по плоскости, за которую мы примем плоскость yOz,
с постоянной поверхностной плотнос(
тью ν. Здесь опять удобно применить тео(
рему Гаусса. Заметим, что в силу соображе(
ний симметрии силовые линии должны
идти
параллельно
оси х.
Возьмем
(рис. 126) тонкий цилиндр, расположен(
ный симметрично относительно плоскос(
ти yOz. Поток через его боковую повер(
хность равен нулю, а через основания, из
Рис. 126.
тех же соображений симметрии, равен
2Eds. С другой стороны, этот поток, по тео(
реме Гаусса, равен произведению 4π на заряд, заключенный внутри
цилиндра, т.е. на ν ds. Приравнивая результаты, получаем
2Eds = 4πν ds, откуда E = 2πν. Таким образом, в данном примере
E = 2 πνi ( x > 0 ),

E = −2 πνi ( x < 0 ).

(29)

Мы видим, что напряженность по обе стороны от заряженной плоскос(
ти постоянная, а при переходе через эту плоскость испытывает скачок
4πνi.
Что же будет, если заряжена не бесконечная плоскость, а, как всегда
на практике, конечный ее кусок? Тогда вблизи этого куска (причем не
у границы, а у внутренней части) конечность куска сказывается слабо
и мы имеем почти однородное поле, вычисляемое по формулам (29).
Вблизи границы куска, а также при удалении от него однородность
поля существенно нарушается. На достаточном расстоянии от куска
(как и от любой конечной системы зарядов) его можно просто заменить
на поле точечного заряда, равного суммарному заряду на указанном
куске, т.е. можно пользоваться формулой (19).

§ 6]

ПРИМЕРЫ

345

Важный случай представляет собой схематически изо(
браженный на рис. 127 плоский конденсатор, т.е. две парал(
лельные пластины с равными и противоположными по зна(
2
ку зарядами на них (ν единиц на 1 см одной и — ν единиц
2
на 1 см другой пластины). Проверьте, что слева от А
и справа от В поля двух пластин направлены в противопо(
ложные стороны и в сумме равны нулю. Внутри конденса(
тора, между А и В, поле равно E = 4πν и направлено от
положительной пластины к отрицательной. Однако нужно
помнить, что это поле наполовину обусловлено зарядами
Рис. 127.
пластины А и наполовину — зарядами пластины В. В час(
1
тности, сила, действующая на пластину А, равна 2πSν2 = qE, так как
2
на пластину А действует только поле зарядов В (ср. ВМ, § VIII.4).
1
получить так: заряды на А распо(
Иначе можно коэффициент
2
ложены на границе между областью, где E = 0 (слева от А), и облас(
тью, где E = 4πν (справа от А); поэтому среднее поле равно
1
(4πν + 0) = 2πν. Но это усреднение и есть способ рассмотреть только ту
2
часть поля, которая создана В(зарядами и одинакова слева и справа
от А. Поле самих зарядов А имеет слева и права от А противополож(
ный знак и при усреднении пропадает.
Перейдем теперь к случаям, когда поле получается с помощью не(
посредственного наложения полей от точечных зарядов.
Рассмотрим комбинацию двух зарядов, +q и −q, в точках
⎛h

⎛ h

⎜ ; 0; 0⎟ и ⎜ − ; 0; 0⎟ . Обозначая через r + и r − радиусы(векторы
⎝2

⎝ 2

этих точек, получим в силу формулы (21) суммарный потенциал
ϕ(r ) =

q
q

=
r − r+
r − r−






1
1
=q ⎜

⎟.
2
2
⎜ ⎛
h⎞
h⎞

2
2
2
2⎟
⎜x + ⎟ + y + z ⎟
⎜ ⎜⎝ x − ⎟⎠ + y + z

2
2⎠



(30)

Так как поле симметрично относительно оси х, то достаточно предста(
вить его картину в какой(либо плоскости, проходящей через эту ось,
например в плоскости xOz. На рис. 128 изображены сплошными ли(
ниями следы пересечения плоскостью xOz эквипотенциальных по(
верхностей, которые получаются, если приравнять правую часть (30)

344

ТЕОРИЯ ПОЛЯ

[Гл. X

Поле можно найти также интегрированием — сложением элементар(
ных полей dE зарядов dq = μ dζ, расположенных на элементе нити. Так
как Е есть вектор, то нужно отдельно складывать компоненты
dE x =

dE y =

[x

x dq

[x

2

2

2

+ y + ( z − ζ)
μx dζ

2

2

2

+ y + ( z − ζ)

]

]

3 2

3 2

,

=

[x

μx dζ
2

dE z =

+ y + ( z − ζ )2

[x

2

]

3 2

μ( z − ζ ) dζ
2

+ y 2 + ( z − ζ )2

,

]

3 2

.

Соответствующие интегралы сходятся, так как при больших ζ подын(
−3
−2
или ζ . Поэтому можно сра(
тегральная функция убывает как ζ
зу брать интегралы в пределах от ζ = −∞ до ζ = ∞ (см. упражнение 1).
Рассмотрим, наконец, поле, порожденное зарядом, равномерно рас(
пределенным по плоскости, за которую мы примем плоскость yOz,
с постоянной поверхностной плотнос(
тью ν. Здесь опять удобно применить тео(
рему Гаусса. Заметим, что в силу соображе(
ний симметрии силовые линии должны
идти
параллельно
оси х.
Возьмем
(рис. 126) тонкий цилиндр, расположен(
ный симметрично относительно плоскос(
ти yOz. Поток через его боковую повер(
хность равен нулю, а через основания, из
Рис. 126.
тех же соображений симметрии, равен
2Eds. С другой стороны, этот поток, по тео(
реме Гаусса, равен произведению 4π на заряд, заключенный внутри
цилиндра, т.е. на ν ds. Приравнивая результаты, получаем
2Eds = 4πν ds, откуда E = 2πν. Таким образом, в данном примере
E = 2 πνi ( x > 0 ),

E = −2 πνi ( x < 0 ).

(29)

Мы видим, что напряженность по обе стороны от заряженной плоскос(
ти постоянная, а при переходе через эту плоскость испытывает скачок
4πνi.
Что же будет, если заряжена не бесконечная плоскость, а, как всегда
на практике, конечный ее кусок? Тогда вблизи этого куска (причем не
у границы, а у внутренней части) конечность куска сказывается слабо
и мы имеем почти однородное поле, вычисляемое по формулам (29).
Вблизи границы куска, а также при удалении от него однородность
поля существенно нарушается. На достаточном расстоянии от куска
(как и от любой конечной системы зарядов) его можно просто заменить
на поле точечного заряда, равного суммарному заряду на указанном
куске, т.е. можно пользоваться формулой (19).

§ 6]

ПРИМЕРЫ

345

Важный случай представляет собой схематически изо(
браженный на рис. 127 плоский конденсатор, т.е. две парал(
лельные пластины с равными и противоположными по зна(
2
ку зарядами на них (ν единиц на 1 см одной и — ν единиц
2
на 1 см другой пластины). Проверьте, что слева от А
и справа от В поля двух пластин направлены в противопо(
ложные стороны и в сумме равны нулю. Внутри конденса(
тора, между А и В, поле равно E = 4πν и направлено от
положительной пластины к отрицательной. Однако нужно
помнить, что это поле наполовину обусловлено зарядами
Рис. 127.
пластины А и наполовину — зарядами пластины В. В час(
1
тности, сила, действующая на пластину А, равна 2πSν2 = qE, так как
2
на пластину А действует только поле зарядов В (ср. ВМ, § VIII.4).
1
получить так: заряды на А распо(
Иначе можно коэффициент
2
ложены на границе между областью, где E = 0 (слева от А), и облас(
тью, где E = 4πν (справа от А); поэтому среднее поле равно
1
(4πν + 0) = 2πν. Но это усреднение и есть способ рассмотреть только ту
2
часть поля, которая создана В(зарядами и одинакова слева и справа
от А. Поле самих зарядов А имеет слева и права от А противополож(
ный знак и при усреднении пропадает.
Перейдем теперь к случаям, когда поле получается с помощью не(
посредственного наложения полей от точечных зарядов.
Рассмотрим комбинацию двух зарядов, +q и −q, в точках
⎛h

⎛ h

⎜ ; 0; 0⎟ и ⎜ − ; 0; 0⎟ . Обозначая через r + и r − радиусы(векторы
⎝2

⎝ 2

этих точек, получим в силу формулы (21) суммарный потенциал
ϕ(r ) =

q
q

=
r − r+
r − r−






1
1
=q ⎜

⎟.
2
2
⎜ ⎛
h⎞
h⎞

2
2
2
2⎟
⎜x + ⎟ + y + z ⎟
⎜ ⎜⎝ x − ⎟⎠ + y + z

2
2⎠



(30)

Так как поле симметрично относительно оси х, то достаточно предста(
вить его картину в какой(либо плоскости, проходящей через эту ось,
например в плоскости xOz. На рис. 128 изображены сплошными ли(
ниями следы пересечения плоскостью xOz эквипотенциальных по(
верхностей, которые получаются, если приравнять правую часть (30)

346

ТЕОРИЯ ПОЛЯ

[Гл. X

§ 6]

ПРИМЕРЫ

347

d
означает производную, полученную при изменении положения
dl
заряда (она отличается от производной, полученной при изменении
положения точки наблюдения M, множителем –1). Упрощая правую
часть (31), получим (проверьте!)
где

⎛ 1 dr 3r dr ⎞ m ⎛ 3r
0⎞
E =m⎜ 3

⎟ = ⎜ cos α − l ⎟ ,

⎝ r dl r4 dl⎠ r3 ⎝ r

где l 0 — единичный вектор, идущий по оси l, а α — угол между век(
торами l 0 и r .
Аналогичное рассмотрение потенциала диполя дает выражение
ϕ=m

Рис. 128.

Если принять ось диполя совпадающей с осью x и, подобно рис. 128, рас(
смотреть картину в плоскости xOz, то мы получим cosα = x r, т.е.
x
x
. На рис. 130 показаны следы эквипотенциальных
ϕ=m 3 =m 2
r
(x + z 2 ) 3 2
поверхностей (это овальные поверхности шестого порядка) и электричес(
кие силовые линии, которые, как видим, начинаются на диполе и на нем же
заканчиваются. (Подумайте, как получить рис. 130 из рис. 128.)

}

постоянной (это — замкнутые овальные поверхности восьмого поряд(
ка). Пунктиром изображены силовые линии; они начинаются на поло(
жительном заряде (это — «источник» силовых линий, имеющий
«обильность» 4πq) и заканчиваются на отрицательном (это — «сток»).
В силу соотношения (20) эти линии нормальны к эквипотенциальным
поверхностям (пересекают их под прямым углом).
Если h бесконечно мало´, т.е. источник и сток расположены в беско(
нечной близости друг от друга, то система зарядов называется диполем.
Однако если при этом сами заряды остают(
M
ся конечными, то их поля просто взаимно
r r1
уничтожаются, так что в сумме получается
нулевое поле. Поэтому интерес представ(
l
ляет только случай, когда заряды беско(
α
нечно большие, причем такие, чтобы про(
изведение m = qh (это произведение на(
q
зывается моментом диполя) оставалось ко(
h
–q
нечным. Диполь в пространстве характери(
Рис. 129.
зуется не только местом расположения и мо(
ментом, но и направлением, для получения которого нужно провести ось
через заряды в направлении от отрицательного к положительному.
Для вывода поля от диполя рассмотрим рис. 129, где l — ось дипо(
ля. При достаточно малом h в любой точке M будет

d ⎛ 1⎞
cos α
⎜ ⎟ =m 2 .
dl ⎝ r⎠
r

E=

q
q
r1 − 3 r3 = qh
r13
r

r1 r

r13 r 3
h

=m

d ⎛ r⎞
⎜ ⎟,
dl ⎝ r3⎠

(31)
Рис. 130.

346

ТЕОРИЯ ПОЛЯ

[Гл. X

§ 6]

ПРИМЕРЫ

347

d
означает производную, полученную при изменении положения
dl
заряда (она отличается от производной, полученной при изменении
положения точки наблюдения M, множителем –1). Упрощая правую
часть (31), получим (проверьте!)
где

⎛ 1 dr 3r dr ⎞ m ⎛ 3r
0⎞
E =m⎜ 3

⎟ = ⎜ cos α − l ⎟ ,

⎝ r dl r4 dl⎠ r3 ⎝ r

где l 0 — единичный вектор, идущий по оси l, а α — угол между век(
торами l 0 и r .
Аналогичное рассмотрение потенциала диполя дает выражение
ϕ=m

Рис. 128.

Если принять ось диполя совпадающей с осью x и, подобно рис. 128, рас(
смотреть картину в плоскости xOz, то мы получим cosα = x r, т.е.
x
x
. На рис. 130 показаны следы эквипотенциальных
ϕ=m 3 =m 2
r
(x + z 2 ) 3 2
поверхностей (это овальные поверхности шестого порядка) и электричес(
кие силовые линии, которые, как видим, начинаются на диполе и на нем же
заканчиваются. (Подумайте, как получить рис. 130 из рис. 128.)

}

постоянной (это — замкнутые овальные поверхности восьмого поряд(
ка). Пунктиром изображены силовые линии; они начинаются на поло(
жительном заряде (это — «источник» силовых линий, имеющий
«обильность» 4πq) и заканчиваются на отрицательном (это — «сток»).
В силу соотношения (20) эти линии нормальны к эквипотенциальным
поверхностям (пересекают их под прямым углом).
Если h бесконечно мало´, т.е. источник и сток расположены в беско(
нечной близости друг от друга, то система зарядов называется диполем.
Однако если при этом сами заряды остают(
M
ся конечными, то их поля просто взаимно
r r1
уничтожаются, так что в сумме получается
нулевое поле. Поэтому интерес представ(
l
ляет только случай, когда заряды беско(
α
нечно большие, причем такие, чтобы про(
изведение m = qh (это произведение на(
q
зывается моментом диполя) оставалось ко(
h
–q
нечным. Диполь в пространстве характери(
Рис. 129.
зуется не только местом расположения и мо(
ментом, но и направлением, для получения которого нужно провести ось
через заряды в направлении от отрицательного к положительному.
Для вывода поля от диполя рассмотрим рис. 129, где l — ось дипо(
ля. При достаточно малом h в любой точке M будет

d ⎛ 1⎞
cos α
⎜ ⎟ =m 2 .
dl ⎝ r⎠
r

E=

q
q
r1 − 3 r3 = qh
r13
r

r1 r

r13 r 3
h

=m

d ⎛ r⎞
⎜ ⎟,
dl ⎝ r3⎠

(31)
Рис. 130.

348

ТЕОРИЯ ПОЛЯ

[Гл. X

Упражнения
1. Вычислите поле от бесконечной однородной заряженной прямолиней(
ной нити с помощью интегрирования.
2. Вычислите поле от бесконечной однородной заряженной плоскости
с помощью интегрирования.
3. Вычислите поле и потенциал от «плоского диполя», представляющего
собой результат наложения двух противоположно заряженных однородных
прямолинейных бесконечно близких нитей.

§ 7. Общее векторное поле и его дивергенция
Теперь легко сформулировать введенные понятия в общем виде, для
некоторого стационарного векторного поля A = A(M ), независимо от
его физического смысла. Естественно обобщается понятие векторных
линий как линий, идущих в каждой своей точке вдоль поля. Как и в § 4,
вводится понятие потока вектора A через ориентированную повер(
хность (σ) по формуле Q =

∫ An

dσ =

( σ)

∫ A ⋅ dσ. Этот поток иначе назы(

( σ)

вается количеством векторных линий, пересекающих (σ) изнутри
наружу.
Как и в § 5, можно рассматривать поток вектора A через замкну(
тую поверхность (σ),
Q=

∫ A ⋅ dσ.

(32)

( σ)

Такой поток обладает следующим простым свойством: если некоторое
тело (Ω) с помощью каких(то поверхностей разбито на части (Ω 1 ),
(Ω 2 ), . . . , то поток поля через поверхность тела (Ω) изнутри наружу
равен сумме аналогичных потоков, взя(
тых для каждого из тел (Ω 1 ), (Ω 2 ), . . .
Например, на рис. 131 показано разбие(
ние (Ω) на две части, (Ω 1 ) и (Ω 2 ). По(
ток вектора A через поверхность тела
(Ω 1 ) можно представить в виде суммы
двух интегралов, по (σ 1 ) и по (σ 3 ); по(
ток же через поверхность тела (Ω 2 ) ра(
Рис. 131.
вен сумме интегралов по (σ 2 ) и по (σ 3 ).
Если сложить эти потоки, то интегралы
по (σ 3 ) взаимно уничтожатся (почему?), а интегралы по (σ 1 ) и по
(σ 2 ) в сумме дадут поток вектора A через поверхность тела (Ω).
Доказанное свойство дает возможность истолковать интеграл (32)
как количество векторных линий, начинающихся внутри объема (Ω),
ограниченного поверхностью (σ). Если Q > 0, то говорят, что в (Ω)
имеется источник векторных линий, a Q называется обильностью этого

§ 7]

ОБЩЕЕ ВЕКТОРНОЕ ПОЛЕ И ЕГО ДИВЕРГЕНЦИЯ

349

источника. Если Q < 0, то говорят, что в (Ω) имеется сток или, что то
же, источник отрицательной обильности; для простоты мы будем всег(
да считать сток частным случаем источника. Если Q = 0, то либо в (Ω)
нет ни источников, ни стоков, либо же они взаимно компенсируются;
впрочем, и при Q ≠ 0 в (Ω) могут быть как источники, так и стоки, ко(
торые, однако, в этом случае компенсируются не полностью.
Пусть векторные линии возникают по всему пространству. Можно
говорить о средней плотности источника Q Ω в любом объеме (Ω)
(под Ω понимается численное значение объема (Ω)) и о плотности
источника в любой точке М пространства; эта плотность равна

lim

( ΔΩ )→ M

ΔQ
= lim
ΔΩ ( ΔΩ )→ M

∫ A ⋅ dσ

( Δσ )

ΔΩ

,

(33)

где под (ΔΩ) понимается малый объем, содержащий точку М, а под
(Δσ) — его поверхность. Эта плотность источника называется также ди
вергенцией (по(русски расходимостью) векторного поля A и обозна(
чается через div A. Таким образом, можно сказать, что дивергенция
векторного поля — это количество векторных линий, начинающихся в
бесконечно малом объеме (или, что то же, поток поля A через повер(
хность этого объема), отнесенное к единице этого объема. Отметим, что
дивергенция векторного поля есть величина скалярная или, точнее, об(
разует скалярное поле, так как она принимает в каждой точке простра(
нства свое значение.
Формулу (33) можно переписать в виде
div A =

dQ
,


т.е. dQ = div A dΩ.

(34)

Получилось выражение для количества векторных линий, начинаю(
щихся в элементарном объеме (dΩ). Производя суммирование
(§ IV.7), получаем выражение для количества векторных линий, начи(
нающихся в конечном объеме (Ω), т.е. для потока вектора A,

∫ A ⋅ dσ = ∫ div A dΩ,

( σ)

(35)

( σ)

где (Ω) —конечный объем, а (σ) — его поверхность. Эта важная фор(
мула называется формулой Остроградского.
Иногда оказывается удобным подсчитать дивергенцию непосред(
ственно на основе ее определения (33). Рассмотрим, например, цен(
трально(симметричное поле в пространстве, определенное формулой
A = f ( r ) r0 .

(36)

348

ТЕОРИЯ ПОЛЯ

[Гл. X

Упражнения
1. Вычислите поле от бесконечной однородной заряженной прямолиней(
ной нити с помощью интегрирования.
2. Вычислите поле от бесконечной однородной заряженной плоскости
с помощью интегрирования.
3. Вычислите поле и потенциал от «плоского диполя», представляющего
собой результат наложения двух противоположно заряженных однородных
прямолинейных бесконечно близких нитей.

§ 7. Общее векторное поле и его дивергенция
Теперь легко сформулировать введенные понятия в общем виде, для
некоторого стационарного векторного поля A = A(M ), независимо от
его физического смысла. Естественно обобщается понятие векторных
линий как линий, идущих в каждой своей точке вдоль поля. Как и в § 4,
вводится понятие потока вектора A через ориентированную повер(
хность (σ) по формуле Q =

∫ An

dσ =

( σ)

∫ A ⋅ dσ. Этот поток иначе назы(

( σ)

вается количеством векторных линий, пересекающих (σ) изнутри
наружу.
Как и в § 5, можно рассматривать поток вектора A через замкну(
тую поверхность (σ),
Q=

∫ A ⋅ dσ.

(32)

( σ)

Такой поток обладает следующим простым свойством: если некоторое
тело (Ω) с помощью каких(то поверхностей разбито на части (Ω 1 ),
(Ω 2 ), . . . , то поток поля через поверхность тела (Ω) изнутри наружу
равен сумме аналогичных потоков, взя(
тых для каждого из тел (Ω 1 ), (Ω 2 ), . . .
Например, на рис. 131 показано разбие(
ние (Ω) на две части, (Ω 1 ) и (Ω 2 ). По(
ток вектора A через поверхность тела
(Ω 1 ) можно представить в виде суммы
двух интегралов, по (σ 1 ) и по (σ 3 ); по(
ток же через поверхность тела (Ω 2 ) ра(
Рис. 131.
вен сумме интегралов по (σ 2 ) и по (σ 3 ).
Если сложить эти потоки, то интегралы
по (σ 3 ) взаимно уничтожатся (почему?), а интегралы по (σ 1 ) и по
(σ 2 ) в сумме дадут поток вектора A через поверхность тела (Ω).
Доказанное свойство дает возможность истолковать интеграл (32)
как количество векторных линий, начинающихся внутри объема (Ω),
ограниченного поверхностью (σ). Если Q > 0, то говорят, что в (Ω)
имеется источник векторных линий, a Q называется обильностью этого

§ 7]

ОБЩЕЕ ВЕКТОРНОЕ ПОЛЕ И ЕГО ДИВЕРГЕНЦИЯ

349

источника. Если Q < 0, то говорят, что в (Ω) имеется сток или, что то
же, источник отрицательной обильности; для простоты мы будем всег(
да считать сток частным случаем источника. Если Q = 0, то либо в (Ω)
нет ни источников, ни стоков, либо же они взаимно компенсируются;
впрочем, и при Q ≠ 0 в (Ω) могут быть как источники, так и стоки, ко(
торые, однако, в этом случае компенсируются не полностью.
Пусть векторные линии возникают по всему пространству. Можно
говорить о средней плотности источника Q Ω в любом объеме (Ω)
(под Ω понимается численное значение объема (Ω)) и о плотности
источника в любой точке М пространства; эта плотность равна

lim

( ΔΩ )→ M

ΔQ
= lim
ΔΩ ( ΔΩ )→ M

∫ A ⋅ dσ

( Δσ )

ΔΩ

,

(33)

где под (ΔΩ) понимается малый объем, содержащий точку М, а под
(Δσ) — его поверхность. Эта плотность источника называется также ди
вергенцией (по(русски расходимостью) векторного поля A и обозна(
чается через div A. Таким образом, можно сказать, что дивергенция
векторного поля — это количество векторных линий, начинающихся в
бесконечно малом объеме (или, что то же, поток поля A через повер(
хность этого объема), отнесенное к единице этого объема. Отметим, что
дивергенция векторного поля есть величина скалярная или, точнее, об(
разует скалярное поле, так как она принимает в каждой точке простра(
нства свое значение.
Формулу (33) можно переписать в виде
div A =

dQ
,


т.е. dQ = div A dΩ.

(34)

Получилось выражение для количества векторных линий, начинаю(
щихся в элементарном объеме (dΩ). Производя суммирование
(§ IV.7), получаем выражение для количества векторных линий, начи(
нающихся в конечном объеме (Ω), т.е. для потока вектора A,

∫ A ⋅ dσ = ∫ div A dΩ,

( σ)

(35)

( σ)

где (Ω) —конечный объем, а (σ) — его поверхность. Эта важная фор(
мула называется формулой Остроградского.
Иногда оказывается удобным подсчитать дивергенцию непосред(
ственно на основе ее определения (33). Рассмотрим, например, цен(
трально(симметричное поле в пространстве, определенное формулой
A = f ( r ) r0 .

(36)

350

ТЕОРИЯ ПОЛЯ

[Гл. X

Как было показано в § 4 (формулы (16)–(17)), поток поля через сферу
радиуса r с центром в начале координат равен Q (r) = 4πr 2 f (r), а по(
тому количество векторных линий, начинающихся в тонком слое меж(
ду двумя такими сферами, равно dQ = 4πd r 2 f (r) = 4π [2r f (r) +
2

[

]

+ r f ′(r) dr.

]

Значит, на единицу объема этого слоя приходится
div A =

2
dQ
= f ( r ) + f ′( r ).
4 πr 2 dr r

(37)

В частности, центрально(симметричное поле без источников вне
начала координат характеризуется тем, что
2
f ( r ) + f ′( r ) = 0,
r

откуда f ( r ) =

C
(C = const ).
r2

Мы пришли к закону Ньютона (10). В силу формулы (17) в само´м нача(
ле координат в данном случае начинается Cr −2 ⋅ 4πr 2 = 4πC вектор(
ных линий. Но точечный источник обильности 4πC в начале
координат имеет плотность 4πC δ(r ). Таким образом, в силу (34)
⎛C

div ⎜ 2 r 0 ⎟ = 4 πC δ(r ),
⎝r


⎛r ⎞
т.е. div ⎜ 3 ⎟ = 4 π δ(r ).
⎝r ⎠

(38)

В этом важном примере забвение дельта(функции привело бы к грубой
ошибке! Здесь фигурирует трехмерная δ(функция (см. § VI.3):
δ(r ) = δ(x) δ(y) δ( z ). Пользование дельта(функцией гораздо удобнее
длинных словесных формулировок: «дивергенция равна нулю везде,
кроме особой точки поля, где она бесконечна» и т.п. Начало координат
является особой точкой, так как плотность источника векторных ли(
ний в этой точке бесконечна. В этом примере все векторные линии ухо(
дят в бесконечность. Подумайте, где начинаются и где заканчиваются
(или куда уходят) векторные линии, если f (r) при r → 0 возрастает
медленнее или быстрее, чем r −2 .
Определение дивергенции (33) было дано в инвариантной форме, не
зависящей от выбора системы координат.
Представляет интерес также вывести фор(
мулу для вычисления дивергенции с по(
мощью декартовой системы коорди(
нат х, у, z. Для этого воспользуемся тем,
что в формуле (34) форма элементарного
объема d(Ω) несущественна, и выберем
в качестве этого объема бесконечно малый
прямоугольный параллелепипед с ребрами,
параллельными осям координат (рис. 132).
Рис. 132.

§ 7]

ОБЩЕЕ ВЕКТОРНОЕ ПОЛЕ И ЕГО ДИВЕРГЕНЦИЯ

351

Тогда поток dQ вектора А через поверхность параллелепипеда (т.е.
числитель дроби, стоящий в первой формуле (34)) можно представить
в виде суммы шести слагаемых, отвечающих шести граням параллеле(
пипеда. Рассмотрим сумму двух из этихслагаемых, отвечающих задней
и передней граням, которые мы обозначим соответственно цифрами I
и II. Тогда (An ) ΙΙ = (Ax ) ΙΙ , (An ) Ι = −(Ax ) Ι (почему?), и потому ука(
занную сумму можно записать в виде

(∫ A

n



) + (∫ A
Ι

n



)

ΙΙ

= − ∫ ( Ax )Ι dσ + ∫ ( Ax )ΙΙ dσ = ∫ [( Ax )ΙΙ − ( Ax )Ι ] dσ.

Подынтегральная функция с точностью до малых высшего порядка
∂Ax
равна ∂ x Ax =
dx; это «частный дифференциал» от Ax по х, по(
∂x
лучающийся из(за того, что точки передней грани отличаются от соот(
ветствующих точек задней грани значением координаты х. Поэтому
весь интеграл, с точностью до членов высшего порядка малости, равен
∂Ax
∂A
dx ∫ dσ = x dx dy dz.
∂x
∂x

Проводя аналогичные вычисления для двух других пар граней, полу(
чим весь элементарный поток
∂A y ∂A z ⎞
⎛ ∂A
dQ = ⎜ x +
+
⎟ dx dy dz.
⎝ ∂x
∂y
∂z ⎠

Но так как dV = dx dy dz , то в силу первой формулы (34) получаем
окончательно
divA =

∂Ax ∂A y ∂A z
.
+
+
∂x
∂y
∂z

(39)

В заключение обратим внимание на следующее обстоятельство. Из
формулы (33) хорошо видно, что поток вектора через малую замкну(
тую поверхность имеет порядок не площади этой поверхности (как
можно было бы ожидать от интеграла по поверхности), а ограниченно(
го ею объема, т.е. по сравнению с линейными размерами имеет не вто(
рой, а третий порядок малости. Это можно объяснить следующим
образом. Поток вектора через разомкнутую поверхность, действитель(
но, имеет второй порядок малости. Однако поток постоянного вектора
через замкнутую поверхность всегда равен нулю! (Это свойство легко
вытекает из предыдущего материала; докажите его, например, с по(
мощью последней формулы § 4 или формулы (35).) Поэтому если
внутри малой замкнутой поверхности разложить поле по формуле
Тейлора (§ IV.6), то интеграл от первого, постоянного члена даст нуль,

350

ТЕОРИЯ ПОЛЯ

[Гл. X

Как было показано в § 4 (формулы (16)–(17)), поток поля через сферу
радиуса r с центром в начале координат равен Q (r) = 4πr 2 f (r), а по(
тому количество векторных линий, начинающихся в тонком слое меж(
ду двумя такими сферами, равно dQ = 4πd r 2 f (r) = 4π [2r f (r) +
2

[

]

+ r f ′(r) dr.

]

Значит, на единицу объема этого слоя приходится
div A =

2
dQ
= f ( r ) + f ′( r ).
4 πr 2 dr r

(37)

В частности, центрально(симметричное поле без источников вне
начала координат характеризуется тем, что
2
f ( r ) + f ′( r ) = 0,
r

откуда f ( r ) =

C
(C = const ).
r2

Мы пришли к закону Ньютона (10). В силу формулы (17) в само´м нача(
ле координат в данном случае начинается Cr −2 ⋅ 4πr 2 = 4πC вектор(
ных линий. Но точечный источник обильности 4πC в начале
координат имеет плотность 4πC δ(r ). Таким образом, в силу (34)
⎛C

div ⎜ 2 r 0 ⎟ = 4 πC δ(r ),
⎝r


⎛r ⎞
т.е. div ⎜ 3 ⎟ = 4 π δ(r ).
⎝r ⎠

(38)

В этом важном примере забвение дельта(функции привело бы к грубой
ошибке! Здесь фигурирует трехмерная δ(функция (см. § VI.3):
δ(r ) = δ(x) δ(y) δ( z ). Пользование дельта(функцией гораздо удобнее
длинных словесных формулировок: «дивергенция равна нулю везде,
кроме особой точки поля, где она бесконечна» и т.п. Начало координат
является особой точкой, так как плотность источника векторных ли(
ний в этой точке бесконечна. В этом примере все векторные линии ухо(
дят в бесконечность. Подумайте, где начинаются и где заканчиваются
(или куда уходят) векторные линии, если f (r) при r → 0 возрастает
медленнее или быстрее, чем r −2 .
Определение дивергенции (33) было дано в инвариантной форме, не
зависящей от выбора системы координат.
Представляет интерес также вывести фор(
мулу для вычисления дивергенции с по(
мощью декартовой системы коорди(
нат х, у, z. Для этого воспользуемся тем,
что в формуле (34) форма элементарного
объема d(Ω) несущественна, и выберем
в качестве этого объема бесконечно малый
прямоугольный параллелепипед с ребрами,
параллельными осям координат (рис. 132).
Рис. 132.

§ 7]

ОБЩЕЕ ВЕКТОРНОЕ ПОЛЕ И ЕГО ДИВЕРГЕНЦИЯ

351

Тогда поток dQ вектора А через поверхность параллелепипеда (т.е.
числитель дроби, стоящий в первой формуле (34)) можно представить
в виде суммы шести слагаемых, отвечающих шести граням параллеле(
пипеда. Рассмотрим сумму двух из этих слагаемых, отвечающих задней
и передней граням, которые мы обозначим соответственно цифрами I
и II. Тогда (An ) ΙΙ = (Ax ) ΙΙ , (An ) Ι = −(Ax ) Ι (почему?), и потому ука(
занную сумму можно записать в виде

(∫ A

n



) + (∫ A
Ι

n



)

ΙΙ

= − ∫ ( Ax )Ι dσ + ∫ ( Ax )ΙΙ dσ = ∫ [( Ax )ΙΙ − ( Ax )Ι ] dσ.

Подынтегральная функция с точностью до малых высшего порядка
∂Ax
равна ∂ x Ax =
dx; это «частный дифференциал» от Ax по х, по(
∂x
лучающийся из(за того, что точки передней грани отличаются от соот(
ветствующих точек задней грани значением координаты х. Поэтому
весь интеграл, с точностью до членов высшего порядка малости, равен
∂Ax
∂A
dx ∫ dσ = x dx dy dz.
∂x
∂x

Проводя аналогичные вычисления для двух других пар граней, полу(
чим весь элементарный поток
∂A y ∂A z ⎞
⎛ ∂A
dQ = ⎜ x +
+
⎟ dx dy dz.
⎝ ∂x
∂y
∂z ⎠

Но так как dV = dx dy dz , то в силу первой формулы (34) получаем
окончательно
divA =

∂Ax ∂A y ∂A z
.
+
+
∂x
∂y
∂z

(39)

В заключение обратим внимание на следующее обстоятельство. Из
формулы (33) хорошо видно, что поток вектора через малую замкну(
тую поверхность имеет порядок не площади этой поверхности (как
можно было бы ожидать от интеграла по поверхности), а ограниченно(
го ею объема, т.е. по сравнению с линейными размерами имеет не вто(
рой, а третий порядок малости. Это можно объяснить следующим
образом. Поток вектора через разомкнутую поверхность, действитель(
но, имеет второй порядок малости. Однако поток постоянного вектора
через замкнутую поверхность всегда равен нулю! (Это свойство легко
вытекает из предыдущего материала; докажите его, например, с по(
мощью последней формулы § 4 или формулы (35).) Поэтому если
внутри малой замкнутой поверхности разложить поле по формуле
Тейлора (§ IV.6), то интеграл от первого, постоянного члена даст нуль,

352

ТЕОРИЯ ПОЛЯ

[Гл. X

а интеграл от членов первого порядка малости будет иметь третий по(
рядок малости.
Сделанное замечание не относится к случаю, когда внутри замкну(
той поверхности находятся особенности поля, в которых объемная
плотность источника обращается в бесконечность. Если внутри повер(
хности имеется источник векторных линий, распределенный по пло(
щади, то поток имеет второй порядок малости; если источник
распределен по линии, то поток имеет первый порядок малости (про(
порционален длине линии); наконец, поток через поверхность, внутри
которой имеется точечный источник (т.е. дивергенция имеет характер
дельта(функции), вообще не является малым. Именно с таким случаем
мы столкнулись выше в весьма важном случае кулоновского поля (см.
формулу (38)).
Упражнения
1. Пользуясь формулой Остроградского, найдите поток через сферу
x + y 2 + z 2 = R 2 изнутри наружу полей A = 2xi + yk; B = y 2i − z 2 j.
2. Получите формулу (37) с помощью формулы (39).
3. Найдите дивергенцию плоскопараллельного осесимметричного поля
A = f( _ ) _0 . В каком случае это поле не имеет источников вне оси z?
2

§ 8. Дивергенция поля скорости и уравнение неразрывности
Вернемся теперь к рассмотрению стационарного течения газа (см.
§ 4) и будем считать, что в процессе течения масса газа не меняется.
В § 4 мы установили, что поток вектора скорости v через ориентиро(
ванную поверхность (σ) равен объему газа, проносимому через (σ)
в единицу времени изнутри наружу. Значит, если поверхность (σ) за(
мкнутая, то этот поток равен разности между объемом, выходящим за
единицу времени из (σ) по той части поверхности, где v направлено
наружу, и объемом, входящим внутрь (σ) по той части поверхности,
где v направлено внутрь.
Почему поток вектора v через замкнутую поверхность может быть
отличным от нуля? Если газ считается несжимаемым в процессе тече(
ния (так будет при рассмотрении скоростей течения, значительно
меньших скорости звука, а также при рассмотрении жидкостей), то
втекающий объем равен вытекающему и потому указанный поток ра(
вен нулю. Однако, если (σ) находится в зоне, где газ по мере течения
расширяется, то вытекающий объем будет больше втекающего и пото(
му суммарный поток будет положительным; аналогично в зоне сжатия
суммарный поток отрицателен.
Теперь ясно, что такое дивергенция вектора скорости. В силу § 7,
чтобы получить div v, надо разделить поток вектора v через повер(
хность бесконечно малого объема (dΩ) на численное значение dΩ этого

§ 8] ДИВЕРГЕНЦИЯ ПОЛЯ СКОРОСТИ И УРАВНЕНИЕ НЕРАЗРЫВНОСТИ

353

объема. Таким образом, получается отношение объема, «рождающегося»
в (dΩ) за единицу времени, к объему dΩ; это отношение естественно
назвать «скоростью относительного увеличения объема». Отсюда
ясно, что равенство div v = 0 — это условие несжимаемости газа, а со(
отношения div v > 0 и div v < 0 выполняются соответственно в зоне
расширения и в зоне сжатия.
Рассмотрим поле «массовой скорости» ρv. В § 4 мы показали, что
поток такого вектора через ориентированную поверхность (σ) равен
массе газа, проносимого за единицу времени через (σ) изнутри нару(
жу. Но так как масса газа остается неизменной, то полный поток вектора
ρv через любую замкнутую поверхность обязательно равен нулю, так
как внутрь такой поверхности втекает такая же масса, как и вытекает из
нее. Так будет и для бесконечно малого объема, и потому в силу § 7 мы
приходим к равенству
div (ρv ) = 0

(40)

для стационарного течения, при котором внутри каждого элемента об(
ъема масса газа с течением времени не меняется. Это уравнение нераз
рывности — одно из основных соотношений гидродинамики, выража(
ющее закон сохранения массы.
Распишем это выражение в координатах. Вектор ρv имеет, очевид(
но, компоненты ρv x , ρv y , ρv z . Поэтому
div (ρv ) =




(ρv x ) + (ρv y ) + (ρv z )=
∂x
∂y
∂z
∂v y ∂v z ⎞
⎛ ∂v
∂ρ
∂ρ
∂ρ
=ρ⎜ x +
+
+ vy
+ vz
= ρ div v + v ⋅ grad ρ
⎟ + vx
⎝ ∂x
∂y
∂z ⎠
∂x
∂y
∂z

(иным путем это будет выведено в § XI.8). Следовательно, условие со(
хранения массы приводит к соотношению
1
div v = − v ⋅ grad ρ.
ρ

Для несжимаемой жидкости ρ = const, grad ρ = 0, div v = 0. Что такое
величина v ⋅ grad ρ в стационарном потоке сжимаемой жидкости
(именно такой поток мы рассматриваем, для него div (ρv ) = 0)? Най(
дем изменение плотности частицы. В стационарном потоке
ρ = ρ( x, y, z ), плотность в д а н н о й т о ч к е не зависит от t, т.е. ∂ρ ∂t = 0.
Но когда мы переходим к рассмотрению д а н н о й ч а с т и ц ы, то нуж(
но учесть, что ее координаты зависят от времени. Скорость v как раз
и характеризует эту зависимость:
dx
= vx ,
dt

dy
= v y,
dt

dz
= vz.
dt

352

ТЕОРИЯ ПОЛЯ

[Гл. X

а интеграл от членов первого порядка малости будет иметь третий по(
рядок малости.
Сделанное замечание не относится к случаю, когда внутри замкну(
той поверхности находятся особенности поля, в которых объемная
плотность источника обращается в бесконечность. Если внутри повер(
хности имеется источник векторных линий, распределенный по пло(
щади, то поток имеет второй порядок малости; если источник
распределен по линии, то поток имеет первый порядок малости (про(
порционален длине линии); наконец, поток через поверхность, внутри
которой имеется точечный источник (т.е. дивергенция имеет характер
дельта(функции), вообще не является малым. Именно с таким случаем
мы столкнулись выше в весьма важном случае кулоновского поля (см.
формулу (38)).
Упражнения
1. Пользуясь формулой Остроградского, найдите поток через сферу
x + y 2 + z 2 = R 2 изнутри наружу полей A = 2xi + yk; B = y 2i − z 2 j.
2. Получите формулу (37) с помощью формулы (39).
3. Найдите дивергенцию плоскопараллельного осесимметричного поля
A = f( _ ) _0 . В каком случае это поле не имеет источников вне оси z?
2

§ 8. Дивергенция поля скорости и уравнение неразрывности
Вернемся теперь к рассмотрению стационарного течения газа (см.
§ 4) и будем считать, что в процессе течения масса газа не меняется.
В § 4 мы установили, что поток вектора скорости v через ориентиро(
ванную поверхность (σ) равен объему газа, проносимому через (σ)
в единицу времени изнутри наружу. Значит, если поверхность (σ) за(
мкнутая, то этот поток равен разности между объемом, выходящим за
единицу времени из (σ) по той части поверхности, где v направлено
наружу, и объемом, входящим внутрь (σ) по той части поверхности,
где v направлено внутрь.
Почему поток вектора v через замкнутую поверхность может быть
отличным от нуля? Если газ считается несжимаемым в процессе тече(
ния (так будет при рассмотрении скоростей течения, значительно
меньших скорости звука, а также при рассмотрении жидкостей), то
втекающий объем равен вытекающему и потому указанный поток ра(
вен нулю. Однако, если (σ) находится в зоне, где газ по мере течения
расширяется, то вытекающий объем будет больше втекающего и пото(
му суммарный поток будет положительным; аналогично в зоне сжатия
суммарный поток отрицателен.
Теперь ясно, что такое дивергенция вектора скорости. В силу § 7,
чтобы получить div v, надо разделить поток вектора v через повер(
хность бесконечно малого объема (dΩ) на численное значение dΩ этого

§ 8] ДИВЕРГЕНЦИЯ ПОЛЯ СКОРОСТИ И УРАВНЕНИЕ НЕРАЗРЫВНОСТИ

353

объема. Таким образом, получается отношение объема, «рождающегося»
в (dΩ) за единицу времени, к объему dΩ; это отношение естественно
назвать «скоростью относительного увеличения объема». Отсюда
ясно, что равенство div v = 0 — это условие несжимаемости газа, а со(
отношения div v > 0 и div v < 0 выполняются соответственно в зоне
расширения и в зоне сжатия.
Рассмотрим поле «массовой скорости» ρv. В § 4 мы показали, что
поток такого вектора через ориентированную поверхность (σ) равен
массе газа, проносимого за единицу времени через (σ) изнутри нару(
жу. Но так как масса газа остается неизменной, то полный поток вектора
ρv через любую замкнутую поверхность обязательно равен нулю, так
как внутрь такой поверхности втекает такая же масса, как и вытекает из
нее. Так будет и для бесконечно малого объема, и потому в силу § 7 мы
приходим к равенству
div (ρv ) = 0

(40)

для стационарного течения, при котором внутри каждого элемента об(
ъема масса газа с течением времени не меняется. Это уравнение нераз
рывности — одно из основных соотношений гидродинамики, выража(
ющее закон сохранения массы.
Распишем это выражение в координатах. Вектор ρv имеет, очевид(
но, компоненты ρv x , ρv y , ρv z . Поэтому
div (ρv ) =




(ρv x ) + (ρv y ) + (ρv z )=
∂x
∂y
∂z
∂v y ∂v z ⎞
⎛ ∂v
∂ρ
∂ρ
∂ρ
=ρ⎜ x +
+
+ vy
+ vz
= ρ div v + v ⋅ grad ρ
⎟ + vx
⎝ ∂x
∂y
∂z ⎠
∂x
∂y
∂z

(иным путем это будет выведено в § XI.8). Следовательно, условие со(
хранения массы приводит к соотношению
1
div v = − v ⋅ grad ρ.
ρ

Для несжимаемой жидкости ρ = const, grad ρ = 0, div v = 0. Что такое
величина v ⋅ grad ρ в стационарном потоке сжимаемой жидкости
(именно такой поток мы рассматриваем, для него div (ρv ) = 0)? Най(
дем изменение плотности частицы. В стационарном потоке
ρ = ρ( x, y, z ), плотность в д а н н о й т о ч к е не зависит от t, т.е. ∂ρ ∂t = 0.
Но когда мы переходим к рассмотрению д а н н о й ч а с т и ц ы, то нуж(
но учесть, что ее координаты зависят от времени. Скорость v как раз
и характеризует эту зависимость:
dx
= vx ,
dt

dy
= v y,
dt

dz
= vz.
dt

354

ТЕОРИЯ ПОЛЯ

[Гл. X

По общему правилу (ср. формулу (IV.5)), рассматривая ρ = [ρ( x(t),
y(t), z (t)] = ρ(t), найдем
dρ ∂ρ dx ∂ρ dy ∂ρ dz
=
+
+
= v ⋅ grad ρ.
dt ∂x dt ∂y dt ∂z dt

Итак,
div v = −

1 dρ
.
ρ dt

Это и есть количественное выражение сделанных выше высказываний
о div v в области, где газ сжимается (dρ dt > 0) или расширяется
∂ρ
= 0.
(dρ dt < 0) при
∂t
Рассмотрим теперь нестационарное течение газа, когда поле скорос(
тей и другие рассматриваемые здесь поля меняются с течением времени.
Тогда все введенные ранее понятия нужно (как и в случае нестационар(
ного поля с любым физическим смыслом) рассматривать для любого
фиксированного момента времени. При этом линии тока (т.е. линии,
которые строятся в любой фиксированный момент времени и в этот
момент в каждой точке идут вдоль вектора скорости) уже не совпадают
с траекториями частиц жидкости (подумайте, почему!).
Если в нестационарном случае рассмотреть некоторый объем (dΩ),
то здесь поток вектора ρv через поверхность, равный в силу формулы
(34) div (ρv) dΩ, дает скорость уменьшения массы газа в этом объеме,
т.е. массу газа, выходящего из этого объема за единицу времени. Одна(
ко масса газа, содержащегося в бесконечно малом объеме (dΩ), равна
ρ dΩ и потому увеличивается* со скоростью

∂ρ
(ρ dΩ ) =
dΩ.
∂t
∂t

§ 9] ДИВЕРГЕНЦИЯ ЭЛЕКТРИЧЕСКОГО ПОЛЯ И УРАВНЕНИЕ ПУАССОНА

исчезает. В стационарном случае уравнение (41), очевидно, переходит
в уравнение (40).

В нестационарном случае скорость
изменения плотности в час(
dt
∂ρ
изменения плотности в фиксирован(
тице (в отличие от скорости
∂t
ной точке) равна
dρ ∂ρ
=
+ v ⋅ grad ρ.
dt ∂t

Отсюда и из (41) найдем, что в нестационарном случае формула
div v = −

Упражнение
Пусть рассматривается поток «нейтронного газа» в реакторе, причем нейт(
роны поступают в поток по всему объему за счет реакции деления ядер урана,
происходящей в данном объеме. Как изменится уравнение неразрывности?

§ 9. Дивергенция электрического поля и уравнение Пуассона
Пусть в пространстве распределен заряд с некоторой плотностью ρ,
и им порождается электрическое поле E. В § 5 мы видели, что поток Q
вектора E через поверхность любого тела (Ω), т.е. количество элек(
трических силовых линий, начинающихся в (Ω), равняется произведе(
нию 4π на заряд q, содержащийся в (Ω). Отсюда, если объем
бесконечно мал, получаем
div E =

∂ρ
dΩ,
∂t

dQ d (4 πq )
dq
,
=
= 4π




т.е. окончательно

откуда
∂ρ
+ div(ρv ) = 0.
∂t

1 dρ
ρ dt

остается без изменения.

Таким образом, получаем
div(ρv ) dΩ = −

355

div E = 4πρ.
(41)

(42)

Это и есть уравнение неразрывности, которое и для нестационарного
случая означает, что в процессе движения газа он не порождается и не

Итак, дивергенция напряженности электрического поля, т.е. плотность
возникновения электрических силовых линий, прямо пропорциональ(
на плотности распределенных зарядов.
В § 5 мы видели, что электрическое поле имеет потенциал ϕ, связан(
ный с вектором E соотношением (20). Подставляя (20) в (42), получаем
уравнение для потенциала

* Слово «увеличивается» надо понимать в алгебраическом смысле: если ∂ρ ∂t > 0, то
масса внутри dΩ увеличивается, а если ∂ρ ∂t < 0, то масса уменьшается.

div grad ϕ = −4 πρ.

354

ТЕОРИЯ ПОЛЯ

[Гл. X

По общему правилу (ср. формулу (IV.5)), рассматривая ρ = [ρ( x(t),
y(t), z (t)] = ρ(t), найдем
dρ ∂ρ dx ∂ρ dy ∂ρ dz
=
+
+
= v ⋅ grad ρ.
dt ∂x dt ∂y dt ∂z dt

Итак,
div v = −

1 dρ
.
ρ dt

Это и есть количественное выражение сделанных выше высказываний
о div v в области, где газ сжимается (dρ dt > 0) или расширяется
∂ρ
= 0.
(dρ dt < 0) при
∂t
Рассмотрим теперь нестационарное течение газа, когда поле скорос(
тей и другие рассматриваемые здесь поля меняются с течением времени.
Тогда все введенные ранее понятия нужно (как и в случае нестационар(
ного поля с любым физическим смыслом) рассматривать для любого
фиксированного момента времени. При этом линии тока (т.е. линии,
которые строятся в любой фиксированный момент времени и в этот
момент в каждой точке идут вдоль вектора скорости) уже не совпадают
с траекториями частиц жидкости (подумайте, почему!).
Если в нестационарном случае рассмотреть некоторый объем (dΩ),
то здесь поток вектора ρv через поверхность, равный в силу формулы
(34) div (ρv) dΩ, дает скорость уменьшения массы газа в этом объеме,
т.е. массу газа, выходящего из этого объема за единицу времени. Одна(
ко масса газа, содержащегося в бесконечно малом объеме (dΩ), равна
ρ dΩ и потому увеличивается* со скоростью

∂ρ
(ρ dΩ ) =
dΩ.
∂t
∂t

§ 9] ДИВЕРГЕНЦИЯ ЭЛЕКТРИЧЕСКОГО ПОЛЯ И УРАВНЕНИЕ ПУАССОНА

исчезает. В стационарном случае уравнение (41), очевидно, переходит
в уравнение (40).

В нестационарном случае скорость
изменения плотности в час(
dt
∂ρ
изменения плотности в фиксирован(
тице (в отличие от скорости
∂t
ной точке) равна
dρ ∂ρ
=
+ v ⋅ grad ρ.
dt ∂t

Отсюда и из (41) найдем, что в нестационарном случае формула
div v = −

Упражнение
Пусть рассматривается поток «нейтронного газа» в реакторе, причем нейт(
роны поступают в поток по всему объему за счет реакции деления ядер урана,
происходящей в данном объеме. Как изменится уравнение неразрывности?

§ 9. Дивергенция электрического поля и уравнение Пуассона
Пусть в пространстве распределен заряд с некоторой плотностью ρ,
и им порождается электрическое поле E. В § 5 мы видели, что поток Q
вектора E через поверхность любого тела (Ω), т.е. количество элек(
трических силовых линий, начинающихся в (Ω), равняется произведе(
нию 4π на заряд q, содержащийся в (Ω). Отсюда, если объем
бесконечно мал, получаем
div E =

∂ρ
dΩ,
∂t

dQ d (4 πq )
dq
,
=
= 4π




т.е. окончательно

откуда
∂ρ
+ div(ρv ) = 0.
∂t

1 dρ
ρ dt

остается без изменения.

Таким образом, получаем
div(ρv ) dΩ = −

355

div E = 4πρ.
(41)

(42)

Это и есть уравнение неразрывности, которое и для нестационарного
случая означает, что в процессе движения газа он не порождается и не

Итак, дивергенция напряженности электрического поля, т.е. плотность
возникновения электрических силовых линий, прямо пропорциональ(
на плотности распределенных зарядов.
В § 5 мы видели, что электрическое поле имеет потенциал ϕ, связан(
ный с вектором E соотношением (20). Подставляя (20) в (42), получаем
уравнение для потенциала

* Слово «увеличивается» надо понимать в алгебраическом смысле: если ∂ρ ∂t > 0, то
масса внутри dΩ увеличивается, а если ∂ρ ∂t < 0, то масса уменьшается.

div grad ϕ = −4 πρ.

356

ТЕОРИЯ ПОЛЯ

[Гл. X

§ 9] ДИВЕРГЕНЦИЯ ЭЛЕКТРИЧЕСКОГО ПОЛЯ И УРАВНЕНИЕ ПУАССОНА

357

Комбинация div grad называется оператором Лапласа и обозначает(
ся буквой Δ; поэтому уравнение для потенциала можно переписать
в виде

§ III.6 дифференцирования интеграла по параметру.) Интегрируя по(
следнее равенство по r, начиная от r = 0, получим

Δϕ = −4 πρ.

∫ ϕ dω − ∫ ϕ dω r = 0 = ∫ s2 ∫ Δϕ dΩ.

r

(43)

ds

(Ω )s

0

Это уравнение называется уравнением Пуассона; его решение (23), рав(
ное нулю на бесконечности, было найдено ранее. В части пространства,
свободной от зарядов, уравнение (43) приобретает вид
Δϕ = 0

⎛ ∂ϕ
∂ϕ
∂ϕ ⎞
j+
k⎟ =
div grad ϕ = div ⎜ i +
⎝ ∂x
∂y
∂z ⎠

2
⎛ ∂ϕ r ⎞ 2 ⎛ ∂ϕ ⎞ ⎛ ∂ϕ ⎞ ⬘ d ϕ 2 dϕ
.
Δϕ ( r ) = div grad ϕ ( r ) = div ⎜
⎟= ⎜ ⎟+⎜ ⎟ = 2 +
⎝ ∂x r ⎠ r ⎝ ∂r ⎠ ⎝ ∂r ⎠ r dr
r dr

Оператор Лапласа связан простой формулой со средним значением
функции на малой сфере. Для вывода этой связи положим в формуле
Остроградского (35) A = grad ϕ; получим

∫ gradn ϕ dσ = ∫ div grad ϕ dΩ,

( σ)

(Ω )

т.е.


dσ = ∫ Δϕ dΩ.
dn
( σ)
(Ω )



Допустим, что (σ) = (σ) r — сфера радиуса r с центром в некоторой
точке О; тогда dσ = r 2 dω, где dω — элемент телесного угла с верши(
ной О (§ 5), откуда



( σ) r

dϕ 2
r dω = ∫ Δϕ dΩ,
dr
(Ω )
r

т.е.

d
1
ϕ dω = 2
dr ∫
r

∫ Δϕ dΩ.

(Ω )r

(К интегрированию по ω мы перешли, чтобы область интегрирования
не зависела от параметра r и потому можно было применить правило

(почему?), откуда, поделив на

4π, получаем
ϕ(O ) =

1
4 πr 2

r

ds
Δϕ dΩ.
4 πs 2 ( Ω∫)
0

∫ ϕ dσ − ∫

( σ) r

(45)

s

Из этой формулы мы выведем некоторые следствия. Прежде всего,
допустим, что Δϕ ≡ 0 в некоторой области, включающей шар (Ω) r ;
тогда функция ϕ называется гармонической (ср. § V.7) и в силу форму(
лы (45)

∂ ⎛ ∂ϕ ⎞
∂ ⎛ ∂ϕ ⎞ ∂ ⎛ ∂ϕ ⎞ ∂ 2ϕ ∂ 2ϕ ∂ 2ϕ
.
+
+
⎜ ⎟+
⎜ ⎟=
⎜ ⎟+
∂x ⎝ ∂x ⎠ ∂y ⎝ ∂y ⎠ ∂z ⎝ ∂z ⎠ ∂x 2 ∂y 2 ∂z 2

Таким образом, уравнение (44) — это то самое уравнение Лапласа, ко(
торое уже встречалось нам в § V.7, но записанное для трехмерного слу(
чая.
Иногда удобнее вычислять оператор Лапласа в других системах ко(
ординат. Например, для центрально(симметричного поля ϕ(r) в силу
формул (5) и (36)–(37) получаем

∫ dω = 4π

= ϕ(O) = const,

r =0

(44)

и называется уравнением Лапласа.
Легко получить выражение для оператора Лапласа в декартовых ко(
ординатах. Из формул (1) и (39) получаем

=

Однако ϕ

ϕ(O ) =

1
4 πr 2

∫ ϕ dσ.

(46)

( σ) r

Таким образом, значение гармонической функции в центре сферы рав(
но среднему значению этой функции на сфере.
Отсюда вытекает, в частности, что гармоническая функция не мо(
жет иметь внутри области своего определения максимумов или мини(
мумов. В самом деле, если, например, в точке О будет минимум, а r
достаточно мало´, то среднее значение функции ϕ на (σ) r будет боль(
ше ϕ(O) (почему?), а это противоречит формуле (46). По(другому это
свойство было доказано в ВМ, § VI.3, где было отмечено и следствие из
него: заряд в электростатическом поле в области, свободной от других
зарядов, не может иметь положений устойчивого равновесия.
Другое следствие из формулы (45) для произвольной функции ϕ
получится, если считать r малым. Тогда (Δϕ) ( Ω ) s ≈ Δϕ O , откуда
r

r

ds

ds ⎛
4 3⎞ 1 2
⎜ Δϕ ⋅ πs ⎟ = r Δϕ .

⎠ 6
O
O 3

∫ 4 πs2 ∫ Δϕ dΩ ≈ ∫ 4 πs2
(Ω )s

0

0

Поэтому, с точностью до величин, малых при малом r
Δϕ

O

=

6
r2

⎡ 1

2
⎢⎣4 πr



∫ ϕ dσ − ϕ(O )⎥⎥ = 6

( σ) r



ϕ ( σ) r − ϕ(O )
,
r2

(47)

где под ϕ ( σ )r понимается среднее по сфере (σ) r . Отсюда видно, в час(
тности, что если ϕ ( σ )r ≡ ϕ(O), т.е. выполняется описанное выше свойство
среднего по сферам, то Δϕ = 0, т.е. функция ϕ гармоническая.

356

ТЕОРИЯ ПОЛЯ

[Гл. X

§ 9] ДИВЕРГЕНЦИЯ ЭЛЕКТРИЧЕСКОГО ПОЛЯ И УРАВНЕНИЕ ПУАССОНА

357

Комбинация div grad называется оператором Лапласа и обозначает(
ся буквой Δ; поэтому уравнение для потенциала можно переписать
в виде

§ III.6 дифференцирования интеграла по параметру.) Интегрируя по(
следнее равенство по r, начиная от r = 0, получим

Δϕ = −4 πρ.

∫ ϕ dω − ∫ ϕ dω r = 0 = ∫ s2 ∫ Δϕ dΩ.

r

(43)

ds

(Ω )s

0

Это уравнение называется уравнением Пуассона; его решение (23), рав(
ное нулю на бесконечности, было найдено ранее. В части пространства,
свободной от зарядов, уравнение (43) приобретает вид
Δϕ = 0

⎛ ∂ϕ
∂ϕ
∂ϕ ⎞
j+
k⎟ =
div grad ϕ = div ⎜ i +
⎝ ∂x
∂y
∂z ⎠

2
⎛ ∂ϕ r ⎞ 2 ⎛ ∂ϕ ⎞ ⎛ ∂ϕ ⎞ ⬘ d ϕ 2 dϕ
.
Δϕ ( r ) = div grad ϕ ( r ) = div ⎜
⎟= ⎜ ⎟+⎜ ⎟ = 2 +
⎝ ∂x r ⎠ r ⎝ ∂r ⎠ ⎝ ∂r ⎠ r dr
r dr

Оператор Лапласа связан простой формулой со средним значением
функции на малой сфере. Для вывода этой связи положим в формуле
Остроградского (35) A = grad ϕ; получим

∫ gradn ϕ dσ = ∫ div grad ϕ dΩ,

( σ)

(Ω )

т.е.


dσ = ∫ Δϕ dΩ.
dn
( σ)
(Ω )



Допустим, что (σ) = (σ) r — сфера радиуса r с центром в некоторой
точке О; тогда dσ = r 2 dω, где dω — элемент телесного угла с верши(
ной О (§ 5), откуда



( σ) r

dϕ 2
r dω = ∫ Δϕ dΩ,
dr
(Ω )
r

т.е.

d
1
ϕ dω = 2
dr ∫
r

∫ Δϕ dΩ.

(Ω )r

(К интегрированию по ω мы перешли, чтобы область интегрирования
не зависела от параметра r и потому можно было применить правило

(почему?), откуда, поделив на

4π, получаем
ϕ(O ) =

1
4 πr 2

r

ds
Δϕ dΩ.
4 πs 2 ( Ω∫)
0

∫ ϕ dσ − ∫

( σ) r

(45)

s

Из этой формулы мы выведем некоторые следствия. Прежде всего,
допустим, что Δϕ ≡ 0 в некоторой области, включающей шар (Ω) r ;
тогда функция ϕ называется гармонической (ср. § V.7) и в силу форму(
лы (45)

∂ ⎛ ∂ϕ ⎞
∂ ⎛ ∂ϕ ⎞ ∂ ⎛ ∂ϕ ⎞ ∂ 2ϕ ∂ 2ϕ ∂ 2ϕ
.
+
+
⎜ ⎟+
⎜ ⎟=
⎜ ⎟+
∂x ⎝ ∂x ⎠ ∂y ⎝ ∂y ⎠ ∂z ⎝ ∂z ⎠ ∂x 2 ∂y 2 ∂z 2

Таким образом, уравнение (44) — это то самое уравнение Лапласа, ко(
торое уже встречалось нам в § V.7, но записанное для трехмерного слу(
чая.
Иногда удобнее вычислять оператор Лапласа в других системах ко(
ординат. Например, для центрально(симметричного поля ϕ(r) в силу
формул (5) и (36)–(37) получаем

∫ dω = 4π

= ϕ(O) = const,

r =0

(44)

и называется уравнением Лапласа.
Легко получить выражение для оператора Лапласа в декартовых ко(
ординатах. Из формул (1) и (39) получаем

=

Однако ϕ

ϕ(O ) =

1
4 πr 2

∫ ϕ dσ.

(46)

( σ) r

Таким образом, значение гармонической функции в центре сферы рав(
но среднему значению этой функции на сфере.
Отсюда вытекает, в частности, что гармоническая функция не мо(
жет иметь внутри области своего определения максимумов или мини(
мумов. В самом деле, если, например, в точке О будет минимум, а r
достаточно мало´, то среднее значение функции ϕ на (σ) r будет боль(
ше ϕ(O) (почему?), а это противоречит формуле (46). По(другому это
свойство было доказано в ВМ, § VI.3, где было отмечено и следствие из
него: заряд в электростатическом поле в области, свободной от других
зарядов, не может иметь положений устойчивого равновесия.
Другое следствие из формулы (45) для произвольной функции ϕ
получится, если считать r малым. Тогда (Δϕ) ( Ω ) s ≈ Δϕ O , откуда
r

r

ds

ds ⎛
4 3⎞ 1 2
⎜ Δϕ ⋅ πs ⎟ = r Δϕ .

⎠ 6
O
O 3

∫ 4 πs2 ∫ Δϕ dΩ ≈ ∫ 4 πs2
(Ω )s

0

0

Поэтому, с точностью до величин, малых при малом r
Δϕ

O

=

6
r2

⎡ 1

2
⎢⎣4 πr



∫ ϕ dσ − ϕ(O )⎥⎥ = 6

( σ) r



ϕ ( σ) r − ϕ(O )
,
r2

(47)

где под ϕ ( σ )r понимается среднее по сфере (σ) r . Отсюда видно, в час(
тности, что если ϕ ( σ )r ≡ ϕ(O), т.е. выполняется описанное выше свойство
среднего по сферам, то Δϕ = 0, т.е. функция ϕ гармоническая.

358

ТЕОРИЯ ПОЛЯ

[Гл. X

2 ⎡ϕ ( x + h ) + ϕ ( x − h )

− ϕ ( x )⎥,
2
h 2 ⎢⎣


которую при малом h для функции ϕ( x) одного переменного легко
проверить с помощью формулы Тейлора (проделайте это!). Во многих
случаях формула (47) дает возможность глубже понять смысл соотно(
шений, в которые входит оператор Лапласа. Например, в теории теп(
∂ν
лопроводности выводится уравнение
= const ⋅ Δν распространения
∂t
тепла в однородной среде, где ν — температура. В силу формулы (47)
это означает, что если вокруг точки О температура в среднем выше,
чем в О, то температура в О должна повышаться.
Упражнения

359

F = − ∫ p da.

2. Докажите, что значение гармонической функции в центре шара любого
радиуса равно среднему значению этой функции на шаре.
3. Докажите формулу (47) с помощью разложения функции ϕ в ряд Тей(
лора.

§ 10. Вектор площадки и давление
В § 4 мы говорили о том, что ориентированную плоскую площадку
принято изображать вектором. Особенно естественен такой подход
при исследовании сил давления в жидкости или газе. В самом деле,
пусть в некоторой точке давление равно p; это, конечно, величина ска(
лярная*. Пусть в этой точке расположен ориентированный элемент по(
верхности (dσ) (см. рис. 120). Тогда сила, с которой жидкость,
расположенная по внутреннюю сторону поверхности, давит на этот
элемент, направлена по нормали к (dσ) во внешнюю сторону и чис(
ленно равна p dσ; таким образом, эта сила равна
(48)

Вектор площадки получает непосредственное истолкование.
Теперь легко подсчитать суммарную силу, с которой жидкость да(
вит на некоторый мысленно выделенный в ней объем (Ω) с поверх(
ностью (σ). Для этого надо просуммировать элементарные силы (48),
поменяв, однако, в правой части знак, так как поверхность (σ) мы
будем, как и в предыдущих параграфах, считать ориентированной
* Жидкость или газ подчиняются закону Паскаля; мы не рассматриваем ни прочнос(
ти, ни вязкости, которые приводят к различию сил, действующих на площадки, по(разно(
му направленные.

(49)

( σ)

При вычислении интеграла (49) часто бывает удобно перейти к ин(
тегрированию по (Ω). Для этого заметим, что



p da = pn dσ = p [cos(n, x )i + cos(n, y ) j + cos(n, z )k] dσ

(50)


(см. конец § IX.1). С другой стороны, p cos(n, x) = ( pi) n , где значком n
обозначена проекция на внешнюю нормаль. Поэтому в силу формулы
Остроградского (35) и формулы (39) для вычисления дивергенции по(
лучаем


1. Чему равно Δϕ( _ ), где _ = xi + y j (§ 6)?

dF = p da.

ВЕКТОР ПЛОЩАДКИ И ДАВЛЕНИЕ

внутренней стороной к (Ω), а не к давящей жидкости. Тогда мы по(
лучим

Формула (47) весьма напоминает формулу
ϕ′′( x ) =

§ 10]

∂p
dΩ,
∂x
(Ω )

∫ p cos(n, x ) dσ = ∫ ( pi)n dσ = ∫ div ( pi) dΩ = ∫

( σ)

( σ)

(Ω )

и интеграл от первого слагаемого в правой части (50) оказывается рав(
∂p
ным i ∫
dΩ. Аналогично преобразуются интегралы от двух других

x
(Ω)
слагаемых, и в результате мы получаем
⎛ ∂p
∂p
∂p ⎞
j+
k⎟ dΩ = ∫ ( grad p) dΩ
⎜ i+

x
y


∂z ⎠
(Ω )
(Ω )

∫ pda = ∫

( σ)

(51)

(см. формулу (1)). Итак, сила давления равна
F =−

∫ ( grad p) dΩ.

(52)

(Ω )

Рассмотрим примеры. Пусть сначала давление постоянно, p = const.
Тогда grad p = 0, и формула (52) показывает, что и F = 0.
Мы приходим к выводу, что постоянное давление, приложенное со
всех сторон к телу как угодно сложной формы, дает нулевую результи(
рующую силу. Именно поэтому нас не выталкивает атмосферное дав(
ление, которое интенсивно, но с постоянной силой давит на сложную
поверхность нашего тела. По существу, данный пример уже был рас(
смотрен в конце § 4; в частности, мы видим, что если в жидкость поме(
щен многогранник, показанный на рис. 121, то
p( − a ) + p( a1 ) + p( a 2 ) + p( a 3 ) = 0.

Сокращая на р, мы вновь приходим к формуле (18).

358

ТЕОРИЯ ПОЛЯ

[Гл. X

2 ⎡ϕ ( x + h ) + ϕ ( x − h )

− ϕ ( x )⎥,
2
h 2 ⎢⎣


которую при малом h для функции ϕ( x) одного переменного легко
проверить с помощью формулы Тейлора (проделайте это!). Во многих
случаях формула (47) дает возможность глубже понять смысл соотно(
шений, в которые входит оператор Лапласа. Например, в теории теп(
∂ν
лопроводности выводится уравнение
= const ⋅ Δν распространения
∂t
тепла в однородной среде, где ν — температура. В силу формулы (47)
это означает, что если вокруг точки О температура в среднем выше,
чем в О, то температура в О должна повышаться.
Упражнения

359

F = − ∫ p da.

2. Докажите, что значение гармонической функции в центре шара любого
радиуса равно среднему значению этой функции на шаре.
3. Докажите формулу (47) с помощью разложения функции ϕ в ряд Тей(
лора.

§ 10. Вектор площадки и давление
В § 4 мы говорили о том, что ориентированную плоскую площадку
принято изображать вектором. Особенно естественен такой подход
при исследовании сил давления в жидкости или газе. В самом деле,
пусть в некоторой точке давление равно p; это, конечно, величина ска(
лярная*. Пусть в этой точке расположен ориентированный элемент по(
верхности (dσ) (см. рис. 120). Тогда сила, с которой жидкость,
расположенная по внутреннюю сторону поверхности, давит на этот
элемент, направлена по нормали к (dσ) во внешнюю сторону и чис(
ленно равна p dσ; таким образом, эта сила равна
(48)

Вектор площадки получает непосредственное истолкование.
Теперь легко подсчитать суммарную силу, с которой жидкость да(
вит на некоторый мысленно выделенный в ней объем (Ω) с поверх(
ностью (σ). Для этого надо просуммировать элементарные силы (48),
поменяв, однако, в правой части знак, так как поверхность (σ) мы
будем, как и в предыдущих параграфах, считать ориентированной
* Жидкость или газ подчиняются закону Паскаля; мы не рассматриваем ни прочнос(
ти, ни вязкости, которые приводят к различию сил, действующих на площадки, по(разно(
му направленные.

(49)

( σ)

При вычислении интеграла (49) часто бывает удобно перейти к ин(
тегрированию по (Ω). Для этого заметим, что



p da = pn dσ = p [cos(n, x )i + cos(n, y ) j + cos(n, z )k] dσ

(50)


(см. конец § IX.1). С другой стороны, p cos(n, x) = ( pi) n , где значком n
обозначена проекция на внешнюю нормаль. Поэтому в силу формулы
Остроградского (35) и формулы (39) для вычисления дивергенции по(
лучаем


1. Чему равно Δϕ( _ ), где _ = xi + y j (§ 6)?

dF = p da.

ВЕКТОР ПЛОЩАДКИ И ДАВЛЕНИЕ

внутренней стороной к (Ω), а не к давящей жидкости. Тогда мы по(
лучим

Формула (47) весьма напоминает формулу
ϕ′′( x ) =

§ 10]

∂p
dΩ,
∂x
(Ω )

∫ p cos(n, x ) dσ = ∫ ( pi)n dσ = ∫ div ( pi) dΩ = ∫

( σ)

( σ)

(Ω )

и интеграл от первого слагаемого в правой части (50) оказывается рав(
∂p
ным i ∫
dΩ. Аналогично преобразуются интегралы от двух других

x
(Ω)
слагаемых, и в результате мы получаем
⎛ ∂p
∂p
∂p ⎞
j+
k⎟ dΩ = ∫ ( grad p) dΩ
⎜ i+

x
y


∂z ⎠
(Ω )
(Ω )

∫ pda = ∫

( σ)

(51)

(см. формулу (1)). Итак, сила давления равна
F =−

∫ ( grad p) dΩ.

(52)

(Ω )

Рассмотрим примеры. Пусть сначала давление постоянно, p = const.
Тогда grad p = 0, и формула (52) показывает, что и F = 0.
Мы приходим к выводу, что постоянное давление, приложенное со
всех сторон к телу как угодно сложной формы, дает нулевую результи(
рующую силу. Именно поэтому нас не выталкивает атмосферное дав(
ление, которое интенсивно, но с постоянной силой давит на сложную
поверхность нашего тела. По существу, данный пример уже был рас(
смотрен в конце § 4; в частности, мы видим, что если в жидкость поме(
щен многогранник, показанный на рис. 121, то
p( − a ) + p( a1 ) + p( a 2 ) + p( a 3 ) = 0.

Сокращая на р, мы вновь приходим к формуле (18).

360

ТЕОРИЯ ПОЛЯ

[Гл. X

В качестве другого примера рассмотрим давление в жидкости, нахо(
дящейся в поле тяготения. Если направить ось z от свободной повер(
хности вверх, то, как хорошо известно, давление в жидкости зависит от
z следующим образом:
p = p0 − gρz,

где p0 — давление на свободной поверхности*, ρ — плотность жид(
кости и g — ускорение земного тяготения. Отсюда в силу (52) получа(
ем выталкивающую силу
F =

∫ gρk d Ω = gρΩk.

§ 10]

ρ dv ⋅ v =

dF = −( grad p) dΩ.

dF1 = f dΩ.

dv
, т.е.
dt

dv
= −( grad p ) dΩ + f dΩ,
dt

(здесь v = v ).

а второе −ρg k ⋅ dr = −ρgdz . Итак,
ρ
d ( v 2 ) = − dp − ρg dz.
2

Подчеркнем, что это соотношение выполняется вдоль линии тока: мы
пользовались этим, когда писали dr = v dt, так как такое равенство
определяет смещение движущейся частицы вдоль траектории (см.
§ IX.4). Интегрируя вдоль такой линии, получаем соотношение
ρv 2
+ p + ρgz = const,
2

Δ
(54)

В левой части здесь стоит скорость изменения вектора v вдоль тра(
ектории частицы. Эта скорость записывается подобно тому, как это
было сделано в § IV. 1 для случая скалярного поля (т.е. она состоит из
* Обратите внимание на то, что в жидкости, очевидно, z < 0, так что давление р по
формуле больше p 0 , как и должно быть.

(55)

которое должно выполняться в стационарном потоке вдоль каждой ли(
нии тока. При этом постоянная интегрирования, стоящая в правой час(
ти, принимает на различных линиях тока, вообще говоря, различные
значения. Соотношение (55), называемое интегралом Бернулли, выра(
жает закон сохранения энергии при движении частицы жидкости. Это
особенно ясно, если помножить обе части на dΩ, а затем взять прира(
щение Δ (не путать с оператором Лапласа!) обеих частей равенства
вдоль некоторого участка линии тока. Мы получим

откуда, сокращая на dΩ, получаем уравнение движения
dv
= − grad p + f .
dt

( )

⎛ ∂p
∂p
∂p ⎞
− grad p ⋅ dr = − ⎜ dx +
dy +
dz⎟ = − dp,
⎝ ∂x
∂y
∂z ⎠

(53)

К объему (dΩ) могут быть приложены некоторые объемные силы (на(
пример, силы тяготения, центробежные силы и т.д.), распределенные
с плотностью f . Результирующая таких сил равна

ρ

ρ
ρ
d ( v ⋅ v) = d v 2 ,
2
2

В правой части первое слагаемое после умножения дает

Так как произведение gρΩ равно весу жидкости в объеме (Ω), то мы
приходим к известному закону Архимеда.
Вернемся к общему случаю и найдем результирующую сил давле(
ния, приложенных к бесконечно малому объему (dΩ). Так как в случае
постоянного давления эта результирующая, как мы только что показа(
ли, равна нулю, то, рассуждая, как в конце § 7, можно вывести, что хотя
силы давления приложены к п о в е р х н о с т и, но результирующая
пропорциональна не площади, а о б ъ е м у. Это видно и из формулы
(52), откуда следует, что для бесконечно малого объема интегрирования

ρ dΩ

361

локальной и конвективной скоростей); ее координатное выражение мы
получим в § XI.8.
Рассмотрим, в частности, стационарное течение несжимаемой (т.е.
при ρ = const) жидкости в поле тяготения. В этом случае, направив ось
z вертикально вверх, получим, что f , т.е. сила, действующая на едини(
цу объема, равна −ρgk. Умножив обе части уравнения (54) скалярно на
dr = v dt, получим в левой части

(Ω )

Обе эти силы придают массе ρ dΩ ускорение

ВЕКТОР ПЛОЩАДКИ И ДАВЛЕНИЕ

ρv 2
dΩ + Δp dΩ + Δρgz dΩ = 0,
2

т.е.

⎛ dm ⋅ v 2
Δ⎜
+ dm ⋅ gz⎟ = − Δp ⋅ dΩ.

⎝ 2

Так как в скобках стоит сумма кинетической и потенциальной энергий
движущейся частицы, то левая часть равна приращению полной энер(
гии этой частицы. Правую часть можно представить в виде интеграла

360

ТЕОРИЯ ПОЛЯ

[Гл. X

В качестве другого примера рассмотрим давление в жидкости, нахо(
дящейся в поле тяготения. Если направить ось z от свободной повер(
хности вверх, то, как хорошо известно, давление в жидкости зависит от
z следующим образом:
p = p0 − gρz,

где p0 — давление на свободной поверхности*, ρ — плотность жид(
кости и g — ускорение земного тяготения. Отсюда в силу (52) получа(
ем выталкивающую силу
F =

∫ gρk d Ω = gρΩk.

§ 10]

ρ dv ⋅ v =

dF = −( grad p) dΩ.

dF1 = f dΩ.

dv
, т.е.
dt

dv
= −( grad p ) dΩ + f dΩ,
dt

(здесь v = v ).

а второе −ρg k ⋅ dr = −ρgdz . Итак,
ρ
d ( v 2 ) = − dp − ρg dz.
2

Подчеркнем, что это соотношение выполняется вдоль линии тока: мы
пользовались этим, когда писали dr = v dt, так как такое равенство
определяет смещение движущейся частицы вдоль траектории (см.
§ IX.4). Интегрируя вдоль такой линии, получаем соотношение
ρv 2
+ p + ρgz = const,
2

Δ
(54)

В левой части здесь стоит скорость изменения вектора v вдоль тра(
ектории частицы. Эта скорость записывается подобно тому, как это
было сделано в § IV. 1 для случая скалярного поля (т.е. она состоит из
* Обратите внимание на то, что в жидкости, очевидно, z < 0, так что давление р по
формуле больше p 0 , как и должно быть.

(55)

которое должно выполняться в стационарном потоке вдоль каждой ли(
нии тока. При этом постоянная интегрирования, стоящая в правой час(
ти, принимает на различных линиях тока, вообще говоря, различные
значения. Соотношение (55), называемоеинтегралом Бернулли, выра(
жает закон сохранения энергии при движении частицы жидкости. Это
особенно ясно, если помножить обе части на dΩ, а затем взять прира(
щение Δ (не путать с оператором Лапласа!) обеих частей равенства
вдоль некоторого участка линии тока. Мы получим

откуда, сокращая на dΩ, получаем уравнение движения
dv
= − grad p + f .
dt

( )

⎛ ∂p
∂p
∂p ⎞
− grad p ⋅ dr = − ⎜ dx +
dy +
dz⎟ = − dp,
⎝ ∂x
∂y
∂z ⎠

(53)

К объему (dΩ) могут быть приложены некоторые объемные силы (на(
пример, силы тяготения, центробежные силы и т.д.), распределенные
с плотностью f . Результирующая таких сил равна

ρ

ρ
ρ
d ( v ⋅ v) = d v 2 ,
2
2

В правой части первое слагаемое после умножения дает

Так как произведение gρΩ равно весу жидкости в объеме (Ω), то мы
приходим к известному закону Архимеда.
Вернемся к общему случаю и найдем результирующую сил давле(
ния, приложенных к бесконечно малому объему (dΩ). Так как в случае
постоянного давления эта результирующая, как мы только что показа(
ли, равна нулю, то, рассуждая, как в конце § 7, можно вывести, что хотя
силы давления приложены к п о в е р х н о с т и, но результирующая
пропорциональна не площади, а о б ъ е м у. Это видно и из формулы
(52), откуда следует, что для бесконечно малого объема интегрирования

ρ dΩ

361

локальной и конвективной скоростей); ее координатное выражение мы
получим в § XI.8.
Рассмотрим, в частности, стационарное течение несжимаемой (т.е.
при ρ = const) жидкости в поле тяготения. В этом случае, направив ось
z вертикально вверх, получим, что f , т.е. сила, действующая на едини(
цу объема, равна −ρgk. Умножив обе части уравнения (54) скалярно на
dr = v dt, получим в левой части

(Ω )

Обе эти силы придают массе ρ dΩ ускорение

ВЕКТОР ПЛОЩАДКИ И ДАВЛЕНИЕ

ρv 2
dΩ + Δp dΩ + Δρgz dΩ = 0,
2

т.е.

⎛ dm ⋅ v 2
Δ⎜
+ dm ⋅ gz⎟ = − Δp ⋅ dΩ.

⎝ 2

Так как в скобках стоит сумма кинетической и потенциальной энергий
движущейся частицы, то левая часть равна приращению полной энер(
гии этой частицы. Правую часть можно представить в виде интеграла

362

ТЕОРИЯ ПОЛЯ

[Гл. X

вдоль линии тока
−∫

dp
ds ⋅ dΩ = − ∫ ( grad p ) τ ds ⋅ dΩ = ∫ Fτ ds
ds

(см. формулу (53)). Значит, эта правая часть равна работе сил давления
при движении частицы. Итак, формула (55) означает, что приращение
полной энергии частицы равно работе действующих на нее сил.
В стационарном потоке закон сохранения энергии можно приме(
нить еще и другим способом. Рассмотрим «трубку тока», т.е. трубку, че(
рез боковую поверхность которой линии тока не выходят и не входят;
схематически эта трубка изображена на рис. 133. При этом стенки мо(
гут быть твердыми, так как на стенках
работа не совершается и жидкость че(
рез них не проходит. Сравним мощ(
ность насоса (т.е. энергию за единицу
времени), затрачиваемую на подачу
жидкости в трубку, с мощностью тур(
Рис. 133.
бины на выходе из трубки; если пре(
небрегать потерями на трение, то эти мощности должны быть равными.
Через входное отверстие в трубку в единицу времени поступа(
ет v1 S 1 единиц объема жидкости, где S — площадь поперечного сече(
ния трубки, а индекс 1 указывает на то, что рассматриваемые величины
относятся ко входу. Эта жидкость обладает кинетической энергией
ρv1 S1

v12
.
2

Кроме того, на создание давления p1 в объеме v1 S 1 тратится мощ(
ность насоса p1 v1 S 1 , а на поднятие на высоту z 1 (от некоторой стан(
дартной высоты z = 0) — мощность ρv1 S 1 gz 1 . Составляя аналогичные
выражения для выходного сечения и приравнивая суммы, получим за(
пись закона сохранения энергии
ρv1 S1

v12
v2
+ p1 v1 S1 + ρv1 S1 gz1 = ρv 2 S 2 2 + p2 v 2 S 2 + ρv 2 S 2 gz 2 .
2
2

(56)

Однако в силу сохранения массы и несжимаемости жидкости имеем
v1 S 1 = v2 S 2 . Сокращая (55) на эту величину, получим
ρv12
ρv 2
+ p1 + ρgz1 = 2 + p2 + ρgz 2 .
2
2

Это равенство равносильно интегралу Бернулли (55).
Из интеграла Бернулли хорошо видно, что при постоянной или мало
изменяющейся высоте давление в струе существенно зависит от скорости
течения: чем больше скорость, тем меньше давление. Это и естественно:
если частица переходит из области с меньшим давлением в область

ОТВЕТЫ И РЕШЕНИЯ

363

с бо´льшим давлением, то равнодействующая сил давления на нее направ(
лена против скорости, т.е. движение тормозится. Если же по мере движе(
ния давление падает, то давление «в спину» частицы больше, чем
давление ей «в грудь», и частица разгоняется. При достижении опреде(
ленной скорости в силу (55) давление должно было бы стать отрицатель(
ным; на самом деле этого не происходит, жидкость теряет сплошность —
в ней возникают полости (возникает так называемая «кавитация»).
Упражнение
Выведите с помощью формулы (51) инвариантное, не связанное с выбором
системы координат, определение градиента, аналогичное определению (33)
дивергенции.

ОТВЕТЫ И РЕШЕНИЯ
§ 1
Легко проверить, что связь старых координат x, y, z с новыми x′, y′, z′
y′ − z′
y′ + z′
; z=
. Подставляя эти формулы в выражение
такова: x = x′; y =
2
2
для u, получим u = x′ 2 + 2 y′ 2 . Так как z′ не входит, то поле плоскопараллельное.
§ 2
1. Так как grad u = yi + xj − 2 zk, то ( grad u )M = i + 2 j + 6 k. Искомая произ(
a
9
водная равна grad u ⋅
=
= 6,01.
a
10


M M
M 2M
.
2. grad u ( M ) = −k1 1 3 − k2
M1 M
M 2M 3
§ 3
F = − grad U = −αyi − αxj. Силовые линии определяются уравнением
dx
dy
, откуда x dx = y dy, x 2 = y 2 + C . Это — гиперболы с центром в нача(
=
−αy −αx
ле координат (рис. 33).
§ 4
b

Q = 2π _ ∫ f ( _ , z ) dz, где z = a и z = b — плоскости оснований цилиндра.
a

В случае плоскопараллельного поля f не зависит от z и Q = 2π _ f ( _ ) h, где
h — высота цилиндра.
§ 6
1. Интегрируя выражение для dE x , указанное в тексте, получаем (с по(
мощью подстановки ζ − z = x 2 + y 2 tg α )

362

ТЕОРИЯ ПОЛЯ

[Гл. X

вдоль линии тока
−∫

dp
ds ⋅ dΩ = − ∫ ( grad p ) τ ds ⋅ dΩ = ∫ Fτ ds
ds

(см. формулу (53)). Значит, эта правая часть равна работе сил давления
при движении частицы. Итак, формула (55) означает, что приращение
полной энергии частицы равно работе действующих на нее сил.
В стационарном потоке закон сохранения энергии можно приме(
нить еще и другим способом. Рассмотрим «трубку тока», т.е. трубку, че(
рез боковую поверхность которой линии тока не выходят и не входят;
схематически эта трубка изображена на рис. 133. При этом стенки мо(
гут быть твердыми, так как на стенках
работа не совершается и жидкость че(
рез них не проходит. Сравним мощ(
ность насоса (т.е. энергию за единицу
времени), затрачиваемую на подачу
жидкости в трубку, с мощностью тур(
Рис. 133.
бины на выходе из трубки; если пре(
небрегать потерями на трение, то эти мощности должны быть равными.
Через входное отверстие в трубку в единицу времени поступа(
ет v1 S 1 единиц объема жидкости, где S — площадь поперечного сече(
ния трубки, а индекс 1 указывает на то, что рассматриваемые величины
относятся ко входу. Эта жидкость обладает кинетической энергией
ρv1 S1

v12
.
2

Кроме того, на создание давления p1 в объеме v1 S 1 тратится мощ(
ность насоса p1 v1 S 1 , а на поднятие на высоту z 1 (от некоторой стан(
дартной высоты z = 0) — мощность ρv1 S 1 gz 1 . Составляя аналогичные
выражения для выходного сечения и приравнивая суммы, получим за(
пись закона сохранения энергии
ρv1 S1

v12
v2
+ p1 v1 S1 + ρv1 S1 gz1 = ρv 2 S 2 2 + p2 v 2 S 2 + ρv 2 S 2 gz 2 .
2
2

(56)

Однако в силу сохранения массы и несжимаемости жидкости имеем
v1 S 1 = v2 S 2 . Сокращая (55) на эту величину, получим
ρv12
ρv 2
+ p1 + ρgz1 = 2 + p2 + ρgz 2 .
2
2

Это равенство равносильно интегралу Бернулли (55).
Из интеграла Бернулли хорошо видно, что при постоянной или мало
изменяющейся высоте давление в струе существенно зависит от скорости
течения: чем больше скорость, тем меньше давление. Это и естественно:
если частица переходит из области с меньшим давлением в область

ОТВЕТЫ И РЕШЕНИЯ

363

с бо´льшим давлением, то равнодействующая сил давления на нее направ(
лена против скорости, т.е. движение тормозится. Если же по мере движе(
ния давление падает, то давление «в спину» частицы больше, чем
давление ей «в грудь», и частица разгоняется. При достижении опреде(
ленной скорости в силу (55) давление должно было бы стать отрицатель(
ным; на самом деле этого не происходит, жидкость теряет сплошность —
в ней возникают полости (возникает так называемая «кавитация»).
Упражнение
Выведите с помощью формулы (51) инвариантное, не связанное с выбором
системы координат, определение градиента, аналогичное определению (33)
дивергенции.

ОТВЕТЫ И РЕШЕНИЯ
§ 1
Легко проверить, что связь старых координат x, y, z с новыми x′, y′, z′
y′ − z′
y′ + z′
; z=
. Подставляя эти формулы в выражение
такова: x = x′; y =
2
2
для u, получим u = x′ 2 + 2 y′ 2 . Так как z′ не входит, то поле плоскопараллельное.
§ 2
1. Так как grad u = yi + xj − 2 zk, то ( grad u )M = i + 2 j + 6 k. Искомая произ(
a
9
водная равна grad u ⋅
=
= 6,01.
a
10


M M
M 2M
.
2. grad u ( M ) = −k1 1 3 − k2
M1 M
M 2M 3
§ 3
F = − grad U = −αyi − αxj. Силовые линии определяются уравнением
dx
dy
, откуда x dx = y dy, x 2 = y 2 + C . Это — гиперболы с центром в нача(
=
−αy −αx
ле координат (рис. 33).
§ 4
b

Q = 2π _ ∫ f ( _ , z ) dz, где z = a и z = b — плоскости оснований цилиндра.
a

В случае плоскопараллельного поля f не зависит от z и Q = 2π _ f ( _ ) h, где
h — высота цилиндра.
§ 6
1. Интегрируя выражение для dE x , указанное в тексте, получаем (с по(
мощью подстановки ζ − z = x 2 + y 2 tg α )

364

ТЕОРИЯ ПОЛЯ


Ex =



−∞

[x

π
2

μx dζ
2

+ y 2 + ( z − ζ )2

]

3 2

∫π

=



2

μx x 2 + y 2
( x 2 + y 2 )3 2

[Гл. X


cos2 α =
1
cos3 α
=

μx
x2 + y2

Аналогично находим
div A =

π
2

2μx

∫π cos α dα = x 2 + y 2 .



2. Приняв заряженную плоскость за плоскость yOz, получим в точке
( x; 0; 0 ) при x > 0 E y = E z = 0, тогда как




νx

∫ ∫ ( x 2 + η2 + ζ 2 )3 2

dη dζ.

365

∂A y ∂A z
,
. Отсюда
∂y
∂z

f ′( r ) 2
3r 2 − x 2 − y2 − z 2
2 f(r )
.
(x + y2 + z 2 ) + f(r )
= f ′( r ) +
2
r
r
r3

3. Рассуждая, как при выводе формулы (37), получим
div A =

2

2μy
2μx
2μy
, E z = 0. Отсюда E = 2
Аналогично находим E y = 2
i+ 2
j=
x + y2
x + y2
x + y2
2μ_ 2μ 0
_ . Результат совпадает с (26).
= 2 =
_
_

Ex =

ОТВЕТЫ И РЕШЕНИЯ

[

] = f ′( _ ) +

d 2π _ f ( _ )
2π _ d _

при этом div A = 0, если f ( _ ) =

1
f ( _ ),
_

C
. Это — поле (26), рассмотренное в § 6.
_

§ 8
dM
∂ρ
, a dM — масса нейтронов, по(
+ div (ρv ) = f , где f = f ( x, y, z, t ) =
dΩ dt
∂t
ступающих в поток в объеме (dΩ) за время dt.

−∞ −∞

Переходя к полярным координатам ρ, ϕ в плоскости η, ζ, как в конце § IV.7,
получим


Ex =



νx ρ dρ

∫ dϕ ∫ ( x 2 + ρ2 )3 2
0

0



ρ dρ
−1
= 2 π νx 2
2 3 2
(
x
+
ρ
)
x
+
(
ρ 2 )1 2
0

= 2 π νx ∫

2


ρ=0

= 2 πν.

Отсюда E = 2πνi, что совпадает с (29).
3. Рассуждая, как в конце § 6, получаем при естественном смысле букв
E = 2m

d
dl

⎛ _ ⎞ 2m ⎛ 2_

0


⎜ _ 2 ⎟ = _ 2 ⎜⎝ _ cos α − l ⎟⎠ ;



ϕ = 2m

d
cos α
(− ln _ ) = 2 m _ .
dl

Можно проверить, что следы цилиндрических эквипотенциальных поверхнос(
тей, а также электрические силовые линии расположены, как на рис. 130, но те(
перь и те и другие будут окружностями.
§ 7
1. По формуле (39) div A = 2, div B = 0. Поэтому по формуле Остроград(
ского искомый поток равен
8
3
∫ div A dΩ = ∫ 2 dΩ = 2 Ω = 3 πR ;
(Ω )
(Ω )
2. Так как A = f ( r )r 0 =

∫ div B dΩ = 0.

(Ω )

f(r )
f(r)x
,
r , то Ax =
r
r

x
x


f ′( r ) x + f ( r ) r − f ( r )x
⎥⎦
∂Ax ⎢⎣
r 2 − x2
r f ′( r ) 2
r
.
=
= 2 x + f(r )
2
∂x
r
r
r3

§ 9
1. ϕ′′ ( _ ) +

2
ϕ′ ( _ ).
_

2. Разобьем шар ( Ω )r на бесконечно тонкие концентрические «пузыри»
радиуса s и толщины ds (0  s  r ). Тогда в силу формулы (46)
r ⎛
r

⎜ ϕ d σ⎟ ds = 4 πs 2ϕ (O ) ds = 4 πr 2ϕ(O ),
ϕ
d
Ω
=

∫ ⎜⎝ ∫


3

0
0 ( σ) s
(Ω )r

откуда и вытекает требуемое утверждение.
3. Пусть О — начало координат. Из соображений симметрии

∫ x dσ = ∫ y dσ = ∫ z dσ = ∫ xy dσ = ∫ xz dσ = ∫ yz dσ = 0
(все интегралы берутся по ( σ )r ); кроме того,

∫x

2

dσ = ∫ y 2 dσ = ∫ z 2 dσ, отку(

1
1
4
( x 2 + y 2 + z 2 ) dσ = r 2 ⋅ 4 πr 2 = πr 4 . Применяя разложение
3∫
3
3
вида (IV.27) с a = b = 0, получим, с точностью до малых пятого порядка,

да

∫x

2

dσ =

∫ ϕ d σ = ϕ(O ) ⋅ 4 πr

2

( σ) r

+

4 4 1
πr ⋅
3
2

⎛ ∂ 2ϕ ∂ 2ϕ ∂ 2ϕ ⎞
⎜ 2 + 2 + 2⎟ ,
∂y
∂z ⎠ O
⎝ ∂x

откуда легко вытекает формула (47).
§ 10
grad p( M ) =

∫ p da

( dσ )



= lim

( ΔΩ)→ Μ

∫ p da

( Δσ )

ΔΩ

.

(57)

Отметим, что эта формула справедлива для любого скалярного поля, а не толь(
ко для поля давлений.

364

ТЕОРИЯ ПОЛЯ


Ex =



−∞

[x

π
2

μx dζ
2

+ y 2 + ( z − ζ )2

]

3 2

∫π

=



2

μx x 2 + y 2
( x 2 + y 2 )3 2

[Гл. X


cos2 α =
1
cos3 α
=

μx
x2 + y2

Аналогично находим
div A =

π
2

2μx

∫π cos α dα = x 2 + y 2 .



2. Приняв заряженную плоскость за плоскость yOz, получим в точке
( x; 0; 0 ) при x > 0 E y = E z = 0, тогда как




νx

∫ ∫ ( x 2 + η2 + ζ 2 )3 2

dη dζ.

365

∂A y ∂A z
,
. Отсюда
∂y
∂z

f ′( r ) 2
3r 2 − x 2 − y2 − z 2
2 f(r )
.
(x + y2 + z 2 ) + f(r )
= f ′( r ) +
2
r
r
r3

3. Рассуждая, как при выводе формулы (37), получим
div A =

2

2μy
2μx
2μy
, E z = 0. Отсюда E = 2
Аналогично находим E y = 2
i+ 2
j=
x + y2
x + y2
x + y2
2μ_ 2μ 0
_ . Результат совпадает с (26).
= 2 =
_
_

Ex =

ОТВЕТЫ И РЕШЕНИЯ

[

] = f ′( _ ) +

d 2π _ f ( _ )
2π _ d _

при этом div A = 0, если f ( _ ) =

1
f ( _ ),
_

C
. Это — поле (26), рассмотренное в § 6.
_

§ 8
dM
∂ρ
, a dM — масса нейтронов, по(
+ div (ρv ) = f , где f = f ( x, y, z, t ) =
dΩ dt
∂t
ступающих в поток в объеме (dΩ) за время dt.

−∞ −∞

Переходя к полярным координатам ρ, ϕ в плоскости η, ζ, как в конце § IV.7,
получим


Ex =



νx ρ dρ

∫ dϕ ∫ ( x 2 + ρ2 )3 2
0

0



ρ dρ
−1
= 2 π νx 2
2 3 2
(
x
+
ρ
)
x
+
(
ρ 2 )1 2
0

= 2 π νx ∫

2


ρ=0

= 2 πν.

Отсюда E = 2πνi, что совпадает с (29).
3. Рассуждая, как в конце § 6, получаем при естественном смысле букв
E = 2m

d
dl

⎛ _ ⎞ 2m ⎛ 2_

0


⎜ _ 2 ⎟ = _ 2 ⎜⎝ _ cos α − l ⎟⎠ ;



ϕ = 2m

d
cos α
(− ln _ ) = 2 m _ .
dl

Можно проверить, что следы цилиндрических эквипотенциальных поверхнос(
тей, а также электрические силовые линии расположены, как на рис. 130, но те(
перь и те и другие будут окружностями.
§ 7
1. По формуле (39) div A = 2, div B = 0. Поэтому по формуле Остроград(
ского искомый поток равен
8
3
∫ div A dΩ = ∫ 2 dΩ = 2 Ω = 3 πR ;
(Ω )
(Ω )
2. Так как A = f ( r )r 0 =

∫ div B dΩ = 0.

(Ω )

f(r )
f(r)x
,
r , то Ax =
r
r

x
x


f ′( r ) x + f ( r ) r − f ( r )x
⎥⎦
∂Ax ⎢⎣
r 2 − x2
r f ′( r ) 2
r
.
=
= 2 x + f(r )
2
∂x
r
r
r3

§ 9
1. ϕ′′ ( _ ) +

2
ϕ′ ( _ ).
_

2. Разобьем шар ( Ω )r на бесконечно тонкие концентрические «пузыри»
радиуса s и толщины ds (0  s  r ). Тогда в силу формулы (46)
r ⎛
r

⎜ ϕ d σ⎟ ds = 4 πs 2ϕ (O ) ds = 4 πr 2ϕ(O ),
ϕ
d
Ω
=

∫ ⎜⎝ ∫


3

0
0 ( σ) s
(Ω )r

откуда и вытекает требуемое утверждение.
3. Пусть О — начало координат. Из соображений симметрии

∫ x dσ = ∫ y dσ = ∫ z dσ = ∫ xy dσ = ∫ xz dσ = ∫ yz dσ = 0
(все интегралы берутся по ( σ )r ); кроме того,

∫x

2

dσ = ∫ y 2 dσ = ∫ z 2 dσ, отку(

1
1
4
( x 2 + y 2 + z 2 ) dσ = r 2 ⋅ 4 πr 2 = πr 4 . Применяя разложение
3∫
3
3
вида (IV.27) с a = b = 0, получим, с точностью до малых пятого порядка,

да

∫x

2

dσ =

∫ ϕ d σ = ϕ(O ) ⋅ 4 πr

2

( σ) r

+

4 4 1
πr ⋅
3
2

⎛ ∂ 2ϕ ∂ 2ϕ ∂ 2ϕ ⎞
⎜ 2 + 2 + 2⎟ ,
∂y
∂z ⎠ O
⎝ ∂x

откуда легко вытекает формула (47).
§ 10
grad p( M ) =

∫ p da

( dσ )



= lim

( ΔΩ)→ Μ

∫ p da

( Δσ )

ΔΩ

.

(57)

Отметим, что эта формула справедлива для любого скалярного поля, а не толь(
ко для поля давлений.

§ 1]

ГЛАВА XI
ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ*
§ 1. Векторное произведение векторов
В векторной алгебре наряду с умножением вектора на скаляр
(§ IX.1) и скалярным произведением двух векторов (§ IX.2) определя
ется также векторное произведение двух векторов, к описанию которого
мы переходим.
Напомним (§ Х.4), что поверхность в пространстве ориентирована,
если указано, какая ее сторона считается внешней, а какая — внутренней.
Принято считать, что если эта поверхность незамкнутая (т.е. с краем), то
ориентация поверхности порождает также ориентацию ее контура, т.е.
направление его обхода. Обратно, если указывается направление обхода
контура, это приводит к ориентации самой поверхности. Связь между
ориентацией поверхности и ориентацией ее контура указана на
рис. 134: если за основу системы координат взята правая тройка векто

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

367

стороне поверхности ее контур по указанному направлению обхода
(см. рис. 134), то сама поверхность должна быть у него по левую руку*.
Переходим к понятию векторного произведения. Векторное произ
ведение двух векторов a и b, по определению, представляет собой век
тор S площадки (S ) (см. § Х.4), которая получится, если a и b от
нести к одному началу, затем построить
на этих векторах параллелограмм и об
ходить его контур, начиная с первого
вектора (т.е. a; см. рис. 135, где приня
то правило правого винта, которым мы
всегда будем пользоваться, если не ого
ворено противное).
Таким образом, векторное произве
дение двух векторов a и b —это век
тор, направленный перпендикулярно
Рис. 135.
обоим векторам, по модулю равный
площади параллелограмма, построенного на a и b, и образующий с
этими векторами тройку такого же смысла (т.е. правую или левую), как
векторы i, j, k. Обозначается векторное произведение косым крес
том a × b или квадратными скобками a, b .
Отметим наиболее важные свойства векторного произведения. Так,
векторное произведение двух ненулевых векторов равно нульвектору
в том и только том случае, если векторы параллельны:

[ ]

a ×b = 0

равносильно

a b,

так как параллельность векторов означает вырождение параллелог
рамма в отрезок, площадь которого равна нулю. В частности, всегда
a × a = 0.
Векторное произведение «антикоммутативно»**
Рис. 134.

b × a = −(a × b ).

ров i, j, k (т.е. такая тройка, что, смотря с конца третьего вектора, мы
видим кратчайший поворот от первого ко второму против часовой
стрелки), то применяется правило правого винта, в противном слу
чае — правило левого винта. Например, правило правого винта можно
сформулировать так: если правый винт (который обычно применяется
в технике и обыденной жизни) вращать в направлении обхода контура,
то винт должен пойти от внутренней стороны поверхности к наружной.
Или, другими словами: если маленький человечек обходит по наружной

Действительно, при перемене порядка множителей параллелог
рамм не изменится, но контур его будет проходиться в противополож
ном направлении и потому вектор площадки заменится на противопо
ложный.

* Эта глава является, непосредственным продолжением двух предыдущих и сущес
твенно опирается на материал §§ IX. 1–2 и Х.1–4, 7. Кроме того, используются понятия
кратного интеграла (§ IV.7), определителя (§ VIII.3) и δфункции (§ VI.1). В § 12 исполь
зуется также материал §§ X.5–9.

* Первые три картинки рис. 134 относятся к правой системе координат. Как видно из
рисунка, если вертеть правый винт от i к j, т.е. вывинчивать его из пластинки, то винт
в целом перемещается в направлении k. Обход контура в эту сторону соответствует
тому, что нижняя сторона поверхности (σ ) — внутренняя, верхняя — наружная, вектор
a направлен по k.
** Коммутативность означает переместительность. Например, умножение обычных
чисел или скалярное умножение векторов коммутативны. Вообще некоторая операция
над какимилибо объектами называется коммутативной, если она не зависит от порядка,
в котором берутся эти объекты.

§ 1]

ГЛАВА XI
ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ*
§ 1. Векторное произведение векторов
В векторной алгебре наряду с умножением вектора на скаляр
(§ IX.1) и скалярным произведением двух векторов (§ IX.2) определя
ется также векторное произведение двух векторов, к описанию которого
мы переходим.
Напомним (§ Х.4), что поверхность в пространстве ориентирована,
если указано, какая ее сторона считается внешней, а какая — внутренней.
Принято считать, что если эта поверхность незамкнутая (т.е. с краем), то
ориентация поверхности порождает также ориентацию ее контура, т.е.
направление его обхода. Обратно, если указывается направление обхода
контура, это приводит к ориентации самой поверхности. Связь между
ориентацией поверхности и ориентацией ее контура указана на
рис. 134: если за основу системы координат взята правая тройка векто

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

367

стороне поверхности ее контур по указанному направлению обхода
(см. рис. 134), то сама поверхность должна быть у него по левую руку*.
Переходим к понятию векторного произведения. Векторное произ
ведение двух векторов a и b, по определению, представляет собой век
тор S площадки (S ) (см. § Х.4), которая получится, если a и b от
нести к одному началу, затем построить
на этих векторах параллелограмм и об
ходить его контур, начиная с первого
вектора (т.е. a; см. рис. 135, где приня
то правило правого винта, которым мы
всегда будем пользоваться, если не ого
ворено противное).
Таким образом, векторное произве
дение двух векторов a и b —это век
тор, направленный перпендикулярно
Рис. 135.
обоим векторам, по модулю равный
площади параллелограмма, построенного на a и b, и образующий с
этими векторами тройку такого же смысла (т.е. правую или левую), как
векторы i, j, k. Обозначается векторное произведение косым крес
том a × b или квадратными скобками a, b .
Отметим наиболее важные свойства векторного произведения. Так,
векторное произведение двух ненулевых векторов равно нульвектору
в том и только том случае, если векторы параллельны:

[ ]

a ×b = 0

равносильно

a b,

так как параллельность векторов означает вырождение параллелог
рамма в отрезок, площадь которого равна нулю. В частности, всегда
a × a = 0.
Векторное произведение «антикоммутативно»**
Рис. 134.

b × a = −(a × b ).

ров i, j, k (т.е. такая тройка, что, смотря с конца третьего вектора, мы
видим кратчайший поворот от первого ко второму против часовой
стрелки), то применяется правило правого винта, в противном слу
чае — правило левого винта. Например, правило правого винта можно
сформулировать так: если правый винт (который обычно применяется
в технике и обыденной жизни) вращать в направлении обхода контура,
то винт должен пойти от внутренней стороны поверхности к наружной.
Или, другими словами: если маленький человечек обходит по наружной

Действительно, при перемене порядка множителей параллелог
рамм не изменится, но контур его будет проходиться в противополож
ном направлении и потому вектор площадки заменится на противопо
ложный.

* Эта глава является, непосредственным продолжением двух предыдущих и сущес
твенно опирается на материал §§ IX. 1–2 и Х.1–4, 7. Кроме того, используются понятия
кратного интеграла (§ IV.7), определителя (§ VIII.3) и δфункции (§ VI.1). В § 12 исполь
зуется также материал §§ X.5–9.

* Первые три картинки рис. 134 относятся к правой системе координат. Как видно из
рисунка, если вертеть правый винт от i к j, т.е. вывинчивать его из пластинки, то винт
в целом перемещается в направлении k. Обход контура в эту сторону соответствует
тому, что нижняя сторона поверхности (σ ) — внутренняя, верхняя — наружная, вектор
a направлен по k.
** Коммутативность означает переместительность. Например, умножение обычных
чисел или скалярное умножение векторов коммутативны. Вообще некоторая операция
над какимилибо объектами называется коммутативной, если она не зависит от порядка,
в котором берутся эти объекты.

368

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Можно проверить, что скалярный множитель можно выносить за
знак векторного произведения:
( λa) × b = a × ( λb ) = λ (a × b )

и что справедлив распределительный закон:
(a + b ) × c = a × c + b × c;

c × (a + b ) = c × a + c × b.

(a + 2b ) × (2a − 3b ) = 2a × a − 3a × b + 4b × a − 6b × b = −7a × b.

Пусть векторы a и b даны своими разложениями в декартовых
проекциях
b = bxi + b y j + b z k.

Тогда, если воспользоваться равенствами (проверьте их!)
i × j = k,

j × i = − k,

j × k = i,

k × j = −i,

k × i = j,

i × k = − j,

(1)

получим
a × b = ( a xi + a y j + a z k ) × (bxi + b y j + b z k )=
= a xb y k − a xb z j − a ybx k + a yb z i + a z bx j − a z b yi =
= i( a yb z − a z b y ) + j( a z bx − a xb z ) + k( a xb y − a ybx )

(2)

(продумайте структуру последнего выражения!).
Этот результат очень просто запомнить, если записать его в виде
определителя (см. формулу (VIII.13)):
i

j

k

a × b = ax
bx

ay
by

az .
bz

(3)

Пусть, например, надо вычислить площадь S параллелограмма,
построенного на векторах a = 3i − 2 j + k и b = −2i + j + 4k. Так как
S = a × b , то вычисляем
S =a ×b =

i
j
3 −2
−2

1

k
1 = i( −8 − 1) + j( −2 − 12 ) + k(3 − 4 ) = −9i − 14 j − k;
4
S = a × b = 9 2 + 14 2 + 12 = 16,67.

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

369

Так как в этом примере векторы a, b безразмерные, то и площадь S
получается, соответственно, безразмерной.
Иногда применяется также векторноскалярное или, иначе, смешан
ное произведение трех векторов a, b, c, которое, по определению, рав
но скалярной величине (a × b) ⋅ c. Ее геометрический смысл виден из
рис. 136:
(a × b ) ⋅ c = d ⋅ c = d cd = a × b cd = Sh = V ,

Раскрывая скобки в выражениях, включающих векторное произве
дение, надо тщательно следить за порядком множителей. Приведем
пример:

a = a xi + a y j + a z k,

§ 1]

т.е. смешанное произведение трех векторов равно объему параллелепи
педа, построенного на этих векторах. На рис. 138 векторы a, b, c обра
зуют правую тройку, и получился объем со знаком плюс. Для левой
тройки угол между c и d был бы ту
пой; в этом случае (a × b) ⋅ c = −V . (Пред
полагается, что за основу принято
правило правого винта.) Векторноска
лярное произведение равно нулю тогда
и только тогда, когда все три вектора па
раллельны одной плоскости, так как та
кая параллельность означает, что
Рис. 136.
параллелограмм вырождается в часть
плоскости, т.е. имеет нулевой объем.
Легко получить выражение для смешанного призведения в случае,
если даны разложения сомножителей в декартовой системе координат.
Для этого нужно правую часть (2) помножить обычным способом ска
лярно (по формуле (IX.5)) на вектор c = c x i + c y j + c z k. Это даст после
перегруппировки слагаемых
(a × b ) ⋅ c = ( a yb z − a z b y ) cx + ( a z bx − a xb z ) c y + ( a xb y − a ybx ) c z =
ax
= a x (b y c z − b z c y ) − a y (bx c z − b z cx ) + a z (bx c y − b y cx ) = bx
cx

ay
by
cy

az
bz .
cz

Нам понадобится еще формула для векторновекторного произведе
ния a × (b × c) трех векторов. Для ее вывода представим себе, что мы
выбрали оси координат так, что ось х пошла по вектору b, а ось у ле
жит в плоскости векторов b и c. Тогда вектор b будет иметь проек
цию только на ось х, т.е. b = bx i; аналогично c = c x i + c y j,
a = a x i + a y j + a z k. Пользуясь формулой (3), получаем
i

j

k

b × c = bx

0

0 = bx c y k;

cx

cy

0

i
a × (b × c) = a x
0

j

k

a y a z = a ybx c yi − a xbx c y j.
0 bx c y

368

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Можно проверить, что скалярный множитель можно выносить за
знак векторного произведения:
( λa) × b = a × ( λb ) = λ (a × b )

и что справедлив распределительный закон:
(a + b ) × c = a × c + b × c;

c × (a + b ) = c × a + c × b.

(a + 2b ) × (2a − 3b ) = 2a × a − 3a × b + 4b × a − 6b × b = −7a × b.

Пусть векторы a и b даны своими разложениями в декартовых
проекциях
b = bxi + b y j + b z k.

Тогда, если воспользоваться равенствами (проверьте их!)
i × j = k,

j × i = − k,

j × k = i,

k × j = −i,

k × i = j,

i × k = − j,

(1)

получим
a × b = ( a xi + a y j + a z k ) × (bxi + b y j + b z k )=
= a xb y k − a xb z j − a ybx k + a yb z i + a z bx j − a z b yi =
= i( a yb z − a z b y ) + j( a z bx − a xb z ) + k( a xb y − a ybx )

(2)

(продумайте структуру последнего выражения!).
Этот результат очень просто запомнить, если записать его в виде
определителя (см. формулу (VIII.13)):
i

j

k

a × b = ax
bx

ay
by

az .
bz

(3)

Пусть, например, надо вычислить площадь S параллелограмма,
построенного на векторах a = 3i − 2 j + k и b = −2i + j + 4k. Так как
S = a × b , то вычисляем
S =a ×b =

i
j
3 −2
−2

1

k
1 = i( −8 − 1) + j( −2 − 12 ) + k(3 − 4 ) = −9i − 14 j − k;
4
S = a × b = 9 2 + 14 2 + 12 = 16,67.

ЛИНЕЙНЫЕ ДЕЙСТВИЯ НАД ВЕКТОРАМИ

369

Так как в этом примере векторы a, b безразмерные, то и площадь S
получается, соответственно, безразмерной.
Иногда применяется также векторноскалярное или, иначе, смешан
ное произведение трех векторов a, b, c, которое, по определению, рав
но скалярной величине (a × b) ⋅ c. Ее геометрический смысл виден из
рис. 136:
(a × b ) ⋅ c = d ⋅ c = d cd = a × b cd = Sh = V ,

Раскрывая скобки в выражениях, включающих векторное произве
дение, надо тщательно следить за порядком множителей. Приведем
пример:

a = a xi + a y j + a z k,

§ 1]

т.е. смешанное произведение трех векторов равно объему параллелепи
педа, построенного на этих векторах. На рис. 138 векторы a, b, c обра
зуют правую тройку, и получился объем со знаком плюс. Для левой
тройки угол между c и d был бы ту
пой; в этом случае (a × b) ⋅ c = −V . (Пред
полагается, что за основу принято
правило правого винта.) Векторноска
лярное произведение равно нулю тогда
и только тогда, когда все три вектора па
раллельны одной плоскости, так как та
кая параллельность означает, что
Рис. 136.
параллелограмм вырождается в часть
плоскости, т.е. имеет нулевой объем.
Легко получить выражение для смешанного призведения в случае,
если даны разложения сомножителей в декартовой системе координат.
Для этого нужно правую часть (2) помножить обычным способом ска
лярно (по формуле (IX.5)) на вектор c = c x i + c y j + c z k. Это даст после
перегруппировки слагаемых
(a × b ) ⋅ c = ( a yb z − a z b y ) cx + ( a z bx − a xb z ) c y + ( a xb y − a ybx ) c z =
ax
= a x (b y c z − b z c y ) − a y (bx c z − b z cx ) + a z (bx c y − b y cx ) = bx
cx

ay
by
cy

az
bz .
cz

Нам понадобится еще формула для векторновекторного произведе
ния a × (b × c) трех векторов. Для ее вывода представим себе, что мы
выбрали оси координат так, что ось х пошла по вектору b, а ось у ле
жит в плоскости векторов b и c. Тогда вектор b будет иметь проек
цию только на ось х, т.е. b = bx i; аналогично c = c x i + c y j,
a = a x i + a y j + a z k. Пользуясь формулой (3), получаем
i

j

k

b × c = bx

0

0 = bx c y k;

cx

cy

0

i
a × (b × c) = a x
0

j

k

a y a z = a ybx c yi − a xbx c y j.
0 bx c y

370

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Этот результат неудобен тем, что «привязан» к специальному выбору
осей координат. Поэтому преобразуем его (проверьте!):
a × (b × c) = ( a x cx + a y c y )bxi − a xbx ( cxi + c y j ) = b(a ⋅ c) − c(a ⋅ b ).

(4)

Эта формула уже не содержит координатных проекций, а потому не за
висит от специального выбора системы координат. Для запоминания
этой формулы студенты пользуются фразой: «абц равно бац минус цаб».
Упражнения
1. Найдите площадь треугольника с вершинами A (1; 0; − 2 ), B ( −1; 1; 2 ),
C (1; 3; 3 ).
2. Какую тройку образуют векторы a = 2i − j, b = 3i + 2 k, c = −i − j + k.
3. Вычислив (i × i) × j и i × (i × j ), покажите, что векторное произведение
не обладает свойством ассоциативности.

§ 2. Некоторые приложения к механике
Векторное произведение особенно удобно при описании враща
тельного движения и связанных с ним понятий. Рассмотрим вращение
твердого тела вокруг некоторой оси (рис. 137) с угловой скоростью ω.
Такое вращение принято изображать вектором угло
вой скорости g, который расположен по оси враще
ния и направлен в соответствии с направлением
вращения согласно выбранному правилу винта; на
пример, на рис. 137 направление ω выбрано по пра
вилу правого винта, как мы всегда будем делать. Где
именно на оси берется вектор ω — безразлично; та
кой вектор, который можно произвольно переме
щать вдоль некоторой оси, но не в сторону от этой
оси, называется скользящим*.
Будем считать, что начало координат О выбра
но в любой точке оси вращения, и найдем линейную
Рис. 137.
скорость v произвольной точки M с радиусомвек
тором r (рис. 137). Очевидно, что вектор v пер
пендикулярен обоим векторам r и g, а потому перпендикулярен и
всему параллелограмму (S ), построенному на последних векторах.
Модуль v равен произведению ω на кратчайшее расстояние точ
ки M до оси вращения, т.е. как раз площади указанного параллелог
рамма. Но этим условиям, сформулированным для вектора v, удовлет
воряет векторное произведение g × r . Таким образом,
v = g ×r

(5)

* Напомним, что раньше точка приложения вектора не фиксировалась, считался воз
можным параллельный перенос вектора в любую точку.

§ 2]

НЕКОТОРЫЕ ПРИЛОЖЕНИЯ К МЕХАНИКЕ

371

(проверьте, что векторное произведение надо брать именно в выписан
ном порядке и что правая часть (5) не зависит от конкретного выбора
точки О на оси вращения).
Удобство вектора угловой скорости видно, в частности, из следую
щего. Допустим, что тело испытывает одновременно два вращения
с (вообще говоря, непараллельными) векторами угловой скорос
ти g 1 и g 2 , причем оси вращения пересекаются в точке О. Тогда
в силу формулы (5) линейная скорость любой точки М равна
v = v1 + v2 = g1 × r + g 2 × r = ( g1 + g 2 ) × r = g × r ,

где обозначено g = g 1 + g 2 . Значит, тело вращается с угловой скорос
тью g, и мы приходим к выводу, что при сложении вращений векторы
угловой скорости складываются по правилу параллелограмма. Именно
поэтому и можно называть угловую скорость вектором!
С помощью векторного произведения вводится такое важное поня
тие, как момент произвольного вектора b с началом в точке M отно
сительно любой точки О: по определению, этот момент равен r × b, где

r = OM. В механике наиболее часто рассматривают момент силы F, т.е.
величину r × F , и момент количества движения mv, т.е. величину
r × mv.
При вычислении момента вектора этот вектор можно считать
скользящим. В самом деле, если вектор b скользит сам по себе, то это
значит, что к r прибавляется λb, где λ — какойто скаляр. Однако
(r + λb ) × b = r × b + ( λb ) × b = r × b + 0 = r × b,

т.е. от такого скольжения момент вектора не
меняется (рис. 138). Если же вектор относить
в сторону относительно его направления, то
момент изменяется.
Рассмотрим систему както связанных
между собой материальных частиц, каждая
из которых имеет постоянную массу mi и
(вообще говоря, переменный) радиусвек
тор r i = r i (t). Пусть на каждую из этих точек
действуют различные силы; обозначим рав
Рис. 138.
нодействующую всех «внутренних» сил (т.е.
сил взаимодействия между точками систе
мы), приложенных к iй точке, через Fiin , а равнодействующую всех
«внешних» сил — через Fiex *. Характерная особенность внутренних
сил состоит в том, что на основе третьего закона Ньютона («действие
равно противодействию») для каждой внутренней силы имеется про
* Индексы происходят от латинского «intra» — внутри и «extra» —вне.

370

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Этот результат неудобен тем, что «привязан» к специальному выбору
осей координат. Поэтому преобразуем его (проверьте!):
a × (b × c) = ( a x cx + a y c y )bxi − a xbx ( cxi + c y j ) = b(a ⋅ c) − c(a ⋅ b ).

(4)

Эта формула уже не содержит координатных проекций, а потому не за
висит от специального выбора системы координат. Для запоминания
этой формулы студенты пользуются фразой: «абц равно бац минус цаб».
Упражнения
1. Найдите площадь треугольника с вершинами A (1; 0; − 2 ), B ( −1; 1; 2 ),
C (1; 3; 3 ).
2. Какую тройку образуют векторы a = 2i − j, b = 3i + 2 k, c = −i − j + k.
3. Вычислив (i × i) × j и i × (i × j ), покажите, что векторное произведение
не обладает свойством ассоциативности.

§ 2. Некоторые приложения к механике
Векторное произведение особенно удобно при описании враща
тельного движения и связанных с ним понятий. Рассмотрим вращение
твердого тела вокруг некоторой оси (рис. 137) с угловой скоростью ω.
Такое вращение принято изображать вектором угло
вой скорости g, который расположен по оси враще
ния и направлен в соответствии с направлением
вращения согласно выбранному правилу винта; на
пример, на рис. 137 направление ω выбрано по пра
вилу правого винта, как мы всегда будем делать. Где
именно на оси берется вектор ω — безразлично; та
кой вектор, который можно произвольно переме
щать вдоль некоторой оси, но не в сторону от этой
оси, называется скользящим*.
Будем считать, что начало координат О выбра
но в любой точке оси вращения, и найдем линейную
Рис. 137.
скорость v произвольной точки M с радиусомвек
тором r (рис. 137). Очевидно, что вектор v пер
пендикулярен обоим векторам r и g, а потому перпендикулярен и
всему параллелограмму (S ), построенному на последних векторах.
Модуль v равен произведению ω на кратчайшее расстояние точ
ки M до оси вращения, т.е. как раз площади указанного параллелог
рамма. Но этим условиям, сформулированным для вектора v, удовлет
воряет векторное произведение g × r . Таким образом,
v = g ×r

(5)

* Напомним, что раньше точка приложения вектора не фиксировалась, считался воз
можным параллельный перенос вектора в любую точку.

§ 2]

НЕКОТОРЫЕ ПРИЛОЖЕНИЯ К МЕХАНИКЕ

371

(проверьте, что векторное произведение надо брать именно в выписан
ном порядке и что правая часть (5) не зависит от конкретного выбора
точки О на оси вращения).
Удобство вектора угловой скорости видно, в частности, из следую
щего. Допустим, что тело испытывает одновременно два вращения
с (вообще говоря, непараллельными) векторами угловой скорос
ти g 1 и g 2 , причем оси вращения пересекаются в точке О. Тогда
в силу формулы (5) линейная скорость любой точки М равна
v = v1 + v2 = g1 × r + g 2 × r = ( g1 + g 2 ) × r = g × r ,

где обозначено g = g 1 + g 2 . Значит, тело вращается с угловой скорос
тью g, и мы приходим к выводу, что при сложении вращений векторы
угловой скорости складываются по правилу параллелограмма. Именно
поэтому и можно называть угловую скорость вектором!
С помощью векторного произведения вводится такое важное поня
тие, как момент произвольного вектора b с началом в точке M отно
сительно любой точки О: по определению, этот момент равен r × b, где

r = OM. В механике наиболее часто рассматривают момент силы F, т.е.
величину r × F , и момент количества движения mv, т.е. величину
r × mv.
При вычислении момента вектора этот вектор можно считать
скользящим. В самом деле, если вектор b скользит сам по себе, то это
значит, что к r прибавляется λb, где λ — какойто скаляр. Однако
(r + λb ) × b = r × b + ( λb ) × b = r × b + 0 = r × b,

т.е. от такого скольжения момент вектора не
меняется (рис. 138). Если же вектор относить
в сторону относительно его направления, то
момент изменяется.
Рассмотрим систему както связанных
между собой материальных частиц, каждая
из которых имеет постоянную массу mi и
(вообще говоря, переменный) радиусвек
тор r i = r i (t). Пусть на каждую из этих точек
действуют различные силы; обозначим рав
Рис. 138.
нодействующую всех «внутренних» сил (т.е.
сил взаимодействия между точками систе
мы), приложенных к iй точке, через Fiin , а равнодействующую всех
«внешних» сил — через Fiex *. Характерная особенность внутренних
сил состоит в том, что на основе третьего закона Ньютона («действие
равно противодействию») для каждой внутренней силы имеется про
* Индексы происходят от латинского «intra» — внутри и «extra» —вне.

372

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

тивоположная ей внутренняя сила, причем, что очень важно, располо
женная на продолжении первой. Поэтому сумма всех внутренних сил,
а также сумма их моментов относительно любой точки равны нулю.
Основные уравнения движения системы частиц получаются, если
записать второй закон Ньютона («сила равна произведению массы на
ускорение»):
2

d ri
= Fiex + Fiin .
dt 2

mi

(6)

d 2r
∑ mi dt 2i = ∑ Fiex + ∑ Fiin = ∑ Fiex ,
i
i
i
i

∑ mi ri ,
i

(7)

где M = ∑ mi

∑ mi ri = ∑ Fiex ,
i

i

т.е. M

d 2rC
= ∑ Fiex .
dt 2
i

d 2ri
= ri × Fiex + ri × Fiin .
dt 2

d
∑ (ri × mi vi ) = ∑ ri × Fiex + ∑ ri × Fiin = ∑ ri × Fiex ,
dt i
i
i
i

(9)

(10)

i

моментов количества движения всех частиц, составляющих систему,
называется кинетическим моментом (моментом вращения) этой систе
мы относительно той же точки О, по отношению к которой берутся все
моменты. Сумма

моментов всех внешних сил, действующих на систему, называется по
лным (главным) моментом внешних сил. Таким образом, формулу (9)
можно переписать
dG
= L,
dt

(8)

Воспользуемся равенством
2

Суммируя эти равенства по всем i, получим

i

Итак, центр масс движется так, как будто он обладает полной массой
системы и на него действует сила, равная сумме всех внешних сил.
В частности, если внешние силы отсутствуют, то центр масс системы
движется прямолинейно и равномерно, rC = at + b.
Перейдем к моментам. Если обе части равенства (6) умножить слева
векторно на r i , мы получим
mi ri ×

d
(ri × mi vi ) = ri × Fiex + ri × Fiin .
dt

L = ∑ ri × Fiex

i

— общая масса системы; эта точка называется «центром масс» рассмат
риваемой системы. При таком обозначении уравнение (7) можно пере
писать в виде
d2
dt 2

373

произведения. Отсюда равенство (8) можно переписать так

G = ∑ ri × mi vi

так как сумма всех внутренних сил, как было сказано выше, равна
нулю. Удобно ввести точку С с радиусомвектором
1
M

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

так как сумма моментов всех внутренних сил равна нулю. Сумма

Если просуммировать эти равенства по всем частицам, получим

rC =

§ 3]

2

d ⎛
dri ⎞ dri dri
d r
d r
×
+ ri × 2i = ri × 2i ,
⎟=
⎜ri ×


dt
dt
dt dt
dt
dt

которое вытекает из общей формулы производной векторного произ
d
dA
dB
выводится совер
ведения; эта формула
( A × B) = × B + A ×
dt
dt
dt
шенно так же, как аналогичная формула (IX.8) для скалярного

(11)

т.е. скорость изменения кинетического момента системы равна полному
моменту внешних сил, действующих на эту систему. В частном случае,
если внешние силы отсутствуют или если их полный момент равен нулю,
получаем, что кинетический момент системы остается постоянным.
Упражнение
Когда момент вектора b относительно точки О равен нулю?

§ 3. Движение в поле центральных сил
Пусть при движении материальной частицы на нее действует сила,
изменяющаяся по произвольному закону, но направленная все время
точно к началу координат О (или от него): такое поле сил называется
центральным. Если в начальный момент времени провести через нача
ло координат и вектор скорости плоскость (P),то точка в процессе
движения не может ее покинуть, так как нет сил, которые могли бы вы
вести точку из (P). (Плоскость (P) совпадает с плоскостью рис. 139.)
Так как внешняя сила направлена вдоль радиусавектора, то ее момент
равен нулю, и потому кинетический момент точки, т.е. ее момент коли

372

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

тивоположная ей внутренняя сила, причем, что очень важно, располо
женная на продолжении первой. Поэтому сумма всех внутренних сил,
а также сумма их моментов относительно любой точки равны нулю.
Основные уравнения движения системы частиц получаются, если
записать второй закон Ньютона («сила равна произведению массы на
ускорение»):
2

d ri
= Fiex + Fiin .
dt 2

mi

(6)

d 2r
∑ mi dt 2i = ∑ Fiex + ∑ Fiin = ∑ Fiex ,
i
i
i
i

∑ mi ri ,
i

(7)

где M = ∑ mi

∑ mi ri = ∑ Fiex ,
i

i

т.е. M

d 2rC
= ∑ Fiex .
dt 2
i

d 2ri
= ri × Fiex + ri × Fiin .
dt 2

d
∑ (ri × mi vi ) = ∑ ri × Fiex + ∑ ri × Fiin = ∑ ri × Fiex ,
dt i
i
i
i

(9)

(10)

i

моментов количества движения всех частиц, составляющих систему,
называется кинетическим моментом (моментом вращения) этой систе
мы относительно той же точки О, по отношению к которой берутся все
моменты. Сумма

моментов всех внешних сил, действующих на систему, называется по
лным (главным) моментом внешних сил. Таким образом, формулу (9)
можно переписать
dG
= L,
dt

(8)

Воспользуемся равенством
2

Суммируя эти равенства по всем i, получим

i

Итак, центр масс движется так, как будто он обладает полной массой
системы и на него действует сила, равная сумме всех внешних сил.
В частности, если внешние силы отсутствуют, то центр масс системы
движется прямолинейно и равномерно, rC = at + b.
Перейдем к моментам. Если обе части равенства (6) умножить слева
векторно на r i , мы получим
mi ri ×

d
(ri × mi vi ) = ri × Fiex + ri × Fiin .
dt

L = ∑ ri × Fiex

i

— общая масса системы; эта точка называется «центром масс» рассмат
риваемой системы. При таком обозначении уравнение (7) можно пере
писать в виде
d2
dt 2

373

произведения. Отсюда равенство (8) можно переписать так

G = ∑ ri × mi vi

так как сумма всех внутренних сил, как было сказано выше, равна
нулю. Удобно ввести точку С с радиусомвектором
1
M

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

так как сумма моментов всех внутренних сил равна нулю. Сумма

Если просуммировать эти равенства по всем частицам, получим

rC =

§ 3]

2

d ⎛
dri ⎞ dri dri
d r
d r
×
+ ri × 2i = ri × 2i ,
⎟=
⎜ri ×


dt
dt
dt dt
dt
dt

которое вытекает из общей формулы производной векторного произ
d
dA
dB
выводится совер
ведения; эта формула
( A × B) = × B + A ×
dt
dt
dt
шенно так же, как аналогичная формула (IX.8) для скалярного

(11)

т.е. скорость изменения кинетического момента системы равна полному
моменту внешних сил, действующих на эту систему. В частном случае,
если внешние силы отсутствуют или если их полный момент равен нулю,
получаем, что кинетический момент системы остается постоянным.
Упражнение
Когда момент вектора b относительно точки О равен нулю?

§ 3. Движение в поле центральных сил
Пусть при движении материальной частицы на нее действует сила,
изменяющаяся по произвольному закону, но направленная все время
точно к началу координат О (или от него): такое поле сил называется
центральным. Если в начальный момент времени провести через нача
ло координат и вектор скорости плоскость (P), то точка в процессе
движения не может ее покинуть, так как нет сил, которые могли бы вы
вести точку из (P). (Плоскость (P) совпадает с плоскостью рис. 139.)
Так как внешняя сила направлена вдоль радиусавектора, то ее момент
равен нулю, и потому кинетический момент точки, т.е. ее момент коли

374

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

модуль вектора r × dr равен удвоенной площади
треугольника (dS ), изображенного на рис. 139
(почему?). Поэтому в процессе движения точки
производная dS dt остается постоянной, т.е. S в
зависимости от времени меняется по линейному
закону. Таким образом, мы приходим ко второму
закону Кеплера: при центральной силе площади
секторов, заметаемых радиусом2вектором за рав2
Рис. 139.
ные промежутки времени, равны. Прочие законы
Кеплера, о которых мы скажем позже, существен2
но используют конкретный вид зависимости силы от длины радиу2
са2вектора*.
Пусть F = −F (r)r 0 . В силу § Х.2 такое поле имеет потенциал U (r),
dU
где функция U (r) — первообразная к F (r), т.е.
= F (r). Введем в
dr
плоскости (P) полярные координаты r, ϕ; тогда закон движения час2
тицы определяется зависимостями r = r (t), ϕ = ϕ (t).
Чтобы найти эти зависимости, воспользуемся двумя законами со2
хранения — кинетического момента (§ 2) и полной энергии (§ Х.3). Для
этого обозначим через s 0 вектор, полученный из r 0 поворотом на
90° в положительном направлении. Тогда
dr 0 dϕ 0
=
s .
dt
dt

(Эта довольно очевидная формула является частным случаем форму2
лы (IX.14) и, по существу, совпадает с формулой (V.10).) Отсюда
dr d
dr
dϕ 0
= (r r 0 ) = r 0 + r
s ,
dt dt
dt
dt

r ×m

dr
dϕ 0
= mr 2
r × s 0,
dt
dt

2
2
2
m ⎛ dr ⎞
m ⎡⎛ dr ⎞
⎛ dϕ ⎞ ⎤
⎜ ⎟ = ⎢⎜ ⎟ + ⎜ r ⎟ ⎥.
⎝ dt ⎠ ⎥
2 ⎝ dt ⎠
2 ⎣⎢⎝ dt ⎠


0

0

(12)

2
2
m ⎡⎛ dr ⎞
⎛ dϕ ⎞ ⎤
⎢⎜ ⎟ + ⎜ r ⎟ ⎥ + U ( r ) = E ( = const ).
⎝ dt ⎠ ⎥
2 ⎢⎣⎝ dt ⎠


375

(14)

При этом постоянные G и E определяются начальными условиями.

Выразим из соотношения (13)
и подставим в (14). Мы получим
dt
дифференциальное уравнение 12го порядка
2


m ⎛ dr ⎞
G2 ⎤
⎜ ⎟ + ⎢U ( r ) +
⎥=E
2 ⎝ dt ⎠
2 mr 2 ⎦


(15)

для r (t); найдя r (t), мы можем получить ϕ(t) из уравнения (13).
Уравнение (15) совершенно аналогично уравнению
2

m ⎛ dx ⎞
⎜ ⎟ + u( x ) = E
2 ⎝ dt ⎠

(16)

движения частицы m по оси x под действием силы с потенциалом
u(x). Напомним простые свойства решений уравнения (16), рассмот2
ренные, в частности, в ВМ, § VI.8. Допустим, что график потенциала
u(x) имеет вид, изображенный на рис. 140, так что u(∞) = u ∞ . Тогда
при u min < E < u ∞ , например при E = E1 на рис. 140, частица будет пери2
одически
колебаться,
имея a и b точками воз2
врата, при этом говорят,
что движение финитно; пе2
риод колебаний, как легко
вывести из (16), равен
T = 2m ∫
a

dx
.
E − u( x )
Рис. 140.

0


= G ( = const )
dt

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

b

Так как вектор r × s = P перпендикулярен плоскости (P) и
имеет постоянный модуль, равный 1, то закон сохранения кинетичес2
кого момента можно записать в виде
mr 2

§ 3]

(13)

Закон сохранения полной энергии в силу (12) приобретает вид

(17)

Если же E Iu ∞ , например при E = E2 на рис. 140, частица при движе2
нии налево дойдет до точки с и повернет назад, а при движении напра2
во уйдет на бесконечность, движение инфинитно.
Уравнение (15) примет вид (16), если вместо r писать букву x
(что несущественно) и обозначить
u ( r ) = U( r ) +

* Кеплер нашел свои законы эмпирически, исследуя движение планет солнечной
системы. Только Ньютон показал, что эти законы являются следствием определенного
вида силы тяготения, с которой центральное тело — Солнце действует на планеты.

G2
(0 < r < ∞ ).
2 mr 2

(18)

374

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

модуль вектора r × dr равен удвоенной площади
треугольника (dS ), изображенного на рис. 139
(почему?). Поэтому в процессе движения точки
производная dS dt остается постоянной, т.е. S в
зависимости от времени меняется по линейному
закону. Таким образом, мы приходим ко второму
закону Кеплера: при центральной силе площади
секторов, заметаемых радиусом2вектором за рав2
Рис. 139.
ные промежутки времени, равны. Прочие законы
Кеплера, о которых мы скажем позже, существен2
но используют конкретный вид зависимости силы от длины радиу2
са2вектора*.
Пусть F = −F (r)r 0 . В силу § Х.2 такое поле имеет потенциал U (r),
dU
где функция U (r) — первообразная к F (r), т.е.
= F (r). Введем в
dr
плоскости (P) полярные координаты r, ϕ; тогда закон движения час2
тицы определяется зависимостями r = r (t), ϕ = ϕ (t).
Чтобы найти эти зависимости, воспользуемся двумя законами со2
хранения — кинетического момента (§ 2) и полной энергии (§ Х.3). Для
этого обозначим через s 0 вектор, полученный из r 0 поворотом на
90° в положительном направлении. Тогда
dr 0 dϕ 0
=
s .
dt
dt

(Эта довольно очевидная формула является частным случаем форму2
лы (IX.14) и, по существу, совпадает с формулой (V.10).) Отсюда
dr d
dr
dϕ 0
= (r r 0 ) = r 0 + r
s ,
dt dt
dt
dt

r ×m

dr
dϕ 0
= mr 2
r × s 0,
dt
dt

2
2
2
m ⎛ dr ⎞
m ⎡⎛ dr ⎞
⎛ dϕ ⎞ ⎤
⎜ ⎟ = ⎢⎜ ⎟ + ⎜ r ⎟ ⎥.
⎝ dt ⎠ ⎥
2 ⎝ dt ⎠
2 ⎣⎢⎝ dt ⎠


0

0

(12)

2
2
m ⎡⎛ dr ⎞
⎛ dϕ ⎞ ⎤
⎢⎜ ⎟ + ⎜ r ⎟ ⎥ + U ( r ) = E ( = const ).
⎝ dt ⎠ ⎥
2 ⎢⎣⎝ dt ⎠


375

(14)

При этом постоянные G и E определяются начальными условиями.

Выразим из соотношения (13)
и подставим в (14). Мы получим
dt
дифференциальное уравнение 12го порядка
2


m ⎛ dr ⎞
G2 ⎤
⎜ ⎟ + ⎢U ( r ) +
⎥=E
2 ⎝ dt ⎠
2 mr 2 ⎦


(15)

для r (t); найдя r (t), мы можем получить ϕ(t) из уравнения (13).
Уравнение (15) совершенно аналогично уравнению
2

m ⎛ dx ⎞
⎜ ⎟ + u( x ) = E
2 ⎝ dt ⎠

(16)

движения частицы m по оси x под действием силы с потенциалом
u(x). Напомним простые свойства решений уравнения (16), рассмот2
ренные, в частности, в ВМ, § VI.8. Допустим, что график потенциала
u(x) имеет вид, изображенный на рис. 140, так что u(∞) = u ∞ . Тогда
при u min < E < u ∞ , например при E = E1 на рис. 140, частица будет пери2
одически
колебаться,
имея a и b точками воз2
врата, при этом говорят,
что движение финитно; пе2
риод колебаний, как легко
вывести из (16), равен
T = 2m ∫
a

dx
.
E − u( x )
Рис. 140.

0


= G ( = const )
dt

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

b

Так как вектор r × s = P перпендикулярен плоскости (P) и
имеет постоянный модуль, равный 1, то закон сохранения кинетичес2
кого момента можно записать в виде
mr 2

§ 3]

(13)

Закон сохранения полной энергии в силу (12) приобретает вид

(17)

Если же E Iu ∞ , например при E = E2 на рис. 140, частица при движе2
нии налево дойдет до точки с и повернет назад, а при движении напра2
во уйдет на бесконечность, движение инфинитно.
Уравнение (15) примет вид (16), если вместо r писать букву x
(что несущественно) и обозначить
u ( r ) = U( r ) +

* Кеплер нашел свои законы эмпирически, исследуя движение планет солнечной
системы. Только Ньютон показал, что эти законы являются следствием определенного
вида силы тяготения, с которой центральное тело — Солнце действует на планеты.

G2
(0 < r < ∞ ).
2 mr 2

(18)

376

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Таким образом, к исходному потенциалу U (r) добавляется центро
G2
, зависящий от начальных условий, точнее, от
бежный потенциал
2mr 2
кинетического момента G рассматриваемой системы.
Таким образом, если u min < E < u ∞ (= U ∞ ), то зависимость r (t) бу
дет периодической. За каждый период изменения r полярный угол
получит одно и то же приращение Δϕ.
r = rmax
Так как Δϕ, вообще говоря, несоизме
римо с 2π, то траектория будет, как пра
вило, иметь вид розетки (рис. 141) и при
своем продолжении всюду плотно за
полнит кольцо между окружностями
r = rmin
0 Δϕ
r = rmin и r = rmax .
Однако для двух наиболее интерес
ных видов центральных сил, которые
мы сейчас рассмотрим, траектории по
лучаются замкнутыми и без самопересе
чений, более того — просто эллипсами!
Рис. 141.
В первом примере будем считать, что
сила обратно пропорциональна квадрату расстояния частицы от нача
ла координат. По этому закону движутся небесные тела (закон Ньюто
на) или электрически заряженные частицы (закон Кулона), если
центральное тело, вызвавшее силу притяжения, можно считать покоя
щимся (об этом условии мы поговорим позже).
k
k
В рассматриваемом примере F (r) = 2 , U (r) = − , поэтому в силу
r
r
формулы (18)
k
G2
.
u( r ) = − +
r 2 mr 2

На рис. 142 показан график
этого эффективного потенциала
при k > 0 (как мы будем считать
впредь) и различных значениях
G. Ясно, что если G ≠ 0, т.е. если
движение не вырождается в пря
молинейное, то центробежный
потенциал при r → 0 нарастает
быстрее, чем потенциал притя
жения, а потому u(+0) = ∞; это
означает, что движущаяся части
ца не может упасть на централь
ное тело — во всяком случае,

§ 3]

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

377

если считать его достаточно малым и тем самым пренебречь возмож
ностью того, что частица «налетит» на него, проходя слишком близко
от начала координат.
du
k
G2
, тo минимум эффективного потенциала
Так как
= 2 −
dr r
mr 3
достигается при
k
r2



G2
mr 3

= 0,

откуда r = ~
r=

G2
,
mk

причем u min = −

mk 2
2G 2

.

G2
, которому отвечает движение час
mk
тицы по окружности с центром в начале координат. Соответствующая
угловая скорость определяется из уравнения (13):

Значит, возможно решение r ≡


G
=

dt mr~ 2

k
;
mr~ 3

(19)

она постоянная, т.е. мы получаем равномерное вращение частицы вок
руг центрального тела. Если рассматривается гравитационное поле, то
k =ƒ mM , где ƒ — гравитационная постоянная, а M — масса централь
ного тела. Отсюда в силу (19) получаем период обращения:
T=


= 2π
dϕ dt

2 π ~3 2
mr~ 3
=
r .
ƒ mM
ƒM

Мы пришли к третьему закону Кеплера: квадраты периодов обраще
ния планет пропорциональны кубам их расстояний от Солнца. Здесь
он доказан только для круговых орбит, но при соответствующем уточ
нении формулировки он оказывается справедливым для любых орбит
(см. упражнение 1).
Чтобы выяснить вид некруговых траекторий при G ≠ 0, подставим
в уравнение (15) U (r) = − k r и произведем дополнение до полного
квадрата; мы получим (проверьте!)
2

2

⎛ dr ⎞
⎛k G ⎞
2
⎜ ⎟ +⎜ −
⎟ =q ,
⎝ dt ⎠
⎝ G mr ⎠

(20)
12

⎡2 ⎛
mk 2 ⎞ ⎤
где для краткости обозначено q = ⎢ ⎜ E +
⎟ ⎥ . При этом мы учи
2G 2 ⎠ ⎥⎦
⎢⎣ m ⎝
mk 2
тываем неравенство E > − 2 (откуда оно вытекает?). В силу (20)
2G
можно обозначить
Рис. 142.

k G

= q cos ψ,
G mr

dr
= q sin ψ,
dt

где ψ = ψ( t ).

(21)

376

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Таким образом, к исходному потенциалу U (r) добавляется центро
G2
, зависящий от начальных условий, точнее, от
бежный потенциал
2mr 2
кинетического момента G рассматриваемой системы.
Таким образом, если u min < E < u ∞ (= U ∞ ), то зависимость r (t) бу
дет периодической. За каждый период изменения r полярный угол
получит одно и то же приращение Δϕ.
r = rmax
Так как Δϕ, вообще говоря, несоизме
римо с 2π, то траектория будет, как пра
вило, иметь вид розетки (рис. 141) и при
своем продолжении всюду плотно за
полнит кольцо между окружностями
r = rmin
0 Δϕ
r = rmin и r = rmax .
Однако для двух наиболее интерес
ных видов центральных сил, которые
мы сейчас рассмотрим, траектории по
лучаются замкнутыми и без самопересе
чений, более того — просто эллипсами!
Рис. 141.
В первом примере будем считать, что
сила обратно пропорциональна квадрату расстояния частицы от нача
ла координат. По этому закону движутся небесные тела (закон Ньюто
на) или электрически заряженные частицы (закон Кулона), если
центральное тело, вызвавшее силу притяжения, можно считать покоя
щимся (об этом условии мы поговорим позже).
k
k
В рассматриваемом примере F (r) = 2 , U (r) = − , поэтому в силу
r
r
формулы (18)
k
G2
.
u( r ) = − +
r 2 mr 2

На рис. 142 показан график
этого эффективного потенциала
при k > 0 (как мы будем считать
впредь) и различных значениях
G. Ясно, что если G ≠ 0, т.е. если
движение не вырождается в пря
молинейное, то центробежный
потенциал при r → 0 нарастает
быстрее, чем потенциал притя
жения, а потому u(+0) = ∞; это
означает, что движущаяся части
ца не может упасть на централь
ное тело — во всяком случае,

§ 3]

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

377

если считать его достаточно малым и тем самым пренебречь возмож
ностью того, что частица «налетит» на него, проходя слишком близко
от начала координат.
du
k
G2
, тo минимум эффективного потенциала
Так как
= 2 −
dr r
mr 3
достигается при
k
r2



G2
mr 3

= 0,

откуда r = ~
r=

G2
,
mk

причем u min = −

mk 2
2G 2

.

G2
, которому отвечает движение час
mk
тицы по окружности с центром в начале координат. Соответствующая
угловая скорость определяется из уравнения (13):

Значит, возможно решение r ≡


G
=

dt mr~ 2

k
;
mr~ 3

(19)

она постоянная, т.е. мы получаем равномерное вращение частицы вок
руг центрального тела. Если рассматривается гравитационное поле, то
k =ƒ mM , где ƒ — гравитационная постоянная, а M — масса централь
ного тела. Отсюда в силу (19) получаем период обращения:
T=


= 2π
dϕ dt

2 π ~3 2
mr~ 3
=
r .
ƒ mM
ƒM

Мы пришли к третьему закону Кеплера: квадраты периодов обраще
ния планет пропорциональны кубам их расстояний от Солнца. Здесь
он доказан только для круговых орбит, но при соответствующем уточ
нении формулировки он оказывается справедливым для любых орбит
(см. упражнение 1).
Чтобы выяснить вид некруговых траекторий при G ≠ 0, подставим
в уравнение (15) U (r) = − k r и произведем дополнение до полного
квадрата; мы получим (проверьте!)
2

2

⎛ dr ⎞
⎛k G ⎞
2
⎜ ⎟ +⎜ −
⎟ =q ,
⎝ dt ⎠
⎝ G mr ⎠

(20)
12

⎡2 ⎛
mk 2 ⎞ ⎤
где для краткости обозначено q = ⎢ ⎜ E +
⎟ ⎥ . При этом мы учи
2G 2 ⎠ ⎥⎦
⎢⎣ m ⎝
mk 2
тываем неравенство E > − 2 (откуда оно вытекает?). В силу (20)
2G
можно обозначить
Рис. 142.

k G

= q cos ψ,
G mr

dr
= q sin ψ,
dt

где ψ = ψ( t ).

(21)

378

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

Дифференцируя

первое

равенство

[Гл. XI

получим (G mr 2 )

(21),

dr
=
dt


, откуда, учитывая второе равенство (21), а также равен
dt


ство (13), получаем, что
= − , т.е. ψ = α − ϕ, где α = const опре
dt
dt
деляется начальными условиями. Из первого равенства (21) получаем
= −q sin ψ

r=

G 2 ⎡ Gq

1−
cos(α − ϕ )
⎥⎦
km ⎢⎣
k

−1

−1

= p [1 − ε cos(α − ϕ )] ,

(22)

где обозначено
p=

G2
,
km

ε=

Gq
.
k

Из уравнения (22) сразу видно, что при ε < 1 траектория будет зам
кнутой (рис. 143), тогда как при ε1 она уходит на бесконечность. Нет
рудно проверить, что условие ε < 1 равносильно неравенству E < 0;
таким образом, траекториями ограниченных движений (см. рис. 142)
служат замкнутые линии. Более точно, уравнение (22) при ε < 1 опреде
ляет эллипс с фокусом в начале координат и большой осью, наклонен
ной под углом α к полярной оси. (Для доказательства этого
утверждения, которое мы предоставим читателю, можно перейти к де
картовым координатам по формулам x ′ = ρ cos(ϕ − α), y ′ = ρ sin(ϕ − α).)
Таким образом, траекториями ограниченных движений служат эллипсы
с одним из фокусов в центральном теле; в этом состоит первый закон
Кеплера. Аналогично проверяется, что при ε > 1 движение происходит
по гиперболе, а в пограничном случае, при ε = 1, — по параболе.

d

Рис. 143.

0

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

379

До сих пор мы считали центральное тело как бы «приклепанным»
к началу координат. Движением центрального тела можно пренебречь,
если его масса М существенно больше движущейся массы m, M  m.
Оказывается — мы не будем здесь это доказывать, — что случай сравни
мых масс М и m приводится к разобранному, однако кривые второго
порядка, по которым движутся обе массы, будут тогда иметь фокус
в центре масс всей системы. Интересно, что при этом распределение
между обоими телами как значений кинетической энергии, так и мо
ментов количества движения относительно центра масс получается
о б р а т н о п р о п о р ц и о н а л ь н ы м массам этих тел. В самом деле,
ограничимся для простоты случаем, когда тела движутся по окружнос
тям с центром в центре масс О с постоянной угловой скоростью ω,
и обозначим через d (постоянное) расстояние между телами
(рис. 144). Тогда кинетическая энергия и момент количества движения
2
M ⎛ ωmd ⎞
md Mωmd
, тогда
массы М равны соответственно
⎟ и



2 M +m
M +m M +m
2

m ⎛ ωMd ⎞
Md mωMd
,
⎟ и

2 ⎝ M + m⎠
M +m M +m
откуда и вытекает обратная пропорциональность.
Случай отталкивания по закону Кулона, т.е. k < 0, мы предоставляем
рассмотреть читателю; отметим только, что при G ≠ 0 траектории
представляют собой гиперболы.
В качестве другого примера центральной силы рассмотрим силу
F = − kr (k > 0), пропорциональную расстоянию частицы от начала ко
k
ординат. Здесь потенциал U (r) = r 2 . В декартовых координатах рас
2
сматриваемый потенциал можно записать в виде
как для массы m эти величины равны

k
U = ( x 2 + y 2 + z 2 ).
2

m d
M+m
M

§ 3]

m
M d
M+m

Рис. 144.

Можно доказать, что, и обратно, из законов Кеплера вытекает закон
притяжения F (r) = k r 2 , поэтому движения по такому закону называ
ются кеплеровыми.

В силу § IV.6 такой вид имеет главная (квадратичная) часть разложе
ния потенциала U по степеням х, у, z в окрестности точки его ми
нимума в изотропном случае, т.е. когда эквипотенциальные
поверхности представляют собой, с точностью до малых высшего по
рядка, не эллипсоиды, а сферы. Поэтому рассматриваемый потенциал
описывает малые колебания частицы вблизи произвольного положе
ния ее устойчивого равновесия (без особенности у потенциала) в изо
тропном случае. Такой случай реализуется, например, для схемы
рис. 145, если все пружины имеют одинаковую жесткость. Из § Х.6 вы
текает, что такой потенциал возникает также внутри однородного
притягивающего шара; можно представить, что частица движется
внутри канала, просверленного в соответствии с рассчитанной траек

378

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

Дифференцируя

первое

равенство

[Гл. XI

получим (G mr 2 )

(21),

dr
=
dt


, откуда, учитывая второе равенство (21), а также равен
dt


ство (13), получаем, что
= − , т.е. ψ = α − ϕ, где α = const опре
dt
dt
деляется начальными условиями. Из первого равенства (21) получаем
= −q sin ψ

r=

G 2 ⎡ Gq

1−
cos(α − ϕ )
⎥⎦
km ⎢⎣
k

−1

−1

= p [1 − ε cos(α − ϕ )] ,

(22)

где обозначено
p=

G2
,
km

ε=

Gq
.
k

Из уравнения (22) сразу видно, что при ε < 1 траектория будет зам
кнутой (рис. 143), тогда как при ε1 она уходит на бесконечность. Нет
рудно проверить, что условие ε < 1 равносильно неравенству E < 0;
таким образом, траекториями ограниченных движений (см. рис. 142)
служат замкнутые линии. Более точно, уравнение (22) при ε < 1 опреде
ляет эллипс с фокусом в начале координат и большой осью, наклонен
ной под углом α к полярной оси. (Для доказательства этого
утверждения, которое мы предоставим читателю, можно перейти к де
картовым координатам по формулам x ′ = ρ cos(ϕ − α), y ′ = ρ sin(ϕ − α).)
Таким образом, траекториями ограниченных движений служат эллипсы
с одним из фокусов в центральном теле; в этом состоит первый закон
Кеплера. Аналогично проверяется, что при ε > 1 движение происходит
по гиперболе, а в пограничном случае, при ε = 1, — по параболе.

d

Рис. 143.

0

ДВИЖЕНИЕ В ПОЛЕ ЦЕНТРАЛЬНЫХ СИЛ

379

До сих пор мы считали центральное тело как бы «приклепанным»
к началу координат. Движением центрального тела можно пренебречь,
если его масса М существенно больше движущейся массы m, M  m.
Оказывается — мы не будем здесь это доказывать, — что случай сравни
мых масс М и m приводится к разобранному, однако кривые второго
порядка, по которым движутся обе массы, будут тогда иметь фокус
в центре масс всей системы. Интересно, что при этом распределение
между обоими телами как значений кинетической энергии, так и мо
ментов количества движения относительно центра масс получается
о б р а т н о п р о п о р ц и о н а л ь н ы м массам этих тел. В самом деле,
ограничимся для простоты случаем, когда тела движутся по окружнос
тям с центром в центре масс О с постоянной угловой скоростью ω,
и обозначим через d (постоянное) расстояние между телами
(рис. 144). Тогда кинетическая энергия и момент количества движения
2
M ⎛ ωmd ⎞
md Mωmd
, тогда
массы М равны соответственно
⎟ и



2 M +m
M +m M +m
2

m ⎛ ωMd ⎞
Md mωMd
,
⎟ и

2 ⎝ M + m⎠
M +m M +m
откуда и вытекает обратная пропорциональность.
Случай отталкивания по закону Кулона, т.е. k < 0, мы предоставляем
рассмотреть читателю; отметим только, что при G ≠ 0 траектории
представляют собой гиперболы.
В качестве другого примера центральной силы рассмотрим силу
F = − kr (k > 0), пропорциональную расстоянию частицы от начала ко
k
ординат. Здесь потенциал U (r) = r 2 . В декартовых координатах рас
2
сматриваемый потенциал можно записать в виде
как для массы m эти величины равны

k
U = ( x 2 + y 2 + z 2 ).
2

m d
M+m
M

§ 3]

m
M d
M+m

Рис. 144.

Можно доказать, что, и обратно, из законов Кеплера вытекает закон
притяжения F (r) = k r 2 , поэтому движения по такому закону называ
ются кеплеровыми.

В силу § IV.6 такой вид имеет главная (квадратичная) часть разложе
ния потенциала U по степеням х, у, z в окрестности точки его ми
нимума в изотропном случае, т.е. когда эквипотенциальные
поверхности представляют собой, с точностью до малых высшего по
рядка, не эллипсоиды, а сферы. Поэтому рассматриваемый потенциал
описывает малые колебания частицы вблизи произвольного положе
ния ее устойчивого равновесия (без особенности у потенциала) в изо
тропном случае. Такой случай реализуется, например, для схемы
рис. 145, если все пружины имеют одинаковую жесткость. Из § Х.6 вы
текает, что такой потенциал возникает также внутри однородного
притягивающего шара; можно представить, что частица движется
внутри канала, просверленного в соответствии с рассчитанной траек

380

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

торией в этом шаре, настолько тонкого,
что влиянием его на гравитационное
поле можно пренебречь.
Если принять плоскость, в которой
движется частица, за плоскость х, у, то
в рассматриваемом примере дифферен
циальное уравнение движения можно за
писать в виде
m
Рис. 145.

d2
( xi + yj ) = −kr r 0 = −kr = −k( xi + yj )
dt 2

§ 4]

ВРАЩЕНИЕ ТВЕРДОГО ТЕЛА

тельно малых отклонений реальных траекторий от эллиптической
формы (например, движение перигелия Меркурия; как известно, объяс
нение этого движения, вытекающее из общей теории относительности,
послужило одним из первых решающих подтверждений этой теории).
Упражнения
1. Найдите период колебаний частицы по эллипсу (22) и установите связь
этого периода с большой полуосью эллипса.
2. Найдите период изменения радиуса траектории частицы для закона
притяжения F = −kr с помощью формулы (17) и объясните расхождение от
вета с результатом, полученным в этом параграфе.

или, в проекциях,

§ 4. Вращение твердого тела
d 2x
d 2y
m 2 + kx = 0, m 2 + ky = 0.
dt
dt

Таким образом, в декартовых координатах переменные разделились,
т.е. колебания по обеим осям происходят независимо друг от друга. За
кон движения в силу § VII.3 имеет вид
x = r1 cos(ωt + ϕ1 ),

где ω =

381

y = r2 cos(ωt + ϕ 2 ),

Рассмотрим вращение твердого тела (Ω) вокруг фиксированной
оси, за которую мы примем ось z. Кинетический момент G этого тела
относительно какойлибо точки О на оси вращения легко связать
с угловой скоростью g = ωk вращения, пользуясь формулой (5):
G=

(23)

k m , а постоянные r1 , ϕ 1 , r2 , ϕ 2 определяются начальны

ми условиями. Мы предоставляем читателю убедиться в том, что урав
нения (23) определяют в качестве траектории частицы эллипс с цен
тром в начале координат.
Таким образом, для силы F (r) = kr все траектории также оказыва
ются замкнутыми, причем период 2π ω = 2π m k колебаний частицы
не зависит от начальных условий. Отсюда вытекает, например, что если
прорыть через центр Земли колодец и выкачать из него воздух, то пери
од колебаний камня, брошенного в этот колодец, не будет зависеть от
амплитуды и окажется равным времени обращения спутников на уров
не земной поверхности (без сопротивления воздуха).
Конечно, во втором из разобранных примеров замкнутость траекто
рий получилась изза того, что в декартовых осях переменные раздели
лись, а колебания по обеим осям имели одинаковый период. Но
удивительно и замечательно то, что и в первом примере, где переменные
не разделяются, траектории тоже оказались замкнутыми! Это похоже на
2
некое математическое чудо. В самом деле, форма закона F = k r была
в § Х.7 получена непосредственно из условия div F(r) = 0 (r ≠ 0), естес
твенного с точки зрения физики. В отличие от этого, замкнутость траек
торий при таком законе притяжения отнюдь не очевидна и доказана
с помощью искусственных математических выкладок. Это «чудо» зна
чительно облегчило измерение и тем самым упростило анализ сравни

∫ r × v dm = ∫ r × (ωk × r ) ρ dΩ =ω ∫ ρr × ( k × r ) dΩ,

(Ω )

(Ω )

(Ω )

где через ρ мы обозначили (вообще говоря, непостоянную) плотность
тела. Вспомнив, что r = xi + yj + zk, найдем по формуле (4)
r × ( k × r ) = (r ⋅ r )k − (r ⋅ k )r = ( x 2 + y 2 + z 2 )k − z( xi + yj + zk ) =
= − xzi − yzj + ( x 2 + y 2 )k,

откуда
G x = −ω ∫ ρxz d Ω,
(Ω )

G y = −ω ∫ ρyz d Ω,
(Ω )

G z = ω ∫ ρ( x 2 + y 2 ) d Ω.
(Ω )

В частности, последний интеграл
Iz =

∫ ρ( x

2

+ y2 ) d Ω

(24)

(Ω )

называется моментом инерции тела (Ω) относительно оси z, так что
G z = ωI z .
Допустим, что на тело (Ω) действуют некоторые заданные силы
Fiex и силы F jоп реакции в опорах, заранее не заданные. Если эти по
следние силы приложены к оси вращения, то их момент r оп × F jоп =
= z оп k × F jоп перпендикулярен оси z. Чтобы не рассматривать эти не
известные силы, спроецируем равенство (11) на ось z, что даст
dG z d (ωI z )
=
= Lz ,
dt
dt

(25)

380

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

торией в этом шаре, настолько тонкого,
что влиянием его на гравитационное
поле можно пренебречь.
Если принять плоскость, в которой
движется частица, за плоскость х, у, то
в рассматриваемом примере дифферен
циальное уравнение движения можно за
писать в виде
m
Рис. 145.

d2
( xi + yj ) = −kr r 0 = −kr = −k( xi + yj )
dt 2

§ 4]

ВРАЩЕНИЕ ТВЕРДОГО ТЕЛА

тельно малых отклонений реальных траекторий от эллиптической
формы (например, движение перигелия Меркурия; как известно, объяс
нение этого движения, вытекающее из общей теории относительности,
послужило одним из первых решающих подтверждений этой теории).
Упражнения
1. Найдите период колебаний частицы по эллипсу (22) и установите связь
этого периода с большой полуосью эллипса.
2. Найдите период изменения радиуса траектории частицы для закона
притяжения F = −kr с помощью формулы (17) и объясните расхождение от
вета с результатом, полученным в этом параграфе.

или, в проекциях,

§ 4. Вращение твердого тела
d 2x
d 2y
m 2 + kx = 0, m 2 + ky = 0.
dt
dt

Таким образом, в декартовых координатах переменные разделились,
т.е. колебания по обеим осям происходят независимо друг от друга. За
кон движения в силу § VII.3 имеет вид
x = r1 cos(ωt + ϕ1 ),

где ω =

381

y = r2 cos(ωt + ϕ 2 ),

Рассмотрим вращение твердого тела (Ω) вокруг фиксированной
оси, за которую мы примем ось z. Кинетический момент G этого тела
относительно какойлибо точки О на оси вращения легко связать
с угловой скоростью g = ωk вращения, пользуясь формулой (5):
G=

(23)

k m , а постоянные r1 , ϕ 1 , r2 , ϕ 2 определяются начальны

ми условиями. Мы предоставляем читателю убедиться в том, что урав
нения (23) определяют в качестве траектории частицы эллипс с цен
тром в начале координат.
Таким образом, для силы F (r) = kr все траектории также оказыва
ются замкнутыми, причем период 2π ω = 2π m k колебаний частицы
не зависит от начальных условий. Отсюда вытекает, например, что если
прорыть через центр Земли колодец и выкачать из него воздух, то пери
од колебаний камня, брошенного в этот колодец, не будет зависеть от
амплитуды и окажется равным времени обращения спутников на уров
не земной поверхности (без сопротивления воздуха).
Конечно, во втором из разобранных примеров замкнутость траекто
рий получилась изза того, что в декартовых осях переменные раздели
лись, а колебания по обеим осям имели одинаковый период. Но
удивительно и замечательно то, что и в первом примере, где переменные
не разделяются, траектории тоже оказались замкнутыми! Это похоже на
2
некое математическое чудо. В самом деле, форма закона F = k r была
в § Х.7 получена непосредственно из условия div F(r) = 0 (r ≠ 0), естес
твенного с точки зрения физики. В отличие от этого, замкнутость траек
торий при таком законе притяжения отнюдь не очевидна и доказана
с помощью искусственных математических выкладок. Это «чудо» зна
чительно облегчило измерение и тем самым упростило анализ сравни

∫ r × v dm = ∫ r × (ωk × r ) ρ dΩ =ω ∫ ρr × ( k × r ) dΩ,

(Ω )

(Ω )

(Ω )

где через ρ мы обозначили (вообще говоря, непостоянную) плотность
тела. Вспомнив, что r = xi + yj + zk, найдем по формуле (4)
r × ( k × r ) = (r ⋅ r )k − (r ⋅ k )r = ( x 2 + y 2 + z 2 )k − z( xi + yj + zk ) =
= − xzi − yzj + ( x 2 + y 2 )k,

откуда
G x = −ω ∫ ρxz d Ω,
(Ω )

G y = −ω ∫ ρyz d Ω,
(Ω )

G z = ω ∫ ρ( x 2 + y 2 ) d Ω.
(Ω )

В частности, последний интеграл
Iz =

∫ ρ( x

2

+ y2 ) d Ω

(24)

(Ω )

называется моментом инерции тела (Ω) относительно оси z, так что
G z = ωI z .
Допустим, что на тело (Ω) действуют некоторые заданные силы
Fiex и силы F jоп реакции в опорах, заранее не заданные. Если эти по
следние силы приложены к оси вращения, то их момент r оп × F jоп =
= z оп k × F jоп перпендикулярен оси z. Чтобы не рассматривать эти не
известные силы, спроецируем равенство (11) на ось z, что даст
dG z d (ωI z )
=
= Lz ,
dt
dt

(25)

382

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

причем при образовании правой части, т.е. проекции полного момента
внешних сил на ось вращения, надо учитывать только заданные силы
Fiex . Таким образом, от векторного равенства (11) мы перешли к ска
лярному равенству (25).
Рассмотрим, в частности, случай, когда внешние силы Fiex отсут
ствуют или направлены параллельно оси вращения. Тогда L z = 0 и из
(25) получаем ωI z = const. Если при этом тело не меняется, то
I z = const, а потому и ω = const, т.е. угловая скорость вращения не ме
няется. (При этом мы пренебрегаем трением в опорах, которое приво
дит к дополнительному слагаемому в правой части (25) и, как
следствие, к затуханию скорости вращения.) Если же I z меняется, то
ω изменяется обратно пропорционально I z . Этим свойством пользу
ется танцовщица, когда она вращается («делает туры») на одной ноге.
Начав вращение с расставленными руками, она быстро сводит их (об
ычно книзу, переводя их в «подготовительное положение»). При этом
в силу формулы (24) получается, что она уменьшает I z своего тела
(причем довольно сильно, так как расставленные руки дают в I z зна
чительный вклад) и соответственно увеличивает ω. (Как сказано
в «Основах классического танца» А.Я. Вагановой, «этим движением
рук и берется нужный для тура форс».) Одновременно она приподни
мается на носок (на «полупальцы» или на пальцы) для уменьшения
трения. После нескольких оборотов она вновь разводит руки, умень
шая ω, и становится на обе ступни, что приводит к полной остановке.
Рассмотрим теперь гироскоп (волчок), т.е. твердое тело, вращающее
ся вокруг неподвижной точки, которую мы примем за начало коорди
нат. Принимается, что гироскоп имеет ось симметрии, проходящую
через точку закрепления, и быстро вращается вокруг этой оси, а силы
трения пренебрежимо малы.
Заметим, что если твердое тело вращается вокруг оси симметрии,
проходящей через начало координат, то кинетический момент этого
тела направлен по оси вращения и пропорционален угловой скорости
вращения. В самом деле, первое вытекает хотя бы из соображений сим
метрии, а второе — непосредственно из определения (10). С другой сто
роны, в механике выводится, что силы тяжести можно заменить
равнодействующей, проходящей через центр тяжести тела, который,
очевидно, лежит на оси симметрии. Поэтому если гироскоп закреплен
в центре тяжести или если он запущен в вертикальном положении
(в обоих этих случаях момент силы тяжести равен нулю), то из раве
нства (11) вытекает, что кинетический момент, а с ним и ось вращения
остаются постоянными. При кратковременных толчках правая часть
(11) может на короткое время становиться отличной от нуля. При этом
G получит некоторое приращение, однако чем больше угловая ско
рость, т.е. чем больше G , тем меньше относительное значение этого

§ 5]

СИММЕТРИЧЕСКИЕ И АНТИСИММЕТРИЧЕСКИЕ ТЕНЗОРЫ

383

приращения, т.е. тем устойчивее гироскоп. На этом свойстве основано
применение гироскопа в технике.
Рассмотрим теперь, что произойдет, если центр тяжести располо
жен выше точки закрепления (как это будет, в частности, для детского
волчка), а ось вращения расположена невертикально. В этом случае
сила тяжести P, приложенная к центру тя
жести С, создает опрокидывающий мо
мент rC × P (рис. 146). В силу уравнения
(11) кинетический момент G за время dt
получит бесконечно малое приращение
dG = (rC × P) dt. Так как этот бесконечно
малый вектор горизонтален и перпендику
лярен вектору G, то вектор G+dG получа
ется из G поворотом на бесконечно малый
Рис. 146.
угол вокруг вертикальной оси. Это значит,
что численное значение угловой скорости не изменится, но ось враще
ния гироскопа повернется вокруг вертикальной оси. К новому положе
нию можно применить то же рассуждение, и мы видим, таким образом,
что под действием силы тяжести ось симметрии гироскопа получает
дополнительное равномерное вращательное движение (так называе
мое прецессионное движение) вокруг вертикальной оси. Скорость пре
цессии тем меньше, чем больше ω, так как при бо´льшем G то же
самое dG влечет за собой меньший поворот.
Сделанные выше выводы не являются вполне точными, так как изза
прецессии кинетический момент идет не точно по оси гироскопа, а от
клоняется от нее. Поэтому в действительности движение гироскопа яв
ляется более сложным, чем описано выше. Однако пока угловая
скорость ω велика, эта поправка незначительна. Если гироскоп не под
кручивается и изза неизбежного постоянно действующего трения угло
вая скорость уменьшается, то скорость прецессии увеличивается, а когда
эти скорости становятся сравнимыми, характер движения существенно
изменяется и, в конце концов, волчок падает.
Упражнение
Вычислите I z для однородного: а) цилиндра радиуса R массы M с осью
вращения Oz; б) прямолинейного стержня длины L массы m, если ось
Oz служит перпендикуляром к середине стержня.

§ 5. Симметрические и антисимметрические тензоры
Рассмотрение кинетического момента твердого тела служит хорошей
областью приложения понятия тензора (§ IX.5). Будем пользоваться
тензорными обозначениями, примененными в § IX.5. Пусть начало ко
ординат О зафиксировано, но оси координат могут выбираться
поразному. Из § 4 видно, что при рассмотрении кинетического момента

382

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

причем при образовании правой части, т.е. проекции полного момента
внешних сил на ось вращения, надо учитывать только заданные силы
Fiex . Таким образом, от векторного равенства (11) мы перешли к ска
лярному равенству (25).
Рассмотрим, в частности, случай, когда внешние силы Fiex отсут
ствуют или направлены параллельно оси вращения. Тогда L z = 0 и из
(25) получаем ωI z = const. Если при этом тело не меняется, то
I z = const, а потому и ω = const, т.е. угловая скорость вращения не ме
няется. (При этом мы пренебрегаем трением в опорах, которое приво
дит к дополнительному слагаемому в правой части (25) и, как
следствие, к затуханию скорости вращения.) Если же I z меняется, то
ω изменяется обратно пропорционально I z . Этим свойством пользу
ется танцовщица, когда она вращается («делает туры») на одной ноге.
Начав вращение с расставленными руками, она быстро сводит их (об
ычно книзу, переводя их в «подготовительное положение»). При этом
в силу формулы (24) получается, что она уменьшает I z своего тела
(причем довольно сильно, так как расставленные руки дают в I z зна
чительный вклад) и соответственно увеличивает ω. (Как сказано
в «Основах классического танца» А.Я. Вагановой, «этим движением
рук и берется нужный для тура форс».) Одновременно она приподни
мается на носок (на «полупальцы» или на пальцы) для уменьшения
трения. После нескольких оборотов она вновь разводит руки, умень
шая ω, и становится на обе ступни, что приводит к полной остановке.
Рассмотрим теперь гироскоп (волчок), т.е. твердое тело, вращающее
ся вокруг неподвижной точки, которую мы примем за начало коорди
нат. Принимается, что гироскоп имеет ось симметрии, проходящую
через точку закрепления, и быстро вращается вокруг этой оси, а силы
трения пренебрежимо малы.
Заметим, что если твердое тело вращается вокруг оси симметрии,
проходящей через начало координат, то кинетический момент этого
тела направлен по оси вращения и пропорционален угловой скорости
вращения. В самом деле, первое вытекает хотя бы из соображений сим
метрии, а второе — непосредственно из определения (10). С другой сто
роны, в механике выводится, что силы тяжести можно заменить
равнодействующей, проходящей через центр тяжести тела, который,
очевидно, лежит на оси симметрии. Поэтому если гироскоп закреплен
в центре тяжести или если он запущен в вертикальном положении
(в обоих этих случаях момент силы тяжести равен нулю), то из раве
нства (11) вытекает, что кинетический момент, а с ним и ось вращения
остаются постоянными. При кратковременных толчках правая часть
(11) может на короткое время становиться отличной от нуля. При этом
G получит некоторое приращение, однако чем больше угловая ско
рость, т.е. чем больше G , тем меньше относительное значение этого

§ 5]

СИММЕТРИЧЕСКИЕ И АНТИСИММЕТРИЧЕСКИЕ ТЕНЗОРЫ

383

приращения, т.е. тем устойчивее гироскоп. На этом свойстве основано
применение гироскопа в технике.
Рассмотрим теперь, что произойдет, если центр тяжести располо
жен выше точки закрепления (как это будет, в частности, для детского
волчка), а ось вращения расположена невертикально. В этом случае
сила тяжести P, приложенная к центру тя
жести С, создает опрокидывающий мо
мент rC × P (рис. 146). В силу уравнения
(11) кинетический момент G за время dt
получит бесконечно малое приращение
dG = (rC × P) dt. Так как этотбесконечно
малый вектор горизонтален и перпендику
лярен вектору G, то вектор G+dG получа
ется из G поворотом на бесконечно малый
Рис. 146.
угол вокруг вертикальной оси. Это значит,
что численное значение угловой скорости не изменится, но ось враще
ния гироскопа повернется вокруг вертикальной оси. К новому положе
нию можно применить то же рассуждение, и мы видим, таким образом,
что под действием силы тяжести ось симметрии гироскопа получает
дополнительное равномерное вращательное движение (так называе
мое прецессионное движение) вокруг вертикальной оси. Скорость пре
цессии тем меньше, чем больше ω, так как при бо´льшем G то же
самое dG влечет за собой меньший поворот.
Сделанные выше выводы не являются вполне точными, так как изза
прецессии кинетический момент идет не точно по оси гироскопа, а от
клоняется от нее. Поэтому в действительности движение гироскопа яв
ляется более сложным, чем описано выше. Однако пока угловая
скорость ω велика, эта поправка незначительна. Если гироскоп не под
кручивается и изза неизбежного постоянно действующего трения угло
вая скорость уменьшается, то скорость прецессии увеличивается, а когда
эти скорости становятся сравнимыми, характер движения существенно
изменяется и, в конце концов, волчок падает.
Упражнение
Вычислите I z для однородного: а) цилиндра радиуса R массы M с осью
вращения Oz; б) прямолинейного стержня длины L массы m, если ось
Oz служит перпендикуляром к середине стержня.

§ 5. Симметрические и антисимметрические тензоры
Рассмотрение кинетического момента твердого тела служит хорошей
областью приложения понятия тензора (§ IX.5). Будем пользоваться
тензорными обозначениями, примененными в § IX.5. Пусть начало ко
ординат О зафиксировано, но оси координат могут выбираться
поразному. Из § 4 видно, что при рассмотрении кинетического момента

384

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

тела Ω существенную роль играют интегралы

(i ≠ j ),
⎪− ∫ ρ x i x j d Ω
⎪ (Ω )
Ii j = ⎨

⎪ ∫ ρ ( xk xk − xi x j ) d Ω (i = j ).
⎩ (Ω )

(27)

∫ ρ(δ i j xk xk − xi x j ) dΩ,

где символ Кронекера δ i j при любом выборе базиса определен равенствами
⎧0 (i ≠ j ),
δij = ⎨
⎩1 (i = j ).

Мы предоставляем читателю убедиться в том, что величины δ i j обра
зуют тензор 2го ранга (он называется единичным тензором). Если те
перь базис заменен по формулам (IX.19), то величины x i как
проекции вектора r , преобразуются по формулам x i′ = α i j x j , откуда,
применяя равенство x k′ x k′ = x k x k (откуда оно следует?), получаем

∫ ρ(δ i j x′k x′k − x′i x′j ) dΩ = ∫ ρ(α i r α j l δ r l xk xk − α i r α j l xr xl ) dΩ =

(Ω )

(Ω )

=αi rα j l

∫ ρ(δ r l xk xk − xr xl ) dΩ = α i r α j l I r l ,

(Ω )

что и требовалось доказать.
Пусть теперь тело (Ω) вращается с угловой скоростью g вокруг
оси, проходящей через начало координат О; покажем, как выражается
соответствующий кинетический момент G относительно О. Рассуж
дая, как в § 4, и пользуясь формулой (4), получаем
G=

∫ ρr × ( g × r ) d Ω = ∫ ρ[(r ⋅ r ) g − (r ⋅ g)r ] d Ω =

(Ω )

(Ω )

=

∫ ρ[ xk xkω iei − x jω j xiei ] dΩ.

(Ω )

385

∫ ρ(δ i j xk xk − xi x j )ω jei dΩ = I i jω jei ,

(Ω )

другими словами,

(Ω )

I ′i j =

G=

(26)

называемый тензором инерции тела (Ω) относительно точки О. Для
доказательства запишем величины I i j единой формулой:
Ii j =

СИММЕТРИЧЕСКИЕ И АНТИСИММЕТРИЧЕСКИЕ ТЕНЗОРЫ

Чтобы вынести под знаком интеграла за скобки ω j и e i , запишем
ω i = δ i j ω j (продумайте эту формулу!); это даст

Нетрудно проверить, что при замене координатного базиса величи
ны (26) преобразуются по тензорному правилу (IX.23) и потому обра
зуют тензор 2го ранга
I = I i jeie j ,

§ 5]

G i = I i jω j .

(Можно написать также G = I ⋅ g, где скалярное произведение тензора
2го ранга на вектор определяется с помощью формул (ab) ⋅ c = a(b ⋅ c) =
= (b ⋅ c)a, откуда
I ⋅ g = ( I i jei e j ) ⋅ ω kek = I i jω kei ( e j ⋅ ek ) = I i jω keiδ j k = G. )

Формула (29), по существу, совпадает с формулами § 4, однако не
связана, как это было в § 4, со специальным выбором декартовых осей.
Она показывает, в частности, что, за исключением сферически симмет
ричного случая (когда I i j = Iδ i j ), направления векторов g и G, во
обще говоря, различны. Например, если для тела,
изображенного на рис. 147, массы втулки и стержня
пренебрежимо малы по сравнению с m, то момент
вращения согласно формуле (4) равен
G = ρr × ( g × r ) = ρr 2 g − (ω пр ω r )r ,

т.е. вектор G вращается с угловой скоростью g.
Это изменение момента вращения в силу формулы
Рис. 147.
(11) компенсируется моментом, передаваемым
втулкой на ось вращения.
Выведем еще формулу для кинетической энергии T вращающего
ся тела (Ω). Для этого заметим сначала, что для любых двух векторов a,
b на основании известной формулы для площади параллелограмма бу


дет a × b = absin (a, b). С другой стороны, a ⋅ b = ab cos (a, b). Отсюда


2
a × b + (a ⋅ b )2 = a 2b 2 [sin 2 (a, b ) + cos2 (a, b )] = a 2b 2 .

(30)

Умножим равенство (28) скалярно на g и воспользуемся форму
лой (30); мы получим
G⋅g=

(28)

(29)

∫ ρ[(r ⋅ r )( g ⋅ g) − (r ⋅ g)(r ⋅ g)] dΩ = ∫ ρ r × g

(Ω )

(Ω )

2

dΩ = 2T .

384

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

тела Ω существенную роль играют интегралы

(i ≠ j ),
⎪− ∫ ρ x i x j d Ω
⎪ (Ω )
Ii j = ⎨

⎪ ∫ ρ ( xk xk − xi x j ) d Ω (i = j ).
⎩ (Ω )

(27)

∫ ρ(δ i j xk xk − xi x j ) dΩ,

где символ Кронекера δ i j при любом выборе базиса определен равенствами
⎧0 (i ≠ j ),
δij = ⎨
⎩1 (i = j ).

Мы предоставляем читателю убедиться в том, что величины δ i j обра
зуют тензор 2го ранга (он называется единичным тензором). Если те
перь базис заменен по формулам (IX.19), то величины x i как
проекции вектора r , преобразуются по формулам x i′ = α i j x j , откуда,
применяя равенство x k′ x k′ = x k x k (откуда оно следует?), получаем

∫ ρ(δ i j x′k x′k − x′i x′j ) dΩ = ∫ ρ(α i r α j l δ r l xk xk − α i r α j l xr xl ) dΩ =

(Ω )

(Ω )

=αi rα j l

∫ ρ(δ r l xk xk − xr xl ) dΩ = α i r α j l I r l ,

(Ω )

что и требовалось доказать.
Пусть теперь тело (Ω) вращается с угловой скоростью g вокруг
оси, проходящей через начало координат О; покажем, как выражается
соответствующий кинетический момент G относительно О. Рассуж
дая, как в § 4, и пользуясь формулой (4), получаем
G=

∫ ρr × ( g × r ) d Ω = ∫ ρ[(r ⋅ r ) g − (r ⋅ g)r ] d Ω =

(Ω )

(Ω )

=

∫ ρ[ xk xkω iei − x jω j xiei ] dΩ.

(Ω )

385

∫ ρ(δ i j xk xk − xi x j )ω jei dΩ = I i jω jei ,

(Ω )

другими словами,

(Ω )

I ′i j =

G=

(26)

называемый тензором инерции тела (Ω) относительно точки О. Для
доказательства запишем величины I i j единой формулой:
Ii j =

СИММЕТРИЧЕСКИЕ И АНТИСИММЕТРИЧЕСКИЕ ТЕНЗОРЫ

Чтобы вынести под знаком интеграла за скобки ω j и e i , запишем
ω i = δ i j ω j (продумайте эту формулу!); это даст

Нетрудно проверить, что при замене координатного базиса величи
ны (26) преобразуются по тензорному правилу (IX.23) и потому обра
зуют тензор 2го ранга
I = I i jeie j ,

§ 5]

G i = I i jω j .

(Можно написать также G = I ⋅ g, где скалярное произведение тензора
2го ранга на вектор определяется с помощью формул (ab) ⋅ c = a(b ⋅ c) =
= (b ⋅ c)a, откуда
I ⋅ g = ( I i jei e j ) ⋅ ω kek = I i jω kei ( e j ⋅ ek ) = I i jω keiδ j k = G. )

Формула (29), по существу, совпадает с формулами § 4, однако не
связана, как это было в § 4, со специальным выбором декартовых осей.
Она показывает, в частности, что, за исключением сферически симмет
ричного случая (когда I i j = Iδ i j ), направления векторов g и G, во
обще говоря, различны. Например, если для тела,
изображенного на рис. 147, массы втулки и стержня
пренебрежимо малы по сравнению с m, то момент
вращения согласно формуле (4) равен
G = ρr × ( g × r ) = ρr 2 g − (ω пр ω r )r ,

т.е. вектор G вращается с угловой скоростью g.
Это изменение момента вращения в силу формулы
Рис. 147.
(11) компенсируется моментом, передаваемым
втулкой на ось вращения.
Выведем еще формулу для кинетической энергии T вращающего
ся тела (Ω). Для этого заметим сначала, что для любых двух векторов a,
b на основании известной формулы для площади параллелограмма бу


дет a × b = absin (a, b). С другой стороны, a ⋅ b = ab cos (a, b). Отсюда


2
a × b + (a ⋅ b )2 = a 2b 2 [sin 2 (a, b ) + cos2 (a, b )] = a 2b 2 .

(30)

Умножим равенство (28) скалярно на g и воспользуемся форму
лой (30); мы получим
G⋅g=

(28)

(29)

∫ ρ[(r ⋅ r )( g ⋅ g) − (r ⋅ g)(r ⋅ g)] dΩ = ∫ ρ r × g

(Ω )

(Ω )

2

dΩ = 2T .

386

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Отсюда в силу (29)
1
1
T = G ⋅ g = I i jω iω j .
2
2

(31)

Тензор (27) обладает важным свойством симметричности:
I i j = I j i,

(32)

что сразу вытекает из его определения (26). Вообще, тензор 2го ранга, об
ладающий таким свойством, называется симметрическим. При этом не
трудно проверить, что если свойство (32) выполняется при какомто одном
выборе базиса, то оно выполняется и при любом другом выборе базиса.
Основным свойством симметрического тензора (IX.25) является воз
можность приведения его к диагональному виду, т.е. возможность такого
выбора базиса e~i , для которого все величины ~
p i j при i ≠ j обращаются
в нуль. Мы не будем здесь доказывать это общее утверждение (справедли
вое для симметрических тензоров в пространстве любого числа измере
ний), а сделаем только два замечания по этому поводу. Прежде всего, так
как диагональный тензор обладает свойством симметричности, а это свой
ство сохраняется при замене базиса, то к диагональному виду можно при
водить т о л ь к о симметрические тензоры. Вовторых, так как при выбо
ре евклидова базиса в трехмерном пространстве имеется три степени
свободы (почему?), а для приведения тензора к диагональному виду надо
удовлетворить трем равенствам ~
p 12 = ~
p 13 = ~
p 23 = 0, то степеней свобо
ды оказывается как раз столько, сколько нужно.
В осях x~ i , в которых тензор инерции имеет диагональный вид (они
называются главными осями этого тензора), выражения (29) для проекций
кинетического момента и (31) для кинетической энергии приобретают вид
~ ~ ~
G1 = I11ω
1,

~ ~ ~
G 2 = I 22ω
2,

~ ~ ~
G 3 = I 33ω
3,

1 ~ ~2 ~ ~2 ~ ~2
1 1 ~2
1 ~2
1 ~2
T = ( I11ω
1 + I 22ω 2 + I 33ω 3 ) = ( ~ G1 + ~ G 2 + ~ G 3 ).
2
2 I11
I 22
I 33

Рис. 148.

(33)

Чтобы нагляднее представить себе
зависимость
кинетической
энер
гии Т от направления момента враще
ния G, изобразим на сфере G = const,
жестко связанной с телом (Ω), линии,
которым отвечают равные значения Т;
другими словами, это линии с уравнением
(33) при различных значениях Т
(рис. 148). Допустим для определеннос
~
~
~
ти, что I 11 < I 22 < I 33 . Тогда при задан
ном G наибольшее значение Т, равное
1
2
~
~
~ G , получится, когда G2 = G 3 = 0
2I 11

§ 5]

СИММЕТРИЧЕСКИЕ И АНТИСИММЕТРИЧЕСКИЕ ТЕНЗОРЫ

387

~
~
(рис. 148); при G1 = G2 = 0 будет наименьшее значение Т, тогда как
~
~
при G1 = G 3 = 0 Т будет иметь минимакс. При свободном вращении
G и Т постоянны, но ω меняется как по направлению, так и по модулю
(за исключением вращения вокруг одной из осей x i , когда g G e i ).
Тело (Ω) поворачивается так, что вектор G все время проходит через
одну из изображенных линий (на рис. 148 показано перемеще
ние G относительно (Ω)).
В качестве другого важного примера симметрического тензора упо
мянем о тензоре упругих напряжений. Пусть рассматривается напря
женное состояние твердого тела, вызванное приложенными к нему
силами. Выделим мысленно в изучаемой среде кубик со стороной h и
с ребрами, параллельными осям
координат. Тогда упругое возде
йствие окружающей среды на
каждую из граней этого кубика
можно заменить силой (рис. 149),
которая при малом h будет про
порциональна h2 :
Fi = σ i je j h 2 + ...

Величины σ i j зависят от выбо
ра направления осей координат.
Можно показать, что при замене
базиса они преобразуются по
тензорному правилу (IX.23) и
Рис. 149.
потому образуют тензор 2го
ранга, который называется тензором упругих напряжений и характери
зует напряженное состояние среды в рассматриваемой точке. Диаго
нальные члены этого тензора определяют напряжения сжатия или
растяжения, а внедиагональные — сдвиговые напряжения*.
Нетрудно проверить, что тензор упругих напряжений симметричес
кий. В самом деле, полный момент внешних сил, действующих на кубик,
относительно его центра с точностью до малых высшего порядка равен
1
∑ 2 ⋅ 2 he i × Fi = ∑ h 3σ i j e i × e j . Если какоелибо σ i j ≠ σ j i , то этот мо
i
i, j
мент был бы отличен от нуля, что невозможно, так как момент инерции
кубика порядка h 5 и получилось бы бесконечное угловое ускорение.
Применяются также антисимметрические тензоры( pi j ), для которых
pi j = − p j i ;

(34)

* Эти сдвиговые напряжения таковы, что в сумме по всем граням они дают равный
нулю момент (хотя сумма по паре противоположных граней и не нулевая). С этим связа
но и то, что имеется система осей (ориентация кубика), в которой нет сдвиговых напря
жений, а есть только растяжение и сжатие.

386

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Отсюда в силу (29)
1
1
T = G ⋅ g = I i jω iω j .
2
2

(31)

Тензор (27) обладает важным свойством симметричности:
I i j = I j i,

(32)

что сразу вытекает из его определения (26). Вообще, тензор 2го ранга, об
ладающий таким свойством, называется симметрическим. При этом не
трудно проверить, что если свойство (32) выполняется при какомто одном
выборе базиса, то оно выполняется и при любом другом выборе базиса.
Основным свойством симметрического тензора (IX.25) является воз
можность приведения его к диагональному виду, т.е. возможность такого
выбора базиса e~i , для которого все величины ~
p i j при i ≠ j обращаются
в нуль. Мы не будем здесь доказывать это общее утверждение (справедли
вое для симметрических тензоров в пространстве любого числа измере
ний), а сделаем только два замечания по этому поводу. Прежде всего, так
как диагональный тензор обладает свойством симметричности, а это свой
ство сохраняется при замене базиса, то к диагональному виду можно при
водить т о л ь к о симметрические тензоры. Вовторых, так как при выбо
ре евклидова базиса в трехмерном пространстве имеется три степени
свободы (почему?), а для приведения тензора к диагональному виду надо
удовлетворить трем равенствам ~
p 12 = ~
p 13 = ~
p 23 = 0, то степеней свобо
ды оказывается как раз столько, сколько нужно.
В осях x~ i , в которых тензор инерции имеет диагональный вид (они
называются главными осями этого тензора), выражения (29) для проекций
кинетического момента и (31) для кинетической энергии приобретают вид
~ ~ ~
G1 = I11ω
1,

~ ~ ~
G 2 = I 22ω
2,

~ ~ ~
G 3 = I 33ω
3,

1 ~ ~2 ~ ~2 ~ ~2
1 1 ~2
1 ~2
1 ~2
T = ( I11ω
1 + I 22ω 2 + I 33ω 3 ) = ( ~ G1 + ~ G 2 + ~ G 3 ).
2
2 I11
I 22
I 33

Рис. 148.

(33)

Чтобы нагляднее представить себе
зависимость
кинетической
энер
гии Т от направления момента враще
ния G, изобразим на сфере G = const,
жестко связанной с телом (Ω), линии,
которым отвечают равные значения Т;
другими словами, это линии с уравнением
(33) при различных значениях Т
(рис. 148). Допустим для определеннос
~
~
~
ти, что I 11 < I 22 < I 33 . Тогда при задан
ном G наибольшее значение Т, равное
1
2
~
~
~ G , получится, когда G2 = G 3 = 0
2I 11

§ 5]

СИММЕТРИЧЕСКИЕ И АНТИСИММЕТРИЧЕСКИЕ ТЕНЗОРЫ

387

~
~
(рис. 148); при G1 = G2 = 0 будет наименьшее значение Т, тогда как
~
~
при G1 = G 3 = 0 Т будет иметь минимакс. При свободном вращении
G и Т постоянны, но ω меняется как по направлению, так и по модулю
(за исключением вращения вокруг одной из осей x i , когда g G e i ).
Тело (Ω) поворачивается так, что вектор G все время проходит через
одну из изображенных линий (на рис. 148 показано перемеще
ние G относительно (Ω)).
В качестве другого важного примера симметрического тензора упо
мянем о тензоре упругих напряжений. Пусть рассматривается напря
женное состояние твердого тела, вызванное приложенными к нему
силами. Выделим мысленно в изучаемой среде кубик со стороной h и
с ребрами, параллельными осям
координат. Тогда упругое возде
йствие окружающей среды на
каждую из граней этого кубика
можно заменить силой (рис. 149),
которая при малом h будет про
порциональна h2 :
Fi = σ i je j h 2 + ...

Величины σ i j зависят от выбо
ра направления осей координат.
Можно показать, что при замене
базиса они преобразуются по
тензорному правилу (IX.23) и
Рис. 149.
потому образуют тензор 2го
ранга, который называется тензором упругих напряжений и характери
зует напряженное состояние среды в рассматриваемой точке. Диаго
нальные члены этого тензора определяют напряжения сжатия или
растяжения, а внедиагональные — сдвиговые напряжения*.
Нетрудно проверить, что тензор упругих напряжений симметричес
кий. В самом деле, полный момент внешних сил, действующих на кубик,
относительно его центра с точностью до малых высшего порядка равен
1
∑ 2 ⋅ 2 he i × Fi = ∑ h 3σ i j e i × e j . Если какоелибо σ i j ≠ σ j i , то этот мо
i
i, j
мент был бы отличен от нуля, что невозможно, так как момент инерции
кубика порядка h 5 и получилось бы бесконечное угловое ускорение.
Применяются также антисимметрические тензоры( pi j ), для которых
pi j = − p j i ;

(34)

* Эти сдвиговые напряжения таковы, что в сумме по всем граням они дают равный
нулю момент (хотя сумма по паре противоположных граней и не нулевая). С этим связа
но и то, что имеется система осей (ориентация кубика), в которой нет сдвиговых напря
жений, а есть только растяжение и сжатие.

388

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

диагональные члены такого тензора по необходимости равны нулю.
Нетрудно проверить, что если свойство антисимметрии (34) выполне
но при какомто одном выборе базиса, то оно выполняется и при любом
другом выборе базиса.
Антисимметрический тензор в трехмерном пространстве непосре
дственно связан с векторным произведением. Именно, пусть дано ли
нейное отображение пространства в себя с антисимметричной матри
цей коэффициентов pi j (см. § IX.5; мы упоминали там, что любой
тензор 2го ранга можно с точностью до размерности истолковать как
матрицу некоторого линейного отображения пространства в себя).
отображается
по
формуле
Тогда
любой
вектор r = x i e i
Tr = pij x j e i = p12 x 2 e1 + p13 x 3 e1 − p12 x 1 e2 + p23 x 3 e2 − p13 x 1 e 3 − p23 x 2 e 3 .
Но тот же результат получится (проверьте!), если векторно помно
жить вектор p = −( p12 e 3 + p23 e1 + p31 e2 ) на r ; итак, Tr ≡ p × r . Из по
следнего равенства видно, что вектор p определен отображением Т,
а потому и тензором pi j инвариантно, т.е. независимо от выбора де
картова базиса.
Рассмотрим в заключение тензор линейного отображения, близкого
к тождественному. Он имеет вид δ i j + ηi j , где δ i j — единичный тензор,
a ηi j — малые коэффициенты; такой тензор получается, в частности,
при рассмотрении малых деформаций упругого тела.
Представим тензор ηi j в виде суммы симметрического тензо
ра β i j и антисимметрического тензора γ i j , где
1
β i j = ( ηi j + η ji ),
2

1
γ i j = ( ηi j − η ji ).
2

(35)

Тогда тензор β i j в некоторых осях x~ i принимает диагональный вид
и потому определяет комбинацию малых равномерных растяжений
~
~
вдоль этих осей: вдоль оси x~1 в 1 + β 11 раз (конечно, если β 11 < 0, то
на самом деле получится сжатие) и т.д. При этом объем увеличится в
~
~
~
(1+ β 11 )(1+ β 22 )(1 + β 33 ) или, с точностью до малых высшего порядка,
~
~
~
~
~
в 1+ β 11 + β 22 + β 33 = 1+ β i i раз. Но β i i = β i i (см. § IX.5), а потому в си
~
лу (35) β i i = ηi i .
Что касается тензора γ i j , то он определяет малый поворот. В самом
деле, при таком повороте вокруг вектора p 0 на малый угол ψ каж
дый вектор r , с точностью до малых высшего порядка, переходит в век
тор r+ψp 0 × r , а мы показали выше, как по антисимметрическому
тензору γ i j можно подобрать соответствующий вектор p = ψp 0 .
Итак, линейное отображение, близкое к тождественному, сводится
к комбинации равномерных растяжений вдоль взаимно перпендику
лярных осей и поворота. Так как при повороте объем не меняется, то
сумма ηi i (она называется следом тензора ηi j ) представляет собой ко

§ 6]

ИСТИННЫЕ ВЕКТОРЫ И ПСЕВДОВЕКТОРЫ

389

эффициент приращения объема, т.е. при рассматриваемом отображе
нии объем увеличится в 1+ ηi i раз.
Подчеркнем, что наложение деформаций приводит к сложению соот
ветствующих тензоров т о л ь к о для малых деформаций; по существу,
это получается в результате применения формулы (1 + α)(1 + β) ≈
≈ 1 + (α + β) при малых α, β. Большие деформации (например, поворо
ты на конечный угол) накладываются по совсем иному, вообще говоря,
некоммутативному закону, который мы здесь не будем рассматривать.
Упражнения
1. Докажите теорему о возможности приведения симметрического тензора
к диагональному виду для двумерного случая.
2. Разложите малый сдвиг (рис. 111, г) на растяжения и поворот.

§ 6. Истинные векторы и псевдовекторы
Между вектором линейной скорости и вектором угловой скорости
имеется следующее принципиальное различие. Куда именно направ
лен вектор линейной скорости, не вызывает никаких сомнений. В отли
чие от этого согласно § 2 вектор угловой скорости откладывается по
оси вращения; но в какую именно сторону? В § 2 мы выбрали эту сторо
ну в соответствии с правилом правого винта. Но с таким же основанием
можно условиться опираться на правило левого винта, и тогда на
рис. 137 вектор g был бы направлен вниз. Таким образом, выбор на
правления вектора угловой скорости по оси вращения является услов
ным и зависит от выбранного правила винта, так что при перемене
этого правила на противоположное этот вектор заменяется на противо
положный. Векторы, обладающие таким свойством, называются псев
довекторами в отличие от истинных векторов, не зависящих от выбора
правила винта. Итак, вектор линейной скорости — это истинный век
тор (такими же являются векторы силы, ускорения, электрической на
пряженности и т.д.), а вектор угловой скорости — это псевдовектор.
Принята также другая терминология, истинные векторы называют по
лярными, (от слова «полюс»), а псевдовекторы — аксиальными (от ла
тинского названия оси)*.
Из определения векторного произведения ясно, что векторное про
изведение двух истинных векторов представляет собой псевдовектор,
так как при перемене правила винта бывшая наружная сторона парал
лелограмма, построенного на перемножаемых векторах, станет внут
ренней (см. рис. 134 и 135). Таким образом, момент силы и кинетичес
кий момент (§2) — это псевдовекторы. Аналогичным образом легко
* При рассмотрении процессов, происходящих во времени, возникает еще классифи
кация векторов по их поведению при изменении знака t (сравните, например, векторы
скорости и перемещения).

388

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

диагональные члены такого тензора по необходимости равны нулю.
Нетрудно проверить, что если свойство антисимметрии (34) выполне
но при какомто одном выборе базиса, то оно выполняется и при любом
другом выборе базиса.
Антисимметрический тензор в трехмерном пространстве непосре
дственно связан с векторным произведением. Именно, пусть дано ли
нейное отображение пространства в себя с антисимметричной матри
цей коэффициентов pi j (см. § IX.5; мы упоминали там, что любой
тензор 2го ранга можно с точностью до размерности истолковать как
матрицу некоторого линейного отображения пространства в себя).
отображается
по
формуле
Тогда
любой
вектор r = x i e i
Tr = pij x j e i = p12 x 2 e1 + p13 x 3 e1 − p12 x 1 e2 + p23 x 3 e2 − p13 x 1 e 3 − p23 x 2 e 3 .
Но тот же результат получится (проверьте!), если векторно помно
жить вектор p = −( p12 e 3 + p23 e1 + p31 e2 ) на r ; итак, Tr ≡ p × r . Из по
следнего равенства видно, что вектор p определен отображением Т,
а потому и тензором pi j инвариантно, т.е. независимо от выбора де
картова базиса.
Рассмотрим в заключение тензор линейного отображения, близкого
к тождественному. Он имеет вид δ i j + ηi j , где δ i j — единичный тензор,
a ηi j — малые коэффициенты; такой тензор получается, в частности,
при рассмотрении малых деформаций упругого тела.
Представим тензор ηi j в виде суммы симметрического тензо
ра β i j и антисимметрического тензора γ i j , где
1
β i j = ( ηi j + η ji ),
2

1
γ i j = ( ηi j − η ji ).
2

(35)

Тогда тензор β i j в некоторых осях x~ i принимает диагональный вид
и потому определяет комбинацию малых равномерных растяжений
~
~
вдоль этих осей: вдоль оси x~1 в 1 + β 11 раз (конечно, если β 11 < 0, то
на самом деле получится сжатие) и т.д. При этом объем увеличится в
~
~
~
(1+ β 11 )(1+ β 22 )(1 + β 33 ) или, с точностью до малых высшего порядка,
~
~
~
~
~
в 1+ β 11 + β 22 + β 33 = 1+ β i i раз. Но β i i = β i i (см. § IX.5), а потому в си
~
лу (35) β i i = ηi i .
Что касается тензора γ i j , то он определяет малый поворот. В самом
деле, при таком повороте вокруг вектора p 0 на малый угол ψ каж
дый вектор r , с точностью до малых высшего порядка, переходит в век
тор r+ψp 0 × r , а мы показали выше, как по антисимметрическому
тензору γ i j можно подобрать соответствующий вектор p = ψp 0 .
Итак, линейное отображение, близкое к тождественному, сводится
к комбинации равномерных растяжений вдоль взаимно перпендику
лярных осей и поворота. Так как при повороте объем не меняется, то
сумма ηi i (она называется следом тензора ηi j ) представляет собой ко

§ 6]

ИСТИННЫЕ ВЕКТОРЫ И ПСЕВДОВЕКТОРЫ

389

эффициент приращения объема, т.е. при рассматриваемом отображе
нии объем увеличится в 1+ ηi i раз.
Подчеркнем, что наложение деформаций приводит к сложению соот
ветствующих тензоров т о л ь к о для малых деформаций; по существу,
это получается в результате применения формулы (1 + α)(1 + β) ≈
≈ 1 + (α + β) при малых α, β. Большие деформации (например, поворо
ты на конечный угол) накладываются по совсем иному, вообще говоря,
некоммутативному закону, который мы здесь не будем рассматривать.
Упражнения
1. Докажите теорему о возможности приведения симметрического тензора
к диагональному виду для двумерного случая.
2. Разложите малый сдвиг (рис. 111, г) на растяжения и поворот.

§ 6. Истинные векторы и псевдовекторы
Между вектором линейной скорости и вектором угловой скорости
имеется следующее принципиальное различие. Куда именно направ
лен вектор линейной скорости, не вызывает никаких сомнений. В отли
чие от этого согласно § 2 вектор угловой скорости откладывается по
оси вращения; но в какую именно сторону? В § 2 мы выбрали эту сторо
ну в соответствии с правилом правого винта. Но с таким же основанием
можно условиться опираться на правило левого винта, и тогда на
рис. 137 вектор g был бы направлен вниз. Таким образом, выбор на
правления вектора угловой скорости по оси вращения является услов
ным и зависит от выбранного правила винта, так что при перемене
этого правила на противоположное этот вектор заменяется на противо
положный. Векторы, обладающие таким свойством, называются псев
довекторами в отличие от истинных векторов, не зависящих от выбора
правила винта. Итак, вектор линейной скорости — это истинный век
тор (такими же являются векторы силы, ускорения, электрической на
пряженности и т.д.), а вектор угловой скорости — это псевдовектор.
Принята также другая терминология, истинные векторы называют по
лярными, (от слова «полюс»), а псевдовекторы — аксиальными (от ла
тинского названия оси)*.
Из определения векторного произведения ясно, что векторное про
изведение двух истинных векторов представляет собой псевдовектор,
так как при перемене правила винта бывшая наружная сторона парал
лелограмма, построенного на перемножаемых векторах, станет внут
ренней (см. рис. 134 и 135). Таким образом, момент силы и кинетичес
кий момент (§2) — это псевдовекторы. Аналогичным образом легко
* При рассмотрении процессов, происходящих во времени, возникает еще классифи
кация векторов по их поведению при изменении знака t (сравните, например, векторы
скорости и перемещения).

390

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

проверить, что векторное произведение истинного вектора на псевдо
вектор представляет собой истинный вектор (см., например, формулу
(5)), а двух псевдовекторов — также псевдовектор.
Вопрос об эквивалентности правой и левой систем координат со
всем не так прост, как это может показаться с первого взгляда. Эта эк
вивалентность означает, что для любого явления теоретически
возможно зеркально отраженное явление, при котором все геометри
чгские формы являются как бы зеркальными.отражениями соотве
тствующих форм для первого явления, подобно тому как правая
перчатка является зеркальным отражением левой. (Так называемый
«закон сохранения четности».) Недавно обнаружено, что этот закон не
имеет универсальной силы, и в связи с этим крупнейший советский
физиктеоретик лауреат Ленинской и Нобелевской премий Л.Д. Лан
дау (1908–1968) предложил «принцип комбинированной четности»,
согласно которому все физические явления допускают зеркальное от
ражение только при замене всех частиц античастицами*.
Отметим в заключение, что векторное умножение двух векторов,
при котором проекции векторапроизведения выражаются через про
екции векторовсомножителей (но в то же время произведение инвари
антно относительно выбора осей координат) и выполняются естест
венные правила умножения, — это операция, характерная для
трехмерного пространства. Грубо говоря, дело здесь заключается в том,
что в трехмерном пространстве можно условиться каждым двум раз
ным ортам, например i и j (по осям x и y), ставить в соответствие
третий недостающий до комплекта орт k (по оси z). Так можно прий
ти, производя циклические (круговые) перестановки, к формулам (1)
векторного умножения ортов. (В самом деле, если i × j = k, то обяза
тельно j × k = i, так как вектор k расположен относительно векторов i,
j в точности так же, как вектор i относительно векторов j, k.) Из по
следних получатся формулы векторного умножения любых векторов.
В nмерном векторном пространстве (§ IX.6) нужно взять n − 1 ортов,
чтобы определить nй недостающий. Поэтому аналогом векторного
произведения в nмерном пространстве является вектор, определен
ным образом построенный из n − 1 векторов**. Таким образом, вектор
* В конце 1964 г. появились новые экспериментальные данные, согласно которым
принцип комбинированной четности также нарушается и не является точным.
** Аналог смешанного произведения (стр. 369) составляется для n векторов; это
произведение равно nобъему «параллелепипеда», натянутого на эти векторы. В частнос
ти, для плоскости, т.е. при n = 2, получаем площадь, которая является скаляром или, точ
нее, — псевдоскаляром. Слово «псевдо» значит «почти»; в данном случае имеется в виду,
что величина не меняется при поворотах системы координат, но множится на –1 при пе
рестановке осей х и у. Примером псевдоскаляра в трехмерном пространстве была ве
личина смешанного произведения трех истинных векторов, равная объему: знак этой
величины при данных трех векторах зависит от выбора правой или левой системы.

§ 7]

РОТОР ВЕКТОРНОГО ПОЛЯ

391

ное произведение двух векторов специфично для трехмерного про
странства. Понятно, что мы не перечислили всех условий, необходимых
для определения векторного произведения. Все же хотелось отметить
разницу между векторным произведением и скалярным произведением,
которое определяется совершенно одинаково в пространстве любого
числа измерений.
Упражнения
1. Справедливы ли формулы (1) и (3) в левой системе координат?
2. Постройте разумное определение векторного произведения в четы
рехмерном пространстве.

§ 7. Ротор векторного поля
В § Х.3 при вычислении работы силового поля мы уже пришли к по
нятию линейного интеграла. Сейчас мы рассмотрим это понятие в об
щем виде.
Пусть в пространстве, в котором задано поле вектора A, выбрана
ориентированная линия ( L). Тогда линейным интегралом вектора A
по линии ( L) называется интеграл
I=

∫ Aτ

dL,

(36)

(L )

где A τ — проекция вектора A на касательную к ( L), проведенную
в направлении обхода (рис. 150). Так как вектор dr идет вдоль по τ ,
a dr = dL (§ IX.4), то выражение для линейного интеграла можно пе
реписать так:
I=



( L)

A cos α dr =

∫ A ⋅ dr =

( L)

=

∫ ( A x dx + A y dy + A z dz ).

(L )

Линейный интеграл есть величина скаляр
ная и обладает обычными свойствами интегра
лов. При перемене ориентации линии ( L) он
меняет только знак. Если угол α (см. рис. 150)
Рис. 150.
во всех точках линии ( L) острый, то I > 0, а
если он тупой, то I < 0. Равенство I = 0 получа
ется, если угол α все время прямой или (что бывает чаще) если интег
ралы по частям ( L), где α острый и α тупой, взаимно уничтожаются.
Если линия ( L) замкнутая, то линейный интеграл
Γ=

∫ A ⋅ dr = ∫ ( A x dx + A y dy + A z dz )

(L )

(L )

(37)

390

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

проверить, что векторное произведение истинного вектора на псевдо
вектор представляет собой истинный вектор (см., например, формулу
(5)), а двух псевдовекторов — также псевдовектор.
Вопрос об эквивалентности правой и левой систем координат со
всем не так прост, как это может показаться с первого взгляда. Эта эк
вивалентность означает, что для любого явления теоретически
возможно зеркально отраженное явление, при котором все геометри
чгские формы являются как бы зеркальными.отражениями соотве
тствующих форм для первого явления, подобно тому как правая
перчатка является зеркальным отражением левой. (Так называемый
«закон сохранения четности».) Недавно обнаружено, что этот закон не
имеет универсальной силы, и в связи с этим крупнейший советский
физиктеоретик лауреат Ленинской и Нобелевской премий Л.Д. Лан
дау (1908–1968) предложил «принцип комбинированной четности»,
согласно которому все физические явления допускают зеркальное от
ражение только при замене всех частиц античастицами*.
Отметим в заключение, что векторное умножение двух векторов,
при котором проекции векторапроизведения выражаются через про
екции векторовсомножителей (но в то же время произведение инвари
антно относительно выбора осей координат) и выполняются естест
венные правила умножения, — это операция, характерная для
трехмерного пространства. Грубо говоря, дело здесь заключается в том,
что в трехмерном пространстве можно условиться каждым двум раз
ным ортам, например i и j (по осям x и y), ставить в соответствие
третий недостающий до комплекта орт k (по оси z). Так можно прий
ти, производя циклические (круговые) перестановки, к формулам (1)
векторного умножения ортов. (В самом деле, если i × j = k, то обяза
тельно j × k = i, так как вектор k расположен относительно векторов i,
j в точности так же, как вектор i относительно векторов j, k.) Из по
следних получатся формулы векторного умножения любых векторов.
В nмерном векторном пространстве (§ IX.6) нужно взять n − 1 ортов,
чтобы определить nй недостающий. Поэтому аналогом векторного
произведения в nмерном пространстве является вектор, определен
ным образом построенный из n − 1 векторов**. Таким образом, вектор
* В конце 1964 г. появились новые экспериментальные данные, согласно которым
принцип комбинированной четности также нарушается и не является точным.
** Аналог смешанного произведения (стр. 369) составляется для n векторов; это
произведение равно nобъему «параллелепипеда», натянутого на эти векторы. В частнос
ти, для плоскости, т.е. при n = 2, получаем площадь, которая является скаляром или, точ
нее, — псевдоскаляром. Слово «псевдо» значит «почти»; в данном случае имеется в виду,
что величина не меняется при поворотах системы координат, но множится на –1 при пе
рестановке осей х и у. Примером псевдоскаляра в трехмерном пространстве была ве
личина смешанного произведения трех истинных векторов, равная объему: знак этой
величины при данных трех векторах зависит от выбора правой или левой системы.

§ 7]

РОТОР ВЕКТОРНОГО ПОЛЯ

391

ное произведение двух векторов специфично для трехмерного про
странства. Понятно, что мы не перечислили всех условий, необходимых
для определения векторного произведения. Все же хотелось отметить
разницу между векторным произведением и скалярным произведением,
которое определяется совершенно одинаково в пространстве любого
числа измерений.
Упражнения
1. Справедливы ли формулы (1) и (3) в левой системе координат?
2. Постройте разумное определение векторного произведения в четы
рехмерном пространстве.

§ 7. Ротор векторного поля
В § Х.3 при вычислении работы силового поля мы уже пришли к по
нятию линейного интеграла. Сейчас мы рассмотрим это понятие в об
щем виде.
Пусть в пространстве, в котором задано поле вектора A, выбрана
ориентированная линия ( L). Тогда линейным интегралом вектора A
по линии ( L) называется интеграл
I=

∫ Aτ

dL,

(36)

(L )

где A τ — проекция вектора A на касательную к ( L), проведенную
в направлении обхода (рис. 150). Так как вектор dr идет вдоль по τ ,
a dr = dL (§ IX.4), то выражение для линейного интеграла можно пе
реписать так:
I=



( L)

A cos α dr =

∫ A ⋅ dr =

( L)

=

∫ ( A x dx + A y dy + A z dz ).

(L )

Линейный интеграл есть величина скаляр
ная и обладает обычными свойствами интегра
лов. При перемене ориентации линии ( L) он
меняет только знак. Если угол α (см. рис. 150)
Рис. 150.
во всех точках линии ( L) острый, то I > 0, а
если он тупой, то I < 0. Равенство I = 0 получа
ется, если угол α все время прямой или (что бывает чаще) если интег
ралы по частям ( L), где α острый и α тупой, взаимно уничтожаются.
Если линия ( L) замкнутая, то линейный интеграл
Γ=

∫ A ⋅ dr = ∫ ( A x dx + A y dy + A z dz )

(L )

(L )

(37)

392

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

называется циркуляцией вектора A по линии ( L). Циркуляция обла
дает следующим важным свойством аддитивности (сложения). Допус
тим, что некоторая ориентированная незамкнутая поверхность (S )
разбита на несколько частей, например на три части (S 1 ), (S 2 ) и (S 3 ),
как на рис. 151. Обозначим контуры (S ) и этих частей, в соответствии
с ориентацией (S ), через ( L), ( L1 ), ( L2 ) и ( L3 ), а соответствующие
циркуляции — через Γ, Γ1 , Γ2 и Γ3 . Тогда
Γ = Γ1 + Γ2 + Γ3 .

В самом деле, если в правой части все циркуляции представить в виде
суммы линейных интегралов по отдельным дугам, изображенным на
рис. 151, то интегралы по внутренним
к (S ) дугам все взаимно уничтожа
ются (так как каждая такая дуга про
ходится дважды в противоположных
направлениях), а интегралы по кон
турным к (S ) дугам сложатся и дадут
циркуляцию, стоящую в левой части.
Доказанное свойство аддитивнос
ти дает возможность говорить о том,
что циркуляция (37) «порождается»
Рис. 151.
на поверхности (S ), а тем самым и
о «плотности порождения циркуляции», т.е. о циркуляции, порождае
мой бесконечно малым куском поверхности и отнесенной к единице
площади этого куска. К целесообразности рассмотрения такой плот
ности, приводит также следующее соображение. Легко проверить, что
циркуляция постоянного вектора всегда равна нулю:

∫ (C 1 dx + C 2 dy + C 3 dz ) = (C 1 x + C 2 y + C 3 z ) ( L| ),

(L )

где последний значок говорит о том, что нужно взять приращение ре
зультата интегрирования, когда точка обходит контур ( L). Однако по
сле такого обхода последнее выражение, стоящее в скобках, возвраща
ется к своему исходному значению, и потому приращение равно нулю.
Но теперь можно рассуждать подобно тому, как это было сделано в кон
це § Х.7. Именно, в силу формулы Тейлора внутри бесконечно малого
контура вектор A можно представить в виде суммы постоянного век
тора и членов первого порядка малости. При этом происходит почти
полная компенсация: интеграл от постоянного вектора равен нулю,
а интеграл от членов первого порядка малости даст величину второго
порядка малости. Таким образом, циркуляция по бесконечно малому
контуру пропорциональна не длине контура, а площади, охватываемой
этим контуром.

§ 7]

РОТОР ВЕКТОРНОГО ПОЛЯ

393

Чтобы подсчитать указанную
плотность порождения циркуляции,
вычислим циркуляцию вектора A
по бесконечно малому контуру.
Сначала допустим, что этот контур
лежит в плоскости z = const. Кроме
того, так как при подсчете плотнос
ти форма контура несущественна,
то возьмем за этот контур прямоу
Рис. 152.
гольник со сторонами, параллель
ными осям координат (см. рис. 152,
где размер этого прямоугольника несколько преувеличен). По формуле
(37) соответствующая циркуляция равна
dΓ =

∫ A x dx + ∫ A y dy + ∫ A x dx + ∫ A y dy

(1 )

(2 )

(3 )

(38)

(4 )

(цифрами обозначены последовательные стороны прямоугольника,
см. рис. 152), так как на каждой стороне изменяется только одна пере
менная, а остальные дифференциалы равны нулю. Учитывая направле
ние обхода указанных сторон, получим из (38)
dΓ = ( A x )1 dx + ( A y )2 dy − ( A x )3 dx − ( A y )4 dy =
= [( A y )2 − ( A y )4 ] dy − [( A x )3 − ( A x )1 ] dx,

(39)

где цифровой индекс указывает, на какой стороне берется соответству
ющая проекция. Однако с точностью до малых высшего порядка
∂A y

( A y )2 − ( A y )4 =

∂x

( Ax )3 − ( Ax )1 =

dx,

∂Ax
dy,
∂y

и потому формула (39) дает
dΓ =

∂A y
∂x

dx dy −

⎛ ∂A y ∂Ax ⎞
∂Ax
dy dx = ⎜

⎟ dS .
⎝ ∂x
∂y
∂y ⎠

Итак, для бесконечно малого замкнутого контура
dΓxy
dS xy

=

∂A y
∂x



∂Ax
∂y

(40)

(индексы в левой части указывают на то, что контур параллелен плос
кости х, у). При этом имеется в виду, что контур обходится в положи
тельном направлении; в противном случае надо поменять знак или, что
то же, считать dS xy < 0.
Декартовы координаты в пространстве полностью равноправны,
и потому из любой верной формулы, содержащей эти координаты,

392

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

называется циркуляцией вектора A по линии ( L). Циркуляция обла
дает следующим важным свойством аддитивности (сложения). Допус
тим, что некоторая ориентированная незамкнутая поверхность (S )
разбита на несколько частей, например на три части (S 1 ), (S 2 ) и (S 3 ),
как на рис. 151. Обозначим контуры (S ) и этих частей, в соответствии
с ориентацией (S ), через ( L), ( L1 ), ( L2 ) и ( L3 ), а соответствующие
циркуляции — через Γ, Γ1 , Γ2 и Γ3 . Тогда
Γ = Γ1 + Γ2 + Γ3 .

В самом деле, если в правой части все циркуляции представить в виде
суммы линейных интегралов по отдельным дугам, изображенным на
рис. 151, то интегралы по внутренним
к (S ) дугам все взаимно уничтожа
ются (так как каждая такая дуга про
ходится дважды в противоположных
направлениях), а интегралы по кон
турным к (S ) дугам сложатся и дадут
циркуляцию, стоящую в левой части.
Доказанное свойствоаддитивнос
ти дает возможность говорить о том,
что циркуляция (37) «порождается»
Рис. 151.
на поверхности (S ), а тем самым и
о «плотности порождения циркуляции», т.е. о циркуляции, порождае
мой бесконечно малым куском поверхности и отнесенной к единице
площади этого куска. К целесообразности рассмотрения такой плот
ности, приводит также следующее соображение. Легко проверить, что
циркуляция постоянного вектора всегда равна нулю:

∫ (C 1 dx + C 2 dy + C 3 dz ) = (C 1 x + C 2 y + C 3 z ) ( L| ),

(L )

где последний значок говорит о том, что нужно взять приращение ре
зультата интегрирования, когда точка обходит контур ( L). Однако по
сле такого обхода последнее выражение, стоящее в скобках, возвраща
ется к своему исходному значению, и потому приращение равно нулю.
Но теперь можно рассуждать подобно тому, как это было сделано в кон
це § Х.7. Именно, в силу формулы Тейлора внутри бесконечно малого
контура вектор A можно представить в виде суммы постоянного век
тора и членов первого порядка малости. При этом происходит почти
полная компенсация: интеграл от постоянного вектора равен нулю,
а интеграл от членов первого порядка малости даст величину второго
порядка малости. Таким образом, циркуляция по бесконечно малому
контуру пропорциональна не длине контура, а площади, охватываемой
этим контуром.

§ 7]

РОТОР ВЕКТОРНОГО ПОЛЯ

393

Чтобы подсчитать указанную
плотность порождения циркуляции,
вычислим циркуляцию вектора A
по бесконечно малому контуру.
Сначала допустим, что этот контур
лежит в плоскости z = const. Кроме
того, так как при подсчете плотнос
ти форма контура несущественна,
то возьмем за этот контур прямоу
Рис. 152.
гольник со сторонами, параллель
ными осям координат (см. рис. 152,
где размер этого прямоугольника несколько преувеличен). По формуле
(37) соответствующая циркуляция равна
dΓ =

∫ A x dx + ∫ A y dy + ∫ A x dx + ∫ A y dy

(1 )

(2 )

(3 )

(38)

(4 )

(цифрами обозначены последовательные стороны прямоугольника,
см. рис. 152), так как на каждой стороне изменяется только одна пере
менная, а остальные дифференциалы равны нулю. Учитывая направле
ние обхода указанных сторон, получим из (38)
dΓ = ( A x )1 dx + ( A y )2 dy − ( A x )3 dx − ( A y )4 dy =
= [( A y )2 − ( A y )4 ] dy − [( A x )3 − ( A x )1 ] dx,

(39)

где цифровой индекс указывает, на какой стороне берется соответству
ющая проекция. Однако с точностью до малых высшего порядка
∂A y

( A y )2 − ( A y )4 =

∂x

( Ax )3 − ( Ax )1 =

dx,

∂Ax
dy,
∂y

и потому формула (39) дает
dΓ =

∂A y
∂x

dx dy −

⎛ ∂A y ∂Ax ⎞
∂Ax
dy dx = ⎜

⎟ dS .
⎝ ∂x
∂y
∂y ⎠

Итак, для бесконечно малого замкнутого контура
dΓxy
dS xy

=

∂A y
∂x



∂Ax
∂y

(40)

(индексы в левой части указывают на то, что контур параллелен плос
кости х, у). При этом имеется в виду, что контур обходится в положи
тельном направлении; в противном случае надо поменять знак или, что
то же, считать dS xy < 0.
Декартовы координаты в пространстве полностью равноправны,
и потому из любой верной формулы, содержащей эти координаты,

394

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

можнo получить другую верную формулу, заменив х, у, z соответ
ственно на у, z, х или на z, x, у. (Такая перестановка, упоминавшая
ся в § 6, называется циклической или круговой; при ней правая система
координат остается правой.) Поэтому из (40) вытекает
dΓ yz
dS yz

=

∂A z ∂A y
,

∂y
∂z

dΓ zx ∂Ax ∂A z
.
=

dS zx
∂z
∂x

(41)

Рассмотрим теперь бесконечно малую ориентированную площадку
(dS), произвольно наклоненную относительно осей координат. Для
подсчета циркуляции эту площадку удоб
нее всего взять в форме треугольника, как
на рис. 153. Построим на этом треугольни
ке тетраэдр с гранями, параллельными ко
ординатным плоскостям, и обозначим
вершины этого тетраэдра цифрами, как на
рис. 153. Тогда легко проверить, что
dΓ = dΓ123 == dΓ123 + dΓ234 + dΓ431 ,

так как в правой части интегралы по от
резкам 41, 42 и 43 взаимно уничтожаются.
Но правую часть можно подсчитать по формулам (40) и (41)
Рис. 153.

∂A y ⎞
⎛ ∂A y ∂Ax ⎞
⎛ ∂A
∂A z ⎞
⎛ ∂A
dΓ = ⎜

⎟ dS 431 ,
⎟ dS124 + ⎜ z −
⎟ dS 234 + ⎜ x −

⎝ ∂x
⎝ ∂y
∂y ⎠
∂z ⎠
∂z
∂x ⎠

(42)

где цифровые индексы показывают, о каких площадях идет речь.
Полученный результат становится более обозримым, если ввести
вектор, называемый ротором (вихрем, или вихревым вектором) поля A
и обозначаемый буквами rot A, по формуле
∂A y ⎞
⎛ ∂A
⎛ ∂A y ∂Ax ⎞
∂A z ⎞
⎛ ∂A
rot A = ⎜ z −

⎟ j+ ⎜
⎟ i+ ⎜ x −
⎟ k.
⎝ ∂z
⎝ ∂y
⎝ ∂x
∂z ⎠
∂x ⎠
∂y ⎠

(43)

§ 7]

РОТОР ВЕКТОРНОГО ПОЛЯ

395

малому контуру, отнесенную к единице площади, охватываемой этим
контуром*.
Таким образом, проекция ротора поля на любое направление n рав
на отношению циркуляции поля по бесконечно малому контуру, перпен
дикулярному n, к площади, охватываемой этим контуром. Отсюда,
в частности, видно, что ротор, определение (43) которого привязано
к выбранной системе координат, на самом деле связан с полем инвариан
тно (образует новое векторное поле, так как имеет в каждой точке про
странства, вообще говоря, свое значение): он не зависит от выбора
системы координат, так как левая часть формулы (44) не зависит от этого
выбора, а знание проекции вектора на каждое направление определяет
этот вектор однозначно. Вместе с тем ротор истинного вектора является
псевдовектором (см. § 6), так как при смене правила винта при той же
ориентации площадки (dS), т.е. при том же векторе n, обход ее контура
сменяется на противоположный, а потому циркуляция сменяет знак.
Отметим, кстати, что получение нового векторного поля путем опреде
ления ротора (вихря) другого векторного поля является специфичным
для трехмерного пространства. Между тем получение векторного поля
как градиента скалярного поля в пространстве любого числа измере
ний происходит одинаково. Соотношение здесь такое же, как между
векторным и скалярным произведениями (см. конец § 6).
Пусть теперь в пространстве задана уже не бесконечно малая, а ко
нечная ориентированная поверхность (S ) с контуром ( L). Мы видели
выше, что циркуляции, отвечающие отдельным участкам этой повер
хности, складываются, т.е. общая циркуляция
Γ=

∫ dΓ .

(S )

Из формул (37) и (44) поэтому вытекает

∫ A ⋅ dr = ∫ ( rotn A ) dS = ∫ rotn A ⋅ dS,

(L )

(S )

(45)

(S )

Если заметить дополнительно, что в силу формулы (Х.18)
dS 234i + dS 431 j + dS124 k = dS 234 + dS 431 + dS124 = dS = n dS ,

и поделить на dS, то формулу (42) можно переписать в более простом
виде:

= (rot A ) ⋅ n = rot n A;
dS

(44)

в последнем выражении индекс n указывает на то, что берется проек
ция ротора на нормаль n. Эта формула дает циркуляцию по бесконечно

т.е. циркуляция поля по замкнутому контуру равна потоку (см. § Х.7)
ротора этого поля через поверхность, ограниченную указанным конту
ром. Эта важная формула называется формулой Стокса.
* Отсюда следует, что направление вектора rot A в пространстве определяется как

максимально. Это определе
направление нормали к такой площадке, для которой
dS
ние сходно с определением направления градиента скаляра ϕ как направления линии

.
(l ), в котором достигает максимума
dl

394

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

можнo получить другую верную формулу, заменив х, у, z соответ
ственно на у, z, х или на z, x, у. (Такая перестановка, упоминавшая
ся в § 6, называется циклической или круговой; при ней правая система
координат остается правой.) Поэтому из (40) вытекает
dΓ yz
dS yz

=

∂A z ∂A y
,

∂y
∂z

dΓ zx ∂Ax ∂A z
.
=

dS zx
∂z
∂x

(41)

Рассмотрим теперь бесконечно малую ориентированную площадку
(dS), произвольно наклоненную относительно осей координат. Для
подсчета циркуляции эту площадку удоб
нее всего взять в форме треугольника, как
на рис. 153. Построим на этом треугольни
ке тетраэдр с гранями, параллельными ко
ординатным плоскостям, и обозначим
вершины этого тетраэдра цифрами, как на
рис. 153. Тогда легко проверить, что
dΓ = dΓ123 == dΓ123 + dΓ234 + dΓ431 ,

так как в правой части интегралы по от
резкам 41, 42 и 43 взаимно уничтожаются.
Но правую часть можно подсчитать по формулам (40) и (41)
Рис. 153.

∂A y ⎞
⎛ ∂A y ∂Ax ⎞
⎛ ∂A
∂A z ⎞
⎛ ∂A
dΓ = ⎜

⎟ dS 431 ,
⎟ dS124 + ⎜ z −
⎟ dS 234 + ⎜ x −

⎝ ∂x
⎝ ∂y
∂y ⎠
∂z ⎠
∂z
∂x ⎠

(42)

где цифровые индексы показывают, о каких площадях идет речь.
Полученный результат становится более обозримым, если ввести
вектор, называемый ротором (вихрем, или вихревым вектором) поля A
и обозначаемый буквами rot A, по формуле
∂A y ⎞
⎛ ∂A
⎛ ∂A y ∂Ax ⎞
∂A z ⎞
⎛ ∂A
rot A = ⎜ z −

⎟ j+ ⎜
⎟ i+ ⎜ x −
⎟ k.
⎝ ∂z
⎝ ∂y
⎝ ∂x
∂z ⎠
∂x ⎠
∂y ⎠

(43)

§ 7]

РОТОР ВЕКТОРНОГО ПОЛЯ

395

малому контуру, отнесенную к единице площади, охватываемой этим
контуром*.
Таким образом, проекция ротора поля на любое направление n рав
на отношению циркуляции поля по бесконечно малому контуру, перпен
дикулярному n, к площади, охватываемой этим контуром. Отсюда,
в частности, видно, что ротор, определение (43) которого привязано
к выбранной системе координат, на самом деле связан с полем инвариан
тно (образует новое векторное поле, так как имеет в каждой точке про
странства, вообще говоря, свое значение): он не зависит от выбора
системы координат, так как левая часть формулы (44) не зависит от этого
выбора, а знание проекции вектора на каждое направление определяет
этот вектор однозначно. Вместе с тем ротор истинного вектора является
псевдовектором (см. § 6), так как при смене правила винта при той же
ориентации площадки (dS), т.е. при том же векторе n, обход ее контура
сменяется на противоположный, а потому циркуляция сменяет знак.
Отметим, кстати, что получение нового векторного поля путем опреде
ления ротора (вихря) другого векторного поля является специфичным
для трехмерного пространства. Между тем получение векторного поля
как градиента скалярного поля в пространстве любого числа измере
ний происходит одинаково. Соотношение здесь такое же, как между
векторным и скалярным произведениями (см. конец § 6).
Пусть теперь в пространстве задана уже не бесконечно малая, а ко
нечная ориентированная поверхность (S ) с контуром ( L). Мы видели
выше, что циркуляции, отвечающие отдельным участкам этой повер
хности, складываются, т.е. общая циркуляция
Γ=

∫ dΓ .

(S )

Из формул (37) и (44) поэтому вытекает

∫ A ⋅ dr = ∫ ( rotn A ) dS = ∫ rotn A ⋅ dS,

(L )

(S )

(45)

(S )

Если заметить дополнительно, что в силу формулы (Х.18)
dS 234i + dS 431 j + dS124 k = dS 234 + dS 431 + dS124 = dS = n dS ,

и поделить на dS, то формулу (42) можно переписать в более простом
виде:

= (rot A ) ⋅ n = rot n A;
dS

(44)

в последнем выражении индекс n указывает на то, что берется проек
ция ротора на нормаль n. Эта формула дает циркуляцию по бесконечно

т.е. циркуляция поля по замкнутому контуру равна потоку (см. § Х.7)
ротора этого поля через поверхность, ограниченную указанным конту
ром. Эта важная формула называется формулой Стокса.
* Отсюда следует, что направление вектора rot A в пространстве определяется как

максимально. Это определе
направление нормали к такой площадке, для которой
dS
ние сходно с определением направления градиента скаляра ϕ как направления линии

.
(l ), в котором достигает максимума
dl

396

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Имеется еще одна полезная интегральная формула, включающая
ротор, которая преобразует интеграл
I=

∫ A × dS

(S )

по замкнутой поверхности (S ) (ориентированной естественным обра
зом, т.е. наружной стороной к бесконечности) в интеграл по объему
(Ω), ограниченному (S ). Для ее вывода заметим, что

∫ (A × dS )⋅ i = ∫ (i × A) ⋅ dS;

Ix = I ⋅ i =

(S )

ОПЕРАТОР ГАМИЛЬТОНА «НАБЛА»

i

j
0
Ay

k
0 = − A z j + A y k,
Az

Выпишем основные дифференциальные операции (действия), ко
торые можно производить над скалярным полем u и векторным по
лем A = Ax i + A y j + A z k:
grad u =
div A =

∂u
∂u
∂u
i+
j+
k,
∂x
∂y
∂z

∂Ax ∂A y ∂A z
,
+
+
∂x
∂y
∂z

∂A y ⎞
⎛ ∂A
∂A z ⎞ ⎛ ∂A y ∂Ax ⎞
⎛ ∂A
rot A = ⎜ z −

⎟ j+ ⎜
⎟i+ ⎜ x −
⎟ k.

⎝ ∂y
∂y ⎠
∂z ⎠
∂z
∂x ⎠ ⎝ ∂x

Английский математик У. Гамильтон заметил, что эти три операции
можно более просто записать, если ввести символ
∇ =i

т.е.
Ix =

∫ ( −A z j + A y k) ⋅ dS.

(S )

Преобразуя этот интеграл по формуле Остроградского (§ Х.7), получим
Ix =

⎛ ∂A z ∂A y ⎞
+
⎟ d Ω.
⎜−
⎝ ∂y
∂z ⎠
(Ω )

∫ div ( −A z j + A y k) dΩ = ∫

(Ω )

Аналогично находим
Iy =

⎛ ∂Ax ∂A z ⎞
+
⎜−
⎟ d Ω,
⎝ ∂z
∂x ⎠
(Ω )



Iz =

⎛ ∂A y ∂Ax ⎞
+
⎟ d Ω,
⎜−
⎝ ∂x
∂y ⎠
(Ω )



откуда

397

§ 8. Оператор Гамильтона «набла»

(S )

здесь мы пользуемся тем, что в силу геометрического смысла вектор
носкалярного произведения оно при «круговой» перестановке сомно
жителей не меняется. Однако
i×A= 1
Ax

§ 8]




+ j
+k ,
∂x
∂y
∂z

называемый набла*. Отдельно взятый, этот символ представляет собой
знак действия, т.е. «оператор», причем векторнодифференциальный, со
храняющий при своем применении как черты вектора, так и черты опера
тора дифференцирования (Общее понятие оператора см. в § VI.2.)
«Умножение» (т.е. действие) оператора Гамильтона на скаляр (точ
нее, на скалярное поле) u и на вектор А производится по следующим
естественным правилам:
⎛ ∂

∂⎞
∂u
∂u
∂u
∇u = ⎜ i
+ j
+ k ⎟ u =i
+ j
+k
= grad u,
⎝ ∂x
∂y
∂z ⎠
∂x
∂y
∂z
∂A y ∂A z
⎛ ∂

∂⎞
∂A
= div A,
∇ ⋅ A = ⎜i
+ j
+ k ⎟ ⋅ iAx + jA y + kA z = x +
+
⎝ ∂x
∂y
∂z ⎠
∂x
∂y
∂z

(

∫ A × dS = I = I xi + I y j + I z k =

)

(S )

=

⎡ ⎛ ∂A z ∂A y ⎞
⎛ ∂A y ∂Ax ⎞ ⎤
⎛ ∂Ax ∂A z ⎞
⎢⎜⎝ − ∂y + ∂z ⎟⎠ i + ⎜⎝ − ∂z + ∂x ⎟⎠ j + ⎜⎝ − ∂x + ∂y ⎟⎠ k ⎥ dΩ = − ∫ rot A dΩ.

(Ω ) ⎣
(S )



Упражнения
1. Получите с помощью последней формулы инвариантное, не связанное
с выбором системы координат определение ротора, аналогичное определениям
(Х.33) дивергенции и (Х.57) градиента.
2. Докажите с помощью формулы Стокса теорему Коши об интеграле от
аналитической функции (§ V.8).
У к а з а н и е. Перейдите к вещественным интегралам и воспользуйтесь
условиями Коши–Римана (V.17).

i

∇×A=
∂x
Ax

j

∂y
Ay

k
∂A y ⎞
⎛ ∂A

=i⎜ z +
⎟ + и т. д. = rot A.

∂z
∂y
∂z ⎠
Az

Набла как дифференциальный оператор действует только на мно
житель, который стоит непосредственно за ним: например,
( ∇u ) v = ( grad u ) v = v grad u,

∇( u v ) = grad ( u v ).

* От греческого слова ναβλα — арфа, форма которолй напоминает символ ∇.

396

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Имеется еще одна полезная интегральная формула, включающая
ротор, которая преобразует интеграл
I=

∫ A × dS

(S )

по замкнутой поверхности (S ) (ориентированной естественным обра
зом, т.е. наружной стороной к бесконечности) в интеграл по объему
(Ω), ограниченному (S ). Для ее вывода заметим, что

∫ (A × dS )⋅ i = ∫ (i × A) ⋅ dS;

Ix = I ⋅ i =

(S )

ОПЕРАТОР ГАМИЛЬТОНА «НАБЛА»

i

j
0
Ay

k
0 = − A z j + A y k,
Az

Выпишем основные дифференциальные операции (действия), ко
торые можно производить над скалярным полем u и векторным по
лем A = Ax i + A y j + A z k:
grad u =
div A =

∂u
∂u
∂u
i+
j+
k,
∂x
∂y
∂z

∂Ax ∂A y ∂A z
,
+
+
∂x
∂y
∂z

∂A y ⎞
⎛ ∂A
∂A z ⎞ ⎛ ∂A y ∂Ax ⎞
⎛ ∂A
rot A = ⎜ z −

⎟ j+ ⎜
⎟i+ ⎜ x −
⎟ k.

⎝ ∂y
∂y ⎠
∂z ⎠
∂z
∂x ⎠ ⎝ ∂x

Английский математик У. Гамильтон заметил, что эти три операции
можно более просто записать, если ввести символ
∇ =i

т.е.
Ix =

∫ ( −A z j + A y k) ⋅ dS.

(S )

Преобразуя этот интеграл по формуле Остроградского (§ Х.7), получим
Ix =

⎛ ∂A z ∂A y ⎞
+
⎟ d Ω.
⎜−
⎝ ∂y
∂z ⎠
(Ω )

∫ div ( −A z j + A y k) dΩ = ∫

(Ω )

Аналогично находим
Iy =

⎛ ∂Ax ∂A z ⎞
+
⎜−
⎟ d Ω,
⎝ ∂z
∂x ⎠
(Ω )



Iz =

⎛ ∂A y ∂Ax ⎞
+
⎟ d Ω,
⎜−
⎝ ∂x
∂y ⎠
(Ω )



откуда

397

§ 8. Оператор Гамильтона «набла»

(S )

здесь мы пользуемся тем, что в силу геометрического смысла вектор
носкалярного произведения оно при «круговой» перестановке сомно
жителей не меняется. Однако
i×A= 1
Ax

§ 8]




+ j
+k ,
∂x
∂y
∂z

называемый набла*. Отдельно взятый, этот символ представляет собой
знак действия, т.е. «оператор», причем векторнодифференциальный, со
храняющий при своем применении как черты вектора, так и черты опера
тора дифференцирования (Общее понятие оператора см. в § VI.2.)
«Умножение» (т.е. действие) оператора Гамильтона на скаляр (точ
нее, на скалярное поле) u и на вектор А производится по следующим
естественным правилам:
⎛ ∂

∂⎞
∂u
∂u
∂u
∇u = ⎜ i
+ j
+ k ⎟ u =i
+ j
+k
= grad u,
⎝ ∂x
∂y
∂z ⎠
∂x
∂y
∂z
∂A y ∂A z
⎛ ∂

∂⎞
∂A
= div A,
∇ ⋅ A = ⎜i
+ j
+ k ⎟ ⋅ iAx + jA y + kA z = x +
+
⎝ ∂x
∂y
∂z ⎠
∂x
∂y
∂z

(

∫ A × dS = I = I xi + I y j + I z k =

)

(S )

=

⎡ ⎛ ∂A z ∂A y ⎞
⎛ ∂A y ∂Ax ⎞ ⎤
⎛ ∂Ax ∂A z ⎞
⎢⎜⎝ − ∂y + ∂z ⎟⎠ i + ⎜⎝ − ∂z + ∂x ⎟⎠ j + ⎜⎝ − ∂x + ∂y ⎟⎠ k ⎥ dΩ = − ∫ rot A dΩ.

(Ω ) ⎣
(S )



Упражнения
1. Получите с помощью последней формулы инвариантное, не связанное
с выбором системы координат определение ротора, аналогичное определениям
(Х.33) дивергенции и (Х.57) градиента.
2. Докажите с помощью формулы Стокса теорему Коши об интеграле от
аналитической функции (§ V.8).
У к а з а н и е. Перейдите к вещественным интегралам и воспользуйтесь
условиями Коши–Римана (V.17).

i

∇×A=
∂x
Ax

j

∂y
Ay

k
∂A y ⎞
⎛ ∂A

=i⎜ z +
⎟ + и т. д. = rot A.

∂z
∂y
∂z ⎠
Az

Набла как дифференциальный оператор действует только на мно
житель, который стоит непосредственно за ним: например,
( ∇u ) v = ( grad u ) v = v grad u,

∇( u v ) = grad ( u v ).

* От греческого слова ναβλα — арфа, форма которолй напоминает символ ∇.

398

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Поэтому если в какомлибо выражении за наблой нет множителей,
то оно представляет собой оператор: например,
⎛ ∂


∂⎞


A ⋅ ∇ = iAx + jA y + kA z ⋅ ⎜i
+ j
+ k ⎟ = Ax
+ Ay
+ Az
⎝ ∂x
∂z
∂y
∂z ⎠
∂x
∂y

(

)

(46)

Повторив вывод этой формулы, легко проверить, что и для скорости
изменения векторного поля вдоль траектории имеет место аналогич
ная формула
dA
∂A
,
= ( v ⋅ ∇) A +
dt
∂t

отдельные слагаемые в которой имеют тот же смысл, что в (46). Это
дает, в частности, возможность переписать уравнение (Х.54) движения
жидкости в форме
ρ ( v ⋅ ∇) v + ρ

∂v
= − grad p + f ,
∂t

от которой уже легко перейти к координатной форме.
При действиях с оператором набла надо пользоваться правилами
векторной алгебры и правилами дифференцирования. Например,
rot ( A + B ) = ∇ × ( A + B ) = ∇ × A + ∇ × B = rot ( A ) + rot ( B ),
div ( λA ) = ∇ ⋅ ( λA ) = λ( ∇ ⋅ A ) = λ div A

( λ = const),

(47)

так как и умножение на вектор, и дифференцирование обладают этими
свойствами линейности. В то же время в формуле (47) нельзя было бы
считать λ зависящим от точки пространства (т.е. скалярным полем),
так как тогда получилось бы, что мы вынесли переменную величину за
знак дифференцирования. Чтобы охватить этот случай, заметим, что
в обычной формуле для производной произведения
( uv )′ = u′ v + uv′

(48)

первое слагаемое получается, если в процессе дифференцирования
считать v постоянным, а второе — если в этом процессе считать u по
стоянным; поэтому дифференцирование (48) можно выполнить так:
( uv )′ = ( uc v )′ + ( uv c )′ = uc v′ + u′ v c = uv′ + u′ v,

ОПЕРАТОР ГАМИЛЬТОНА «НАБЛА»

399

где индекс c указывает, что при дифференцировании к данной вели
чине надо относиться, как к постоянной (конечно, если величина стоит
вне знака дифференцирования, то индекс с с нее можно снять). Таким
образом,
div ( uA ) = ∇ ⋅ ( uA ) = ∇ ⋅ ( uc A ) + ∇ ⋅ ( uAc ) =

— это скалярный дифференциальный оператор, который может дей
ствовать на скалярное или векторное поле. Он применяется, в частнос
ти, в формуле для скорости изменения поля вдоль траектории (§ IV.1)
∂u
∂u
∂u ∂u
∂u
du
= vx
+ vy
+ vz
+
= ( v ⋅ ∇) u + .
∂x
∂y
∂z ∂t
∂t
dt

§ 8]

= u( ∇ ⋅ A ) + ( ∇u ) ⋅ A = u div A + grad u ⋅ A

(эта формула иным путем была выведена в Х.8).
После применения дифференциальной операции к полю получает
ся новое поле, к которому можно вновь применять эти операции. Рас
смотрим, например, «составную» операцию rot grad u. Ее можно
записать в виде ∇ × (∇u). Но для «обычного» вектора a и «обычного»
скаляра u всегда
a × (au ) = 0

(49)

(почему?). Значит, если вместо a в левую часть подставить его разло
жение по декартовым осям и произвести вычисления по формальным
правилам векторной алгебры, то мы получим нуль. Но вычисление
комбинации ∇ × (∇u) производится по тем же формальным правилам,
∂ ∂ ∂
,
,
. Значит,
что и (49), только вместо a x , a y , a z надо взять
∂x ∂y ∂z
и здесь получится нуль, т.е. всегда
rot grad u = 0.

(50)

Аналогично получаем (проверьте!), что всегда
div rot A = 0.

(51)

Это простое свойство имеет важное следствие. Именно, для любого
поля А можно наряду с векторными линиями (§ Х.7) рассматривать
вихревые линии, т.е. векторные линии поля rot A. Формула (51) гово
рит, что вихревые линии не могут иметь ни источников, ни стоков, т.е.
они не могут ни начинаться, ни кончаться.
Наконец, комбинация
div grad = ∇ ⋅ ∇ = ∇ 2 =

∂2
∂2
∂2
+ 2 + 2
2
∂x
∂y
∂z

(оператор Лапласа Δ) была.рассмотрена в § Х.9.
Упражнения
1. Выведите формулы для rot ( uA ); div(A × B ).
2. На основе формул (Х.33), (Х.57) и решения упражнения 1 § 7 напишите
символическое выражение ∇ в виде интеграла.

398

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Поэтому если в какомлибо выражении за наблой нет множителей,
то оно представляет собой оператор: например,
⎛ ∂


∂⎞


A ⋅ ∇ = iAx + jA y + kA z ⋅ ⎜i
+ j
+ k ⎟ = Ax
+ Ay
+ Az
⎝ ∂x
∂z
∂y
∂z ⎠
∂x
∂y

(

)

(46)

Повторив вывод этой формулы, легко проверить, что и для скорости
изменения векторного поля вдоль траектории имеет место аналогич
ная формула
dA
∂A
,
= ( v ⋅ ∇) A +
dt
∂t

отдельные слагаемые в которой имеют тот же смысл, что в (46). Это
дает, в частности, возможность переписать уравнение (Х.54) движения
жидкости в форме
ρ ( v ⋅ ∇) v + ρ

∂v
= − grad p + f ,
∂t

от которой уже легко перейти к координатной форме.
При действиях с оператором набла надо пользоваться правилами
векторной алгебры и правилами дифференцирования. Например,
rot ( A + B ) = ∇ × ( A + B ) = ∇ × A + ∇ × B = rot ( A ) + rot ( B ),
div ( λA ) = ∇ ⋅ ( λA ) = λ( ∇ ⋅ A ) = λ div A

( λ = const),

(47)

так как и умножение на вектор, и дифференцирование обладают этими
свойствами линейности. В то же время в формуле (47) нельзя было бы
считать λ зависящим от точки пространства (т.е. скалярным полем),
так как тогда получилось бы, что мы вынесли переменную величину за
знак дифференцирования. Чтобы охватить этот случай, заметим, что
в обычной формуле для производной произведения
( uv )′ = u′ v + uv′

(48)

первое слагаемое получается, если в процессе дифференцирования
считать v постоянным, а второе — если в этом процессе считать u по
стоянным; поэтому дифференцирование (48) можно выполнить так:
( uv )′ = ( uc v )′ + ( uv c )′ = uc v′ + u′ v c = uv′ + u′ v,

ОПЕРАТОР ГАМИЛЬТОНА «НАБЛА»

399

где индекс c указывает, что при дифференцировании к данной вели
чине надо относиться, как к постоянной (конечно, если величина стоит
вне знака дифференцирования, то индекс с с нее можно снять). Таким
образом,
div ( uA ) = ∇ ⋅ ( uA ) = ∇ ⋅ ( uc A ) + ∇ ⋅ ( uAc ) =

— это скалярный дифференциальный оператор, который может дей
ствовать на скалярное или векторное поле. Он применяется, в частнос
ти, в формуле для скорости изменения поля вдоль траектории (§ IV.1)
∂u
∂u
∂u ∂u
∂u
du
= vx
+ vy
+ vz
+
= ( v ⋅ ∇) u + .
∂x
∂y
∂z ∂t
∂t
dt

§ 8]

= u( ∇ ⋅ A ) + ( ∇u ) ⋅ A = u div A + grad u ⋅ A

(эта формула иным путем была выведена в Х.8).
После применения дифференциальной операции к полю получает
ся новое поле, к которому можно вновь применять эти операции. Рас
смотрим, например, «составную» операцию rot grad u. Ее можно
записать в виде ∇ × (∇u). Но для «обычного» вектора a и «обычного»
скаляра u всегда
a × (au ) = 0

(49)

(почему?). Значит, если вместо a в левую часть подставить его разло
жение по декартовым осям и произвести вычисления по формальным
правилам векторной алгебры, то мы получим нуль. Но вычисление
комбинации ∇ × (∇u) производится по тем же формальным правилам,
∂ ∂ ∂
,
,
. Значит,
что и (49), только вместо a x , a y , a z надо взять
∂x ∂y ∂z
и здесь получится нуль, т.е. всегда
rot grad u = 0.

(50)

Аналогично получаем (проверьте!), что всегда
div rot A = 0.

(51)

Это простое свойство имеет важное следствие. Именно, для любого
поля А можно наряду с векторными линиями (§ Х.7) рассматривать
вихревые линии, т.е. векторные линии поля rot A. Формула (51) гово
рит, что вихревые линии не могут иметь ни источников, ни стоков, т.е.
они не могут ни начинаться, ни кончаться.
Наконец, комбинация
div grad = ∇ ⋅ ∇ = ∇ 2 =

∂2
∂2
∂2
+ 2 + 2
2
∂x
∂y
∂z

(оператор Лапласа Δ) была.рассмотрена в § Х.9.
Упражнения
1. Выведите формулы для rot ( uA ); div(A × B ).
2. На основе формул (Х.33), (Х.57) и решения упражнения 1 § 7 напишите
символическое выражение ∇ в виде интеграла.

400

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

§ 9. Потенциальные поля
В § Х.3 мы рассмотрели вопрос о существовании потенциала (по
тенциальной энергии) у силового поля. Сейчас мы рассмотрим этот
вопрос в общем виде. Векторное поле А называется потенциальным,
если оно является градиентом некоторого скалярного поля; если об
означить это поле через −ϕ, то
A = − grad ϕ

(52)

(ср. формулу (Х.9)). При этом поле ϕ называется потенциалом поля А.
Так как градиент постоянного скалярного поля равен нулю, то по
тенциал любого поля А, если он имеется, определен с точностью до
произвольного постоянного слагаемого. Подбирая это слагаемое, мож
но сделать значение потенциала равным нулю в любой заданной точке;
чаще всего принимается равным нулю значение потенциала на беско
нечности. Разность значений потенциала в двух точках уже не зависит
от этого небольшого произвола в выборе потенциала, так как постоян
ные слагаемые в такой разности взаимно уничтожаются.
Далеко не всякое поле является потенциальным. Именно, из (52)
сразу следует, что
rot A = − rot grad ϕ = 0

(53)

(см. формулу (50)), т.е. потенциальное поле обязательно является без
вихревым. Учитывая выражение (43) для ротора, условие (53) можно
переписать в виде
∂A z ∂A y
,
=
∂y
∂z

∂Ax ∂A z
,
=
∂z
∂x

∂A y
∂x

=

∂Ax
.
∂y

(54)

Условия (54) можно вывести и другим способом. Равенство (52)
в координатной форме имеет вид
⎛ ∂ϕ
∂ϕ
∂ϕ ⎞
Axi + A y j + A z k = − ⎜ i +
j+
k⎟ ,
⎝ ∂x
∂y
∂z ⎠

откуда следует, что
Ax = −

∂ϕ
,
∂x

Ay = −

∂ϕ
,
∂y

Az = −

∂ϕ
.
∂z

§ 9]

ПОТЕНЦИАЛЬНЫЕ ПОЛЯ

401

Обратно, пусть поле, заданное во всем пространстве, является безвих
ревым*. Тогда это поле обязательно является бесциркуляционным, т.е.

∫ A ⋅ dr = 0

(L )

для любого замкнутого контура ( L). В самом деле, «натянем» на кон
тур ( L) поверхность (S ). Применяя к ней формулу Стокса (18), полу
чим, если rot A = 0,



(L )

A ⋅ dr =

∫ rot A ⋅ dS = 0.

(S )

Иначе говоря, для безвихревого поля циркуляция по любому бесконеч
но малому контуру равна нулю, а потому и циркуляция по любому ко
нечному контуру равна нулю.
В § Х.3 мы показали, что бесциркуляционное поле обязательно имеет
потенциал, который строится по формуле (см. формулу (Х.8).)
ϕ( M ) =

∫ A ⋅ dr ,

(55)

MM 0

где M 0 — какая угодно фиксированная точка, а выбор конкретного
пути интегрирования несуществен, так как в бесциркуляционном поле
линейный интеграл зависит только от положения начала и конца пути
интегрирования. Правда, в § Х.3 мы говорили о силовом поле и истол
ковывали потенциал как работу, но с математической точки зрения та
кое конкретное истолкование несущественно, можно говорить о любом
векторном поле и о его потенциале.
Итак, при рассмотрении векторного поля во всем пространстве тре
бования, чтобы это поле было потенциальным, безвихревым или бес
циркуляционным, полностью равносильны, так что из выполнения
одного этого требования вытекает выполнение остальных. Из форму
лы (55) в силу произвольности точки M 0 еще раз вытекает, что потен
циал определен с точностью до постоянного слагаемого.
Если векторное поле А является не только безвихревым, но и не
имеет источников векторных линий (см. § Х.7), т.е. если
rot A = 0 и

div A = 0,

то из первого следует, что A = − grad ϕ, а из второго — что

Но тогда
∂A z
∂ 2ϕ
,
=−
∂y
∂z ∂y

∂A y
∂z

=−

∂ 2ϕ
,
∂y ∂z

и из равенства смешанных частных производных (§ IV.1) получаем
первое соотношение (54). Аналогично выводятся и остальные.

div grad ϕ = − div A = 0,

т.е. ∇ 2ϕ = 0.

* Если поле рассматривается не во всем пространстве, а в некоторой его части, то в
этом пункте могут быть осложнения, которые будут освещены в § 13.

400

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

§ 9. Потенциальные поля
В § Х.3 мы рассмотрели вопрос о существовании потенциала (по
тенциальной энергии) у силового поля. Сейчас мы рассмотрим этот
вопрос в общем виде. Векторное поле А называется потенциальным,
если оно является градиентом некоторого скалярного поля; если об
означить это поле через −ϕ, то
A = − grad ϕ

(52)

(ср. формулу (Х.9)). При этом поле ϕ называется потенциалом поля А.
Так как градиент постоянного скалярного поля равен нулю, то по
тенциал любого поля А, если он имеется, определен с точностью до
произвольного постоянного слагаемого. Подбирая это слагаемое, мож
но сделать значение потенциала равным нулю в любой заданной точке;
чаще всего принимается равным нулю значение потенциала на беско
нечности. Разность значений потенциала в двух точках уже не зависит
от этого небольшого произвола в выборе потенциала, так как постоян
ные слагаемые в такой разности взаимно уничтожаются.
Далеко не всякое поле является потенциальным. Именно, из (52)
сразу следует, что
rot A = − rot grad ϕ = 0

(53)

(см. формулу (50)), т.е. потенциальное поле обязательно является без
вихревым. Учитывая выражение (43) для ротора, условие (53) можно
переписать в виде
∂A z ∂A y
,
=
∂y
∂z

∂Ax ∂A z
,
=
∂z
∂x

∂A y
∂x

=

∂Ax
.
∂y

(54)

Условия (54) можно вывести и другим способом. Равенство (52)
в координатной форме имеет вид
⎛ ∂ϕ
∂ϕ
∂ϕ ⎞
Axi + A y j + A z k = − ⎜ i +
j+
k⎟ ,
⎝ ∂x
∂y
∂z ⎠

откуда следует, что
Ax = −

∂ϕ
,
∂x

Ay = −

∂ϕ
,
∂y

Az = −

∂ϕ
.
∂z

§ 9]

ПОТЕНЦИАЛЬНЫЕ ПОЛЯ

401

Обратно, пусть поле, заданное во всем пространстве, является безвих
ревым*. Тогда это поле обязательно является бесциркуляционным, т.е.

∫ A ⋅ dr = 0

(L )

для любого замкнутого контура ( L). В самом деле, «натянем» на кон
тур ( L) поверхность (S ). Применяя к ней формулу Стокса (18), полу
чим, если rot A = 0,



(L )

A ⋅ dr =

∫ rot A ⋅ dS = 0.

(S )

Иначе говоря, для безвихревого поля циркуляция по любому бесконеч
но малому контуру равна нулю, а потому и циркуляция по любому ко
нечному контуру равна нулю.
В § Х.3 мы показали, что бесциркуляционное поле обязательно имеет
потенциал, который строится по формуле (см. формулу (Х.8).)
ϕ( M ) =

∫ A ⋅ dr ,

(55)

MM 0

где M 0 — какая угодно фиксированная точка, а выбор конкретного
пути интегрирования несуществен, так как в бесциркуляционном поле
линейный интеграл зависит только от положения начала и конца пути
интегрирования. Правда, в § Х.3 мы говорили о силовом поле и истол
ковывали потенциал как работу, но с математической точки зрения та
кое конкретное истолкование несущественно, можно говорить о любом
векторном поле и о его потенциале.
Итак, при рассмотрении векторного поля во всем пространстве тре
бования, чтобы это поле было потенциальным, безвихревым или бес
циркуляционным, полностью равносильны, так что из выполнения
одного этого требования вытекает выполнение остальных. Из форму
лы (55) в силу произвольности точки M 0 еще раз вытекает, что потен
циал определен с точностью до постоянного слагаемого.
Если векторное поле А является не только безвихревым, но и не
имеет источников векторных линий (см. § Х.7), т.е. если
rot A = 0 и

div A = 0,

то из первого следует, что A = − grad ϕ, а из второго — что

Но тогда
∂A z
∂ 2ϕ
,
=−
∂y
∂z ∂y

∂A y
∂z

=−

∂ 2ϕ
,
∂y ∂z

и из равенства смешанных частных производных (§ IV.1) получаем
первое соотношение (54). Аналогично выводятся и остальные.

div grad ϕ = − div A = 0,

т.е. ∇ 2ϕ = 0.

* Если поле рассматривается не во всем пространстве, а в некоторой его части, то в
этом пункте могут быть осложнения, которые будут освещены в § 13.

402

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Таким образом, в этом случае потенциал поля должен удовлетворять
уравнению Лапласа (которое уже встречалось нам в § Х.9) или, как вы
ражают это другими словами, быть гармонической функцией.
Если у безвихревого поля, рассматриваемого во всем пространстве, нет
источников не только на конечном расстоянии, но и на бесконечности, то
вектор такого поля просто тождественно равен нулю, т.е., по существу,
поля нет. Этому соответствует следующее свойство гармонических функ
ций: функция, гармоническая во всем пространстве и равная нулю на бес
конечности, тождественно равна нулю. Можно доказать (мы не будем
этого делать) более общий факт: функция, гармоническая во всем про
странстве и ограниченная на бесконечности, тождественно равна посто
янной, т.е. такому потенциалу также отвечает нулевое поле. Таким
образом, чтобы теория стала содержательной, нужно либо допустить ис
точники поля на бесконечности, т.е. неограниченность потенциала на бес
конечности, либо допустить источники на конечном расстоянии, т.е.
считать потенциал гармоническим не во всем пространстве. Например,
полю А = const отвечает потенциал ϕ = − A ⋅ r (проверьте!), неограничен
ный на бесконечности, а ньютонову полю (§ Х.3) отвечает потенциал, гар
монический всюду, кроме одной точки*.
Вернемся к рассмотрению силового поля F, а буквой A будем, как
и в § Х.3, обозначать работу. Эта сила может обладать потенциалом, но
может и не соответствовать никакому потенциалу. Последнее можно
выяснить двумя способами: либо проверить, что rot F ≠ 0, т.е. что хотя
бы одно из условий
∂F z ∂F y
,
=
∂y
∂z

∂F x ∂F z
,
=
∂z
∂x

∂F y

∂F
= x
∂x
∂y

(см. условия (54)) не выполнено, либо же проверить, что поле не явля
ется бесциркуляционным, т.е. что хотя бы для одного замкнутого кон
тура работа силы F отлична от нуля.
Рассмотрим пример. Пусть сила F лежит в плоскости х, у, т.е. об
разует плоское поле, и в каждой точке перпендикулярна прямой, соеди
няющей эту точку с началом координат (перпендикулярна радиусувек
тору), причем направлена против стрелки часов. Пусть при этом
величина силы пропорциональна расстоянию r от точки до начала ко
ординат, т.е. F = ar, где а — постоянный коэффициент пропорцио
нальности. (Для нескольких точек плоскости такая сила изображена на
рис. 154.) Пусть под действием такой силы тело движется по окружнос
ти радиуса R с центром в начале координат (рис. 155). Весьма малый
путь от точки М до точки N (он соответствует повороту на угол dϕ)
можно приближенно считать прямолинейным. Он равен Rdϕ, как длина
* В этой точке Δϕ бесконечен, пропорционален дельтафункции, так что хотя точка
«мала» по сравнению с бесконечным объемом, забывать об э т о й точке нельзя.

§ 9]

ПОТЕНЦИАЛЬНЫЕ ПОЛЯ

403

дуги окружности, соответствующая центральному углу dϕ. Сила на
правлена вдоль пути, поэтому работа на участке MN есть
dA = R dϕ ⋅ F = R dϕ ⋅ aR = aR 3 dϕ.

Следовательно, работа при обходе точкой всей окружности есть


A=

∫ aR
0



2

dϕ = aR 2 ⋅ ∫ dϕ = πR 2 ⋅ 2 a .
0

Работа пропорциональна площади круга и отнюдь не равна нулю. (Мож
но доказать, что для рассматриваемой силы работа, совершенная при об
ходе замкнутой линии, пропорциональна площади, ограниченной линией
движения, при любой форме
этой линии.) Ясно, что такая
сила не может соответствовать
никакому потенциалу.

Рис. 154.

Рис. 155.

Последний вывод можно сделать и с помощью формального подсче
та ротора. Так как поле сил получается в данном примере таким же, как
поле линейных скоростей при вращении вокруг оси z с угловой ско
ростью а, то можно воспользоваться формулой (5), что даст
i
F = ( ak ) × r = 0
x

j

k

0 a = − ayi + axj
y 0

(это легко получить и непосредственно из рис. 154). Отсюда
i

rot F = ∇ × F =
∂x
− ay

j

∂y
ax

k

= ak + ak = 2 ak ≠ 0.
∂z
0

Итак, ротор не равен нулю, и потому поле не потенциальное.
Упражнение
Докажите, что поле
A = 2xzi + y 2 j + x 2 k

потенциальное, и постройте его потенциал.

(56)

402

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Таким образом, в этом случае потенциал поля должен удовлетворять
уравнению Лапласа (которое уже встречалось нам в § Х.9) или, как вы
ражают это другими словами, быть гармонической функцией.
Если у безвихревого поля, рассматриваемого во всем пространстве, нет
источников не только на конечном расстоянии, но и на бесконечности, то
вектор такого поля просто тождественно равен нулю, т.е., по существу,
поля нет. Этому соответствует следующее свойство гармонических функ
ций: функция, гармоническая во всем пространстве и равная нулю на бес
конечности, тождественно равна нулю. Можно доказать (мы не будем
этого делать) более общий факт: функция, гармоническая во всем про
странстве и ограниченная на бесконечности, тождественно равна посто
янной, т.е. такому потенциалу также отвечает нулевое поле. Таким
образом, чтобы теория стала содержательной, нужно либо допустить ис
точники поля на бесконечности, т.е. неограниченность потенциала на бес
конечности, либо допустить источники на конечном расстоянии, т.е.
считать потенциал гармоническим не во всем пространстве. Например,
полю А = const отвечает потенциал ϕ = − A ⋅ r (проверьте!), неограничен
ный на бесконечности, а ньютонову полю (§ Х.3) отвечает потенциал, гар
монический всюду, кроме одной точки*.
Вернемся к рассмотрению силового поля F, а буквой A будем, как
и в § Х.3, обозначать работу. Эта сила может обладать потенциалом, но
может и не соответствовать никакому потенциалу. Последнее можно
выяснить двумя способами: либо проверить, что rot F ≠ 0, т.е. что хотя
бы одно из условий
∂F z ∂F y
,
=
∂y
∂z

∂F x ∂F z
,
=
∂z
∂x

∂F y

∂F
= x
∂x
∂y

(см. условия (54)) не выполнено, либо же проверить, что поле не явля
ется бесциркуляционным, т.е. что хотя бы для одного замкнутого кон
тура работа силы F отлична от нуля.
Рассмотрим пример. Пусть сила F лежит в плоскости х, у, т.е. об
разует плоское поле, и в каждой точке перпендикулярна прямой, соеди
няющей эту точку с началом координат (перпендикулярна радиусувек
тору), причем направлена против стрелки часов. Пусть при этом
величина силы пропорциональна расстоянию r от точки до начала ко
ординат, т.е. F = ar, где а — постоянный коэффициент пропорцио
нальности. (Для нескольких точек плоскости такая сила изображена на
рис. 154.) Пусть под действием такой силы тело движется по окружнос
ти радиуса R с центром в начале координат (рис. 155). Весьма малый
путь от точки М до точки N (он соответствует повороту на угол dϕ)
можно приближенно считать прямолинейным. Он равен Rdϕ, как длина
* В этой точке Δϕ бесконечен, пропорционален дельтафункции, так что хотя точка
«мала» по сравнению с бесконечным объемом, забывать об э т о й точке нельзя.

§ 9]

ПОТЕНЦИАЛЬНЫЕ ПОЛЯ

403

дуги окружности, соответствующая центральному углу dϕ. Сила на
правлена вдоль пути, поэтому работа на участке MN есть
dA = R dϕ ⋅ F = R dϕ ⋅ aR = aR 3 dϕ.

Следовательно, работа при обходе точкой всей окружности есть


A=

∫ aR
0



2

dϕ = aR 2 ⋅ ∫ dϕ = πR 2 ⋅ 2 a .
0

Работа пропорциональна площади круга и отнюдь не равна нулю. (Мож
но доказать, что для рассматриваемой силы работа, совершенная при об
ходе замкнутой линии, пропорциональна площади, ограниченной линией
движения, при любой форме
этой линии.) Ясно, что такая
сила не может соответствовать
никакому потенциалу.

Рис. 154.

Рис. 155.

Последний вывод можно сделать и с помощью формального подсче
та ротора. Так как поле сил получается в данном примере таким же, как
поле линейных скоростей при вращении вокруг оси z с угловой ско
ростью а, то можно воспользоваться формулой (5), что даст
i
F = ( ak ) × r = 0
x

j

k

0 a = − ayi + axj
y 0

(это легко получить и непосредственно из рис. 154). Отсюда
i

rot F = ∇ × F =
∂x
− ay

j

∂y
ax

k

= ak + ak = 2 ak ≠ 0.
∂z
0

Итак, ротор не равен нулю, и потому поле не потенциальное.
Упражнение
Докажите, что поле
A = 2xzi + y 2 j + x 2 k

потенциальное, и постройте его потенциал.

(56)

404

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

§ 10. Ротор поля скорости
Понятие ротора особенно наглядно при рассмотрении поля линей
ных скоростей v частиц сплошной среды. Рассмотрим несколько при
меров.
Пусть среда движется поступательно, как твердое тело. Тогда
v = const, и так как ротор выражается с помощью операций дифферен
цирования, то rot v = 0. В данном случае циркуляция скорости отсу
тствует.
Пусть среда вращается вокруг некоторой оси с угловой скоростью
ω, как твердое тело. Воспользуемся тем, что ротор связан с полем инва
риантно и, стало быть, при его вычислении мы можем располагать оси
координат по своему усмотрению, как нам удобнее; поэтому направим
ось z по оси вращения. Тогда вычисления, аналогичные проведенным
в конце § 9, дают
v = −ωyi + ωxj,
rot v = 2ωk = 2 g.

Итак, в данном случае ротор постоянный во всем пространстве и равен
удвоенному вектору угловой скорости. Поэтому циркуляция линей
ной скорости по малому контуру максимальна, если этот контур распо
ложен перпендикулярно оси вращения(тогда ротор проецируется на
нормаль к соответствующей малой площадке своим полным модулем),
а если плоскость контура параллельна оси вращения, то циркуляция
равна нулю.
Можно доказать, что любое движение твердого тела в каждый мо
мент времени получается в результате наложения поступательного
и вращательного движений. В силу двух предыдущих абзацев ротор
линейной скорости твердого тела в каждый момент времени одинаков
во всех точках тела и равен удвоенному мгновенному вектору угловой.
скорости.
Перейдем к движению среды, при котором расстояния между ее
точками изменяются. Пусть рассматривается «чистое» сжатие газа по
ршнем вдоль оси х к плоскости x = 0; тогда поле скоростей имеет вид
v = −λxi,

j

∂y
0

РОТОР ПОЛЯ СКОРОСТИ

k

= 0.
∂z
0

405

Коши доказал, что любое движение малого объема деформируемой
сплошной среды (газа, жидкости или деформируемого твердого тела)
в любой момент времени получается в результате наложения поступа
тельного и вращательного движений, а также «чистых» сжатий и растя
жений. (Отметим, что и малые порции несжимаемой жидкости могут
испытывать одновременно «чистые» сжатия и растяжения по различ
ным направлениям.) Так как ненулевой ротор получается лишь для
вращательного движения, то мы видим, что при произвольном движе
нии среды ротор поля линейной скорости v частиц равен в каждой
точке удвоенному вектору угловой скорости соответствующей части
цы. Конечно, в общем случае ротор получается в различных точках раз
личным. Таким образом, при течении жидкости или газа отличие
ротора поля линейной скорости от нуля указывает на наличие завих
ренности, вращения, чем и объясняется название ротор*.
Рассмотрим в качестве следую
щего примера «сдвиговое» течение,
изображенное стрелками на рис. 156.
Такая картина получается при тече
нии вязкой жидкости вдоль твердой
стенки. В этом cлучае v = ayi,
где а — коэффициент пропорцио
нальности, откуда rot v = −ak (про
верьте!). Итак, это течение завихрен
Рис. 156.
ное, каждая частица жидкости вра
щается с угловой скоростью a 2 по часовой стрелке.
Рассмотрим, наконец, простейшую «вихревую линию», т.е. плоско
параллельное поле, определенное в плоскости х, у равенством
v = ( pk ) ×

r0
r
= ( pk ) × 2 .
r
r

Это поле, показанное на рис. 157, несколько напоминает поле
рис. 154, но в данном случае модуль вектора поля не прямо пропорцио
нален, а обратно пропорционален расстоянию от начала координат.
Осью вихревой линии в данном случае служит ось z. Подобно (56),
найдем выражение скорости в координатной форме:
v=−

где λ — коэффициент пропорциональности. Подсчитывая ротор, по
лучаем
i

rot v =
∂x
− λx

§ 10]

py
px
i+ 2
j,
x2 + y2
x + y2

(57)

откуда легко с помощью непосредственного вычисления подсчитать,
что вне оси z будет rot v = 0 (проверьте!). Таким образом, частицы
жидкости обходят вихревую линию, деформируясь, но не совершая
* От латинского слова roto — вращаюсь.

404

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

§ 10. Ротор поля скорости
Понятие ротора особенно наглядно при рассмотрении поля линей
ных скоростей v частиц сплошной среды. Рассмотрим несколько при
меров.
Пусть среда движется поступательно, как твердое тело. Тогда
v = const, и так как ротор выражается с помощью операций дифферен
цирования, то rot v = 0. В данном случае циркуляция скорости отсу
тствует.
Пусть среда вращается вокруг некоторой оси с угловой скоростью
ω, как твердое тело. Воспользуемся тем, что ротор связан с полем инва
риантно и, стало быть, при его вычислении мы можем располагать оси
координат по своему усмотрению, как нам удобнее; поэтому направим
ось z по оси вращения. Тогда вычисления, аналогичные проведенным
в конце § 9, дают
v = −ωyi + ωxj,
rot v = 2ωk = 2 g.

Итак, в данном случае ротор постоянный во всем пространстве и равен
удвоенному вектору угловой скорости. Поэтому циркуляция линей
ной скорости по малому контуру максимальна, если этот контур распо
ложен перпендикулярно оси вращения (тогда ротор проецируется на
нормаль к соответствующей малой площадке своим полным модулем),
а если плоскость контура параллельна оси вращения, то циркуляция
равна нулю.
Можно доказать, что любое движение твердого тела в каждый мо
мент времени получается в результате наложения поступательного
и вращательного движений. В силу двух предыдущих абзацев ротор
линейной скорости твердого тела в каждый момент времени одинаков
во всех точках тела и равен удвоенному мгновенному вектору угловой.
скорости.
Перейдем к движению среды, при котором расстояния между ее
точками изменяются. Пусть рассматривается «чистое» сжатие газа по
ршнем вдоль оси х к плоскости x = 0; тогда поле скоростей имеет вид
v = −λxi,

j

∂y
0

РОТОР ПОЛЯ СКОРОСТИ

k

= 0.
∂z
0

405

Коши доказал, что любое движение малого объема деформируемой
сплошной среды (газа, жидкости или деформируемого твердого тела)
в любой момент времени получается в результате наложения поступа
тельного и вращательного движений, а также «чистых» сжатий и растя
жений. (Отметим, что и малые порции несжимаемой жидкости могут
испытывать одновременно «чистые» сжатия и растяжения по различ
ным направлениям.) Так как ненулевой ротор получается лишь для
вращательного движения, то мы видим, что при произвольном движе
нии среды ротор поля линейной скорости v частиц равен в каждой
точке удвоенному вектору угловой скорости соответствующей части
цы. Конечно, в общем случае ротор получается в различных точках раз
личным. Таким образом, при течении жидкости или газа отличие
ротора поля линейной скорости от нуля указывает на наличие завих
ренности, вращения, чем и объясняется название ротор*.
Рассмотрим в качестве следую
щего примера «сдвиговое» течение,
изображенное стрелками на рис. 156.
Такая картина получается при тече
нии вязкой жидкости вдоль твердой
стенки. В этом cлучае v = ayi,
где а — коэффициент пропорцио
нальности, откуда rot v = −ak (про
верьте!). Итак, это течение завихрен
Рис. 156.
ное, каждая частица жидкости вра
щается с угловой скоростью a 2 по часовой стрелке.
Рассмотрим, наконец, простейшую «вихревую линию», т.е. плоско
параллельное поле, определенное в плоскости х, у равенством
v = ( pk ) ×

r0
r
= ( pk ) × 2 .
r
r

Это поле, показанное на рис. 157, несколько напоминает поле
рис. 154, но в данном случае модуль вектора поля не прямо пропорцио
нален, а обратно пропорционален расстоянию от начала координат.
Осью вихревой линии в данном случае служит ось z. Подобно (56),
найдем выражение скорости в координатной форме:
v=−

где λ — коэффициент пропорциональности. Подсчитывая ротор, по
лучаем
i

rot v =
∂x
− λx

§ 10]

py
px
i+ 2
j,
x2 + y2
x + y2

(57)

откуда легко с помощью непосредственного вычисления подсчитать,
что вне оси z будет rot v = 0 (проверьте!). Таким образом, частицы
жидкости обходят вихревую линию, деформируясь, но не совершая
* От латинского слова roto — вращаюсь.

406

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

вращательного движения относи
тельно собственной оси. В то же вре
мя, так как циркуляция вектора v по
любой окружности с центром в нача
ле координат равна
p
⋅ 2 πr = 2 πp,
r

то в начале координат имеется «ис
точник циркуляции», плотность ко
торого на плоскости х, у равна

= 2πpδ (r )
dS

Рис. 157.

(где δ — дельтафункция*, см. § VI.3). Так как ротор плоскопараллель
ного поля перпендикулярен плоскости поля, то мы получаем в данном
примере
rot v = 2 πpδ ( xi + yj ) k = 2 πpδ ( x ) δ ( y ) k

(58)

(по поводу последнего представления см. § VI.3).
Упражнение

§ 11]

МАГНИТНОЕ ПОЛЕ И ЭЛЕКТРИЧЕСКИЙ ТОК

Понятия векторного произведения и ротора широко применяются
при рассмотрении магнитных полей. Мы ограничимся для простоты
рассмотрением полей в вакууме.
Магнитное поле в каждой точке пространства полностью характе
ризуется вектором Н «напряженности магнитного поля». Этот век
тор во многом аналогичен вектору E напряженности электрического
поля (§§ Х.5 и Х.9), но проявляется своим действием не на неподвиж
ные заряды, как E, а на постоянные магниты или (что, как мы сейчас
увидим, равносильно) на движущиеся заряды. Создается магнитное
поле также постоянными магнитами или движущимися зарядами.
Рассмотрим сначала самую простую схему. Пусть магнитное поле со
здается током J, текущим вдоль бесконечно длинного (практически
весьма длинного) прямолинейного проводника, который мы предположим

z

совпадающим с осью z. Ясно, что при этом
получается плоскопараллельное поле, ко
торое достаточно, таким образом, рассмат
ривать только.в плоскости х, у. Из экспе
римента
известно,
что
при
этом
вектор Н получается, как на рис. 158: он
лежит в плоскости х, у и перпендикуля
рен радиусувектору r, причем направле
ние Н определяется по правилу правого
винта. Величина напряженности прямо
пропорциональна силе тока и обратно про

J
0

r

H

x
Рис. 158.

rot H = 2 π

2J
δ ( x ) δ ( y ) k.
c

С другой стороны, произведение J δ (x) δ (y)k представляет собой
плотность тока, показанного на рис. 158. Мы будем плотность тока об
означать через j (не путать с единичным вектором оси у!); таким об
разом, в данном примере
rot H =


j.
c

(59)

По этой формуле j выражается через H. Можно получить и обрат
ную формулу, по которой H выражается через j. Для этого введем
«векторный потенциал» A поля H, аналогичный скалярному потен
циалу электрического поля (см. § Х.5),
A(r ) =

1
c

j(r0 )
dΩ 0 .
r − r0



(60)

В рассматриваемом примере этот потенциал равен
* В данном случае имеется в виду двумерная дельтафункция: δ (r ) = δ (x ) δ ( y ), по
скольку интегрирование ведется по плоскости, Γ = ∫ rot A ⋅ dS .

y

J
порциональна расстоянию точки от проводника, т.е. H = a , где а —
r
некоторый коэффициент пропорциональности; при определенном вы
боре единиц H и J он оказывается равным 2 c, где с — скорость све
2J
та, так что H = .
cr
Рассматриваемое нами поле Н имеет в точности вид, изображен
ный на рис. 157, т.е. имеет формулу (57), где взамен р надо поставить
2J
. Отсюда по формуле (58)
c

В примере (57) найдите направления в частице вихревой линии, остающие
ся инвариантными при бесконечно малом перемещении.
У к а з а н и е. Исходите из того, что вектор dr не должен повернуться.

§ 11. Магнитное поле и электрический ток

407

A(r ) =

1
c





−∞

Jk dζ
2

2

2

x + y + (ζ − z )

=

J
c





−∞


2

2

x + y + (ζ − z )2

k.

406

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

вращательного движения относи
тельно собственной оси. В то же вре
мя, так как циркуляция вектора v по
любой окружности с центром в нача
ле координат равна
p
⋅ 2 πr = 2 πp,
r

то в начале координат имеется «ис
точник циркуляции», плотность ко
торого на плоскости х, у равна

= 2πpδ (r )
dS

Рис. 157.

(где δ — дельтафункция*, см. § VI.3). Так как ротор плоскопараллель
ного поля перпендикулярен плоскости поля, то мы получаем в данном
примере
rot v = 2 πpδ ( xi + yj ) k = 2 πpδ ( x ) δ ( y ) k

(58)

(по поводу последнего представления см. § VI.3).
Упражнение

§ 11]

МАГНИТНОЕ ПОЛЕ И ЭЛЕКТРИЧЕСКИЙ ТОК

Понятия векторного произведения и ротора широко применяются
при рассмотрении магнитных полей. Мы ограничимся для простоты
рассмотрением полей в вакууме.
Магнитное поле в каждой точке пространства полностью характе
ризуется вектором Н «напряженности магнитного поля». Этот век
тор во многом аналогичен вектору E напряженности электрического
поля (§§ Х.5 и Х.9), но проявляется своим действием не на неподвиж
ные заряды, как E, а на постоянные магниты или (что, как мы сейчас
увидим, равносильно) на движущиеся заряды. Создается магнитное
поле также постоянными магнитами или движущимися зарядами.
Рассмотрим сначала самую простую схему. Пусть магнитное поле со
здается током J, текущим вдоль бесконечно длинного (практически
весьма длинного) прямолинейного проводника, который мы предположим

z

совпадающим с осью z. Ясно, что при этом
получается плоскопараллельное поле, ко
торое достаточно, таким образом, рассмат
ривать только.в плоскости х, у. Из экспе
римента
известно,
что
при
этом
вектор Н получается, как на рис. 158: он
лежит в плоскости х, у и перпендикуля
рен радиусувектору r, причем направле
ние Н определяется по правилу правого
винта. Величина напряженности прямо
пропорциональна силе тока и обратно про

J
0

r

H

x
Рис. 158.

rot H = 2 π

2J
δ ( x ) δ ( y ) k.
c

С другой стороны, произведение J δ (x) δ (y)k представляет собой
плотность тока, показанного на рис. 158. Мы будем плотность тока об
означать через j (не путать с единичным вектором оси у!); таким об
разом, в данном примере
rot H =


j.
c

(59)

По этой формуле j выражается через H. Можно получить и обрат
ную формулу, по которой H выражается через j. Для этого введем
«векторный потенциал» A поля H, аналогичный скалярному потен
циалу электрического поля (см. § Х.5),
A(r ) =

1
c

j(r0 )
dΩ 0 .
r − r0



(60)

В рассматриваемом примере этот потенциал равен
* В данном случае имеется в виду двумерная дельтафункция: δ (r ) = δ (x ) δ ( y ), по
скольку интегрирование ведется по плоскости, Γ = ∫ rot A ⋅ dS .

y

J
порциональна расстоянию точки от проводника, т.е. H = a , где а —
r
некоторый коэффициент пропорциональности; при определенном вы
боре единиц H и J он оказывается равным 2 c, где с — скорость све
2J
та, так что H = .
cr
Рассматриваемое нами поле Н имеет в точности вид, изображен
ный на рис. 157, т.е. имеет формулу (57), где взамен р надо поставить
2J
. Отсюда по формуле (58)
c

В примере (57) найдите направления в частице вихревой линии, остающие
ся инвариантными при бесконечно малом перемещении.
У к а з а н и е. Исходите из того, что вектор dr не должен повернуться.

§ 11. Магнитное поле и электрический ток

407

A(r ) =

1
c





−∞

Jk dζ
2

2

2

x + y + (ζ − z )

=

J
c





−∞


2

2

x + y + (ζ − z )2

k.

408

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Хотя последний интеграл расходится, но мы можем его дифференци
ровать по параметрам (ср. § Х.6); отсюда, в частности,
i

rot A =
∂x

j

∂y

0

0

J
=
c

k

∂z
J
c∫

=







⎜ ∂
i−

⎜ ∂y ∫ x 2 + y 2 + (ζ − z )2
2
2

x
+
+ (ζ − z )2
x
y
⎝ −∞
−∞


=−

[

J
2
2
2
∫ x + y + (ζ − z )
c −∞

Этот интеграл легко взять с помощью
ζ − z = x 2 + y 2 tg s, и мы получаем (проверьте!)

]

dζ ⋅( yi − xj ).

подстановки

H = rot A =

2J
, т.е. к H:
c

1
j(r0 )
dΩ 0 .
rot ∫
c
r − r0

(61)

При рассмотрении системы бесконечных прямолинейных провод
ников их магнитные поля H, а также плотности токов складываются,
т.е. формулы (59) и (61) все равно остаются справедливыми. Мы при
мем, что они справедливы и при любом стационарном, не обязательно
прямолинейном распределении токов в пространстве. (Для формулы
(59) это довольно ясно, так как она связывает значения H и j в од
ной и той же точке, а формулу (61) можно вывести из (59), на чем мы не
будем останавливаться.) Это допущение обосновывается тем, что по
лучающиеся из него следствия согласуются друг с другом и подтвер
ждаются экспериментами.
Из формулы (59) вытекает важное следствие. Для его получения
применим к вычислению циркуляции вектора H по любому замкнуто
му контуру ( L), ограничивающему поверхность (σ), формулу Стокса:

∫ H ⋅ dr = ∫ ( rot H )n dσ =

(L )

( σ)


jn dσ.
c (∫σ)

(62)

409

Интеграл в правой части имеет простой физический смысл (ср. § Х.4):
это количество электричества, проходящее через (σ) за единицу вре
мени с внутренней стороны к наружной, т.е. полный ток J через (σ).
Таким образом, циркуляция вектора H по любому замкнутому конту
ру пропорциональна полному току через поверхность, ограничивае
мую этим контуром.
Другое важное следствие получится, если взять дивергенцию обеих
частей формулы (59). Мы получим
c
div rot H = 0


(см. (51)). Этот «закон сохранения электричества» в стационарном слу
чае можно было вывести независимо от формулы (59): он означает, что
в любой объем за единицу времени втекает столько же электричества,
сколько вытекает, т.е. полный поток вектора j через любую замкнутую
поверхность равен нулю (ср. аналогичные рассуждения в § Х.8).
Если взять дивергенцию обеих частей равенства (61), то мы увидим, что
div H = div rot A = 0.

J
2
rot A = − ⋅ 2
( yi − xj ).
c x + y2

Мы опять пришли к формуле (57) с p =

МАГНИТНОЕ ПОЛЕ И ЭЛЕКТРИЧЕСКИЙ ТОК

div j =


j⎟ =



−3 2

§ 11]

(63)

Таким образом (см. § Х.7), магнитное поле в отличие от электрического
не имеет источников векторных линий, т.е. магнитные силовые линии
не могут ни начинаться, ни заканчиваться. (Так как при этом мы опира
лись только на формулу (51), то ив общем случае векторное поле может
быть ротором некоторого «векторного потенциала», только если ди
вергенция этого поля равна нулю, т.е. оно не имеет источников вектор
ных линий; такие поля принято называть соленоидальными.)
Вычислим в качестве примера магнитное поле от бесконечной ци
линдрической катушки с обмоткой в n витков на единицу длины, по
которой течет ток J. Толщиной обмотки будем пренебрегать (в даль
нейшем мы увидим, что она несущественна) и будем для простоты счи
тать обмотку не винтовой, а кольцевой. Из формулы (60) мы видим,
что в данном примере векторный потенциал А параллелен плоскости
витков и по смыслу задачи образует плоскопараллельное поле. Но тог
да из формулы (61) и определения (43) ротора сразу следует, что поле
H всюду параллельно оси катушки и не меняется вдоль катушки, т.е.
также является плоскопараллельным. Применим теперь формулу (62)
к прямоугольному контуру ABCD, показанному на рис. 159. Так как
интегралы по отрезкам ВС и DA равны нулю и так как через повер
хность, ограниченную этим контуром, ток не проходит, то получаем
H1 h − H 2 h = 0

(h — высота прямоугольника), откуда H 1 = H 2 . Итак, магнитное поле
внутри соленоида (катушки) постоянно не только по высоте, но
и в поперечном сечении. Аналогично получаем, что поле и вне катушки

408

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Хотя последний интеграл расходится, но мы можем его дифференци
ровать по параметрам (ср. § Х.6); отсюда, в частности,
i

rot A =
∂x

j

∂y

0

0

J
=
c

k

∂z
J
c∫

=







⎜ ∂
i−

⎜ ∂y ∫ x 2 + y 2 + (ζ − z )2
2
2

x
+
+ (ζ − z )2
x
y
⎝ −∞
−∞


=−

[

J
2
2
2
∫ x + y + (ζ − z )
c −∞

Этот интеграл легко взять с помощью
ζ − z = x 2 + y 2 tg s, и мы получаем (проверьте!)

]

dζ ⋅( yi − xj ).

подстановки

H = rot A =

2J
, т.е. к H:
c

1
j(r0 )
dΩ 0 .
rot ∫
c
r − r0

(61)

При рассмотрении системы бесконечных прямолинейных провод
ников их магнитные поля H, а также плотности токов складываются,
т.е. формулы (59) и (61) все равно остаются справедливыми. Мы при
мем, что они справедливы и при любом стационарном, не обязательно
прямолинейном распределении токов в пространстве. (Для формулы
(59) это довольно ясно, так как она связывает значения H и j в од
ной и той же точке, а формулу (61) можно вывести из (59), на чем мы не
будем останавливаться.) Это допущение обосновывается тем, что по
лучающиеся из него следствия согласуются друг с другом и подтвер
ждаются экспериментами.
Из формулы (59) вытекает важное следствие. Для его получения
применим к вычислению циркуляции вектора H по любому замкнуто
му контуру ( L), ограничивающему поверхность (σ), формулу Стокса:

∫ H ⋅ dr = ∫ ( rot H )n dσ =

(L )

( σ)


jn dσ.
c (∫σ)

(62)

409

Интеграл в правой части имеет простой физический смысл (ср. § Х.4):
это количество электричества, проходящее через (σ) за единицу вре
мени с внутренней стороны к наружной, т.е. полный ток J через (σ).
Таким образом, циркуляция вектора H по любому замкнутому конту
ру пропорциональна полному току через поверхность, ограничивае
мую этим контуром.
Другое важное следствие получится, если взять дивергенцию обеих
частей формулы (59). Мы получим
c
div rot H = 0


(см. (51)). Этот «закон сохранения электричества» в стационарном слу
чае можно было вывести независимо от формулы (59): он означает, что
в любой объем за единицу времени втекает столько же электричества,
сколько вытекает, т.е. полный поток вектора j через любую замкнутую
поверхность равен нулю (ср. аналогичные рассуждения в § Х.8).
Если взять дивергенцию обеих частей равенства (61), то мы увидим, что
div H = div rot A = 0.

J
2
rot A = − ⋅ 2
( yi − xj ).
c x + y2

Мы опять пришли к формуле (57) с p =

МАГНИТНОЕ ПОЛЕ И ЭЛЕКТРИЧЕСКИЙ ТОК

div j =


j⎟ =



−3 2

§ 11]

(63)

Таким образом (см. § Х.7), магнитное поле в отличие от электрического
не имеет источников векторных линий, т.е. магнитные силовые линии
не могут ни начинаться, ни заканчиваться. (Так как при этом мы опира
лись только на формулу (51), то ив общем случае векторное поле может
быть ротором некоторого «векторного потенциала», только если ди
вергенция этого поля равна нулю, т.е. оно не имеет источников вектор
ных линий; такие поля принято называть соленоидальными.)
Вычислим в качестве примера магнитное поле от бесконечной ци
линдрической катушки с обмоткой в n витков на единицу длины, по
которой течет ток J. Толщиной обмотки будем пренебрегать (в даль
нейшем мы увидим, что она несущественна) и будем для простоты счи
тать обмотку не винтовой, а кольцевой. Из формулы (60) мы видим,
что в данном примере векторный потенциал А параллелен плоскости
витков и по смыслу задачи образует плоскопараллельное поле. Но тог
да из формулы (61) и определения (43) ротора сразу следует, что поле
H всюду параллельно оси катушки и не меняется вдоль катушки, т.е.
также является плоскопараллельным. Применим теперь формулу (62)
к прямоугольному контуру ABCD, показанному на рис. 159. Так как
интегралы по отрезкам ВС и DA равны нулю и так как через повер
хность, ограниченную этим контуром, ток не проходит, то получаем
H1 h − H 2 h = 0

(h — высота прямоугольника), откуда H 1 = H 2 . Итак, магнитное поле
внутри соленоида (катушки) постоянно не только по высоте, но
и в поперечном сечении. Аналогично получаем, что поле и вне катушки

410

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

C

J
F

E

G B
H1
H
K A

H2
D

[Гл. XI

постоянно, а так как в бесконечном удалении от ка
тушки оно равно нулю, то оно равно нулю всюду
вне катушки. Применив в заключение формулу
(62) к прямоугольному контуру EKGF, мы полу

чим Hh =
Jnh, откуда находим напряженность
c
магнитного поля внутри катушки
H=

J
Рис. 159.


Jn.
c

Мы видим, что она не зависит от радиуса катушки,
а только от числа «ампервитков» на единицу длины. Отсюда, в частнос
ти, вытекает упомянутая ранее независимость поля от толщины обмот
ки. Предоставляем читателю получить выражение для потенциала
Hr 2
H
A = re ϕ (r < r0 ), A = 0 e ϕ (r > r0 ), где r = xi + yj, r = r , e ϕ = k × r 0 ,
2
2r
r0 — радиус катушки, r 0 = r r.
К задаче о построении магнитного поля от заданной системы токов
возможен иной подход. Именно, допускается, что магнитное поле в лю
бой точке M создается каждым «элементом тока» d J = jdΩ в соотве
тствии с законом Био–Савара
dH =

⎯ ⎯→
1
( dj × M 0 M ) ,
c( M 0 M )3

где M 0 — точка, в которой расположен элемент тока. Полный вектор
H в точке M находится с помощью интегрирования по всем элемен
там тока. То, что формула для dH пишется именно в таком виде, об
основывается согласованностью следствий из этой формулы с экспери
ментом. Этот подход полностью равносилен разобранному нами выше:
из закона Био–Савара можно вывести формулы (59) и (61), и обратно.
Упражнение
Получите из закона Био–Савара напряженность магнитного поля: а) от
прямолинейного бесконечно длинного проводника; б) на оси соленоида от од
ного его витка.

§ 12. Электромагнитное поле и уравнения Максвелла
На самом деле в общем случае в одной и той же области простра
нства существуют и электрическое и магнитное поля; при этом получа
ется электромагнитное поле, которое в каждой точке пространства (во
всяком случае, в вакууме, что мы будем предполагать) характеризуется
двумя векторами: электрическим E и магнитным H. Дифференци
альные уравнения, связывающие эти векторы, называются уравнениями
Максвелла и имеют очень большое значение в физике.

§ 12]

ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ И УРАВНЕНИЯ МАКСВЕЛЛА

411

Для стационарного электромагнитного поля соответствующие уравне
ния были, по существу, уже нами выписаны. Это прежде всего уравнения
rot E = 0,

div E = 4πρ,

из которых первое вытекает из потенциальности стационарного элек
трического поля (§§ Х.5 и XI.9), а второе — это уравнение (Х.42). Кроме
того, это уравнения
rot H =


j,
c

div H = 0

(см. (59) и (63)).
Для стационарного случая взаимосвязь электрического и магнитного
полей еще не сказывается. Не то будет в нестационарном случае, к которо
му мы сейчас переходим. Оказывается, что всякое изменение электричес
кого поля влияет на магнитное поле, а вся
кое изменение магнитного поля возде
йствует на электрическое поле, так что эти
поля рассматривать порознь уже нельзя.
При рассмотрении первого воздей
ствия чрезвычайно полезно представле
ние о «токах смещения». Для вывода со
ответствующих формул рассмотрим
сначала конденсатор (рис. 160), обклад
ки которого заряжены с поверхностной
плотностью +ν левая и −ν правая.
Рис. 160.
Каждая из этих обкладок порождает
в пространстве между ними электрическое поле, которое можно под
считать по формулам (Х.29), так что суммарное поле
E = 4πνi.

(64)

Если ν увеличивается, то к левой обкладке подходят извне положи
d (Sν)
тельные заряды и оседают на ней со скоростью J =
, где S —
dt
площадь одной обкладки, а на правой обкладке оседают отрицательные
заряды с той же скоростью. Если на минуту представить себе, что точки
А и В соединены проводником, на котором заряды не оседают, то
в силу закона сохранения электричества через любое сечение между
А и В должен проходить один и тот же ток J. На самом же деле заря
ды между обкладками конденсатора не переносятся; однако закон по
стоянства токов можно сохранить, если ввести понятие тока смещения
силы J, который «как будто» течет от А к В . Плотность этого тока
смещения в силу формулы (64) равна
jсм =

J

1 ∂E
.
i= i=
S
dt
4 π ∂t

410

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

C

J
F

E

G B
H1
H
K A

H2
D

[Гл. XI

постоянно, а так как в бесконечном удалении от ка
тушки оно равно нулю, то оно равно нулю всюду
вне катушки. Применив в заключение формулу
(62) к прямоугольному контуру EKGF, мы полу

чим Hh =
Jnh, откуда находим напряженность
c
магнитного поля внутри катушки
H=

J
Рис. 159.


Jn.
c

Мы видим, что она не зависит от радиуса катушки,
а только от числа «ампервитков» на единицу длины. Отсюда, в частнос
ти, вытекает упомянутая ранее независимость поля от толщины обмот
ки. Предоставляем читателю получить выражение для потенциала
Hr 2
H
A = re ϕ (r < r0 ), A = 0 e ϕ (r > r0 ), где r = xi + yj, r = r , e ϕ = k × r 0 ,
2
2r
r0 — радиус катушки, r 0 = r r.
К задаче о построении магнитного поля от заданной системы токов
возможен иной подход. Именно, допускается, что магнитное поле в лю
бой точке M создается каждым «элементом тока» d J = jdΩ в соотве
тствии с законом Био–Савара
dH =

⎯ ⎯→
1
( dj × M 0 M ) ,
c( M 0 M )3

где M 0 — точка, в которой расположен элемент тока. Полный вектор
H в точке M находится с помощью интегрирования по всем элемен
там тока. То, что формула для dH пишется именно в таком виде, об
основывается согласованностью следствий из этой формулы с экспери
ментом. Этот подход полностью равносилен разобранному нами выше:
из закона Био–Савара можно вывести формулы (59) и (61), и обратно.
Упражнение
Получите из закона Био–Савара напряженность магнитного поля: а) от
прямолинейного бесконечно длинного проводника; б) на оси соленоида от од
ного его витка.

§ 12. Электромагнитное поле и уравнения Максвелла
На самом деле в общем случае в одной и той же области простра
нства существуют и электрическое и магнитное поля; при этом получа
ется электромагнитное поле, которое в каждой точке пространства (во
всяком случае, в вакууме, что мы будем предполагать) характеризуется
двумя векторами: электрическим E и магнитным H. Дифференци
альные уравнения, связывающие эти векторы, называются уравнениями
Максвелла и имеют очень большое значение в физике.

§ 12]

ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ И УРАВНЕНИЯ МАКСВЕЛЛА

411

Для стационарного электромагнитного поля соответствующие уравне
ния были, по существу, уже нами выписаны. Это прежде всего уравнения
rot E = 0,

div E = 4πρ,

из которых первое вытекает из потенциальности стационарного элек
трического поля (§§ Х.5 и XI.9), а второе — это уравнение (Х.42). Кроме
того, это уравнения
rot H =


j,
c

div H = 0

(см. (59) и (63)).
Для стационарного случая взаимосвязь электрического и магнитного
полей еще не сказывается. Не то будет в нестационарном случае, к которо
му мы сейчас переходим. Оказывается, что всякое изменение электричес
кого поля влияет на магнитное поле, а вся
кое изменение магнитного поля возде
йствует на электрическое поле, так что эти
поля рассматривать порознь уже нельзя.
При рассмотрении первого воздей
ствия чрезвычайно полезно представле
ние о «токах смещения». Для вывода со
ответствующих формул рассмотрим
сначала конденсатор (рис. 160), обклад
ки которого заряжены с поверхностной
плотностью +ν левая и −ν правая.
Рис. 160.
Каждая из этих обкладок порождает
в пространстве между ними электрическое поле, которое можно под
считать по формулам (Х.29), так что суммарное поле
E = 4πνi.

(64)

Если ν увеличивается, то к левой обкладке подходят извне положи
d (Sν)
тельные заряды и оседают на ней со скоростью J =
, где S —
dt
площадь одной обкладки, а на правой обкладке оседают отрицательные
заряды с той же скоростью. Если на минуту представить себе, что точки
А и В соединены проводником, на котором заряды не оседают, то
в силу закона сохранения электричества через любое сечение между
А и В должен проходить один и тот же ток J. На самом же деле заря
ды между обкладками конденсатора не переносятся; однако закон по
стоянства токов можно сохранить, если ввести понятие тока смещения
силы J, который «как будто» течет от А к В . Плотность этого тока
смещения в силу формулы (64) равна
jсм =

J

1 ∂E
.
i= i=
S
dt
4 π ∂t

412

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Оказывается, что и в формулах, связывающих магнитный вектор H
с током j, изменение электрического поля нужно заменить током сме
щения, плотность которого вычисляется по той же формуле,
1 ∂E
. Поэтому для нестационарного электрического поля
j см =
4π ∂t
взамен (59) надо написать уравнение
rot H =



1 ∂E
.
( j + jсм )=
j+
c
c
c ∂t

(65)

Подобным образом, и в формуле (61) для построения H вза
мен j надо поставить j + j см . Но отсюда, рассуждая, как в § 11, мы мо
жем вывести соотношение
div H = 0

(66)

(см. (63)).
Обратимся к переменному магнитному полю. Опыт показывает
(Фарадей), что изменение магнитного поля возбуждает (индуцирует)
электрическое поле, которое в отличие от поля, порожденного заряда
ми, является вихревым. Мы сейчас покажем, что соответствующий за
кон индукции имеет вид
rot E = −

1 ∂H
.
c ∂t

(67)

В силу § 9 в этом случае электрическое поле не имеет потенциала, т.е.
нельзя говорить о разности потенциалов в поле, а работа, совершаемая
полем, зависит не только от начала и конца пути, но и от всей трассы.
Для вывода формулы (67) поместим мысленно в поле замкнутый
проводник ( L), ограничивающий поверхность (σ). Согласно результа
там опытов Фарадея изменение магнитного потока

∫ H ⋅ dσ

влечет за

( σ)

собой появление ЭДС в контуре ( L), пропорциональной скорости из
менения потока. Однако указанная ЭДС равна сумме элементарных
ЭДС в малых участках контура, а эти малые ЭДС, как легко понять,
равны E ⋅ dr . Итак,
d

∂H
⋅ da;
∂t
( σ)

∫ E ⋅ dr = −k dt ∫ H ⋅ da = −k ∫

(L)

( σ)

здесь знак минус взят по правилу Ленца, согласно которому возникаю
щая ЭДС стремится воспрепятствовать изменению потока; k — коэф
1
фициент пропорциональности, который, как можно показать, равен ;
c
дифференцирование по t внесено под знак интеграла как дифферен

§ 12]

ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ И УРАВНЕНИЯ МАКСВЕЛЛА

413

цирование по параметру (§ III.6). Преобразуя левую часть по формуле
Стокса, получим
1

∂H
⋅ da.
∂t
( σ)

∫ rot E ⋅ da = − c ∫

( σ)

Отсюда в силу произвольности (σ) и вытекает (67).
Случай силы, не соответствующей потенциалу, осуществляется
в трансформаторе. Первичная обмотка, когда по ней течет ток, создает
магнитное поле. Если ток в первичной обмотке с течением времени из
меняется, то создается переменное магнитное поле, которое сопровож
дается появлением электрического поля как раз такого типа (так
называемое вихревое поле), как показано на рис. 154. Значит сила,
действующая на заряженное тело, например на электрон, находящийся
внутри вторичной обмотки, не соответствует никакому потенциалу.
Двигаясь по кругу, электрон может набирать все большую и боль
шую энергию. Это, конечно, не означает нарушения закона сохранения
энергии, так как ускоренное движение электрона в свою очередь влия
ет на первичную обмотку, вызывая дополнительный расход энергии
в питающих ее источниках тока. Но для отдельного электрона закон
«сумма кинетической и потенциальной энергии электрона постоянна»
не выполняется, так как сила, действующая на электрон, не соотве
тствует никакой потенциальной энергии. Такой принцип ускорения
электронов успешно применяется в машине, называемой бетатроном.
При этом электрическое поле ускоряет электроны, а магнитное поле
надлежащим образом искривляет их путь, обеспечивая движение по
окружности.
Так как вихревое электрическое поле появляется только в процессе
изменения магнитного поля, то такое электрическое поле не будет по
стоянным в течение длительного времени: когда магнитное поле дос
тигнет максимума, скорость его изменения станет равной нулю, после
чего электрическое поле также исчезнет.
Вследствие малой длительности электрического поля в бетатроне
тяжелые частицы, например протоны, не успевают набирать большую
энергию. Хорошо набирают энергию легкие электроны. Существуют
бетатроны, в которых электроны набирают энергию в десятки миллио
нов электронвольт, т.е. такую же, как если бы они прошли разность по
тенциалов в десятки миллионов вольт. Быстрые электроны, испускае
мые при радиоактивных превращениях, были названы беталучами
в начале исследования радиоактивности, когда физическая природа
этих лучей еще не была ясна. Отсюда и происходит название «бетат
рон» для прибора, в котором быстрые электроны получаются путем
ускорения медленных, без участия явления радиоактивности.

412

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Оказывается, что и в формулах, связывающих магнитный вектор H
с током j, изменение электрического поля нужно заменить током сме
щения, плотность которого вычисляется по той же формуле,
1 ∂E
. Поэтому для нестационарного электрического поля
j см =
4π ∂t
взамен (59) надо написать уравнение
rot H =



1 ∂E
.
( j + jсм )=
j+
c
c
c ∂t

(65)

Подобным образом, и в формуле (61) для построения H вза
мен j надо поставить j + j см . Но отсюда, рассуждая, как в § 11, мы мо
жем вывести соотношение
div H = 0

(66)

(см. (63)).
Обратимся к переменному магнитному полю. Опыт показывает
(Фарадей), что изменение магнитного поля возбуждает (индуцирует)
электрическое поле, которое в отличие от поля, порожденного заряда
ми, является вихревым. Мы сейчас покажем, что соответствующий за
кон индукции имеет вид
rot E = −

1 ∂H
.
c ∂t

(67)

В силу § 9 в этом случае электрическое поле не имеет потенциала, т.е.
нельзя говорить о разности потенциалов в поле, а работа, совершаемая
полем, зависит не только от начала и конца пути, но и от всей трассы.
Для вывода формулы (67) поместим мысленно в поле замкнутый
проводник ( L), ограничивающий поверхность (σ). Согласно результа
там опытов Фарадея изменение магнитного потока

∫ H ⋅ dσ

влечет за

( σ)

собой появление ЭДС в контуре ( L), пропорциональной скорости из
менения потока. Однако указанная ЭДС равна сумме элементарных
ЭДС в малых участках контура, а эти малые ЭДС, как легко понять,
равны E ⋅ dr . Итак,
d

∂H
⋅ da;
∂t
( σ)

∫ E ⋅ dr = −k dt ∫ H ⋅ da = −k ∫

(L)

( σ)

здесь знак минус взят по правилу Ленца, согласно которому возникаю
щая ЭДС стремится воспрепятствовать изменению потока; k — коэф
1
фициент пропорциональности, который, как можно показать, равен ;
c
дифференцирование по t внесено под знак интеграла как дифферен

§ 12]

ЭЛЕКТРОМАГНИТНОЕ ПОЛЕ И УРАВНЕНИЯ МАКСВЕЛЛА

413

цирование по параметру (§ III.6). Преобразуя левую часть по формуле
Стокса, получим
1

∂H
⋅ da.
∂t
( σ)

∫ rot E ⋅ da = − c ∫

( σ)

Отсюда в силу произвольности (σ) и вытекает (67).
Случай силы, не соответствующей потенциалу, осуществляется
в трансформаторе. Первичная обмотка, когда по ней течет ток, создает
магнитное поле. Если ток в первичной обмотке с течением времени из
меняется, то создается переменное магнитное поле, которое сопровож
дается появлением электрического поля как раз такого типа (так
называемое вихревое поле), как показано на рис. 154. Значит сила,
действующая на заряженное тело, например на электрон, находящийся
внутри вторичной обмотки, не соответствует никакому потенциалу.
Двигаясь по кругу, электрон может набирать все большую и боль
шую энергию. Это, конечно, не означает нарушения закона сохранения
энергии, так как ускоренное движение электрона в свою очередь влия
ет на первичную обмотку, вызывая дополнительный расход энергии
в питающих ее источниках тока. Но для отдельного электрона закон
«сумма кинетической и потенциальной энергии электрона постоянна»
не выполняется, так как сила, действующая на электрон, не соотве
тствует никакой потенциальной энергии. Такой принцип ускорения
электронов успешно применяется в машине, называемой бетатроном.
При этом электрическое поле ускоряет электроны, а магнитное поле
надлежащим образом искривляет их путь, обеспечивая движение по
окружности.
Так как вихревое электрическое поле появляется только в процессе
изменения магнитного поля, то такое электрическое поле не будет по
стоянным в течение длительного времени: когда магнитное поле дос
тигнет максимума, скорость его изменения станет равной нулю, после
чего электрическое поле также исчезнет.
Вследствие малой длительности электрического поля в бетатроне
тяжелые частицы, например протоны, не успевают набирать большую
энергию. Хорошо набирают энергию легкие электроны. Существуют
бетатроны, в которых электроны набирают энергию в десятки миллио
нов электронвольт, т.е. такую же, как если бы они прошли разность по
тенциалов в десятки миллионов вольт. Быстрые электроны, испускае
мые при радиоактивных превращениях, были названы беталучами
в начале исследования радиоактивности, когда физическая природа
этих лучей еще не была ясна. Отсюда и происходит название «бетат
рон» для прибора, в котором быстрые электроны получаются путем
ускорения медленных, без участия явления радиоактивности.

414

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Уравнение
div E = 4πρ,

(68)

связывающее электрическое поле и заряды (см. (Х.42)), сохраняет
силу и в нестационарном случае. Все четыре указанных уравнения
(65)–(68) и образуют систему уравнений Максвелла. К ним можно до
бавить уравнение неразрывности
∂ρ
+ div j = 0,
∂t

(69)

которое выводится в точности как аналогичное уравнение (Х.41) в гид
родинамике, а также то или иное соотношение, связывающее j с Е
(обобщенный закон Ома, имеющий в простейших случаях вид j = λE ,
где λ — коэффициент электропроводности) и включающее в себя
в общем случае действие внешних сил.
Упражнение
Выведите уравнение (69) из уравнений (65) и (68).

§ 13. Потенциал в многосвязной области
Рассмотрим поле силы F. Из обоих условий существования потен
циала — условия rot F = 0 (§ 9) и условия равенства нулю работы при
обходе замкнутой линии (§ Х.3) — видно, что возможность нарушения
этих условий, т.е. возможность существования сил непотенциального
типа, связана с рассмотрением функции не одной, а двух или трех пере
менных. В самом деле, в случае одной переменной (движение по пря
мой) вернуться в точку, из которой вышел, можно лишь при таком
движении, когда каждый отрезок пути проходится дважды: один раз
в одном направлении, другой раз — в противоположном. Поэтому
(если только сила не зависит от времени или от скорости движения,
а зависит только от положения тела) при движении вдоль одной
прямой работа силы равна нулю, если только путь заканчивается воз
вращением в исходную точку.
При произвольном движении на плоскости или в пространстве
можно, выйдя из начальной точки, пройти по некоторой линии в ко
нечную точку, а затем вернуться в начальную точку по совершенно дру
гой линии. При этом может оказаться, что работа не равна нулю. В этом
и заключается различие между движением по одной прямой, когда
любой силе F(x) соответствует потенциальная энергия U (x), и дви
жением в плоскости или в пространстве, когда потенциальной энергии
может вовсе и не быть.
Рассмотрим теперь движение тела на плоскости или в пространстве.
Если заставить тело двигаться только по одной определенной и притом
незамкнутой линии, то мывернемся к тому же положению, которое

§ 13]

ПОТЕНЦИАЛ В МНОГОСВЯЗНОЙ ОБЛАСТИ

415

имеет место при движении вдоль прямой. Действительно, в этом случае
будем характеризовать положение тела на линии величиной пути, прой
денного телом вдоль линии (путь отсчитываем от какойнибудь выбран
ной точки на линии). Тогда фактически мы имеем дело с одной перемен
ной — величиной пути вдоль линии. Поэтому, рассматривая незамкнутую
вторичную обмотку трансформатора, можно говорить о разности потен
циалов (или лучше об электродвижущей силе) на ее концах. Однако если
внутри первичной обмотки поместить замкнутое
кольцо, то в нем нет определенной разности потен
циалов между двумя его точками А и В (рис. 161).
Работа по перемещению заряда из точки А в точ
ку В зависит от того, вдоль какой линии,
ADB или АСВ, происходит движение.
Пусть теперь тело не обязано двигаться
вдоль фиксированной линии, а может сдвигать
ся и в стороны. Тогда для существования потен
Рис. 161.
циала прежде всего требуется, чтобы работа
силы при перемещении тела по любому бесконечно малому замкнуто
му контуру была бы равна нулю. Это в силу § 7 равносильно услови
ю rot F = 0 (так как такая работа равна циркуляции вектора F по
указанному контуру), т.е. поле F должно быть безвихревым.
Но пусть rot F = 0 не во всем пространстве, а только в некоторой
его области (части) (G). Тогда работа по конечному замкнутому конту
ру ( L), лежащему в (G), не обязана равняться
нулю! Можно только утверждать, что при беско
нечно малой деформации замкнутого контура ра
бота не изменится, так как работа по контуру
AB1 CDA (рис. 162) отличается от работы по конту
ру AB2 CDA на работу по контуру AB1 CB2 A, рав
ную нулю. Совершая такие деформации, можно
получить контур, лежащий в (G) и существенно
отличающийся от исходного, однако работа силы
Рис. 162.
F по этим контурам одинакова.
Отсюда ясно, что если контур ( L) можно в пределах (G) путем не
прерывной деформации «стянуть в точку», то работа силы по ( L) рав
на нулю. В самом деле, после такого стягивания работа уже, очевидно,
равна нулю (так как перемещение отсутствует). Но так как при дефор
мации контура работа не меняется, то она равнялась нулю и для исход
ного контура.
Область (G) может обладать свойством односвязности: это зна
чит, что в ней можно любой замкнутый контур путем непрерывной де
формации стянуть в точку, не касаясь границ области. Например,
внутренность кругового цилиндра, внутренность или внешность сфе
ры — это односвязные области; все пространство или вся плоскость

414

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

Уравнение
div E = 4πρ,

(68)

связывающее электрическое поле и заряды (см. (Х.42)), сохраняет
силу и в нестационарном случае. Все четыре указанных уравнения
(65)–(68) и образуют систему уравнений Максвелла. К ним можно до
бавить уравнение неразрывности
∂ρ
+ div j = 0,
∂t

(69)

которое выводится в точности как аналогичное уравнение (Х.41) в гид
родинамике, а также то или иное соотношение, связывающее j с Е
(обобщенный закон Ома, имеющий в простейших случаях вид j = λE ,
где λ — коэффициент электропроводности) и включающее в себя
в общем случае действие внешних сил.
Упражнение
Выведите уравнение (69) из уравнений (65) и (68).

§ 13. Потенциал в многосвязной области
Рассмотрим поле силы F. Из обоих условий существования потен
циала — условия rot F = 0 (§ 9) и условия равенства нулю работы при
обходе замкнутой линии (§ Х.3) — видно, что возможность нарушения
этих условий, т.е. возможность существования сил непотенциального
типа, связана с рассмотрением функции не одной, а двух или трех пере
менных. В самом деле, в случае одной переменной (движение по пря
мой) вернуться в точку, из которой вышел, можно лишь при таком
движении, когда каждый отрезок пути проходится дважды: один раз
в одном направлении, другой раз — в противоположном. Поэтому
(если только сила не зависит от времени или от скорости движения,
а зависит только от положения тела) при движении вдоль одной
прямой работа силы равна нулю, если только путь заканчивается воз
вращением в исходную точку.
При произвольном движении на плоскости или в пространстве
можно, выйдя из начальной точки, пройти по некоторой линии в ко
нечную точку, а затем вернуться в начальную точку по совершенно дру
гой линии. При этом может оказаться, что работа не равна нулю. В этом
и заключается различие между движением по одной прямой, когда
любой силе F(x) соответствует потенциальная энергия U (x), и дви
жением в плоскости или в пространстве, когда потенциальной энергии
может вовсе и не быть.
Рассмотрим теперь движение тела на плоскости или в пространстве.
Если заставить тело двигаться только по одной определенной и притом
незамкнутой линии, то мы вернемся к тому же положению, которое

§ 13]

ПОТЕНЦИАЛ В МНОГОСВЯЗНОЙ ОБЛАСТИ

415

имеет место при движении вдоль прямой. Действительно, в этом случае
будем характеризовать положение тела на линии величиной пути, прой
денного телом вдоль линии (путь отсчитываем от какойнибудь выбран
ной точки на линии). Тогда фактически мы имеем дело с одной перемен
ной — величиной пути вдоль линии. Поэтому, рассматривая незамкнутую
вторичную обмотку трансформатора, можно говорить о разности потен
циалов (или лучше об электродвижущей силе) на ее концах. Однако если
внутри первичной обмотки поместить замкнутое
кольцо, то в нем нет определенной разности потен
циалов между двумя его точками А и В (рис. 161).
Работа по перемещению заряда из точки А в точ
ку В зависит от того, вдоль какой линии,
ADB или АСВ, происходит движение.
Пусть теперь тело не обязано двигаться
вдоль фиксированной линии, а может сдвигать
ся и в стороны. Тогда для существования потен
Рис. 161.
циала прежде всего требуется, чтобы работа
силы при перемещении тела по любому бесконечно малому замкнуто
му контуру была бы равна нулю. Это в силу § 7 равносильно услови
ю rot F = 0 (так как такая работа равна циркуляции вектора F по
указанному контуру), т.е. поле F должно быть безвихревым.
Но пусть rot F = 0 не во всем пространстве, а только в некоторой
его области (части) (G). Тогда работа по конечному замкнутому конту
ру ( L), лежащему в (G), не обязана равняться
нулю! Можно только утверждать, что при беско
нечно малой деформации замкнутого контура ра
бота не изменится, так как работа по контуру
AB1 CDA (рис. 162) отличается от работы по конту
ру AB2 CDA на работу по контуру AB1 CB2 A, рав
ную нулю. Совершая такие деформации, можно
получить контур, лежащий в (G) и существенно
отличающийся от исходного, однако работа силы
Рис. 162.
F по этим контурам одинакова.
Отсюда ясно, что если контур ( L) можно в пределах (G) путем не
прерывной деформации «стянуть в точку», то работа силы по ( L) рав
на нулю. В самом деле, после такого стягивания работа уже, очевидно,
равна нулю (так как перемещение отсутствует). Но так как при дефор
мации контура работа не меняется, то она равнялась нулю и для исход
ного контура.
Область (G) может обладать свойством односвязности: это зна
чит, что в ней можно любой замкнутый контур путем непрерывной де
формации стянуть в точку, не касаясь границ области. Например,
внутренность кругового цилиндра, внутренность или внешность сфе
ры — это односвязные области; все пространство или вся плоскость

416

ВЕКТОРНОЕ ПРОИЗВЕДЕНИЕ И ВРАЩЕНИЕ

[Гл. XI

также причисляются к односвязным областям. В отличие от этого
внешность бесконечного кругового цилиндра, внутренность или внеш
ность «тора» (поверхности бублика) — это неодносвязные области.
Если область (G) односвязная, то из сказанного выше вытекает, что
в этом случае работа силы по конечному замкнутому контуру, лежащему
в (G), обязательно равна нулю. Если отвлечься от конкретного физичес
кого истолкования поля, то можно сделать следующий общий математи
ческий вывод (ср. § 9): в односвязной области безвихревое поле обяза
тельно является потенциальным, т.е. бесциркуляционным.
В отличие от этого, если область неодносвязная, то циркуляция без
вихревого поля может быть отличной от нуля (если рассматриваемый
контур нельзя путем непрерывной деформации стянуть в точку, оста
ваясь в пределах области), т.е. без
вихревое поле может быть цирку
ляционным. Такими будут, напри
мер, магнитное поле внутри торо
видной катушки (с плоскостями
витков, проходящими через ось
вращения), по которой проходит
постоянный ток; поле скоростей
при безвихревом течении жидкос
ти, обтекающей замкнутый канал,
Рис. 163.
и т.д. Если при этом строить потен
циал по формуле (55), то он получится неоднозначным: если обойти за
мкнутый контур, то из потенциала вычтется циркуляция поля по этому
контуру. Когда мы говорим о потенциальном поле, мы имеем в виду
только однозначный потенциал; таким образом, безвихревое поле в не
односвязной области не обязано быть потенциальным.
Большой интерес представляет торовидный трансформатор с же
лезным кольцевым сердечником. При пропускании через обмотку пе
ременного тока во внешней части пространства образуется безвихре
вое электрическое поле, которое, однако, имеет отличную от нуля
циркуляцию по контуру ( L), зацепленному за тор (рис. 163).
Упражнение

ОТВЕТЫ И РЕШЕНИЯ
§ 1






i

j k

1. AB = −2i + j + 4k; AC = 3 j + 5k; AB × AC = −2 1 4 = −7i + 10 j − 6k;
0 3 5

417

1 → → 1 2
1
S ΔABC = | AB× AC | =
7 + 10 2 + 6 2 =
185 = 6,80.
2
2
2
−1 0
3
0 2 = 9 > 0, то тройка правая.
−1 −1 1
2

2. Так как (a × b) ⋅ c =

3. (i × i) × j = 0, i × (i × j) = − j,

т.е.

(i × i) × j ≠ i × (i × j).

§ 2
Если 1) b = 0, или 2) b приложен к точке О, или 3) b направлен точно
на О или от О, так что прямая, на которой лежит вектор b, проходит через О.
При этом третий случай охватывает первые два.
§ 3
1. T = ∫ dt = ∫
T =2

r max



r min

dr
dr
; подстановка
из уравнения (15) приводит к интегралу
dr dt
dt

m ⎛
k
G2 ⎞
⎜E + −

2 ⎝
r 2mr 2 ⎠

−1 2

dr ;

вычисление

при



mk 2
2G 2

< E 0, то тройка правая.
−1 −1 1
2

2. Так как (a × b) ⋅ c =

3. (i × i) × j = 0, i × (i × j) = − j,

т.е.

(i × i) × j ≠ i × (i × j).

§ 2
Если 1) b = 0, или 2) b приложен к точке О, или 3) b направлен точно
на О или от О, так что прямая, на которой лежит вектор b, проходит через О.
При этом третий случай охватывает первые два.
§ 3
1. T = ∫ dt = ∫
T =2

r max



r min

dr
dr
; подстановка
из уравнения (15) приводит к интегралу
dr dt
dt

m ⎛
k
G2 ⎞
⎜E + −

2 ⎝
r 2mr 2 ⎠

−1 2

dr ;

вычисление

при



mk 2
2G 2

< E y b имеется
и его только надо найти. А так как с помощью применения необходимо"
го условия (уравнения Эйлера) получилось лишь одно решение, то оно
и является искомым. Конечно, не вдумавшись в смысл задачи, мы мог"
ли поставить вопрос об отыскании линии с максимальным временем
падения и прийти к тому же уравнению Эйлера и к тому же решению.
Но этот ответ был бы ошибочным, так как мы видим теперь, что постро"
енное решение (которое является единственным) дает именно мини"
мум времени падения. Что касается соответствующей задачи на
максимум, то она вовсе не имеет решения и легко построить линии
с как угодно большим временем падения.
Таким образом, задача на экстремум может не иметь решения; в не"
которых случаях это более или менее сразу ясно из формулировки за"
дачи (как в предыдущем примере при рассмотрении задачи на
максимум), тогда как в других случаях вытекает из результатов вычис"
лений. Покажем это на примере.
Пусть требуется найти форму пленки минимальной площади, если
эта пленка натянута на два равных круглых колечка, расположенных
перпендикулярно их линии центров.
y
Такую форму принимает мыльная
y=y(x)
пленка, натянутая на эти колечки (рис.
167, где жирными линиями изображе"
r
но осевое сечение пленки). Так как из
соображений симметрии ясно, что ис"
0
комая поверхность будет поверхнос"
x
–a
a
тью вращения, а площадь поверхности
вращения, как известно (см., например,
ВМ, § (II.7), равна
a

a

S = 2 π ∫ y dl =2 π ∫ y 1 + y′ 2 dx,
−a

(36)

−a

Рис. 167.

то дело сводится к отысканию функции y(x), реализующей минимум
интеграла (36) при граничных условиях:
y( − a ) = r ,

y( a ) = r .

(37)

И здесь x под знак интеграла не входит непосредственно, так что можно

438

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Точка B должна быть ниже точки A, иначе, естественно, решения во"
обще не существует.
Вернемся к общему функционалу (25) при граничных условиях
(26). Пусть, зафиксировав эти условия, мы получили какое"то решение
y(x) задачи на экстремум. Представим теперь, что эти условия могут
изменяться. Тогда экстремальное значение функционала I будет за"
висеть от этих условий
I = I ( a , b, ya , yb ).

(35)

При этом мы в I подставляем только функции, придающие ему
экстремальное значение для фиксированных граничных условий; если
бы это не было сделано, то I зависело бы, помимо граничных условий,
еще от произвольной функции y(x).
Может оказаться необходимым изучить функциональную зависи"
мость (35) значения I при изменении граничных условий y(a) = y a ,
y(b) = y b . Так как функция (35) зависит уже от конечного числа незави"
симых переменных, то эта задача решается средствами обычного
анализа, с помощью вычисления производных. Покажем, например,
∂I
. Если зафиксировать a, b, y b и из"
как вычисляется производная
∂y a
менять y a , то решение y(x) задачи на экстремум изменится, получит
приращение δy(x). При этом, с точностью до малых высшего порядка,
b

ΔI = ∫ ( F y′ δy + F y′ ′ δy′ ) dx = F y′ ′ δy
a

b

d


+ ∫ ⎢F y′ − ( F y′ ′ )⎥ δy dx.
dx
a


a
b

Но так как y(x) была решением задачи на экстремум, то она удовлет"
воряет уравнению Эйлера, и потому последний интеграл обращается
в нуль. Кроме того, δy(b) = 0 (так как y b не меняется), и мы получаем
ΔI = −( F y′ ′ )a δy( a ),

∂I
= −( F y′ ′ )a .
∂y a

Аналогично вычисляются остальные производные функции (35).
Упражнения
1

1. Найдите решение задач: a) I = min ∫ ( y 2 + y′ 2 ) dx, y(0 ) = 0, y(1) = 1;
0

1

б) I = min ∫ yy′ 2 dx, y(0 ) = p > 0, y(1) = q > 0.
0

2. В последней задаче найдите

∂I
непосредственно и по формуле, выве"
∂p

денной в тексте.
3. Выведите с помощью вариационного исчисления уравнение прямой как
кратчайшей линии, соединяющей две заданные точки.

§ 5]

ВСЕГДА ЛИ СУЩЕСТВУЕТ РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ?

439

§ 5. Всегда ли существует решение поставленной задачи?
Условие (20) является только необходимым для экстремума. Дос"
таточные условия довольно сложны, однако в большинстве практичес"
ких задач они не требуются. Например, в задаче, разобранной в § 4, мы
не проверяли, что для построенной арки циклоиды осуществляется
именно минимальное время падения. Однако из физических соображе"
ний ясно, что какое"то решение задачи о минимуме при y a > y b имеется
и его только надо найти. А так как с помощью применения необходимо"
го условия (уравнения Эйлера) получилось лишь одно решение, то оно
и является искомым. Конечно, не вдумавшись в смысл задачи, мы мог"
ли поставить вопрос об отыскании линии с максимальным временем
падения и прийти к тому же уравнению Эйлера и к тому же решению.
Но этот ответ был бы ошибочным, так как мы видим теперь, что постро"
енное решение (которое является единственным) дает именно мини"
мум времени падения. Что касается соответствующей задачи на
максимум, то она вовсе не имеет решения и легко построить линии
с как угодно большим временем падения.
Таким образом, задача на экстремум может не иметь решения; в не"
которых случаях это более или менее сразу ясно из формулировки за"
дачи (как в предыдущем примере при рассмотрении задачи на
максимум), тогда как в других случаях вытекает из результатов вычис"
лений. Покажем это на примере.
Пусть требуется найти форму пленки минимальной площади, если
эта пленка натянута на два равных круглых колечка, расположенных
перпендикулярно их линии центров.
y
Такую форму принимает мыльная
y=y(x)
пленка, натянутая на эти колечки (рис.
167, где жирными линиями изображе"
r
но осевое сечение пленки). Так как из
соображений симметрии ясно, что ис"
0
комая поверхность будет поверхнос"
x
–a
a
тью вращения, а площадь поверхности
вращения, как известно (см., например,
ВМ, § (II.7), равна
a

a

S = 2 π ∫ y dl =2 π ∫ y 1 + y′ 2 dx,
−a

(36)

−a

Рис. 167.

то дело сводится к отысканию функции y(x), реализующей минимум
интеграла (36) при граничных условиях:
y( − a ) = r ,

y( a ) = r .

(37)

И здесь x под знак интеграла не входит непосредственно, так что можно

440

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 5]

ВСЕГДА ЛИ СУЩЕСТВУЕТ РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ?

441

воспользоваться промежуточным интегралом (34), что даст
2 πy 1 + y′ 2 −

2 πyy′
1 + y′

2

Обозначив правую часть через
y2
1
= ,
1 + y′ 2 k 2
dy
k 2 y2 − 1

y′ = C1 ,

т.е.

y
1 + y′

2

=

C1
.


1
и проводя преобразования, получим
k
2

 dy 
k 2 y2 = 1 +   ,
 dx 
= ± dx,



dy
= ± k 2 y 2 − 1,
dx

dy
k 2 y2 − 1

= ± ( x + C ).

(38)

Последний интеграл при k = 1 приведен в ВМ, стр. 167 (№ 31), он
равен ln (y + y 2 − 1). Попробуем вычислить производную от функ!
2

2

2

ции ln (ky + (ky) − 1), она равна k k y − 1 (проверьте!). Поэтому
1
из (38) мы получаем ln (ky + k 2 y 2 − 1) = ±(x + C), откуда после не!
k
сложных преобразований, которые мы предоставляем читателю,
e k( x +C ) + e − k( x +C )
(знак ± здесь несуществен).
y=
2k
Чтобы линия была симметрична относительно x = 0, должно быть
C = 0, т.е. окончательно
y=

e kx + e − kx
.
2k

Рис. 168.

Рис. 169.

Пусть сначала a сравнительно мало´, т.е. имеется два решения, изо!
браженных жирными линиями на рис. 169 (на этом же рисунке пункти!
ром обозначены колечки). Если мысленно представить себе другие
формы пленки, изображенные на рис. 169 тонкими линиями, то площа!
ди соответствующих поверхностей вращения будут иметь значения,
изображенные графически на рис. 170. Мы видим, что из двух решений
именно для верхнего реализуется минимум площади, а для нижнего —
максимум. Поэтому верхнее решение дает устойчивую форму равнове!
сия пленки, а нижнее — неустойчивую.
Если теперь a увеличивать (при данном r), т.е. отодвигать колечки
друг от друга, то точки экстремума α и β сближаются и для достаточно
больших a график площадей принимает вид, изображенный на
рис. 171. Таким образом, в этом случае пленка, стремясь уменьшить

Это — так называемая цепная линия; название объясняется тем, что
форму этой линии принимает тяжелая цепь, подвешенная за концы
(см. упражнение 2 к § 8). Итак, искомая поверхность мыльной пленки
получается в результате вращения цепной линии.
Чтобы удовлетворялись граничные условия (37), требуется, чтобы
e ka + e − ka
= r,
2k

т.е.

e ak + e − ak
= rk,
2

(39)

откуда и следует найти пока неизвестное значение параметра k. Поп!
робуем решить эту задачу графически, для чего изобразим при задан!
ных a и r графики изменения левой и правой частей уравнения (39)
(рис. 168) и найдем точку пересечения обоих графиков. Мы с удивле!
нием обнаруживаем, что получается не одно решение, как можно было
бы ожидать, а два (при сравнительно малых a, т.е. при сближении ко!
лечек) или ни одного (при удалении колечек). Какую же форму примет
пленка на самом деле?

Рис. 170.

Рис. 171.

свою площадь, стягивается к линии центров, расцепляется и приобрета!
ет вид двух отдельных кружков, каждый из которых натянут на свое ко!
лечко. (Кстати, так же ведет себя пленка при малых a, если она начинает
деформироваться, имея слишком тонкий перешеек.) Итак, в этом случае
единой поверхности действительно не будет. Вид графиков на рис. 170
и 171 подтверждается тем, что при y = 0 будет S = 2πr 2 , а при y = r бу!
дет S = 4πra, так что при малых a последнее значение меньше S y = 0 ,

440

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 5]

ВСЕГДА ЛИ СУЩЕСТВУЕТ РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ?

441

воспользоваться промежуточным интегралом (34), что даст
2 πy 1 + y′ 2 −

2 πyy′
1 + y′

2

Обозначив правую часть через
y2
1
= ,
1 + y′ 2 k 2
dy
k 2 y2 − 1

y′ = C1 ,

т.е.

y
1 + y′

2

=

C1
.


1
и проводя преобразования, получим
k
2

 dy 
k 2 y2 = 1 +   ,
 dx 
= ± dx,



dy
= ± k 2 y 2 − 1,
dx

dy
k 2 y2 − 1

= ± ( x + C ).

(38)

Последний интеграл при k = 1 приведен в ВМ, стр. 167 (№ 31), он
равен ln (y + y 2 − 1). Попробуем вычислить производную от функ!
2

2

2

ции ln (ky + (ky) − 1), она равна k k y − 1 (проверьте!). Поэтому
1
из (38) мы получаем ln (ky + k 2 y 2 − 1) = ±(x + C), откуда после не!
k
сложных преобразований, которые мы предоставляем читателю,
e k( x +C ) + e − k( x +C )
(знак ± здесь несуществен).
y=
2k
Чтобы линия была симметрична относительно x = 0, должно быть
C = 0, т.е. окончательно
y=

e kx + e − kx
.
2k

Рис. 168.

Рис. 169.

Пусть сначала a сравнительно мало´, т.е. имеется два решения, изо!
браженных жирными линиями на рис. 169 (на этом же рисунке пункти!
ром обозначены колечки). Если мысленно представить себе другие
формы пленки, изображенные на рис. 169 тонкими линиями, то площа!
ди соответствующих поверхностей вращения будут иметь значения,
изображенные графически на рис. 170. Мы видим, что из двух решений
именно для верхнего реализуется минимум площади, а для нижнего —
максимум. Поэтому верхнее решение дает устойчивую форму равнове!
сия пленки, а нижнее — неустойчивую.
Если теперь a увеличивать (при данном r), т.е. отодвигать колечки
друг от друга, то точки экстремума α и β сближаются и для достаточно
больших a график площадей принимает вид, изображенный на
рис. 171. Таким образом, в этом случае пленка, стремясь уменьшить

Это — так называемая цепная линия; название объясняется тем, что
форму этой линии принимает тяжелая цепь, подвешенная за концы
(см. упражнение 2 к § 8). Итак, искомая поверхность мыльной пленки
получается в результате вращения цепной линии.
Чтобы удовлетворялись граничные условия (37), требуется, чтобы
e ka + e − ka
= r,
2k

т.е.

e ak + e − ak
= rk,
2

(39)

откуда и следует найти пока неизвестное значение параметра k. Поп!
робуем решить эту задачу графически, для чего изобразим при задан!
ных a и r графики изменения левой и правой частей уравнения (39)
(рис. 168) и найдем точку пересечения обоих графиков. Мы с удивле!
нием обнаруживаем, что получается не одно решение, как можно было
бы ожидать, а два (при сравнительно малых a, т.е. при сближении ко!
лечек) или ни одного (при удалении колечек). Какую же форму примет
пленка на самом деле?

Рис. 170.

Рис. 171.

свою площадь, стягивается к линии центров, расцепляется и приобрета!
ет вид двух отдельных кружков, каждый из которых натянут на свое ко!
лечко. (Кстати, так же ведет себя пленка при малых a, если она начинает
деформироваться, имея слишком тонкий перешеек.) Итак, в этом случае
единой поверхности действительно не будет. Вид графиков на рис. 170
и 171 подтверждается тем, что при y = 0 будет S = 2πr 2 , а при y = r бу!
дет S = 4πra, так что при малых a последнее значение меньше S y = 0 ,

442

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

а при больших a — больше. При больших a форму, состоящую из двух
отдельных кружков, можно считать обобщенным решением нашей зада!
чи. Это решение имеет характер «концевого», «острого» минимума, для
него уравнение Эйлера не выполняется (ср. § 9).
Мы видим, что в результате вычислений мы приходим к выводам,
которые заранее можно было и не предвидеть.
a
является критическим в том
Легко подсчитать, какое значение
r
смысле, что при меньших значениях равновесие возможно, а при
бо´льших — невозможно. Это будет, когда на рис. 168 оба графика каса!
ются друг друга, т. е. производные от обеих функций по k равны
ae ak − ae − ak
= r.
2

Комбинируя это равенство с (39) и обозначая

a
= λ (это и есть крити!
r

ческое значение), получим
ae ak − ae − ak 1
= ;
2
λ

e ak = rk +

1
;
λ

1
e − ak = rk − ;
λ

1 
1
1

1 =  rk +   rk −  = r 2 k 2 − 2 ;

λ 
λ
λ
k=

1 + λ2
1 + λ2
;
=

a

e

1+ λ2

− e−
2

1+ λ2

1
= .
λ

Итак, λ находится из последнего уравнения. Грубый численный
расчет дает приближенное значение λ = 0663
, .
Интересно отметить, что если верхнее решение на рис. 169 реализу!
ет абсолютный минимум площади поверхности вращения, то нижнее
решение реализует максимум только в изображенном семействе повер!
хностей. Если выйти за рамки этого семейства, то нижнее решение бу!
дет стационарным, так как оно удовлетворяет уравнению Эйлера, но
отнюдь не максимальным, а имеет характер минимакса (ср. § IV.6).
Если выбрать на нижнем решении любые две достаточно близкие точ!
ки и рассматривать их как граничные условия, то дуга, заключенная
между ними, является устойчивой, т.е. реализует решение задачи на
минимум. Значит, при любом изменении нижнего решения на доста!
точно малом интервале площадь будет возрастать. Задача на максимум
поверхности вращения решения не имеет. (Это ясно также из
возможности «гофрировать» любую поверхность.)
То соображение, что малый участок стационарного решения явля!
ется не только стационарным, но и экстремальным, оказывается полез!
ным во многих задачах.

§ 6]

ВАРИАНТЫ ОСНОВНОЙ ЗАДАЧИ

443

Упражнение
a

Рассмотрите задачу на минимум функционала I = ∫ ( y′ 2 − y 2 ) dx ( a > 0 )
0

при граничных условиях y(0 ) = y( a ) = 0. Этим условиям удовлетворяют, в час!
πx
тности, функции y = Cx( a − x ) и y = C sin . Какой отсюда можно сделать
a
вывод о существовании решения задачи?

§ 6. Варианты основной задачи
Имеется большое число других типов вариационных задач, которые
разбираются в курсах вариационного исчисления. Некоторые из этих
задач исследуются подобно тому, как мы рассмотрели в § 4 задачу об
экстремуме функционала (25) при условии (26). Например, под знак
интеграла могут входить производные более высокого, чем первого, по!
рядка от искомой функции; тогда и уравнение Эйлера имеет более вы!
сокий порядок, чем второй (а именно, в два раза более высокий, чем
наивысший порядок производных, входящих в функционал). Под знак
интеграла может входить несколько неизвестных функций; тогда для
их отыскания получается система дифференциальных уравнений
Эйлера, причём число уравнений в системе равно числу искомых
функций, так как надо приравнять нулю вариации функционала, полу!
ченные в результате варьирования каждой из этих функций. Так полу!
чится, в частности, при разыскании линии в пространстве, потому что
такая линия определяется двумя функциями, например y(x) и z (x).
Рассмотрим теперь вариационную задачу для функции нескольких,
для определенности двух, независимых переменных. Пусть ищется
функция z (x, y), придающая экстремальное значение интегралу

∫∫ F ( x,

y, z, z′x , z′y ) dx dy,

(40)

( σ)

где (σ) — некоторая заданная область с границей ( L), при условии на
границе
z

( L)

= ϕ (задано).

(41)

Рассуждения, аналогичные проведенным в § 4, приводят к уравнению
Эйлера, которое в данном случае имеет вид
F z′ −



F z′ −
F z′ = 0;
∂x x′ ∂y y′

(42)



и
здесь z
∂x
∂y
рассматривается как функция переменных x и y. Таким образом, для
при этом надо иметь в виду, что при вычислении

442

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

а при больших a — больше. При больших a форму, состоящую из двух
отдельных кружков, можно считать обобщенным решением нашей зада!
чи. Это решение имеет характер «концевого», «острого» минимума, для
него уравнение Эйлера не выполняется (ср. § 9).
Мы видим, что в результате вычислений мы приходим к выводам,
которые заранее можно было и не предвидеть.
a
является критическим в том
Легко подсчитать, какое значение
r
смысле, что при меньших значениях равновесие возможно, а при
бо´льших — невозможно. Это будет, когда на рис. 168 оба графика каса!
ются друг друга, т. е. производные от обеих функций по k равны
ae ak − ae − ak
= r.
2

Комбинируя это равенство с (39) и обозначая

a
= λ (это и есть крити!
r

ческое значение), получим
ae ak − ae − ak 1
= ;
2
λ

e ak = rk +

1
;
λ

1
e − ak = rk − ;
λ

1 
1
1

1 =  rk +   rk −  = r 2 k 2 − 2 ;

λ 
λ
λ
k=

1 + λ2
1 + λ2
;
=

a

e

1+ λ2

− e−
2

1+ λ2

1
= .
λ

Итак, λ находится из последнего уравнения. Грубый численный
расчет дает приближенное значение λ = 0663
, .
Интересно отметить, что если верхнее решение на рис. 169 реализу!
ет абсолютный минимум площади поверхности вращения, то нижнее
решение реализует максимум только в изображенном семействе повер!
хностей. Если выйти за рамки этого семейства, то нижнее решение бу!
дет стационарным, так как оно удовлетворяет уравнению Эйлера, но
отнюдь не максимальным, а имеет характер минимакса (ср. § IV.6).
Если выбрать на нижнем решении любые две достаточно близкие точ!
ки и рассматривать их как граничные условия, то дуга, заключенная
между ними, является устойчивой, т.е. реализует решение задачи на
минимум. Значит, при любом изменении нижнего решения на доста!
точно малом интервале площадь будет возрастать. Задача на максимум
поверхности вращения решения не имеет. (Это ясно также из
возможности «гофрировать» любую поверхность.)
То соображение, что малый участок стационарного решения явля!
ется не только стационарным, но и экстремальным, оказывается полез!
ным во многих задачах.

§ 6]

ВАРИАНТЫ ОСНОВНОЙ ЗАДАЧИ

443

Упражнение
a

Рассмотрите задачу на минимум функционала I = ∫ ( y′ 2 − y 2 ) dx ( a > 0 )
0

при граничных условиях y(0 ) = y( a ) = 0. Этим условиям удовлетворяют, в час!
πx
тности, функции y = Cx( a − x ) и y = C sin . Какой отсюда можно сделать
a
вывод о существовании решения задачи?

§ 6. Варианты основной задачи
Имеется большое число других типов вариационных задач, которые
разбираются в курсах вариационного исчисления. Некоторые из этих
задач исследуются подобно тому, как мы рассмотрели в § 4 задачу об
экстремуме функционала (25) при условии (26). Например, под знак
интеграла могут входить производные более высокого, чем первого, по!
рядка от искомой функции; тогда и уравнение Эйлера имеет более вы!
сокий порядок, чем второй (а именно, в два раза более высокий, чем
наивысший порядок производных, входящих в функционал). Под знак
интеграла может входить несколько неизвестных функций; тогда для
их отыскания получается система дифференциальных уравнений
Эйлера, причём число уравнений в системе равно числу искомых
функций, так как надо приравнять нулю вариации функционала, полу!
ченные в результате варьирования каждой из этих функций. Так полу!
чится, в частности, при разыскании линии в пространстве, потому что
такая линия определяется двумя функциями, например y(x) и z (x).
Рассмотрим теперь вариационную задачу для функции нескольких,
для определенности двух, независимых переменных. Пусть ищется
функция z (x, y), придающая экстремальное значение интегралу

∫∫ F ( x,

y, z, z′x , z′y ) dx dy,

(40)

( σ)

где (σ) — некоторая заданная область с границей ( L), при условии на
границе
z

( L)

= ϕ (задано).

(41)

Рассуждения, аналогичные проведенным в § 4, приводят к уравнению
Эйлера, которое в данном случае имеет вид
F z′ −



F z′ −
F z′ = 0;
∂x x′ ∂y y′

(42)



и
здесь z
∂x
∂y
рассматривается как функция переменных x и y. Таким образом, для
при этом надо иметь в виду, что при вычислении

444

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

нахождения решения получается дифференциальное уравнение второго
порядка (42) с частными производными при граничном условии (41).
Решение таких уравнений выходит за рамки этой книги, однако один
физически важный пример будет нами разобран (другой см. в § 12).
Найдем уравнение для формы равновесия мембраны, натянутой на
жесткий контур. Будем считать мембрану однородной (одинаковой во
всех точках), изотропной (одинаковой во всех направлениях) и натя3
нутой с силой T на единицу длины. Потенциальная энергия мембра3
ны, получающаяся при натяжении ее на контур, возникает из3за
увеличения ее площади по сравнению с горизонтальным положением.
В интегральном исчислении доказывается, что площадь Q поверхнос3
ти, описываемой уравнением z = z (x, y), равна

∫∫

1 + ( z′x )2 + ( z′y )2 dx dy,

( σ)

так что увеличение ΔQ площади мембраны равно

∫∫

( σ)

1 + ( z′x )2 + ( z′y )2 dx dy − σ = ∫∫

[ 1 + ( z′ ) + ( z′ ) − 1] dx dy.
2

2

x

y

( σ)

Считая отклонение малым (для этого нужно, чтобы заданный контур
мембраны мало отклонялся от плоскости z = 0), а потому и величины
z x′ и z ′y малыми, разложим подынтегральную функцию в ряд и от3
бросим члены высшего порядка малости:
1
⎧⎡ 1
⎤ ⎫
ΔQ = ∫∫ ⎨ 1 + [( z′x )2 + ( z′y )2 ] + чл. высш. пор. малости − 1⎬ dx dy =
⎥⎦ ⎭

2
2
( σ) ⎩ ⎣
=

1
[( z′x )2 + ( z′y )2 ] dx dy.
2 (∫∫
σ)

Приняв, что в процессе растяжения мембраны ее натяжение остается
неизменным, получим, что в этом процессе совершается работа
ΔA =

T
2

∫∫ [( z′x )

2

+ ( z′y )2 ] dx dy.

(43)

( σ)

Значит, такой будет и накопленная потенциальная энергия.
Однако из физики известно, что из всех возможных форм равнове3
сия мембрана выбирает такую, для которой потенциальная энергия ми3
нимальна. Таким образом, получается задача о минимуме интеграла
(43). В силу общего уравнения Эйлера (42) получаем
0−

∂ ⎛T
⎞ ∂ ⎛T

⎜ 2 z′x ⎟ −
⎜ 2 z′ ⎟ = 0,

⎠ ∂y ⎝ 2 y ⎠
∂x 2

т.е. после сокращения

z′′xx + z′′yy = 0.

(44)

§ 7]

УСЛОВНЫЙ ЭКСТРЕМУМ

445

Итак, форма равновесия мембраны описывается функцией z = z (x, y),
удовлетворяющей уравнению Лапласа (см. § V.7). Для нахождения
этой формы в конкретном случае надо найти решение уравнения (44)
при граничном условии (41).
Упражнения
b

1. Выведите уравнение Эйлера для функционала I = ∫ F ( x, y, y′, y′′ ) dx
a

при граничных условиях y( a ) = ya , y′( a ) = ya , y(b ) = yb , y′(b ) = y′b .
2. Запишите уравнение (42) в развернутом виде, наподобие (30).

§ 7. Условный экстремум для конечного числа степеней свободы
Вернемся к задачам на экстремум для систем с конечным числом
степеней свободы. В задачах, рассмотренных в § IV.6, независимые пе3
ременные не были связаны между собой никакими соотношениями; та3
кой экстремум называется безусловным. Встречаются также задачи на
условный экстремум, в которых независимые переменные связаны
между собой определенными равенствами. Начнем с функций от двух
переменных.
Пусть ищется максимум или минимум функции z = f (x, y) при
условии, что переменные x и y не являются независимыми, а связа3
ны соотношением
F ( x, y ) = h.

(45)

Это означает, что значения функции f рассматриваются и сравнива3
ются только для точек (в плоскости аргументов), лежащих на линии
с уравнением (45). Например, на рис. 172 изображены линии уровня
некоторой функции f (x, y), имеющей безусловный максимум к точ3
ке K; там же изображена жирно линия
( L) с уравнением (43). Следуя вдоль ( L),
мы в точке A подходим к линии уровня
с наивысшей отметкой и сразу же затем
отходим в область с более низкими от3
метками, т.е. в область меньших высот.
Значит, в точке A функция f имеет
условный максимум; он не является бе3
зусловным, так как, уйдя с ( L) в сторо3
ну K, мы могли бы вблизи А найти еще
более высокие значения f . Аналогично
Рис. 172.
проверяем, что в точке B будет условный
минимум, а в точке C —другой условный максимум, т.е. здесь имеется
три условных экстремума. Итак, безусловный максимум — это как бы вер3
шина горы, а условный — это самая высокая точка заданной горной тропы
(проекция этой тропы на плоскость x, y имеет уравнение (45)).

444

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

нахождения решения получается дифференциальное уравнение второго
порядка (42) с частными производными при граничном условии (41).
Решение таких уравнений выходит за рамки этой книги, однако один
физически важный пример будет нами разобран (другой см. в § 12).
Найдем уравнение для формы равновесия мембраны, натянутой на
жесткий контур. Будем считать мембрану однородной (одинаковой во
всех точках), изотропной (одинаковой во всех направлениях) и натя3
нутой с силой T на единицу длины. Потенциальная энергия мембра3
ны, получающаяся при натяжении ее на контур, возникает из3за
увеличения ее площади по сравнению с горизонтальным положением.
В интегральном исчислении доказывается, что площадь Q поверхнос3
ти, описываемой уравнением z = z (x, y), равна

∫∫

1 + ( z′x )2 + ( z′y )2 dx dy,

( σ)

так что увеличение ΔQ площади мембраны равно

∫∫

( σ)

1 + ( z′x )2 + ( z′y )2 dx dy − σ = ∫∫

[ 1 + ( z′ ) + ( z′ ) − 1] dx dy.
2

2

x

y

( σ)

Считая отклонение малым (для этого нужно, чтобы заданный контур
мембраны мало отклонялся от плоскости z = 0), а потому и величины
z x′ и z ′y малыми, разложим подынтегральную функцию в ряд и от3
бросим члены высшего порядка малости:
1
⎧⎡ 1
⎤ ⎫
ΔQ = ∫∫ ⎨ 1 + [( z′x )2 + ( z′y )2 ] + чл. высш. пор. малости − 1⎬ dx dy =
⎥⎦ ⎭

2
2
( σ) ⎩ ⎣
=

1
[( z′x )2 + ( z′y )2 ] dx dy.
2 (∫∫
σ)

Приняв, что в процессе растяжения мембраны ее натяжение остается
неизменным, получим, что в этом процессе совершается работа
ΔA =

T
2

∫∫ [( z′x )

2

+ ( z′y )2 ] dx dy.

(43)

( σ)

Значит, такой будет и накопленная потенциальная энергия.
Однако из физики известно, что из всех возможных форм равнове3
сия мембрана выбирает такую, для которой потенциальная энергия ми3
нимальна. Таким образом, получается задача о минимуме интеграла
(43). В силу общего уравнения Эйлера (42) получаем
0−

∂ ⎛T
⎞ ∂ ⎛T

⎜ 2 z′x ⎟ −
⎜ 2 z′ ⎟ = 0,

⎠ ∂y ⎝ 2 y ⎠
∂x 2

т.е. после сокращения

z′′xx + z′′yy = 0.

(44)

§ 7]

УСЛОВНЫЙ ЭКСТРЕМУМ

445

Итак, форма равновесия мембраны описывается функцией z = z (x, y),
удовлетворяющей уравнению Лапласа (см. § V.7). Для нахождения
этой формы в конкретном случае надо найти решение уравнения (44)
при граничном условии (41).
Упражнения
b

1. Выведите уравнение Эйлера для функционала I = ∫ F ( x, y, y′, y′′ ) dx
a

при граничных условиях y( a ) = ya , y′( a ) = ya , y(b ) = yb , y′(b ) = y′b .
2. Запишите уравнение (42) в развернутом виде, наподобие (30).

§ 7. Условный экстремум для конечного числа степеней свободы
Вернемся к задачам на экстремум для систем с конечным числом
степеней свободы. В задачах, рассмотренных в § IV.6, независимые пе3
ременные не были связаны между собой никакими соотношениями; та3
кой экстремум называется безусловным. Встречаются также задачи на
условный экстремум, в которых независимые переменные связаны
между собой определенными равенствами. Начнем с функций от двух
переменных.
Пусть ищется максимум или минимум функции z = f (x, y) при
условии, что переменные x и y не являются независимыми, а связа3
ны соотношением
F ( x, y ) = h.

(45)

Это означает, что значения функции f рассматриваются и сравнива3
ются только для точек (в плоскости аргументов), лежащих на линии
с уравнением (45). Например, на рис. 172 изображены линии уровня
некоторой функции f (x, y), имеющей безусловный максимум к точ3
ке K; там же изображена жирно линия
( L) с уравнением (43). Следуя вдоль ( L),
мы в точке A подходим к линии уровня
с наивысшей отметкой и сразу же затем
отходим в область с более низкими от3
метками, т.е. в область меньших высот.
Значит, в точке A функция f имеет
условный максимум; он не является бе3
зусловным, так как, уйдя с ( L) в сторо3
ну K, мы могли бы вблизи А найти еще
более высокие значения f . Аналогично
Рис. 172.
проверяем, что в точке B будет условный
минимум, а в точке C —другой условный максимум, т.е. здесь имеется
три условных экстремума. Итак, безусловный максимум — это как бы вер3
шина горы, а условный — это самая высокая точка заданной горной тропы
(проекция этой тропы на плоскость x, y имеет уравнение (45)).

446

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Если из «уравнения связи» (45) можно выразить y через x, то этот
результат можно подставить в выражение для z,
z = f [( x, y( x )],

(46)

и получить, таким образом, z как функцию одного независимого пе!
ременного. Так как условия больше нет (оно учтено подстановкой
y = y(x)), то задача об отыскании экстремума z становится задачей на
безусловный экстремум. Аналогичный результат получится, если
уравнение (45) можно разрешить относительно x или если уравнение
линии (45) можно представить в параметрическом виде.
Однако такое разрешение уравнения (45) не всегда возможно и це!
лесообразно. Тогда можно рассуждать так. Уравнение связи (45) опре!
деляет принципиально некоторую зависимость y = y(x), хотя бы нам
явно и не известную. Таким образом, z является сложной функцией
(46) независимого переменного x, и необходимое условие экстремума
дает по формуле производной сложной функции
dz
dy
= fx′ + f y′
= 0.
dx
dx

(47)

Здесь dy dx означает производную неявной функции y(x), опреде!
ленной из условия (45). По правилам § IV.3 получаем, что
dy
dy
Fx′ + F y′
= 0, т.е.
= − Fx′ F y′ . Подставляя это выражение в (47), ви!
dx
dx
дим, что в точке условного экстремума
fx′ −

(48)

т.е.
f y′ − λF y′ = 0.

(49)

Обозначим
f *( x, y; λ ) = f ( x, y ) − λF ( x, y ),

447

где λ — неизвестный параметр, который называется множителем Лаг"
ранжа. Тогда уравнения (49) можно записать так:
fx*′ = 0,

f y*′ = 0.

(51)

Таким образом, получаются те же уравнения, как и в случае безуслов!
ного экстремума (см, (IV.28)), однако они составляются не для самой
функции f , а для измененной функции f *, определенной по формуле
(50). Уравнения (51) вместе с уравнением связи (45) образуют систему
трех уравнений с тремя неизвестными x, y, λ; из этих уравнений и на!
ходятся точки условного экстремума.
Множитель Лагранжа λ имеет простой смысл. Для выяснения
его обозначим координаты точки условного экстремума и само экс!
тремальное значение соответственно через x, y и z. До сих пор мы
считали h зафиксированным, но если менять h, то эти три величины
будут зависеть от h. Вычислим, с какой скоростью меняется экстре!
мальное значение z при изменении h. Так как z (h) = f (x (h), y (h)),
то
dy
dx
dz
= fx′
+ f y′ .
dh
dh
dh

(52)

С другой стороны, в силу (45)
Fx′

dy
dx
+ F y′
=1.
dh
dh

(53)

dz
dx
dy
dy 
 dx
= λFx′
+ λF y′
= λ  Fx′
+ F y′  = λ.
 dh
dh
dh
dh
dh 

(Среднее равенство, в силу § IV.3, означает, что линия (45) в точке
условного экстремума касается линии уровня функции f , ср.
рис. 172.) Обозначим величину последнего отношения в рассмат!
риваемой точке буквой λ. Тогда получим в точке условного экстре!
мума

fx′ − λFx′ = 0,

УСЛОВНЫЙ ЭКСТРЕМУМ

Из (52), (48) и (53) получим

Fx′
f ′ f y′
F′
f′
= 0, т.е. − x = − x , или x = .
Fx′ F y′
F y′
F y′
f y′

fx′ f y′
= λ,
=
Fx′ F y′

§ 7]

(50)

Итак, множитель λ равен скорости изменения экстремального значе!
ния при изменении параметра h в условии. Метод Лагранжа замечате!
лен тем, что производную dz dh удается найти, не выписывая в явном
виде функцию z (h), которая может быть очень сложной.
Постановка задачи на условный экстремум типична для экономики:
ищем максимум количества z продукта при заданных затратах h; из!
вестна зависимость z и h от способа действий, характеризуемого пе!
ременными х, у. При наилучшем способе действий каждому h
соответствует одно определенное z. Производная dh dz есть себесто!
имость (добавочного) продукта в идеально налаженном хозяйстве, где
уже сделаны затраты h и произведено z, а теперь потребовалось уве!
личить производство.
Для функций любого числа переменных и для любого числа связей
исследование условного экстремума проводится аналогично. Напри!

446

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Если из «уравнения связи» (45) можно выразить y через x, то этот
результат можно подставить в выражение для z,
z = f [( x, y( x )],

(46)

и получить, таким образом, z как функцию одного независимого пе!
ременного. Так как условия больше нет (оно учтено подстановкой
y = y(x)), то задача об отыскании экстремума z становится задачей на
безусловный экстремум. Аналогичный результат получится, если
уравнение (45) можно разрешить относительно x или если уравнение
линии (45) можно представить в параметрическом виде.
Однако такое разрешение уравнения (45) не всегда возможно и це!
лесообразно. Тогда можно рассуждать так. Уравнение связи (45) опре!
деляет принципиально некоторую зависимость y = y(x), хотя бы нам
явно и не известную. Таким образом, z является сложной функцией
(46) независимого переменного x, и необходимое условие экстремума
дает по формуле производной сложной функции
dz
dy
= fx′ + f y′
= 0.
dx
dx

(47)

Здесь dy dx означает производную неявной функции y(x), опреде!
ленной из условия (45). По правилам § IV.3 получаем, что
dy
dy
Fx′ + F y′
= 0, т.е.
= − Fx′ F y′ . Подставляя это выражение в (47), ви!
dx
dx
дим, что в точке условного экстремума
fx′ −

(48)

т.е.
f y′ − λF y′ = 0.

(49)

Обозначим
f *( x, y; λ ) = f ( x, y ) − λF ( x, y ),

447

где λ — неизвестный параметр, который называется множителем Лаг"
ранжа. Тогда уравнения (49) можно записать так:
fx*′ = 0,

f y*′ = 0.

(51)

Таким образом, получаются те же уравнения, как и в случае безуслов!
ного экстремума (см, (IV.28)), однако они составляются не для самой
функции f , а для измененной функции f *, определенной по формуле
(50). Уравнения (51) вместе с уравнением связи (45) образуют систему
трех уравнений с тремя неизвестными x, y, λ; из этих уравнений и на!
ходятся точки условного экстремума.
Множитель Лагранжа λ имеет простой смысл. Для выяснения
его обозначим координаты точки условного экстремума и само экс!
тремальное значение соответственно через x, y и z. До сих пор мы
считали h зафиксированным, но если менять h, то эти три величины
будут зависеть от h. Вычислим, с какой скоростью меняется экстре!
мальное значение z при изменении h. Так как z (h) = f (x (h), y (h)),
то
dy
dx
dz
= fx′
+ f y′ .
dh
dh
dh

(52)

С другой стороны, в силу (45)
Fx′

dy
dx
+ F y′
= 1.
dh
dh

(53)

dz
dx
dy
dy 
 dx
= λFx′
+ λF y′
= λ  Fx′
+ F y′  = λ.
 dh
dh
dh
dh
dh 

(Среднее равенство, в силу § IV.3, означает, что линия (45) в точке
условного экстремума касается линии уровня функции f , ср.
рис. 172.) Обозначим величину последнего отношения в рассмат!
риваемой точке буквой λ. Тогда получим в точке условного экстре!
мума

fx′ − λFx′ = 0,

УСЛОВНЫЙ ЭКСТРЕМУМ

Из (52), (48) и (53) получим

Fx′
f ′ f y′
F′
f′
= 0, т.е. − x = − x , или x = .
Fx′ F y′
F y′
F y′
f y′

fx′ f y′
= λ,
=
Fx′ F y′

§ 7]

(50)

Итак, множитель λ равен скорости изменения экстремального значе!
ния при изменении параметра h в условии. Метод Лагранжа замечате!
лен тем, что производную dz dh удается найти, не выписывая в явном
виде функцию z (h), которая может быть очень сложной.
Постановка задачи на условный экстремум типична для экономики:
ищем максимум количества z продукта при заданных затратах h; из!
вестна зависимость z и h от способа действий, характеризуемого пе!
ременными х, у. При наилучшем способе действий каждому h
соответствует одно определенное z. Производная dh dz есть себесто!
имость (добавочного) продукта в идеально налаженном хозяйстве, где
уже сделаны затраты h и произведено z, а теперь потребовалось уве!
личить производство.
Для функций любого числа переменных и для любого числа связей
исследование условного экстремума проводится аналогично. Напри!

448

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

мер, если ищется экстремум функции f (x, y, z , u, v) при условиях
F1 ( x, y, z, u, v ) = 0,

F2 ( x, y, z, u, v ) = 0,

F3 ( x, y, z, u, v ) = 0,

(54)

то надо поступать так, как если бы мы искали безусловный экстремум
для функции f * = f − λ 1 F1 − λ 2 F2 − λ 3 F3 , где λ 1 , λ 2 , λ 3 — неизвес!
тные множители Лагранжа. Необходимое условие экстремума для f *
дает f x* ′ = 0, f y* ′ = 0, f z* ′ = 0, f u* ′ = 0, f v* ′ = 0, что вместе с (54) дает
5 + 3 уравнений с 5 + 3 неизвестными x, y, z , u, v, λ 1 , λ 2 , λ 3 .
Упражнение
Найдите условный экстремум функции u( x, y, z ) = x 2 − y 2 + z 2 − 2 x: а) при
условии x + 2 y − z = 3; б) при условиях x + y − z = 0, x + 2 y = 1.

§ 8. Условный экстремум в вариационном исчислении
Задачи на условный экстремум в вариационном исчислении ставят!
ся и решаются аналогично тому, как это было сделано в § 7 для задач
с конечным числом степеней свободы. Рассмотрим, например, задачу
о нахождении экстремума функционала (25) при граничных условиях
(26) и дополнительном интегральном условии
b

∫ G ( x, y, y′ ) dx = K,

(55)

a

где G — заданная функция, а K — заданное число. Если разбить ин!
тервал интегрирования на большое количество мелких частей и заме!
нить интегралы (25) и (55) на суммы, зависящие от значений y i
искомой функции в точках деления (т.е. совершить как бы переход, об!
ратный сделанному в § 1), то мы приходим к задаче на условный экстре!
мум функции от конечного числа переменных y i . В силу результатов § 7
эта задача равносильна задаче о безусловном экстремуме выражения
b

b

b

∫ F ( x, y, y′ ) dx − λ ∫ G ( x, y, y′ ) dx = ∫ ( F − λG ) dx
a

a

dI экстр
dK

.

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

(56)

Это равенство дает возможность выяснить характер зависимости экс!
тремального (в общем случае стационарного) значения I экстр функ!

449

ционала в том случае, если параметр K в условии (55) может
изменяться (тогда, конечно, это значение I экстр зависит от K).
Рассмотрим в качестве примера знаменитую задачу Дидo. Легенда
рассказывает, что в древности жила финикийская царица Дидo. Прес!
ледуемая властителем соседнего государства, она бежала в Северную
Африку и обратилась к местному племени с просьбой приютить ее, вы!
делив для этого столько земли, сколько можно охватить шкурой вола.
Когда эта просьба была удовлетворена, Дидо разрезала шкуру на тон!
чайшие ремешки и, связав их последовательно один с другим, получи!
ла длиннейшую нить. Охватив на глазах у изумленной публики этой
нитью изрядный по тем временам участок земли, Дидо развернула там
строительство и основала знаменитый город Карфаген.
Уже античная наука заинтересовалась задачей: как следовало Дидо
расположить свою нить, чтобы охватить наибольшую площадь, други!
ми словами, как выбрать из всех линий заданной длины ту, которая
охватывает наибольшую площадь. Оказалось, что решением этой изо"
периметрической задачи служит окружность (если линия берется за!
мкнутой) или дуга окружности (если
линия берется незамкнутой, например,
если Дидо расположила свою нить кон!
цами у моря, см. рис. 173). Однако до!
казать это строго совсем не просто.
Посмотрим, как сформулировать
задачу Дидо аналитически. Для этого
допустим для простоты, что берег пря!
мой, и расположим оси координат, как
на рис. 173. Рассмотрим вариант, в ко!
тором зафиксировано положение кон!
цов нити. Тогда форма нити задается
Рис. 173.
уравнением y = y(x), причем функция
y(x) заранее не известна, однако должна удовлетворять условиям
y( a ) = 0,

a

(мы от сумм опять перешли к интегралам), где λ — неизвестный заранее
постоянный множитель Лагранжа. Таким образом, взамен уравнения (29)
надо написать аналогичное уравнение Эйлера для функции F * = F − λG;
после решения этого уравнения две постоянные интегрирования и посто!
янную λ находим из трех условий (26) и (55). При этом в силу § 7 вели!
чина λ имеет важное значение, так как она равна
λ=

§ 8]

y(b ) = 0.

(57)

Кроме того, задана длина линии
b



1 + y′ 2 dx = L

(58)

a

(формула для длины линии выводится в интегральном исчислении,
см., например, ВМ, § III.5). При этом требуется, чтобы площадь, т.е.
b

S = ∫ y dx,
a

(59)

448

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

мер, если ищется экстремум функции f (x, y, z , u, v) при условиях
F1 ( x, y, z, u, v ) = 0,

F2 ( x, y, z, u, v ) = 0,

F3 ( x, y, z, u, v ) = 0,

(54)

то надо поступать так, как если бы мы искали безусловный экстремум
для функции f * = f − λ 1 F1 − λ 2 F2 − λ 3 F3 , где λ 1 , λ 2 , λ 3 — неизвес!
тные множители Лагранжа. Необходимое условие экстремума для f *
дает f x* ′ = 0, f y* ′ = 0, f z* ′ = 0, f u* ′ = 0, f v* ′ = 0, что вместе с (54) дает
5 + 3 уравнений с 5 + 3 неизвестными x, y, z , u, v, λ 1 , λ 2 , λ 3 .
Упражнение
Найдите условный экстремум функции u( x, y, z ) = x 2 − y 2 + z 2 − 2 x: а) при
условии x + 2 y − z = 3; б) при условиях x + y − z = 0, x + 2 y = 1.

§ 8. Условный экстремум в вариационном исчислении
Задачи на условный экстремум в вариационном исчислении ставят!
ся и решаются аналогично тому, как это было сделано в § 7 для задач
с конечным числом степеней свободы. Рассмотрим, например, задачу
о нахождении экстремума функционала (25) при граничных условиях
(26) и дополнительном интегральном условии
b

∫ G ( x, y, y′ ) dx = K,

(55)

a

где G — заданная функция, а K — заданное число. Если разбить ин!
тервал интегрирования на большое количество мелких частей и заме!
нить интегралы (25) и (55) на суммы, зависящие от значений y i
искомой функции в точках деления (т.е. совершить как бы переход, об!
ратный сделанному в § 1), то мы приходим к задаче на условный экстре!
мум функции от конечного числа переменных y i . В силу результатов § 7
эта задача равносильна задаче о безусловном экстремуме выражения
b

b

b

∫ F ( x, y, y′ ) dx − λ ∫ G ( x, y, y′ ) dx = ∫ ( F − λG ) dx
a

a

dI экстр
dK

.

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

(56)

Это равенство дает возможность выяснить характер зависимости экс!
тремального (в общем случае стационарного) значения I экстр функ!

449

ционала в том случае, если параметр K в условии (55) может
изменяться (тогда, конечно, это значение I экстр зависит от K).
Рассмотрим в качестве примера знаменитую задачу Дидo. Легенда
рассказывает, что в древности жила финикийская царица Дидo. Прес!
ледуемая властителем соседнего государства, она бежала в Северную
Африку и обратилась к местному племени с просьбой приютить ее, вы!
делив для этого столько земли, сколько можно охватить шкурой вола.
Когда эта просьба была удовлетворена, Дидо разрезала шкуру на тон!
чайшие ремешки и, связав их последовательно один с другим, получи!
ла длиннейшую нить. Охватив на глазах у изумленной публики этой
нитью изрядный по тем временам участок земли, Дидо развернула там
строительство и основала знаменитый город Карфаген.
Уже античная наука заинтересовалась задачей: как следовало Дидо
расположить свою нить, чтобы охватить наибольшую площадь, други!
ми словами, как выбрать из всех линий заданной длины ту, которая
охватывает наибольшую площадь. Оказалось, что решением этой изо"
периметрической задачи служит окружность (если линия берется за!
мкнутой) или дуга окружности (если
линия берется незамкнутой, например,
если Дидо расположила свою нить кон!
цами у моря, см. рис. 173). Однако до!
казать это строго совсем не просто.
Посмотрим, как сформулировать
задачу Дидо аналитически. Для этого
допустим для простоты, что берег пря!
мой, и расположим оси координат, как
на рис. 173. Рассмотрим вариант, в ко!
тором зафиксировано положение кон!
цов нити. Тогда форма нити задается
Рис. 173.
уравнением y = y(x), причем функция
y(x) заранее не известна, однако должна удовлетворять условиям
y( a ) = 0,

a

(мы от сумм опять перешли к интегралам), где λ — неизвестный заранее
постоянный множитель Лагранжа. Таким образом, взамен уравнения (29)
надо написать аналогичное уравнение Эйлера для функции F * = F − λG;
после решения этого уравнения две постоянные интегрирования и посто!
янную λ находим из трех условий (26) и (55). При этом в силу § 7 вели!
чина λ имеет важное значение, так как она равна
λ=

§ 8]

y(b ) = 0.

(57)

Кроме того, задана длина линии
b



1 + y′ 2 dx = L

(58)

a

(формула для длины линии выводится в интегральном исчислении,
см., например, ВМ, § III.5). При этом требуется, чтобы площадь, т.е.
b

S = ∫ y dx,
a

(59)

450

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

была максимальной. Итак, получается следующая задача: среди всех
функций y = y(x), удовлетворяющих условиям (57) и (58), надо выбрать такую, для которой интеграл (59) имеет наибольшее возможное
значение.
Задача Дидо была впервые решена геометрическими методами,
с привлечением очень остроумных, но не очевидных соображений. На
основе аппарата вариационного исчисления она решается совершенно
стандартно. В силу сказанного в начале этого параграфа просто требуется решить уравнение Эйлера для функции
F * = y − λ 1 + y′ 2 .

§ 8]

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

451

Задача Дидо имеет простое физическое истолкование. Представим
себе горизонтальную жесткую рамку, на которую натянута мыльная
пленка, и пусть на этой пленке плавает тонкая нить, прикрепленная
концами к рамке (рис. 174, а) в точках a и b. Если проколоть иглой
пленку внутри нити, то в силу поверхностного натяжения пленки она
натянется так (рис. 174, б), чтобы ее площадь была по возможности
меньшей, а значит, чтобы свободная от пленки площадь была по возможности большей. Мы приходим как раз к задаче Дидо.

(60)

Пользуясь промежуточным интегралом (34), находим
y − λ 1 + y′ 2 + λ

y′
1 + y′ 2

y′ = C1 .

Преобразуя, получим
y−

λ
1 + y′ 2

= C1 ;

Рис. 174.
2

2

2

λ = (1 + y′ )(C1 − y ) ;

λ2 − ( y − C1 )2
dy
;

dx
y − C1
m λ2 − ( y − C1 )2 = x + C 2 ;

λ2
y′ =
− 1;
(C1 − y )2
2

( y − C1 ) dy
± λ2 − ( y − C1 )2

Такая физическая картина дает возможность истолковать уравнение Эйлера, подобно § 1, как уравнение статического равновесия. Если
длина L нити задана, то потенциальная энергия U системы пропорциональна поверхности пленки, т.е.

= dx;

( x + C 2 )2 + ( y − C1 )2 = λ2 .

U = 2 σ( S 0 − S ),
(61)

Итак, получилось уравнение окружности, т.е. решением задачи Дидо
служит дуга окружности, как и было уже указано. Поскольку длина L
дуги окружности и ее концы заданы, то не представляет труда найти
центр окружности и изобразить саму дугу.
Задача Дидо имеет варианты. Так, если длина L задана, но концы a,
b дуги не заданы, то из всех дуг данной длины надо выбрать такую, которая ограничивает наибольшую площадь. Можно проверить, что искомая дуга окружности должна подходить к берегу перпендикулярно; в
частности, если берег прямой, то надо взять полуокружность. Если же
моря нет, и линия берется замкнутой, то как было сказано выше, получается окружность. Проверим в этом случае соотношение (56). Здесь
I экстр = πR 2 , K = L = 2πR (R — радиус окружности), откуда
dI d ( πR 2 )
=
= R.
dK d (2 πR )

Это как раз соответствует формуле (61), из которой видно, что радиус
окружности равен λ (ниже мы увидим, что λ = R, так что и знаки
в формуле (56) согласуются).

где σ — «коэффициент поверхностного натяжения» (множитель 2
связан с тем, что пленка имеет две стороны), a S 0 — площадь, охваченная рамкой, так что S 0 − S есть площадь пленки. Условие статического равновесия, как мы видели, сводится к стационарности потенциальной энергии U, что равносильно
стационарности величины S (причем максимальность S означает минимальность U, т.е. устойчивость
равновесия). Таким образом, мы приРис. 175.
ходим к уравнению Эйлера для
функции F *.
Найденное нами решение также можно получить из физических соображений. Рассмотрим (рис. 175) элемент (dL) нити, на который
действует сила 2σdL поверхностного натяжения и силы натяжения
нити P и P + dP, приложенные к его концам. Проецируя эти силы на
касательную к элементу и отбрасывая члены выше первого порядка малости, получим

450

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

была максимальной. Итак, получается следующая задача: среди всех
функций y = y(x), удовлетворяющих условиям (57) и (58), надо выбрать такую, для которой интеграл (59) имеет наибольшее возможное
значение.
Задача Дидо была впервые решена геометрическими методами,
с привлечением очень остроумных, но не очевидных соображений. На
основе аппарата вариационного исчисления она решается совершенно
стандартно. В силу сказанного в начале этого параграфа просто требуется решить уравнение Эйлера для функции
F * = y − λ 1 + y′ 2 .

§ 8]

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

451

Задача Дидо имеет простое физическое истолкование. Представим
себе горизонтальную жесткую рамку, на которую натянута мыльная
пленка, и пусть на этой пленке плавает тонкая нить, прикрепленная
концами к рамке (рис. 174, а) в точках a и b. Если проколоть иглой
пленку внутри нити, то в силу поверхностного натяжения пленки она
натянется так (рис. 174, б), чтобы ее площадь была по возможности
меньшей, а значит, чтобы свободная от пленки площадь была по возможности большей. Мы приходим как раз к задаче Дидо.

(60)

Пользуясь промежуточным интегралом (34), находим
y − λ 1 + y′ 2 + λ

y′
1 + y′ 2

y′ = C1 .

Преобразуя, получим
y−

λ
1 + y′ 2

= C1 ;

Рис. 174.
2

2

2

λ = (1 + y′ )(C1 − y ) ;

λ2 − ( y − C1 )2
dy
;

dx
y − C1
m λ2 − ( y − C1 )2 = x + C 2 ;

λ2
y′ =
− 1;
(C1 − y )2
2

( y − C1 ) dy
± λ2 − ( y − C1 )2

Такая физическая картина дает возможность истолковать уравнение Эйлера, подобно § 1, как уравнение статического равновесия. Если
длина L нити задана, то потенциальная энергия U системы пропорциональна поверхности пленки, т.е.

= dx;

( x + C 2 )2 + ( y − C1 )2 = λ2 .

U = 2 σ( S 0 − S ),
(61)

Итак, получилось уравнение окружности, т.е. решением задачи Дидо
служит дуга окружности, как и было уже указано. Поскольку длина L
дуги окружности и ее концы заданы, то не представляет труда найти
центр окружности и изобразить саму дугу.
Задача Дидо имеет варианты. Так, если длина L задана, но концы a,
b дуги не заданы, то из всех дуг данной длины надо выбрать такую, которая ограничивает наибольшую площадь. Можно проверить, что искомая дуга окружности должна подходить к берегу перпендикулярно; в
частности, если берег прямой, то надо взять полуокружность. Если же
моря нет, и линия берется замкнутой, то как было сказано выше, получается окружность. Проверим в этом случае соотношение (56). Здесь
I экстр = πR 2 , K = L = 2πR (R — радиус окружности), откуда
dI d ( πR 2 )
=
= R.
dK d (2 πR )

Это как раз соответствует формуле (61), из которой видно, что радиус
окружности равен λ (ниже мы увидим, что λ = R, так что и знаки
в формуле (56) согласуются).

где σ — «коэффициент поверхностного натяжения» (множитель 2
связан с тем, что пленка имеет две стороны), a S 0 — площадь, охваченная рамкой, так что S 0 − S есть площадь пленки. Условие статического равновесия, как мы видели, сводится к стационарности потенциальной энергии U, что равносильно
стационарности величины S (причем максимальность S означает минимальность U, т.е. устойчивость
равновесия). Таким образом, мы приРис. 175.
ходим к уравнению Эйлера для
функции F *.
Найденное нами решение также можно получить из физических соображений. Рассмотрим (рис. 175) элемент (dL) нити, на который
действует сила 2σdL поверхностного натяжения и силы натяжения
нити P и P + dP, приложенные к его концам. Проецируя эти силы на
касательную к элементу и отбрасывая члены выше первого порядка малости, получим

452

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 8]

453

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

(при этом надо учесть, что косинус малого угла отличается от единицы
на величину второго порядка малости). Отсюда dP = 0, т.е. вдоль нити
P = const. Проецируя силы на нормаль, получим
2P sin dα = 2P dα = 2 σ dL,

(62)

откуда
2 dα 2 σ
=
= const.
dL
P

2dα
представляет собой кривизну k нити (§ IX.4). ТаdL
ким образом, нить в положении равновесия имеет постоянную кривизну, т.е. представляет собой дугу окружности
1 P
радиуса R = = . (Впрочем, постояk 2σ
нство P можно получить и из формулы
(62), которую можно переписать в виде
P = 2σR, исходя из найденного решения (61)
задачи на условный экстремум, причем
R = λ, т.е. P = 2σλ.)
К решению задачи о мыльной пленке
можно
подойти иначе. Именно, будем счиРис. 176.
тать натяжение P нити заданным, а ее длину L не заданной, т.е. рассмотрим схему, изображенную на рис. 176.
В этом случае потенциальная энергия системы равна
Отношение

P ⎞

U = const − 2 σS + PL = const − 2 σ ⎜ S −
L⎟ ,

2σ ⎠

так как при увеличении L на ΔL груз поднимается на ΔL, т.е. U возрастет на PΔL. Таким образом, мы приходим к задаче на безусловный
экстремум функционала
b

S−

P
P


1 + y′ 2 ⎟ dx.
L=∫ ⎜y−



2
σ
a

Для ее решения надо составить уравнение Эйлера для функции (60) с
P
λ = ; как мы видели, решением уравнения служит линия с уравнением

(61), т.е. дуга окружности радиуса
R= λ =

P
.


(63)

Итак, решение задачи на условный экстремум при новом истолковании можно рассматривать как решение задачи на безусловный экстре-

Рис. 177.

Рис. 178.

мум, причем этот переход имеет физический, а не только формальный
смысл.
Интересно, что при второй трактовке задача имеет два решения: из
(63) мы получаем значение радиуса искривленной нити, но ведь имеется два возможных положения нити с заданным радиусом (рис. 177)!
Если рассмотреть семейство окружностей, проходящих через точки a и b, то график зависимости U от h имеет вид, изображенный
на рис. 178. Таким образом, из двух возможных положений груза более
низкое является устойчивым, а более высокое — неустойчивым. При
этом, как и в конце § 5, минимум имеет абсолютный характер, а максимум экстремален только среди дуг окружностей; в действительности
для более высокого положения энергия имеет минимакс.
Можно обобщить задачу Дидо, предположив, что требуется охватить наиболее ценный участок, причем стоимость единицы площади не
постоянна, а зависит, например, от расстояния до моря. Элементарно
решить такую обобщенную задачу уже нельзя, Однако ее можно решить с помощью уравнения Эйлера, заметив, что вместо (59) в данном
случае надо максимизировать интеграл

b

y

a

0

∫ F (y) dx, где F (y) = ∫ ϕ(η) dη,

а ϕ(η) — стоимость единицы площади на расстоянии η от моря.
(Если ϕ(η) ≡ 1, то мы возвращаемся к (59).)
Рассмотрим еще одну задачу на условный экстремум, именно задачу о распределении зарядов в проводнике. Представим себе уединенный проводник (Ω) любой формы, на который помещено количество
электричества q. Это количество разместится на проводнике с плотностью ρ, которую и нужно найти.
Для решения этой задачи вспомним формулу (Х.23) для потенциала,
порожденного распределенным зарядом, которую перепишем в виде
ϕ(r ) =



(Ω )

ρ(r0 )
dΩ 0 .
r − r0

452

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 8]

453

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

(при этом надо учесть, что косинус малого угла отличается от единицы
на величину второго порядка малости). Отсюда dP = 0, т.е. вдоль нити
P = const. Проецируя силы на нормаль, получим
2P sin dα = 2P dα = 2 σ dL,

(62)

откуда
2 dα 2 σ
=
= const.
dL
P

2dα
представляет собой кривизну k нити (§ IX.4). ТаdL
ким образом, нить в положении равновесия имеет постоянную кривизну, т.е. представляет собой дугу окружности
1 P
радиуса R = = . (Впрочем, постояk 2σ
нство P можно получить и из формулы
(62), которую можно переписать в виде
P = 2σR, исходя из найденного решения (61)
задачи на условный экстремум, причем
R = λ, т.е. P = 2σλ.)
К решению задачи о мыльной пленке
можно
подойти иначе. Именно, будем счиРис. 176.
тать натяжение P нити заданным, а ее длину L не заданной, т.е. рассмотрим схему, изображенную на рис. 176.
В этом случае потенциальная энергия системы равна
Отношение

P ⎞

U = const − 2 σS + PL = const − 2 σ ⎜ S −
L⎟ ,

2σ ⎠

так как при увеличении L на ΔL груз поднимается на ΔL, т.е. U возрастет на PΔL. Таким образом, мы приходим к задаче на безусловный
экстремум функционала
b

S−

P
P


1 + y′ 2 ⎟ dx.
L=∫ ⎜y−



2
σ
a

Для ее решения надо составить уравнение Эйлера для функции (60) с
P
λ = ; как мы видели, решением уравнения служит линия с уравнением

(61), т.е. дуга окружности радиуса
R= λ =

P
.


(63)

Итак, решение задачи на условный экстремум при новом истолковании можно рассматривать как решение задачи на безусловный экстре-

Рис. 177.

Рис. 178.

мум, причем этот переход имеет физический, а не только формальный
смысл.
Интересно, что при второй трактовке задача имеет два решения: из
(63) мы получаем значение радиуса искривленной нити, но ведь имеется два возможных положения нити с заданным радиусом (рис. 177)!
Если рассмотреть семейство окружностей, проходящих через точки a и b, то график зависимости U от h имеет вид, изображенный
на рис. 178. Таким образом, из двух возможных положений груза более
низкое является устойчивым, а более высокое — неустойчивым. При
этом, как и в конце § 5, минимум имеет абсолютный характер, а максимум экстремален только среди дуг окружностей; в действительности
для более высокого положения энергия имеет минимакс.
Можно обобщить задачу Дидо, предположив, что требуется охватить наиболее ценный участок, причем стоимость единицы площади не
постоянна, а зависит, например, от расстояния до моря. Элементарно
решить такую обобщенную задачу уже нельзя, Однако ее можно решить с помощью уравнения Эйлера, заметив, что вместо (59) в данном
случае надо максимизировать интеграл

b

y

a

0

∫ F (y) dx, где F (y) = ∫ ϕ(η) dη,

а ϕ(η) — стоимость единицы площади на расстоянии η от моря.
(Если ϕ(η) ≡ 1, то мы возвращаемся к (59).)
Рассмотрим еще одну задачу на условный экстремум, именно задачу о распределении зарядов в проводнике. Представим себе уединенный проводник (Ω) любой формы, на который помещено количество
электричества q. Это количество разместится на проводнике с плотностью ρ, которую и нужно найти.
Для решения этой задачи вспомним формулу (Х.23) для потенциала,
порожденного распределенным зарядом, которую перепишем в виде
ϕ(r ) =



(Ω )

ρ(r0 )
dΩ 0 .
r − r0

454

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Поэтому полная потенциальная энергия заряда равна
U=

ρ(r0 )ρ(r ) dΩ dΩ 0
1
1
1
.
ϕ(r ) dq = ∫ ϕ(r )ρ(r ) dΩ = ∫ ∫
r − r0
2 ( ∫Ω )
2 (Ω )
2 (Ω ) (Ω )

Согласно общему принципу статического равновесия этот интеграл
должен принимать минимальное (или, во всяком случае, стационарное) значение при условии

∫ ρ(r ) dΩ = q

( = const ),

(Ω )

так как заряды могут только перераспределяться, но не порождаться
или исчезать. Таким образом, получилась задача на условный экстремум. Чтобы ее решить, надо приравнять нулю вариацию δ(U − λq), где
λ —множитель Лагранжа.
Однако по формуле дифференциала произведения
δU =

δρ(r0 ) ⋅ ρ(r ) dΩ dΩ 0 1
ρ(r0 )δρ(r ) dΩ dΩ 0
1
.
+ ∫ ∫
r − r0
2 ( ∫Ω ) ( Ω∫ )
r − r0
2 (Ω ) (Ω )

Если в первом интеграле обозначить r через r 0 , а r 0 — через r , то мы
видим, что он равен второму, откуда
0 = δ(U − λq ) =

ρ(r0 )δρ(r ) dΩ dΩ 0
− λ ∫ δρ(r ) dΩ = ∫ [ϕ(r ) − λ ] δρ(r ) dΩ.
r − r0
(Ω ) (Ω )
(Ω )
(Ω )

∫ ∫

В силу произвольности δρ(r ) отсюда получаем ϕ(r ) − λ = 0, т.е.
ϕ(r ) = λ = const.
Итак, мы видим, что свободный заряд в проводнике располагается
так, что потенциал ϕ 0 во всех точках проводника одинаков; при этом
видно также, что множитель Лагранжа в этой задаче равен ϕ 0 (выведите последний результат из формулы (56)). К выводу о постоянстве
потенциала можно было прийти и из физических соображений: если
бы потенциал был в разных точках различным, то заряды, свободно перемещающиеся в проводнике, перетекали бы от областей с бо´льшим
потенциалом в области с меньшим потенциалом, так что статическое
равновесие при таких условиях невозможно.
Так как потенциал связан с зарядами известным уравнением Пуассона (Х.43), то из постоянства потенциала можно сделать вывод, что
внутри проводника ρ = 0, т.е. весь заряд располагается на поверхности
проводника. Впрочем, и к этому выводу можно прийти из физических
соображений.
При переходе через поверхность проводника потенциал имеет «излом» (рис. 179), т.е. разрыв в первой производной. Если выбрать оси

§ 8]

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

455

координат так, чтобы начало координат находилось в некоторой точке
поверхности проводника, а ось z пошла в направлении внешней нор∂ϕ
мали к этой поверхности, то производная
будет иметь скачок
∂z
∂2 ϕ
, а с ней и Δϕ будет иметь дельтообразную
−tgα. Поэтому
∂z 2
особенность вида −tgα δ( z ). С другой
стороны, если заряд расположен на поверхности с плотностью σ, то вблизи
рассматриваемой точки будетρ = σ δ( z ).
Поэтому уравнение (Х.43) дает
− tgα δ( z ) = −4πσ δ( z ), т.е. tgα = 4πσ.
В заключение отметим, что решение задачи на условный экстремум
всегда одновременно является решением некоторой «сопряженной» задачи на условный экстремум. Например,
в задаче Дидо тот же ответ получится,
если искать минимальную длину шнуРис. 179.
ра, охватывающего заданную площадь.
В самом деле, если бы некруговой контур ( L1 ) охватывал ту же площадь, что и круг ( L), причем L1 < L, то, подобно увеличивая контур
( L1 ), мы могли бы получить контур ( L2 ), L2 = L, охватывающий большую площадь, чем ( L), а это противоречит решению задачи Дидо.
Аналогично в задаче на потенциал можно было искать максимальный
заряд, который умещается на проводнике при заданном значении потенциальной энергии. В общем случае оказывается, что задача о стационарном значении величины A при условии постоянства величины B
и задача о стационарном значении величины B при условии постоянства величины A приводят к одним и тем же решениям. В самом
деле, они сводятся к задачам о стационарности величины A + λB или
B + μA = μ( A + λ 1 B) (λ 1 = 1 μ), т.е., в силу постоянства μ, величины
A + λ 1 B; значит, обе задачи равносильны.
Упражнения
1. Найдите тело вращения наибольшего объема, имеющее заданную площадь поверхности.
2. Найдите форму равновесия однородной тяжелой нити, подвешенной за
концы.
У к а з а н и е. Нить должна расположиться так, чтобы ее центр тяжести был
по возможности ниже.
3. В обеих задачах укажите смысл множителя Лагранжа.

454

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Поэтому полная потенциальная энергия заряда равна
U=

ρ(r0 )ρ(r ) dΩ dΩ 0
1
1
1
.
ϕ(r ) dq = ∫ ϕ(r )ρ(r ) dΩ = ∫ ∫
r − r0
2 ( ∫Ω )
2 (Ω )
2 (Ω ) (Ω )

Согласно общему принципу статического равновесия этот интеграл
должен принимать минимальное (или, во всяком случае, стационарное) значение при условии

∫ ρ(r ) dΩ = q

( = const ),

(Ω )

так как заряды могут только перераспределяться, но не порождаться
или исчезать. Таким образом, получилась задача на условный экстремум. Чтобы ее решить, надо приравнять нулю вариацию δ(U − λq), где
λ —множитель Лагранжа.
Однако по формуле дифференциала произведения
δU =

δρ(r0 ) ⋅ ρ(r ) dΩ dΩ 0 1
ρ(r0 )δρ(r ) dΩ dΩ 0
1
.
+ ∫ ∫
r − r0
2 ( ∫Ω ) ( Ω∫ )
r − r0
2 (Ω ) (Ω )

Если в первом интеграле обозначить r через r 0 , а r 0 — через r , то мы
видим, что он равен второму, откуда
0 = δ(U − λq ) =

ρ(r0 )δρ(r ) dΩ dΩ 0
− λ ∫ δρ(r ) dΩ = ∫ [ϕ(r ) − λ ] δρ(r ) dΩ.
r − r0
(Ω ) (Ω )
(Ω )
(Ω )

∫ ∫

В силу произвольности δρ(r ) отсюда получаем ϕ(r ) − λ = 0, т.е.
ϕ(r ) = λ = const.
Итак, мы видим, что свободный заряд в проводнике располагается
так, что потенциал ϕ 0 во всех точках проводника одинаков; при этом
видно также, что множитель Лагранжа в этой задаче равен ϕ 0 (выведите последний результат из формулы (56)). К выводу о постоянстве
потенциала можно было прийти и из физических соображений: если
бы потенциал был в разных точках различным, то заряды, свободно перемещающиеся в проводнике, перетекали бы от областей с бо´льшим
потенциалом в области с меньшим потенциалом, так что статическое
равновесие при таких условиях невозможно.
Так как потенциал связан с зарядами известным уравнением Пуассона (Х.43), то из постоянства потенциала можно сделать вывод, что
внутри проводника ρ = 0, т.е. весь заряд располагается на поверхности
проводника. Впрочем, и к этому выводу можно прийти из физических
соображений.
При переходе через поверхность проводника потенциал имеет «излом» (рис. 179), т.е. разрыв в первой производной. Если выбрать оси

§ 8]

УСЛОВНЫЙ ЭКСТРЕМУМ В ВАРИАЦИОННОМ ИСЧИСЛЕНИИ

455

координат так, чтобы начало координат находилось в некоторой точке
поверхности проводника, а ось z пошла в направлении внешней нор∂ϕ
мали к этой поверхности, то производная
будет иметь скачок
∂z
∂2 ϕ
, а с ней и Δϕ будет иметь дельтообразную
−tgα. Поэтому
∂z 2
особенность вида −tgα δ( z ). С другой
стороны, если заряд расположен на поверхности с плотностью σ, то вблизи
рассматриваемой точки будетρ = σ δ( z ).
Поэтому уравнение (Х.43) дает
− tgα δ( z ) = −4πσ δ( z ), т.е. tgα = 4πσ.
В заключение отметим, что решение задачи на условный экстремум
всегда одновременно является решением некоторой «сопряженной» задачи на условный экстремум. Например,
в задаче Дидо тот же ответ получится,
если искать минимальную длину шнуРис. 179.
ра, охватывающего заданную площадь.
В самом деле, если бы некруговой контур ( L1 ) охватывал ту же площадь, что и круг ( L), причем L1 < L, то, подобно увеличивая контур
( L1 ), мы могли бы получить контур ( L2 ), L2 = L, охватывающий большую площадь, чем ( L), а это противоречит решению задачи Дидо.
Аналогично в задаче на потенциал можно было искать максимальный
заряд, который умещается на проводнике при заданном значении потенциальной энергии. В общем случае оказывается, что задача о стационарном значении величины A при условии постоянства величины B
и задача о стационарном значении величины B при условии постоянства величины A приводят к одним и тем же решениям. В самом
деле, они сводятся к задачам о стационарности величины A + λB или
B + μA = μ( A + λ 1 B) (λ 1 = 1 μ), т.е., в силу постоянства μ, величины
A + λ 1 B; значит, обе задачи равносильны.
Упражнения
1. Найдите тело вращения наибольшего объема, имеющее заданную площадь поверхности.
2. Найдите форму равновесия однородной тяжелой нити, подвешенной за
концы.
У к а з а н и е. Нить должна расположиться так, чтобы ее центр тяжести был
по возможности ниже.
3. В обеих задачах укажите смысл множителя Лагранжа.

456

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 9]

ЗАДАЧИ НА ЭКСТРЕМУМ С ОГРАНИЧЕНИЯМИ

457

§ 9. Задачи на экстремум с ограничениями
Остановимся еще на одном классе задач на экстремум, получивших
широкое распространение в последние годы. Речь идет о задачах, в которых на искомые величины или на искомую функцию наложены дополнительные ограничения, имеющие вид н е р а в е н с т в.
Начнем с самого простого случая. Пусть ищется экстремум функции y = f (x), причем изменение независимой переменной х ограничено неравенствами a  x  b (рис. 180).
Тогда возможны как внутренние экстремумы (на рис. 180 максимум при x = c
и минимум при x = d ), так и концевые
экстремумы (на рис. 180 концевой минимум при x = a и концевой максимум
при x = b). При нахождении внутренних экстремумов можно воспользоваться условием стационарности y ′ = 0, тогРис. 180.
да как для концевых экстремумов это
условие не действует, т.е. эти последние имеют характер «острых» экстремумов (ср., например, ВМ, § III.2).
Пусть теперь ищется экстремум функции двух переменных
z = f (x, y), причем независимые переменные связаны ограничением
F (x, y)0; мы предположим, что это неравенство определяет в плоскости аргументов x, y некоторую конечную область (S ) с границей ( L)
(рис. 181), на которой F ≡ 0. Функция f может иметь как внутренние
экстремумы, достигающиеся внутри (S ), так и граничные экстремумы, достигающиеся на ( L). Для нахождения первых можно воспользоваться условиями стационарности, разобранными в § IV.6. Однако, как
и в одномерном случае, для граничных экстремумов эти условия не действуют. Для нахождения граничных экстремумов можно заметить,
что если в некоторой точке M (рис. 181) функция f имеет экстремум, например минимум, то значение f (M ) меньше всех значений f на ( L) вблизи M. Поэтому в точке M одновременно достигается минимум функции f при условии F = 0, а такие точки можно
разыскать по методу § 7. Итак, граничные экстремумы ищутся по правилу нахождения условных экстремумов. Задачи на экстремум с ограничениями встречаются и в вариационном вычислении. Рассмотрим
в качестве примера задачу о кривой наибыстрейшего спуска, решенную
в § 4, но предположим дополнительно, что точке в процессе падения запрещено скатываться ниже конечной точки, т.е. на искомое решение
наложено неравенство y  y b . Изобразим циклоиды с острием в начальной точке A (рис. 182); при этом искомая линия должна целиком
пройти в заштрихованной зоне. Ясно, что если конечная точка лежит
левее B, например в положении B1 , то искомой линией служит дуга

Рис. 181.

Рис. 182.

циклоиды AB1 , так как это решение является наилучшим для всех линий и удовлетворяет поставленному неравенству. Но что будет, если
конечная точка лежит правее B, например в положении B2 ?
Прежде всего заметим, что та часть искомой линии, которая лежит
строго внутри (не на границе) заштрихованной зоны, удовлетворяет
уравнению Эйлера и потому представляет собой циклоиду. В самом
деле, если вся линия служит решением поставленной задачи, то и любая
ее дуга служит линией наибыстрейшего спуска между своими концами*.
Таким образом, искомая линия может состоять из интегральных линий
уравнения Эйлера (такие линии называются экстремалями) и линий,
лежащих на границе заштрихованной зоны. Но теперь можно понять,
что искомая линия состоит из дуги циклоиды AB и отрезка B B2 . В самом деле, возьмем любую другую возможную линию, например
AB1 B B2 . Тогда и на своем участке AB1 B она должна быть решением
задачи на минимум, что несправедливо, так как дуга циклоиды AB дает меньшее время падения. Легко убедиться, что нужно взять
дугу именно той циклоиды, для которой B наиболее сдвинуто вправо,
т.е. циклоиды, к а с а ю щ е й с я нижней прямой.
Таким образом, решение вариационной задачи с ограничениями может лишь частично или совсем не удовлетворять условию стационарности (уравнению Эйлера); это решение, как и для функций одного
переменного, имеет характер острого экстремума.
Задачи на экстремум с ограничениями могут возникать в процессах
управления. Например, при управлении движением какого-либо объекта может быть поставлена задача так поворачивать рули, чтобы за
кратчайшее время вывести его на заданную траекторию. Так как искомым является закон поворота рулей во времени, то получается вариационная задача. При этом если рули имеют ограничители поворота

* Дуга АС между точкой A и любой точкой C, лежащей между A и B, есть линия
наибыстрейшего спуска с нулевой начальной скоростью, т.е. решает такую же задачу, которая ставилась при определении АB. Легко доказать, что дуга той же линии между двумя промежуточными точками C ′ и C ′′ решает задачу наибыстрейшего спуска при
заданной, ненулевой начальной скорости в C ′, соответствующей разности высот A и C ′.

456

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 9]

ЗАДАЧИ НА ЭКСТРЕМУМ С ОГРАНИЧЕНИЯМИ

457

§ 9. Задачи на экстремум с ограничениями
Остановимся еще на одном классе задач на экстремум, получивших
широкое распространение в последние годы. Речь идет о задачах, в которых на искомые величины или на искомую функцию наложены дополнительные ограничения, имеющие вид н е р а в е н с т в.
Начнем с самого простого случая. Пусть ищется экстремум функции y = f (x), причем изменение независимой переменной х ограничено неравенствами a  x  b (рис. 180).
Тогда возможны как внутренние экстремумы (на рис. 180 максимум при x = c
и минимум при x = d ), так и концевые
экстремумы (на рис. 180 концевой минимум при x = a и концевой максимум
при x = b). При нахождении внутренних экстремумов можно воспользоваться условием стационарности y ′ = 0, тогРис. 180.
да как для концевых экстремумов это
условие не действует, т.е. эти последние имеют характер «острых» экстремумов (ср., например, ВМ, § III.2).
Пусть теперь ищется экстремум функции двух переменных
z = f (x, y), причем независимые переменные связаны ограничением
F (x, y)0; мы предположим, что это неравенство определяет в плоскости аргументов x, y некоторую конечную область (S ) с границей ( L)
(рис. 181), на которой F ≡ 0. Функция f может иметь как внутренние
экстремумы, достигающиеся внутри (S ), так и граничные экстремумы, достигающиеся на ( L). Для нахождения первых можно воспользоваться условиями стационарности, разобранными в § IV.6. Однако, как
и в одномерном случае, для граничных экстремумов эти условия не действуют. Для нахождения граничных экстремумов можно заметить,
что если в некоторой точке M (рис. 181) функция f имеет экстремум, например минимум, то значение f (M ) меньше всех значений f на ( L) вблизи M. Поэтому в точке M одновременно достигается минимум функции f при условии F = 0, а такие точки можно
разыскать по методу § 7. Итак, граничные экстремумы ищутся по правилу нахождения условных экстремумов. Задачи на экстремум с ограничениями встречаются и в вариационном вычислении. Рассмотрим
вкачестве примера задачу о кривой наибыстрейшего спуска, решенную
в § 4, но предположим дополнительно, что точке в процессе падения запрещено скатываться ниже конечной точки, т.е. на искомое решение
наложено неравенство y  y b . Изобразим циклоиды с острием в начальной точке A (рис. 182); при этом искомая линия должна целиком
пройти в заштрихованной зоне. Ясно, что если конечная точка лежит
левее B, например в положении B1 , то искомой линией служит дуга

Рис. 181.

Рис. 182.

циклоиды AB1 , так как это решение является наилучшим для всех линий и удовлетворяет поставленному неравенству. Но что будет, если
конечная точка лежит правее B, например в положении B2 ?
Прежде всего заметим, что та часть искомой линии, которая лежит
строго внутри (не на границе) заштрихованной зоны, удовлетворяет
уравнению Эйлера и потому представляет собой циклоиду. В самом
деле, если вся линия служит решением поставленной задачи, то и любая
ее дуга служит линией наибыстрейшего спуска между своими концами*.
Таким образом, искомая линия может состоять из интегральных линий
уравнения Эйлера (такие линии называются экстремалями) и линий,
лежащих на границе заштрихованной зоны. Но теперь можно понять,
что искомая линия состоит из дуги циклоиды AB и отрезка B B2 . В самом деле, возьмем любую другую возможную линию, например
AB1 B B2 . Тогда и на своем участке AB1 B она должна быть решением
задачи на минимум, что несправедливо, так как дуга циклоиды AB дает меньшее время падения. Легко убедиться, что нужно взять
дугу именно той циклоиды, для которой B наиболее сдвинуто вправо,
т.е. циклоиды, к а с а ю щ е й с я нижней прямой.
Таким образом, решение вариационной задачи с ограничениями может лишь частично или совсем не удовлетворять условию стационарности (уравнению Эйлера); это решение, как и для функций одного
переменного, имеет характер острого экстремума.
Задачи на экстремум с ограничениями могут возникать в процессах
управления. Например, при управлении движением какого-либо объекта может быть поставлена задача так поворачивать рули, чтобы за
кратчайшее время вывести его на заданную траекторию. Так как искомым является закон поворота рулей во времени, то получается вариационная задача. При этом если рули имеют ограничители поворота

* Дуга АС между точкой A и любой точкой C, лежащей между A и B, есть линия
наибыстрейшего спуска с нулевой начальной скоростью, т.е. решает такую же задачу, которая ставилась при определении АB. Легко доказать, что дуга той же линии между двумя промежуточными точками C ′ и C ′′ решает задачу наибыстрейшего спуска при
заданной, ненулевой начальной скорости в C ′, соответствующей разности высот A и C ′.

458

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

(предназначенные, например, для ограничения центробежных сил), то
получается задача с ограничениями. При оптимальном процессе управления, полученном в результате решения вариационной задачи, имеются интервалы времени, когда рули лежат на ограничителях, т.е. решение
проходит по границе области, в которой оно может находиться. При подходе к этой границе решение должно удовлетворять определенным
условиям, которые мы здесь не рассматриваем.
Упражнения
1. Найдите наибольшее и наименьшее значения функции z = x 2 − y 2 − x + y
в треугольнике, ограниченном прямыми x = 0, y = 0, x + y = 2.
2. Найдите положение однородной тяжелой нити длины L > 2, подвешенной в точках ( −1; 1) и (1; 1), если эта нить расположена в верхней полуплоскости y0.

§ 10. Вариационные принципы. Принцип Ферма в оптике
Помимо отдельных задач вариационного характера, примеры которых были разобраны в предыдущих параграфах, имеются вариационные принципы, каждый из которых применим к анализу широкого
класса явлений. Каждый из этих принципов обычно утверждает, что из
всех состояний, процессов и т.п., которые допустимы при имеющихся
связях, ограничениях в рассматриваемой физической системе, на самом деле реализуется такое состояние, такой процесс и т.п., для которых некоторый (вполне определенный для данного принципа) функционал принимает стационарное значение. Каждый из этих принципов
дает возможность единообразного рассмотрения многих задач, включения их в единую теорию и поэтому часто является значительным научным достижением.
Один из наиболее важных и общих принципов физики был уже продемонстрирован нами на большом числе примеров. Он состоит в том,
что из всех возможных положений физической системы, допустимых
при заданных связях, равновесным является такое, при котором потенциальная энергия рассматриваемой системы имеет стационарное значение (а при устойчивом равновесии системы имеет минимальное
значение). Если система имеет конечное число степеней свободы, то
потенциальную энергию можно выразить в виде функции конечного
числа обобщенных координат (см. § IV.8), так что применение указанного принципа сводится к нахождению минимума функции нескольких переменных (см. § IV.6). Если же рассматравается сплошная среда,
состояние которой описывается некоторой функцией координат (или
системой таких функций), то потенциальная энергия является функционалом, и применение этого принципа производится на основе методов вариационного исчисления, подобно тому как это было сделано
ранее.

§ 10]

ВАРИАЦИОННЫЕ ПРИНЦИПЫ. ПРИНЦИП ФЕРМА В ОПТИКЕ

459

Одним из первых в истории науки был вариационный принцип
Ферма в оптике, который утверждает, что из всех мыслимых путей, соединяющих две заданные точки, луч света избирает такой, который он
проходит за минимальное время. Чтобы записать принцип Ферма математически, напомним, что скорость света с в пустоте имеет вполне
определенное значение, тогда как в прозрачной среде эта скорость равc
на , где n > 1 — «показатель преломления» среды, зависящий, вообn
ще говоря, не только от среды, но и от длины световой волны. Мы будем
для простоты рассматривать случай, когда n не зависит от длины волны и потому в каждой среде будет иметь вполне определенное значеc n
ние. Так как путь dL проходится светом за время dt = dL : = dL, то
n c
время t прохождения данного пути ( L) вычисляется по формуле
t=

1
n dL.
c (∫L )

(64)

Таким образом, мы имеем функционал, зависящий от выбора пути, соединяющего две точки, так что задача о нахождении формы светового
луча является вариационной задачей.
Из принципа Ферма можно вывести основные законы распространения света.
Например, в случае распространения света в среде с постоянной
оптической плотностью, т.е. постоянной скоростью света, принцип
Ферма приводит к выводу, что свет распространяется по прямой линии
(рис. 183, где через И обозначен источник
света, а через A — точка наблюдения), так
как прямая ИA короче любой другой лиРис. 183.
нии, соединяющей точки И и A.
Отсюда в свою очередь вытекает, что если путь света состоит из нескольких участков (например, между последовательными отражениями,
преломлениями и т.д.), каждый из которых проходит в среде постоянной
оптической плотности, то каждый из этих участков представляет собой
отрезок прямой, а весь путь — ломаную линию. Для определения этого
пути требуется найти координаты вершин ломаной, т.е. здесь имеется
лишь конечное число степеней свободы. Поэтому такие задачи решаются
средствами дифференциального исчисления. В частности, таким способом, при помощи решения задачи на минимум, легко вывести законы отражения света от плоской поверхности и преломления его при переходе
через плоскую поверхность раздела двух сред (см., например, ВМ, § III.1).
Таким образом, действительно, принцип Ферма приводит к правильным, согласующимся с опытом выводам для отражения и преломления света.

458

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

(предназначенные, например, для ограничения центробежных сил), то
получается задача с ограничениями. При оптимальном процессе управления, полученном в результате решения вариационной задачи, имеются интервалы времени, когда рули лежат на ограничителях, т.е. решение
проходит по границе области, в которой оно может находиться. При подходе к этой границе решение должно удовлетворять определенным
условиям, которые мы здесь не рассматриваем.
Упражнения
1. Найдите наибольшее и наименьшее значения функции z = x 2 − y 2 − x + y
в треугольнике, ограниченном прямыми x = 0, y = 0, x + y = 2.
2. Найдите положение однородной тяжелой нити длины L > 2, подвешенной в точках ( −1; 1) и (1; 1), если эта нить расположена в верхней полуплоскости y0.

§ 10. Вариационные принципы. Принцип Ферма в оптике
Помимо отдельных задач вариационного характера, примеры которых были разобраны в предыдущих параграфах, имеются вариационные принципы, каждый из которых применим к анализу широкого
класса явлений. Каждый из этих принципов обычно утверждает, что из
всех состояний, процессов и т.п., которые допустимы при имеющихся
связях, ограничениях в рассматриваемой физической системе, на самом деле реализуется такое состояние, такой процесс и т.п., для которых некоторый (вполне определенный для данного принципа) функционал принимает стационарное значение. Каждый из этих принципов
дает возможность единообразного рассмотрения многих задач, включения их в единую теорию и поэтому часто является значительным научным достижением.
Один из наиболее важных и общих принципов физики был уже продемонстрирован нами на большом числе примеров. Он состоит в том,
что из всех возможных положений физической системы, допустимых
при заданных связях, равновесным является такое, при котором потенциальная энергия рассматриваемой системы имеет стационарное значение (а при устойчивом равновесии системы имеет минимальное
значение). Если система имеет конечное число степеней свободы, то
потенциальную энергию можно выразить в виде функции конечного
числа обобщенных координат (см. § IV.8), так что применение указанного принципа сводится к нахождению минимума функции нескольких переменных (см. § IV.6). Если же рассматравается сплошная среда,
состояние которой описывается некоторой функцией координат (или
системой таких функций), то потенциальная энергия является функционалом, и применение этого принципа производится на основе методов вариационного исчисления, подобно тому как это было сделано
ранее.

§ 10]

ВАРИАЦИОННЫЕ ПРИНЦИПЫ. ПРИНЦИП ФЕРМА В ОПТИКЕ

459

Одним из первых в истории науки был вариационный принцип
Ферма в оптике, который утверждает, что из всех мыслимых путей, соединяющих две заданные точки, луч света избирает такой, который он
проходит за минимальное время. Чтобы записать принцип Ферма математически, напомним, что скорость света с в пустоте имеет вполне
определенное значение, тогда как в прозрачной среде эта скорость равc
на , где n > 1 — «показатель преломления» среды, зависящий, вообn
ще говоря, не только от среды, но и от длины световой волны. Мы будем
для простоты рассматривать случай, когда n не зависит от длины волны и потому в каждой среде будет иметь вполне определенное значеc n
ние. Так как путь dL проходится светом за время dt = dL : = dL, то
n c
время t прохождения данного пути ( L) вычисляется по формуле
t=

1
n dL.
c (∫L )

(64)

Таким образом, мы имеем функционал, зависящий от выбора пути, соединяющего две точки, так что задача о нахождении формы светового
луча является вариационной задачей.
Из принципа Ферма можно вывести основные законы распространения света.
Например, в случае распространения света в среде с постоянной
оптической плотностью, т.е. постоянной скоростью света, принцип
Ферма приводит к выводу, что свет распространяется по прямой линии
(рис. 183, где через И обозначен источник
света, а через A — точка наблюдения), так
как прямая ИA короче любой другой лиРис. 183.
нии, соединяющей точки И и A.
Отсюда в свою очередь вытекает, что если путь света состоит из нескольких участков (например, между последовательными отражениями,
преломлениями и т.д.), каждый из которых проходит в среде постоянной
оптической плотности, то каждый из этих участков представляет собой
отрезок прямой, а весь путь — ломаную линию. Для определения этого
пути требуется найти координаты вершин ломаной, т.е. здесь имеется
лишь конечное число степеней свободы. Поэтому такие задачи решаются
средствами дифференциального исчисления. В частности, таким способом, при помощи решения задачи на минимум, легко вывести законы отражения света от плоской поверхности и преломления его при переходе
через плоскую поверхность раздела двух сред (см., например, ВМ, § III.1).
Таким образом, действительно, принцип Ферма приводит к правильным, согласующимся с опытом выводам для отражения и преломления света.

460

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Рассмотрим теперь отражение света от искривленной поверхности, касаOII II
ющейся плоскости в той точке О,
II
O
в
которой происходило бы отражение
x
Oп O
I
I
в случае плоскости (рис. 184). На риI
Рис. 184.
сунке показаны два примера таких поверхностей, изогнутых в противоположные стороны: IOI, касающаяся снизу, и IIOII, касающаяся сверху
оси абсцисс. (Мы рассматриваем цилиндрические поверхности с образующими, перпендикулярными плоскости чертежа.)
Можно показать, что при этом достаточно рассматривать лучи, лежащие в плоскости рисунка, и сечения отражающих поверхностей
плоскостью чертежа. Поэтому в дальнейшем будем говорить не об отражающей плоскости, а об отражающей прямой, не об отражающих
кривых поверхностях, а об отражающих кривых линиях IOI и IIOII
в плоскости рис. 184.
Для рассмотрения задачи не надо конкретных вычислений. Известно (см., например, ВМ, § II.17), что расстояние между кривой и касательной пропорционально (x − x 0 )2 , где x 0 обозначает абсциссу точки касания О.
Рассмотрим длины ломаных LП (ИO П A), LI (ИO I A) и LII (ИO II A).
Сами эти ломаные на рис. 184 не показаны, чтобы не затенять чертеж,
точки O П , O I , O II , как видно на рисунке, лежат правее точки касания О,
при одном и том же значении x; при этом O П лежит на прямой, O I —
на нижней линии I, O II — на верхней линии II. Видя на рисунке точки И, A, O П , O I , O II , нетрудно представить себе и ломаные линии.
Абсциссы O П , O I , O II одинаковы. Ординаты O П , O I и O II отличаются на величину, пропорциональную (x − x 0 )2 . Следовательно,
и длины LП , LI , LII отличаются только на величину, пропорциональную (x − x 0 )2 . Запишем разложения LП , LI и LII в ряд Тейлора по степеням (x − x 0 ):
И

A

( x − x0 )2
L′′П ( x0 ) + ... ,
2
2
( x − x0 )
LI ( x ) = LI ( x0 ) + ( x − x0 )L′I ( x0 ) +
L′′I ( x0 ) + ... ,
2
( x − x0 )2
LII ( x ) = LII ( x0 ) + ( x − x0 )L′II ( x0 ) +
L′′II ( x0 ) + ... .
2
LП ( x ) = LП ( x0 ) + ( x − x0 )L′П ( x0 ) +

Раз LП , LI и LII отличаются
(x − x 0 )2 , значит,

только

на

величину

порядка

LП ( x0 ) = LI ( x0 ) = LII ( x0 ) ,

(65)

LП′ ( x0 ) = LI′ ( x0 ) = LII
′ ( x0 ) ( = 0 ),

(66)

L′′П ( x0 ) ≠ L′′I ( x0 ) ≠ L′′II ( x0 ).

(67)

§ 10]

ВАРИАЦИОННЫЕ ПРИНЦИПЫ. ПРИНЦИП ФЕРМА В ОПТИКЕ

461

Первые из этих равенств, (65), суть очевидные следствия того, что
все три линии — прямая П, кривая I и кривая II — проходят через
одну точку O, x = x 0 .
Вторые равенства, (66), получились благодаря тому, что в точке O
указанные три линии касаются друг друга, а угол падения луча равен
углу его отражения.
Мы знаем, что равенство нулю производной означает, что LП , LI
и LII как функции х могут иметь при x = x 0 минимум или максимум. Будет ли это именно минимум, а не максимум, определяется знаком второй производной.
Для прямой мы имеем минимум, LП′′ > 0. Однако, мы видим из (67),
что отсюда нельзя сделать вывод для кривых линий I и II. В частности, для линии II при достаточной кривизне ее длина LII имеет в точке О, при x = x 0 , именно максимум, а не минимум. Благодаря подъему
кривой II слева и справа от O путь ИO II A короче ИOA, путь ИOA
является наиболее длинным из всех соседних путей из точки И в какую-либо точку линии II и оттуда в точку А.
Опыт показывает, что и в случае кривой II отражение происходит
в точке O, т.е. в той точке, где длина пути имеет максимум; очевидно,
в этой точке по-прежнему угол падения равен углу отражения.
Тот факт, что длина пути может быть не минимумом, а максимумом,
очень важен для понимания смысла и происхождения принципа Ферма. Очевидно, что этот принцип не есть следствие какого-то «стремления» света выбирать кратчайшие пути: в случае такого «стремления»
свету было бы небезразлично, имеем ли мы дело с минимумом или
с максимумом.
На самом деле принцип Ферма есть следствие того, что распространение света есть распространение волн, в которых электрическое и магнитное поля очень быстро (1015 раз в секунду в случае видимого света)
меняют свой знак. Соответственно очень мала и длина волны света.
В данный момент в точках, находящихся на расстоянии половины длины
волны друг от друга, знак поля противоположный. Пусть в определенный момент в точке И (источнике света) поле имело отрицательный
знак. Знак поля в точке A зависит от того, сколько раз успевает измениться знак на пути от И до A. Если мы рассмотрим два соседних
пути от И до A, то при одинаковой длине путей те поля, которые придут в точку A из И по этим путям, будут иметь одинаковый знак; они
сложатся, усиливая друг друга.
Если длины путей разные, то поля могут оказаться с одинаковым
знаком, а могут оказаться с разным знаком и в среднем взаимно уничтожатся. В этом причина того, что для распространения света играют
роль пучки лучей одинаковой длины, с одинаковым временем распространения.

460

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Рассмотрим теперь отражение света от искривленной поверхности, касаOII II
ющейся плоскости в той точке О,
II
O
в
которой происходило бы отражение
x
Oп O
I
I
в случае плоскости (рис. 184). На риI
Рис. 184.
сунке показаны два примера таких поверхностей, изогнутых в противоположные стороны: IOI, касающаяся снизу, и IIOII, касающаяся сверху
оси абсцисс. (Мы рассматриваем цилиндрические поверхности с образующими, перпендикулярными плоскости чертежа.)
Можно показать, что при этом достаточно рассматривать лучи, лежащие в плоскости рисунка, и сечения отражающих поверхностей
плоскостью чертежа. Поэтому в дальнейшем будем говорить не об отражающей плоскости, а об отражающей прямой, не об отражающих
кривых поверхностях, а об отражающих кривых линиях IOI и IIOII
в плоскости рис. 184.
Для рассмотрения задачи не надо конкретных вычислений. Известно (см., например, ВМ, § II.17), что расстояние между кривой и касательной пропорционально (x − x 0 )2 , где x 0 обозначает абсциссу точки касания О.
Рассмотрим длины ломаных LП (ИO П A), LI (ИO I A) и LII (ИO II A).
Сами эти ломаные на рис. 184 не показаны, чтобы не затенять чертеж,
точки O П , O I , O II , как видно на рисунке, лежат правее точки касания О,
при одном и том же значении x; при этом O П лежит на прямой, O I —
на нижней линии I, O II — на верхней линии II. Видя на рисунке точки И, A, O П , O I , O II , нетрудно представить себе и ломаные линии.
Абсциссы O П , O I , O II одинаковы. Ординаты O П , O I и O II отличаются на величину, пропорциональную (x − x 0 )2 . Следовательно,
и длины LП , LI , LII отличаются только на величину, пропорциональную (x − x 0 )2 . Запишем разложения LП , LI и LII в ряд Тейлора по степеням (x − x 0 ):
И

A

( x − x0 )2
L′′П ( x0 ) + ... ,
2
2
( x − x0 )
LI ( x ) = LI ( x0 ) + ( x − x0 )L′I ( x0 ) +
L′′I ( x0 ) + ... ,
2
( x − x0 )2
LII ( x ) = LII ( x0 ) + ( x − x0 )L′II ( x0 ) +
L′′II ( x0 ) + ... .
2
LП ( x ) = LП ( x0 ) + ( x − x0 )L′П ( x0 ) +

Раз LП , LI и LII отличаются
(x − x 0 )2 , значит,

только

на

величину

порядка

LП ( x0 ) = LI ( x0 ) = LII ( x0 ) ,

(65)

LП′ ( x0 ) = LI′ ( x0 ) = LII
′ ( x0 ) ( = 0 ),

(66)

L′′П ( x0 ) ≠ L′′I ( x0 ) ≠ L′′II ( x0 ).

(67)

§ 10]

ВАРИАЦИОННЫЕ ПРИНЦИПЫ. ПРИНЦИП ФЕРМА В ОПТИКЕ

461

Первые из этих равенств, (65), суть очевидные следствия того, что
все три линии — прямая П, кривая I и кривая II — проходят через
одну точку O, x = x 0 .
Вторые равенства, (66), получились благодаря тому, что в точке O
указанные три линии касаются друг друга, а угол падения луча равен
углу его отражения.
Мы знаем, что равенство нулю производной означает, что LП , LI
и LII как функции х могут иметь при x = x 0 минимум или максимум. Будет ли это именно минимум, а не максимум, определяется знаком второй производной.
Для прямой мы имеем минимум, LП′′ > 0. Однако, мы видим из (67),
что отсюда нельзя сделать вывод для кривых линий I и II. В частности, для линии II при достаточной кривизне ее длина LII имеет в точке О, при x = x 0 , именно максимум, а не минимум. Благодаря подъему
кривой II слева и справа от O путь ИO II A короче ИOA, путь ИOA
является наиболее длинным из всех соседних путей из точки И в какую-либо точку линии II и оттуда в точку А.
Опыт показывает, что и в случае кривой II отражение происходит
в точке O, т.е. в той точке, где длина пути имеет максимум; очевидно,
в этой точке по-прежнему угол падения равен углу отражения.
Тот факт, что длина пути может быть не минимумом, а максимумом,
очень важен для понимания смысла и происхождения принципа Ферма. Очевидно, что этот принцип не есть следствие какого-то «стремления» света выбирать кратчайшие пути: в случае такого «стремления»
свету было бы небезразлично, имеем ли мы дело с минимумом или
с максимумом.
На самом деле принцип Ферма есть следствие того, что распространение света есть распространение волн, в которых электрическое и магнитное поля очень быстро (1015 раз в секунду в случае видимого света)
меняют свой знак. Соответственно очень мала и длина волны света.
В данный момент в точках, находящихся на расстоянии половины длины
волны друг от друга, знак поля противоположный. Пусть в определенный момент в точке И (источнике света) поле имело отрицательный
знак. Знак поля в точке A зависит от того, сколько раз успевает измениться знак на пути от И до A. Если мы рассмотрим два соседних
пути от И до A, то при одинаковой длине путей те поля, которые придут в точку A из И по этим путям, будут иметь одинаковый знак; они
сложатся, усиливая друг друга.
Если длины путей разные, то поля могут оказаться с одинаковым
знаком, а могут оказаться с разным знаком и в среднем взаимно уничтожатся. В этом причина того, что для распространения света играют
роль пучки лучей одинаковой длины, с одинаковым временем распространения.

462

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Равенство нулю производной длины пути по координате точки от!
ражения означает, что по крайней мере с точностью до членов порядка
(x − x 0 )2 длины путей одинаковы, волны, прошедшие через точку О
и ближайшие, соседние к ней, взаимно усиливаются. С этой точки зре!
ния, очевидно, безразлично, имеем мы дело с минимумом или макси!
мумом, L ′′ > 0 или L ′′ < 0. Более того, очевидно, что наилучшие
условия отражения получаются, когда длина пути на возможно боль!
шем участке отражающей поверхности одинакова. Значит, желательно,
чтобы было L ′′ = 0; тогда зависимость L от x, при малых x, еще сла!
бее — только в членах (x − x 0 ) 3 и более высоких. Физически L ′′ = 0
соответствует такой кривизне отражающей линии, при которой зерка!
ло собирает, фокусирует в точке A лучи, вышедшие из И.
В геометрической оптике лучи рассматриваются как геометричес!
кие линии. На примере отражения мы только что видели, что законы
геометрической оптики являются следствием волновой природы света.
При этом рассматривался не один луч, а пучок соседних лучей.
Можно дать оценку толщины этого пучка. Складываются между собой
амплитуды тех волн, у которых длина пути от И до A отличается мень!
λ
ше, чем на половину длины волны. Составим условие L(x) − L(x 0 ) = .
2
(x − x 0 )2
Вблизи точки отражения L ′(x 0 ) = 0, L(x) − L(x 0 ) =
L ′′(x 0 ) ,
2
λ
откуда x − x 0 =
. Таким образом, в действительности свет
L ′′(x 0 )
отражается не в одной точке зеркала, а на пятнышке, размеры которого,
как видно из формулы, только стремятся к нулю при стремлении к ну!
лю длины волны.
На основании принципа Ферма можно рассмотреть и более слож!
ную задачу о форме луча света в среде с постепенно меняющейся опти!
ческой плотностью, например луча света, идущего от звезды к наблю!
дателю, если учитывать постепенное изменение плотности атмосферы.
Форма луча в этом случае криволинейная и определится из условия
стационарного значения (обычно минимума) интеграла (64). В некото!
рых случаях интегрирование соответствующего уравнения Эйлера
можно довести до квадратур. Рассмотрим, например, распространение
света в плоскости x, y, если скорость света зависит только от высоты
y, т.е. n = n(y). Переписав (64) в виде
ct =

∫ n( y )

1 + y′ 2 dx,

(L )

можно воспользоваться промежуточным интегралом (34) уравнения

§ 10]

ВАРИАЦИОННЫЕ ПРИНЦИПЫ. ПРИНЦИП ФЕРМА В ОПТИКЕ

463

Эйлера, что даст
n ( y ) 1 + y′ 2 − n ( y )

y′
1 + y′

2

y′ = C1 ,

т.е.

= dx,

C1 ∫

n( y )
1 + y′ 2

= C1 .

Отсюда легко находим
y′ =

[n ( y )]2 − C12
dy
,
=
dx
C1

C1 dy
2

[n ( y )]

− C12

dy
[n ( y )]2 − C12

= x + C2.

Если последний интеграл при том или ином специальном виде функ!
ции n(y) удастся взять, то мы получим уравнение луча в конечном
виде; в противном случае интеграл можно вычислить приближенно
n0
получается задача, решенная
(гл. I). Интересно, что при n =
y0 − y
в § 4, т.е. свет распространяется по циклоидам, а при n = n0 y получает!
ся задача, решенная в § 5, т.е. свет распространяется по цепным линиям.
Заметим, что в общем случае, когда показатель преломления зави!
сит от частоты света, необходимо различать так называемые групповую
и фазовую скорости света в среде.
Фазовая скорость света c Φ дает соотношение между длиной вол!
ны и периодом колебаний
λ = c ΦT .

При этом все поля зависят от x и t гармонически
 2 πt 2 πx 
2 π


H , E  cos 
 = cos  ( cΦ t − x )
 T
λ 
λ



( знак пропорциональности). Величина, стоящая под знаком косину!
са, может быть названа фазой. Отсюда и происходит название «фазовая
скорость». Показатель преломления непосредственно характеризует
с
именно фазовую скорость c Φ = , где c — скорость света в пустоте.
n
От c Φ надо отличать так называемую групповую скорость света
c Γ . Групповая скорость входит в ответ на такой вопрос: через какое вре!
мя после открытия заслонки в точке 1 свет придет в точку 2, распрос!
траняясь в однородной среде? Ответ гласит t = r12 c Γ , а величина c Γ
выражается через показатель преломления так:
cΓ =

c
n+ω

dn


.

Следовательно, выражение c Γ равно c Φ лишь в том частном случае,
когда n не зависит от ω, c Γ = c Φ ; в общем случае они различны.

462

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Равенство нулю производной длины пути по координате точки от!
ражения означает, что по крайней мере с точностью до членов порядка
(x − x 0 )2 длины путей одинаковы, волны, прошедшие через точку О
и ближайшие, соседние к ней, взаимно усиливаются. С этой точки зре!
ния, очевидно, безразлично, имеем мы дело с минимумом или макси!
мумом, L ′′ > 0 или L ′′ < 0. Более того, очевидно, что наилучшие
условия отражения получаются, когда длина пути на возможно боль!
шем участке отражающей поверхности одинакова. Значит, желательно,
чтобы было L ′′ = 0; тогда зависимость L от x, при малых x, еще сла!
бее — только в членах (x − x 0 ) 3 и более высоких. Физически L ′′ = 0
соответствует такой кривизне отражающей линии, при которой зерка!
ло собирает, фокусирует в точке A лучи, вышедшие из И.
В геометрической оптике лучи рассматриваются как геометричес!
кие линии. На примере отражения мы только что видели, что законы
геометрической оптики являются следствием волновой природы света.
При этом рассматривался не один луч, а пучок соседних лучей.
Можно дать оценку толщины этого пучка. Складываются между собой
амплитуды тех волн, у которых длина пути от И до A отличается мень!
λ
ше, чем на половину длины волны. Составим условие L(x) − L(x 0 ) = .
2
(x − x 0 )2
Вблизи точки отражения L ′(x 0 ) = 0, L(x) − L(x 0 ) =
L ′′(x 0 ) ,
2
λ
откуда x − x 0 =
. Таким образом, в действительности свет
L ′′(x 0 )
отражается не в одной точке зеркала, а на пятнышке, размеры которого,
как видно из формулы, только стремятся к нулю при стремлении к ну!
лю длины волны.
На основании принципа Ферма можно рассмотреть и более слож!
ную задачу о форме луча света в среде с постепенно меняющейся опти!
ческой плотностью, например луча света, идущего от звезды к наблю!
дателю, если учитывать постепенное изменение плотности атмосферы.
Форма луча в этом случае криволинейная и определится из условия
стационарного значения (обычно минимума) интеграла (64). В некото!
рых случаях интегрирование соответствующего уравнения Эйлера
можно довести до квадратур. Рассмотрим, например, распространение
света в плоскости x, y, если скорость света зависит только от высоты
y, т.е. n = n(y). Переписав (64) в виде
ct =

∫ n( y )

1 + y′ 2 dx,

(L )

можно воспользоваться промежуточным интегралом (34) уравнения

§ 10]

ВАРИАЦИОННЫЕ ПРИНЦИПЫ. ПРИНЦИП ФЕРМА В ОПТИКЕ

463

Эйлера, что даст
n ( y ) 1 + y′ 2 − n ( y )

y′
1 + y′

2

y′ = C1 ,

т.е.

= dx,

C1 ∫

n( y )
1 + y′ 2

= C1 .

Отсюда легко находим
y′ =

[n ( y )]2 − C12
dy
,
=
dx
C1

C1 dy
2

[n ( y )]

− C12

dy
[n ( y )]2 − C12

= x + C2.

Если последний интеграл при том или ином специальном виде функ!
ции n(y) удастся взять, то мы получим уравнение луча в конечном
виде; в противном случае интеграл можно вычислить приближенно
n0
получается задача, решенная
(гл. I). Интересно, что при n =
y0 − y
в § 4, т.е. свет распространяется по циклоидам, а при n = n0 y получает!
ся задача, решенная в § 5, т.е. свет распространяется по цепным линиям.
Заметим, что в общем случае, когда показатель преломления зави!
сит от частоты света, необходимо различать так называемые групповую
и фазовую скорости света в среде.
Фазовая скорость света c Φ дает соотношение между длиной вол!
ны и периодом колебаний
λ = c ΦT .

При этом все поля зависят от x и t гармонически
 2 πt 2 πx 
2 π


H , E  cos 
 = cos  ( cΦ t − x )
 T
λ 
λ



( знак пропорциональности). Величина, стоящая под знаком косину!
са, может быть названа фазой. Отсюда и происходит название «фазовая
скорость». Показатель преломления непосредственно характеризует
с
именно фазовую скорость c Φ = , где c — скорость света в пустоте.
n
От c Φ надо отличать так называемую групповую скорость света
c Γ . Групповая скорость входит в ответ на такой вопрос: через какое вре!
мя после открытия заслонки в точке 1 свет придет в точку 2, распрос!
траняясь в однородной среде? Ответ гласит t = r12 c Γ , а величина c Γ
выражается через показатель преломления так:
cΓ =

c
n+ω

dn


.

Следовательно, выражение c Γ равно c Φ лишь в том частном случае,
когда n не зависит от ω, c Γ = c Φ ; в общем случае они различны.

464

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

Например, для рентгеновых лучей в среде n = 1 −

[Гл. XII

§ 11]

ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ

465

a

, показатель
ω2
преломления меньше 1. Значит, c Φ > c. Но это не значит, что сигнал
может распространяться со скоростью больше скорости света! В самом
деле, легко найдем
n+ω

dn
a
a
2a
=1− 2 + ω 3 =1+ 2 ,

ω
ω
ω

так что c Γ < c.
Опыт показывает, что в принцип Ферма входят именно n и c Φ ; тем
самым еще раз видно, что принцип Ферма не есть результат стремле!
ния света поскорей дойти из одной точки в другую. Дело именно в ус!
ловии сложения волн, зависящем от фазы волны.
Разницу между минимальностью и стационарностью значения
функционала в реальном процессе можно понять также на следующем
простом примере, взятом из статьи «Принцип наименьшего действия»
знаменитого немецкого физика!теоретика Макса Планка (1858–1947).
Путь свободной материальной точки, движущейся по поверхности без
воздействия внешних сил, представляет собой кратчайшую линию, со!
единяющую начальную и конечную точки пути. В частности, на сфере
такой линией служит дуга большого круга. Но если путь длиннее, чем
половина окружности большого круга, то значение его длины будет,
хотя и стационарным, но уже, как легко понять, не минимальным по
сравнению с длинами соседних путей. Это значение не будет и макси!
мальным, так как с помощью внесения извилин всегда можно, оставив
начало и конец пути без изменения, увеличить его длину. Это значение
имеет характер минимакса (см. § IV.6). Вспомнив высказывающуюся
одно время идею, что в природе господствует божественный промысел
и что в основе всякого явления природы лежит сознательное намере!
ние, направленное к определенной цели, причем эта цель достигается
кратчайшим путем и наилучшими средствами, Планк по этому поводу
не без ехидства замечает: «Значит, за пределами полуокружности
божественное провидение уже не действует».
Упражнения
1. Как известно, уравнение эллипса выводится из условия, что сумма рас!
стояний любой его точки K от двух точек F1 ( x1 = − c, y = 0 ) и F2 ( x2 = c, y = 0 ),
т.е. сумма F1 K + F2 K = L, одинакова для всех точек (рис. 185). Найдите уравне!
ния касательной и нормали к эллипсу в произвольной его точке K. Найдите
углы между линиями F1 K , F2 K и нормалью в точке K. Покажите, что все
лучи, вышедшие из F1 , проходят после отражения через F2 , а следовательно,
фокусируются в F2 .
2. Рассмотрите отражение от параболы y = x 2 параллельного пучка света,
идущего вниз по оси ординат (рис. 186). Считая, что свет идет из точки A,

Рис. 186.

Рис. 185.

xA = 0, yA = Y , и считая Y большим, замените на Y − yK расстояние AK,
равное xK2 + (Y − yK )2 . Найдите длину L = AKN и точку N , для которой
dL
= 0. Найдите уравнения касательной и нормали к параболе в точке K и
dxK
убедитесь в том, что для точки N удовлетворяется условие равенства угла па!
дения углу отражения.
3. Точки И и A находятся на высоте 1 см над зеркалом и на расстоянии
2 см друг от друга. Найдите L′′( x0 ) и при λ = 5 ⋅ 10 −5 см найдите размеры отра!
жающей области.

§ 11. Принцип наименьшего действия
Успех универсального принципа минимума потенциальной энер!
гии, с помощью которого определяются положения равновесия системы,
побудил к поискам аналогичного универсального принципа, с по!
мощью которого можно было бы определять возможные движения сис!
темы. Это привело к открытию «принципа наименьшего действия».
Рассмотрим сначала частный пример. Пусть частица массы m дви!
жется по оси x под действием силы с потенциалом U (x). Как известно
(см., например, ВМ, § VI.8), уравнение движения при этом имеет вид
m

d 2x
= −U ′( x ),
dt 2

т.е. m

d 2x
+ U ′( x ) = 0.
dt 2

(68)

Нетрудно подобрать функционал, для которого последнее уравнение
dx &
было бы как раз уравнением Эйлера (§ 4). Обозначив
= x, перепи!
dt
шем (68) в форме
dU d
+ ( mx& ) = 0,
dt dt

т.е.

d ( −U ) d

dt
dt

 d  mx& 2  
  = 0.
 &
 dx  2  

(69)

Последнее уравнение по форме напоминает уравнение Эйлера, которое
в случае искомой функции x(t) должно иметь вид (ср. (29))
d ∂


F ( t, x, x& ) = 0.
F ( t, x, x& ) −
dt  ∂x&
∂x


(70)

464

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

Например, для рентгеновых лучей в среде n = 1 −

[Гл. XII

§ 11]

ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ

465

a

, показатель
ω2
преломления меньше 1. Значит, c Φ > c. Но это не значит, что сигнал
может распространяться со скоростью больше скорости света! В самом
деле, легко найдем
n+ω

dn
a
a
2a
=1− 2 + ω 3 =1+ 2 ,

ω
ω
ω

так что c Γ < c.
Опыт показывает, что в принцип Ферма входят именно n и c Φ ; тем
самым еще раз видно, что принцип Ферма не есть результат стремле!
ния света поскорей дойти из одной точки в другую. Дело именно в ус!
ловии сложения волн, зависящем от фазы волны.
Разницу между минимальностью и стационарностью значения
функционала в реальном процессе можно понять также на следующем
простом примере, взятом из статьи «Принцип наименьшего действия»
знаменитого немецкого физика!теоретика Макса Планка (1858–1947).
Путь свободной материальной точки, движущейся по поверхности без
воздействия внешних сил, представляет собой кратчайшую линию, со!
единяющую начальную и конечную точки пути. В частности, на сфере
такой линией служит дуга большого круга. Но если путь длиннее, чем
половина окружности большого круга, то значение его длины будет,
хотя и стационарным, но уже, как легко понять, не минимальным по
сравнению с длинами соседних путей. Это значение не будет и макси!
мальным, так как с помощью внесения извилин всегда можно, оставив
начало и конец пути без изменения, увеличить его длину. Это значение
имеет характер минимакса (см. § IV.6). Вспомнив высказывающуюся
одно время идею, что в природе господствует божественный промысел
и что в основе всякого явления природы лежит сознательное намере!
ние, направленное к определенной цели, причем эта цель достигается
кратчайшим путем и наилучшими средствами, Планк по этому поводу
не без ехидства замечает: «Значит, за пределами полуокружности
божественное провидение уже не действует».
Упражнения
1. Как известно, уравнение эллипса выводится из условия, что сумма рас!
стояний любой его точки K от двух точек F1 ( x1 = − c, y = 0 ) и F2 ( x2 = c, y = 0 ),
т.е. сумма F1 K + F2 K = L, одинакова для всех точек (рис. 185). Найдите уравне!
ния касательной и нормали к эллипсу в произвольной его точке K. Найдите
углы между линиями F1 K , F2 K и нормалью в точке K. Покажите, что все
лучи, вышедшие из F1 , проходят после отражения через F2 , а следовательно,
фокусируются в F2 .
2. Рассмотрите отражение от параболы y = x 2 параллельного пучка света,
идущего вниз по оси ординат (рис. 186). Считая, что свет идет из точки A,

Рис. 186.

Рис. 185.

xA = 0, yA = Y , и считая Y большим, замените на Y − yK расстояние AK,
равное xK2 + (Y − yK )2 . Найдите длину L = AKN и точку N , для которой
dL
= 0. Найдите уравнения касательной и нормали к параболе в точке K и
dxK
убедитесь в том, что для точки N удовлетворяется условие равенства угла па!
дения углу отражения.
3. Точки И и A находятся на высоте 1 см над зеркалом и на расстоянии
2 см друг от друга. Найдите L′′( x0 ) и при λ = 5 ⋅ 10 −5 см найдите размеры отра!
жающей области.

§ 11. Принцип наименьшего действия
Успех универсального принципа минимума потенциальной энер!
гии, с помощью которого определяются положения равновесия системы,
побудил к поискам аналогичного универсального принципа, с по!
мощью которого можно было бы определять возможные движения сис!
темы. Это привело к открытию «принципа наименьшего действия».
Рассмотрим сначала частный пример. Пусть частица массы m дви!
жется по оси x под действием силы с потенциалом U (x). Как известно
(см., например, ВМ, § VI.8), уравнение движения при этом имеет вид
m

d 2x
= −U ′( x ),
dt 2

т.е. m

d 2x
+ U ′( x ) = 0.
dt 2

(68)

Нетрудно подобрать функционал, для которого последнее уравнение
dx &
было бы как раз уравнением Эйлера (§ 4). Обозначив
= x, перепи!
dt
шем (68) в форме
dU d
+ ( mx& ) = 0,
dt dt

т.е.

d ( −U ) d

dt
dt

 d  mx& 2  
  = 0.
 &
 dx  2  

(69)

Последнее уравнение по форме напоминает уравнение Эйлера, которое
в случае искомой функции x(t) должно иметь вид (ср. (29))
d ∂


F ( t, x, x& ) = 0.
F ( t, x, x& ) −
dt  ∂x&
∂x


(70)

466

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Однако в уравнении (70) в обоих членах дифференцируется одна и та
же функция, тогда как в уравнении (69) это не так. Поэтому «подго*
ним» уравнение (69) под вид (70), добавив под знаками производных
слагаемые, производная которых равна нулю:

∂x

⎡ mx& 2
⎤ d ⎧∂
− U ( x )⎥ − ⎨

⎣ 2
⎦ dt ⎩ ∂x&

⎡ mx& 2
⎤⎫
− U ( x )⎥⎬ = 0.

⎣ 2
⎦⎭

Мы видим (ср. формулы (25) и (29)), что искомым функционалом яв*
ляется
t2

S=

⎡ mx& 2

∫ ⎢⎣

t1

2


− U ( x )⎥ dt.


mx& 2
как раз равен кинетической энергии T дви*
2
жущейся частицы, и обозначим подынтегральную функцию

§ 11]

а каждая из этих энергий выражается через обобщенные координаты
системы (см. § IV.8) и производные от них по времени. Принцип наи*
меньшего действия применим как к системам с конечным числом сте*
пеней свободы, так и к сплошным средам, причем не только
к механическим, но и к электромагнитным и иным явлениям.
Применим принцип наименьшего действия к выводу уравнения по*
перечных малых колебаний натянутой мембраны, рассмотренной в кон*
це § 6. Так как кинетическая энергия элемента (dσ) мембраны равна
2

1
⎛ ∂z ⎞
ρ dσ ⎜ ⎟ ,
⎝ ∂t ⎠
2

где ρ — поверхностная плотность мембраны, то общая кинетическая
энергия мембраны равна
2

1
⎛ ∂z ⎞
E = ρ ∫∫ ⎜ ⎟ dx dy.
2 ( σ ) ⎝ ∂t ⎠

Заметим, что член

L = T − U;

(71)

это так называемая функция Лагранжа. Тогда вариационная задача со*
стоит в отыскании стационарного значения интеграла

Пользуясь выражением (43) для потенциальной энергии, получаем
функцию Лагранжа и действие
L=

t2

S = ∫ L dt,

(72)

t1

который называется действием. Здесь t1 и t2 — начальный и конеч*
ный моменты движения, а сравниваются между собой все мыслимые
виды движений с одинаковыми начальными условиями, а также с оди*
наковыми конечными условиями. Можно проверить, что в целом ряде
случаев, например, если промежуток времени t2 − t1 достаточно мал,
интеграл (72) имеет для реального движения не просто стационарное,
а минимальное значение. Поэтому возможность отыскать это движе*
ние, исходя из вариационной задачи для интеграла (72), называется
принципом наименьшего действия.
Оказывается, что вариационный принцип наименьшего действия
имеет универсальный характер и выполняется для любых замкнутых
систем без диссипации энергии (т.е. рассеяния, потери энергии — на*
пример, из*за наличия трения; впрочем, систему с диссипацией можно
в определенном смысле считать незамкнутой). Согласно этому при*
нципу из всех мыслимых (при данных связях) способов перехода из не*
которого состояния в момент t1 в некоторое другое состояние
в момент t2 система выбирает такой способ, для которого действие,
т.е. интеграл (72), принимает стационарное (как правило, минималь*
ное) значение. При этом функция Лагранжа L представляет собой раз*
ность (71) между кинетической и потенциальной энергиями системы,

467

ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ

S=

1
2

1
2

2

⎪ ⎛ ∂z ⎞

∫∫ ⎨ρ ⎜⎝ ∂t ⎟⎠

( σ)

⎪⎩

⎡ ⎛ ∂z ⎞ 2 ⎛ ∂z ⎞ 2 ⎤⎫⎪
− T ⎢ ⎜ ⎟ + ⎜ ⎟ ⎥⎬ dx dy,
⎝ ∂y ⎠ ⎥ ⎪
⎢⎣ ⎝ ∂x ⎠
⎦⎭

2

⎡ ⎛ ∂z ⎞ 2 ⎛ ∂z ⎞ 2 ⎤⎫⎪
⎪ ⎛ ∂z ⎞
⎢ ⎜ ⎟ + ⎜ ⎟ ⎥⎬ dx dy dt.

T
ρ


∫ ∫∫ ⎨ ⎝ ∂t ⎠
⎝ ∂y ⎠ ⎥ ⎪
⎢⎣ ⎝ ∂x ⎠
t 1 ( σ)

⎦⎭
t2

Применяя уравнение Эйлера по трем независимым переменным (ср.
§ 6), получаем уравнение колебаний мембраны


∂ ⎛ ∂z ⎞
∂ ⎛ ∂z ⎞
∂ ⎛ ∂z ⎞
⎜ρ ⎟ +
⎜T ⎟ +
⎜T ⎟ = 0,
∂t ⎝ ∂t ⎠ ∂x ⎝ ∂x ⎠ ∂y ⎝ ∂y ⎠

т.е.
∂2 z T ⎛ ∂2 z ∂2 z⎞
= ⎜
+
⎟ = a2
∂t 2 ρ ⎝ ∂x 2 ∂y 2 ⎠

⎛ ∂2 z ∂2 z⎞
⎜ 2 + 2⎟
∂y ⎠
⎝ ∂x


⎜a =


T ⎞
⎟.
ρ⎠

На первый взгляд выражение (71) для функции Лагранжа пред*
ставляется формальным, неестественным, так как непонятно, какой
смысл может иметь разность энергий. Положение проясняется на сле*
дующем простом примере. При движении частицы с заданной энергией
E в заданном стационарном потенциальном поле U траектория опре*
деляется условием минимума ∫ p ⋅ dr вдоль пути, где p = mv — им*
пульс, а r — радиус*вектор. В самом деле,
T − U = 2T − (T + U ) = 2T − E .

466

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Однако в уравнении (70) в обоих членах дифференцируется одна и та
же функция, тогда как в уравнении (69) это не так. Поэтому «подго*
ним» уравнение (69) под вид (70), добавив под знаками производных
слагаемые, производная которых равна нулю:

∂x

⎡ mx& 2
⎤ d ⎧∂
− U ( x )⎥ − ⎨

⎣ 2
⎦ dt ⎩ ∂x&

⎡ mx& 2
⎤⎫
− U ( x )⎥⎬ = 0.

⎣ 2
⎦⎭

Мы видим (ср. формулы (25) и (29)), что искомым функционалом яв*
ляется
t2

S=

⎡ mx& 2

∫ ⎢⎣

t1

2


− U ( x )⎥ dt.


mx& 2
как раз равен кинетической энергии T дви*
2
жущейся частицы, и обозначим подынтегральную функцию

§ 11]

а каждая из этих энергий выражается через обобщенные координаты
системы (см. § IV.8) и производные от них по времени. Принцип наи*
меньшего действия применим как к системам с конечным числом сте*
пеней свободы, так и к сплошным средам, причем не только
к механическим, но и к электромагнитным и иным явлениям.
Применим принцип наименьшего действия к выводу уравнения по*
перечных малых колебаний натянутой мембраны, рассмотренной в кон*
це § 6. Так как кинетическая энергия элемента (dσ) мембраны равна
2

1
⎛ ∂z ⎞
ρ dσ ⎜ ⎟ ,
⎝ ∂t ⎠
2

где ρ — поверхностная плотность мембраны, то общая кинетическая
энергия мембраны равна
2

1
⎛ ∂z ⎞
E = ρ ∫∫ ⎜ ⎟ dx dy.
2 ( σ ) ⎝ ∂t ⎠

Заметим, что член

L = T − U;

(71)

это так называемая функция Лагранжа. Тогда вариационная задача со*
стоит в отыскании стационарного значения интеграла

Пользуясь выражением (43) для потенциальной энергии, получаем
функцию Лагранжа и действие
L=

t2

S = ∫ L dt,

(72)

t1

который называется действием. Здесь t1 и t2 — начальный и конеч*
ный моменты движения, а сравниваются между собой все мыслимые
виды движений с одинаковыми начальными условиями, а также с оди*
наковыми конечными условиями. Можно проверить, что в целом ряде
случаев, например, если промежуток времени t2 − t1 достаточно мал,
интеграл (72) имеет для реального движения не просто стационарное,
а минимальное значение. Поэтому возможность отыскать это движе*
ние, исходя из вариационной задачи для интеграла (72), называется
принципом наименьшего действия.
Оказывается, что вариационный принцип наименьшего действия
имеет универсальный характер и выполняется для любых замкнутых
систем без диссипации энергии (т.е. рассеяния, потери энергии — на*
пример, из*за наличия трения; впрочем, систему с диссипацией можно
в определенном смысле считать незамкнутой). Согласно этому при*
нципу из всех мыслимых (при данных связях) способов перехода из не*
которого состояния в момент t1 в некоторое другое состояние
в момент t2 система выбирает такой способ, для которого действие,
т.е. интеграл (72), принимает стационарное (как правило, минималь*
ное) значение. При этом функция Лагранжа L представляет собой раз*
ность (71) между кинетической и потенциальной энергиями системы,

467

ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ

S=

1
2

1
2

2

⎪ ⎛ ∂z ⎞

∫∫ ⎨ρ ⎜⎝ ∂t ⎟⎠

( σ)

⎪⎩

⎡ ⎛ ∂z ⎞ 2 ⎛ ∂z ⎞ 2 ⎤⎫⎪
− T ⎢ ⎜ ⎟ + ⎜ ⎟ ⎥⎬ dx dy,
⎝ ∂y ⎠ ⎥ ⎪
⎢⎣ ⎝ ∂x ⎠
⎦⎭

2

⎡ ⎛ ∂z ⎞ 2 ⎛ ∂z ⎞ 2 ⎤⎫⎪
⎪ ⎛ ∂z ⎞
⎢ ⎜ ⎟ + ⎜ ⎟ ⎥⎬ dx dy dt.

T
ρ


∫ ∫∫ ⎨ ⎝ ∂t ⎠
⎝ ∂y ⎠ ⎥ ⎪
⎢⎣ ⎝ ∂x ⎠
t 1 ( σ) ⎩

⎦⎭
t2

Применяя уравнение Эйлера по трем независимым переменным (ср.
§ 6), получаем уравнение колебаний мембраны


∂ ⎛ ∂z ⎞
∂ ⎛ ∂z ⎞
∂ ⎛ ∂z ⎞
⎜ρ ⎟ +
⎜T ⎟ +
⎜T ⎟ = 0,
∂t ⎝ ∂t ⎠ ∂x ⎝ ∂x ⎠ ∂y ⎝ ∂y ⎠

т.е.
∂2 z T ⎛ ∂2 z ∂2 z⎞
= ⎜
+
⎟ = a2
∂t 2 ρ ⎝ ∂x 2 ∂y 2 ⎠

⎛ ∂2 z ∂2 z⎞
⎜ 2 + 2⎟
∂y ⎠
⎝ ∂x


⎜a =


T ⎞
⎟.
ρ⎠

На первый взгляд выражение (71) для функции Лагранжа пред*
ставляется формальным, неестественным, так как непонятно, какой
смысл может иметь разность энергий. Положение проясняется на сле*
дующем простом примере. При движении частицы с заданной энергией
E в заданном стационарном потенциальном поле U траектория опре*
деляется условием минимума ∫ p ⋅ dr вдоль пути, где p = mv — им*
пульс, а r — радиус*вектор. В самом деле,
T − U = 2T − (T + U ) = 2T − E .

468

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Значит,
t2

t2

t2

t2

t1

t1

t1

t1

§ 12]

ПРЯМЫЕ МЕТОДЫ

469

не всегда это четко осознаем и не всегда применяем их наилучшим об!
разом.

∫ L dt = ∫ 2T dt − ∫ E dt = ∫ 2T dt − E ( t2 − t1 ),

где член E (t2 − t1 ) постоянен. Запишем 2T = 2

Упражнение

mv 2
= mv ⋅ v, v dt = dr
2

Исходя из выражения (11) для потенциальной энергии однородной струны
на упругой подкладке, выведите уравнение движения такой струны, не учиты!
вая кинетической энергии подкладки.

t2

и

отсюда

получим,

что

условие

экстремума

∫ L dt

совпадает

t1

с условием экстремума

∫ p ⋅ dr

при заданных начале и конце пути и за!

данной энергии. При этом p2 = 2m(E − U ).
В то же время условие стационарности

∫ p ⋅ dr

полностью анало!

гично принципу Ферма. Дело в том, что в квантовой механике длина
волны, связанная с движением тела, равна λ = 2πh p, где h — посто!
г ⋅ см 2
янная Планка, h = 10 −27
. При этом вероятность найти частицу
сек
в данной точке пропорциональна квадрату амплитуды волны, а во´лны,
прошедшие по разным путям, складываются. Условие стационарности
∫ p ⋅ dr вдоль траектории, вычисленной в классической механике, как
раз и представляет собой условие сложения с одинаковой фазой волн,
прошедших по путям, близким к траектории.
Аналогия между механическими принципами наименьшего дейст!
вия и принципом Ферма сыграла большую роль в становлении кванто!
вой механики.
Известен целый ряд других вариационных принципов в различных
областях, в том числе даже столь далеких от физики, как, например,
экономика. При решении экономической задачи мы обычно располага!
ем теми или иными ресурсами (деньгами, материалами и т.д.), которые
должны использовать так, чтобы в том или ином смысле получить мак!
симальную пользу. Таким образом, получается задача на максимум,
в которой искомым является оптимальный план использования ресур!
сов, а максимизируется польза. В зависимости от характера задачи при
выборе плана может быть либо конечное число степеней свободы, т.е.
искомым является набор параметров, определяющих план, либо же мо!
жет быть бесконечное число степеней свободы, так что искомой явля!
ется некоторая функция. В первом случае задача иногда решается
средствами дифференциального исчисления (§ IV.6 и § 7), а иногда,
если число искомых величин и наложенных на них ограничений вели!
ко, — средствами новой математической дисциплины, которая называ!
ется «теорией математического программирования». Во втором случае
задача принадлежит вариационному исчислению. Аналогичные экстре!
мальные принципы мы постоянно применяем и в своем поведении, хотя

§ 12. Прямые методы
Долгое время почти единственным путем решения вариационных
задач считался переход к дифференциальным уравнениям Эйлера.
Однако решение получающихся краевых задач для дифференциаль!
ных уравнений оказывается очень часто довольно сложным делом; яв!
ное решение в квадратурах удается получить редко, и приходится
пользоваться приближенными методами. Еще реже получается явное
решение уравнений Эйлера для вариационных задач с несколькими
независимыми переменными.
Поэтому в последнее время часто применяется ряд эффективных
приближенных методов непосредственного решения вариационных
задач, не связанных с переходом к дифференциальным уравнениям;
эти методы получили наименование прямых методов вариационного
исчисления. Большинство из них основано на переходе к задачам на
экстремум функции нескольких переменных, т.е. к задачам с конечным
числом степеней свободы. Мы рассмотрим здесь два таких метода.
Первый метод основан на процессе, противоположном тому, кото!
рый был описан в § 1. Там мы перешли от задачи с конечным числом
степеней свободы к вариационной задаче с помощью измельчения раз!
биения интервала, в результате чего сумма (3) перешла в интеграл (7).
С помощью обратного процесса можно перейти от интеграла к сумме
и тем самым свести задачу об экстремуме функционала к задаче об экс!
тремуме функции нескольких переменных.
Пусть, например, рассматривается экстремум функционала (25)
при краевых условиях (26). Разбив интервал интегрирования на n
равных частей с помощью точек деления x 0 = a, x 1 , x 2 , ..., x n = b и об!
y − yi 
b − a
означив y(x i ) = y i , заменим приближенно y i′ = i +1
h =


h
n 
b

∫ F ( x,
a

n −1

y, y′ ) dx ≈ ∑ F ( xi , yi , y′i ) h ≈ h
i=0

n −1



∑ F  xi ,
i=0

yi ,

yi + 1 − yi 
.

h

(73)

(Как и в §§ I.1 и II.2, можно было бы воспользоваться более точными
формулами численного дифференцирования и интегрирования, но мы
здесь не будем на этом останавливаться.) Так как значения y 0 = y a и
y n = y b заданы, то задача сводится к отысканию экстремума функции

468

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

Значит,
t2

t2

t2

t2

t1

t1

t1

t1

§ 12]

ПРЯМЫЕ МЕТОДЫ

469

не всегда это четко осознаем и не всегда применяем их наилучшим об!
разом.

∫ L dt = ∫ 2T dt − ∫ E dt = ∫ 2T dt − E ( t2 − t1 ),

где член E (t2 − t1 ) постоянен. Запишем 2T = 2

Упражнение

mv 2
= mv ⋅ v, v dt = dr
2

Исходя из выражения (11) для потенциальной энергии однородной струны
на упругой подкладке, выведите уравнение движения такой струны, не учиты!
вая кинетической энергии подкладки.

t2

и

отсюда

получим,

что

условие

экстремума

∫ L dt

совпадает

t1

с условием экстремума

∫ p ⋅ dr

при заданных начале и конце пути и за!

данной энергии. При этом p2 = 2m(E − U ).
В то же время условие стационарности

∫ p ⋅ dr

полностью анало!

гично принципу Ферма. Дело в том, что в квантовой механике длина
волны, связанная с движением тела, равна λ = 2πh p, где h — посто!
г ⋅ см 2
янная Планка, h = 10 −27
. При этом вероятность найти частицу
сек
в данной точке пропорциональна квадрату амплитуды волны, а во´лны,
прошедшие по разным путям, складываются. Условие стационарности
∫ p ⋅ dr вдоль траектории, вычисленной в классической механике, как
раз и представляет собой условие сложения с одинаковой фазой волн,
прошедших по путям, близким к траектории.
Аналогия между механическими принципами наименьшего дейст!
вия и принципом Ферма сыграла большую роль в становлении кванто!
вой механики.
Известен целый ряд других вариационных принципов в различных
областях, в том числе даже столь далеких от физики, как, например,
экономика. При решении экономической задачи мы обычно располага!
ем теми или иными ресурсами (деньгами, материалами и т.д.), которые
должны использовать так, чтобы в том или ином смысле получить мак!
симальную пользу. Таким образом, получается задача на максимум,
в которой искомым является оптимальный план использования ресур!
сов, а максимизируется польза. В зависимости от характера задачи при
выборе плана может быть либо конечное число степеней свободы, т.е.
искомым является набор параметров, определяющих план, либо же мо!
жет быть бесконечное число степеней свободы, так что искомой явля!
ется некоторая функция. В первом случае задача иногда решается
средствами дифференциального исчисления (§ IV.6 и § 7), а иногда,
если число искомых величин и наложенных на них ограничений вели!
ко, — средствами новой математической дисциплины, которая называ!
ется «теорией математического программирования». Во втором случае
задача принадлежит вариационному исчислению. Аналогичные экстре!
мальные принципы мы постоянно применяем и в своем поведении, хотя

§ 12. Прямые методы
Долгое время почти единственным путем решения вариационных
задач считался переход к дифференциальным уравнениям Эйлера.
Однако решение получающихся краевых задач для дифференциаль!
ных уравнений оказывается очень часто довольно сложным делом; яв!
ное решение в квадратурах удается получить редко, и приходится
пользоваться приближенными методами. Еще реже получается явное
решение уравнений Эйлера для вариационных задач с несколькими
независимыми переменными.
Поэтому в последнее время часто применяется ряд эффективных
приближенных методов непосредственного решения вариационных
задач, не связанных с переходом к дифференциальным уравнениям;
эти методы получили наименование прямых методов вариационного
исчисления. Большинство из них основано на переходе к задачам на
экстремум функции нескольких переменных, т.е. к задачам с конечным
числом степеней свободы. Мы рассмотрим здесь два таких метода.
Первый метод основан на процессе, противоположном тому, кото!
рый был описан в § 1. Там мы перешли от задачи с конечным числом
степеней свободы к вариационной задаче с помощью измельчения раз!
биения интервала, в результате чего сумма (3) перешла в интеграл (7).
С помощью обратного процесса можно перейти от интеграла к сумме
и тем самым свести задачу об экстремуме функционала к задаче об экс!
тремуме функции нескольких переменных.
Пусть, например, рассматривается экстремум функционала (25)
при краевых условиях (26). Разбив интервал интегрирования на n
равных частей с помощью точек деления x 0 = a, x 1 , x 2 , ..., x n = b и об!
y − yi 
b − a
означив y(x i ) = y i , заменим приближенно y i′ = i +1
h =


h
n 
b

∫ F ( x,
a

n −1

y, y′ ) dx ≈ ∑ F ( xi , yi , y′i ) h ≈ h
i=0

n −1



∑ F  xi ,
i=0

yi ,

yi + 1 − yi 
.

h

(73)

(Как и в §§ I.1 и II.2, можно было бы воспользоваться более точными
формулами численного дифференцирования и интегрирования, но мы
здесь не будем на этом останавливаться.) Так как значения y 0 = y a и
y n = y b заданы, то задача сводится к отысканию экстремума функции

470

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

n − 1 переменных y 1 , y 2 , ..., y n −1 , стоящей в правой части (73). Как было
показано в § 1, эту задачу иногда бывает нетрудно довести до конца.
Одним из наиболее распространенных прямых методов вариацион!
ного исчисления является сейчас так называемый метод Ритца*, со!
стоящий в том, что искомая функция ищется в виде, включающем
несколько произвольных постоянных (параметров); например, в слу!
чае одного независимого переменного в виде
y = ϕ( x; C1 , C 2 , ..., C n ).

1

(75)

0

ПРЯМЫЕ МЕТОДЫ

471

функция (74) и в других примерах.) Подстановка (77) в (75) дает после
вычислений
1

I = ∫ [(1 + C − 2Cx )2 + ( x + Cx − Cx 2 )2 ] dx =
0

1
1
1

= 1 + C 2 + 4C 2 + 2C − 4C − 4C 2  +

3
2
2

(74)

При этом правая часть выбирается так, чтобы для любых значений этих
параметров удовлетворялись поставленные граничные условия. Под!
ставляя (74) в выражение для заданного функционала, получаем, что
значение функционала оказывается зависящим от C1 , C2 , ..., C n . Тем
самым задача об экстремуме функционала сводится к задаче об экстре!
муме функции от n независимых параметров C1 , C2 , ..., C n , последняя
же задача решается по методам гл. IV. Конечно, получающееся при
этом решение является лишь приближенным решением исходной зада!
чи, так как в виде (74) можно представить далеко не любую функцию.
Чем больше введено параметров С i , тем более «гибкой» является фор!
мула (74), т.е. тем точнее можно представить этой формулой искомое
решение, но тем сложнее получаются вычисления. Поэтому на практи!
ке число этих параметров берется небольшим, иногда бывает достаточ!
но даже принять n = 1.
Приведем примеры. Пусть ищется минимум функционала
I = ∫ ( y′ 2 + y 2 ) dx

§ 12]

1
1
1
1
1 4 1
11
1
+  + C 2 + C 2 + 2C − 2C − 2C 2  = + C + C 2 .
3

3
5
3
4
4
3 6
30

Чтобы найти минимум этой функции от C, приравняем нулю произ!
водную:
1 11
+ C = 0,
6 15

откуда найдем C = −

5
= −0227
, , т.e. приближенное решение (77) имеет
22

вид
y1 = x − 0,227 x (1 − x ) = 0,773 x + 0,227 x 2 .

Более точный результат получится, если искать приближенное ре!
шение в виде y = x + C1 x (1 − x) + C2 x 2 (1 − x), включающем два пара!
метра. Подстановка в (75) и приравнивание нулю производных по C1 и
C2 приводят (соответствующие вычисления мы предоставляем чита!
телю) к значениям C1 = −0146
, , C2 = −0163
, , т.е. к приближенному ре!
шению
yII = x − 0,146 x (1 − x ) − 0,163 x 2 (1 − x ) = 0,854 x − 0,017 x 2 + 0,163 x 3 .

при краевых условиях
y(0 ) = 0,

y(1) = 1.

(76)

Будем искать приближенное решение в виде
y = x + Cx(1 − x ).

(77)

(Первое из этих слагаемых удовлетворяет условиям (76), а второе —
соответствующим однородным условиям, не нарушающимся при
умножении на произвольную постоянную, так что вся сумма также
удовлетворяет условиям (76); по такому образцу часто составляется

В разобранном примере легко получить точное решение. В самом
деле, уравнение Эйлера для функционала (75) имеет вид
2y −

d
(2 y′ ) = 0,
dx

и обладает общим решением (§ VII.3)
y = Ae x + Be − x ,

где A и B — произвольные постоянные. При условиях (76) получаем
y=

* Этот метод был предложен в 1908 г. немецким физиком и математиком В. Ритцем.
В 1915 г. русский механик Б.Г. Галеркин (1871–1945) применил более общий метод, при!
годный для краевых задач не обязательно вариационного щюисхождения; поэтому опи!
санный метод иногда называют методом Ритца"Галеркина.

т.е. y′′ − y = 0,

e x − e − x sh x
.
=
sh 1
e − e −1

Это точное решение легко сравнить с обоими приближенными реше!
ниями (см. таблицу).

470

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

n − 1 переменных y 1 , y 2 , ..., y n −1 , стоящей в правой части (73). Как было
показано в § 1, эту задачу иногда бывает нетрудно довести до конца.
Одним из наиболее распространенных прямых методов вариацион!
ного исчисления является сейчас так называемый метод Ритца*, со!
стоящий в том, что искомая функция ищется в виде, включающем
несколько произвольных постоянных (параметров); например, в слу!
чае одного независимого переменного в виде
y = ϕ( x; C1 , C 2 , ..., C n ).

1

(75)

0

ПРЯМЫЕ МЕТОДЫ

471

функция (74) и в других примерах.) Подстановка (77) в (75) дает после
вычислений
1

I = ∫ [(1 + C − 2Cx )2 + ( x + Cx − Cx 2 )2 ] dx =
0

1
1
1

= 1 + C 2 + 4C 2 + 2C − 4C − 4C 2  +

3
2
2

(74)

При этом правая часть выбирается так, чтобы для любых значений этих
параметров удовлетворялись поставленные граничные условия. Под!
ставляя (74) в выражение для заданного функционала, получаем, что
значение функционала оказывается зависящим от C1 , C2 , ..., C n . Тем
самым задача об экстремуме функционала сводится к задаче об экстре!
муме функции от n независимых параметров C1 , C2 , ..., C n , последняя
же задача решается по методам гл. IV. Конечно, получающееся при
этом решение является лишь приближенным решением исходной зада!
чи, так как в виде (74) можно представить далеко не любую функцию.
Чем больше введено параметров С i , тем более «гибкой» является фор!
мула (74), т.е. тем точнее можно представить этой формулой искомое
решение, но тем сложнее получаются вычисления. Поэтому на практи!
ке число этих параметров берется небольшим, иногда бывает достаточ!
но даже принять n = 1.
Приведем примеры. Пусть ищется минимум функционала
I = ∫ ( y′ 2 + y 2 ) dx

§ 12]

1
1
1
1
1 4 1
11
1
+  + C 2 + C 2 + 2C − 2C − 2C 2  = + C + C 2 .
3

3
5
3
4
4
3 6
30

Чтобы найти минимум этой функции от C, приравняем нулю произ!
водную:
1 11
+ C = 0,
6 15

откуда найдем C = −

5
= −0227
, , т.e. приближенное решение (77) имеет
22

вид
y1 = x − 0,227 x (1 − x ) = 0,773 x + 0,227 x 2 .

Более точный результат получится, если искать приближенное ре!
шение в виде y = x + C1 x (1 − x) + C2 x 2 (1 − x), включающем два пара!
метра. Подстановка в (75) и приравнивание нулю производных по C1 и
C2 приводят (соответствующие вычисления мы предоставляем чита!
телю) к значениям C1 = −0146
, , C2 = −0163
, , т.е. к приближенному ре!
шению
yII = x − 0,146 x (1 − x ) − 0,163 x 2 (1 − x ) = 0,854 x − 0,017 x 2 + 0,163 x 3 .

при краевых условиях
y(0 ) = 0,

y(1) = 1.

(76)

Будем искать приближенное решение в виде
y = x + Cx(1 − x ).

(77)

(Первое из этих слагаемых удовлетворяет условиям (76), а второе —
соответствующим однородным условиям, не нарушающимся при
умножении на произвольную постоянную, так что вся сумма также
удовлетворяет условиям (76); по такому образцу часто составляется

В разобранном примере легко получить точное решение. В самом
деле, уравнение Эйлера для функционала (75) имеет вид
2y −

d
(2 y′ ) = 0,
dx

и обладает общим решением (§ VII.3)
y = Ae x + Be − x ,

где A и B — произвольные постоянные. При условиях (76) получаем
y=

* Этот метод был предложен в 1908 г. немецким физиком и математиком В. Ритцем.
В 1915 г. русский механик Б.Г. Галеркин (1871–1945) применил более общий метод, при!
годный для краевых задач не обязательно вариационного щюисхождения; поэтому опи!
санный метод иногда называют методом Ритца"Галеркина.

т.е. y′′ − y = 0,

e x − e − x sh x
.
=
sh 1
e − e −1

Это точное решение легко сравнить с обоими приближенными реше!
ниями (см. таблицу).

472

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

ОТВЕТЫ И РЕШЕНИЯ

[Гл. XII

x

yI

y II

yточн

x

yI

y II

yточн

0,0
0,1
0,2
0,3
0,4
0,5

0,000
0,080
0,164
0,252
0,346
0,443

0,000
0,085
0,171
0,259
0,349
0,443

0,000
0,085
0,171
0,259
0,350
0,444

0,6
0,7
0,8
0,9
1,0

0,546
0,652
0,764
0,880
1,000

0,541
0,645
0,756
0,874
1,000

0,542
0,645
0,754
0,873
1,000

473

Подстановка в (79) дает
1 1

Таким образом, даже в простейшем варианте метод Ритца дает
в данном примере очень хорошую точность.
Еще лучшую точность дает метод Ритца, если требуется найти не
функцию, реализующую экстремум, а само экстремальное значение
функционала. В самом деле, малая вариация функции вблизи стацио/
нарного значения функционала приводит к еще меньшему изменению
значения функционала. (Сравните изменения независимого и зависи/
мого переменных вблизи стационарного значения функции, например
изменения x и y вблизи значения x = c на рис. 180.) Поэтому по/
грешность в значении функционала будет высшего порядка малости по
сравнению с погрешностью в функции, которая реализует экстремум.
Так, в разобранном только что примере при подстановке функции
y I (x) функционал (75) дает приближенное минимальное значение
1,314, тогда как точное значение равно 1,313. Ошибка составляет 0,1%.
А чтобы уловить ошибку при подстановке y II (x), потребовались бы
вычисления с значительно большей точностью.
Если проделать аналогичные вычисления для функционала
1

I = ∫ ( y′ 2 + xy 2 ) dx,

(78)

0

что мы предоставим сделать читателю, то почти при том же объеме вы/
числений мы также получим приближенное решение с хорошей точ/
ностью, хотя в данном случае точное решение уже не выражается через
элементарные функции. Для прямых методов это обстоятельство не
является препятствием.
Приведем еще пример на экстремальную задачу для функции двух
переменных. Пусть ищется экстремум функционала
⎡ ⎛ ∂u ⎞ 2 ⎛ ∂u ⎞ 2

I = ∫ ∫ ⎢⎜ ⎟ + ⎜ ⎟ + 2 u ⎥ dx dy
⎝ ∂x ⎠
⎝ ∂y ⎠
⎥⎦
−1 −1 ⎢

1 1

(79)

среди функций, обращающихся в нуль на границе квадрата, ограничен/
ного прямыми x = ±1, y = ±1. В этом случае уравнение Эйлера не реша/
ется точно с помощью элементарных функций. Приближенное реше/
ние по методу Ритца ищем в виде
u = C (1 − x 2 )(1 − y 2 ).

I=∫

∫ {[−2Cx(1 − y

−1 −1

2

)]2 + [−2Cy(1 − x 2 )]2 +

}

+2C (1 − x 2 )(1 − y 2 ) dx dy =
2 ⎛ 2 1⎞
2
= 4C 2 ⋅ 2 ⎜1 − + ⎟ + 4C 2 ⋅ 2
3 ⎝ 3 5⎠
3

⎛ 2 1⎞
⎜1 − + ⎟ +
⎝ 3 5⎠

⎛ 1⎞ ⎛ 1⎞ 256 2 32
+2C ⋅ 2 ⎜1 − ⎟ ⋅ 2 ⎜1 − ⎟ =
C + C.
⎝ 3 ⎠ ⎝ 3 ⎠ 45
9

5
. Зна/
16
чит, решение задачи о минимуме функционала (79) при заданных гра/
ничных условиях приближенно имеет вид

Приравнивание производной нулю дает минимум при C = −

u=−

5
(1 − x 2 )(1 − y 2 ).
16

Сравнение с точной формулой (имеющей вид бесконечного ряда) по/
казывает, что погрешность этого приближенного решения в среднем
равна 1,5%; погрешность в значении функционала I около 0,2%.
Упражнения
1. Найдите приближенное решение задачи о минимуме функционала (75)
при условиях (76), выбрав приближенное решение в форме y = x + C sin πx.
Сравните полученные значения I и y(0,5 ) с точными.
2. Найдите приближенное решение задачи о минимуме функционала (78)
при условиях (76), выбрав приближенное решение в виде (77).
3. Найдите приближенное решение разобранной в основном тексте задачи
о минимуме функционала (79), выбрав приближенное решение в виде
πx
πy
u = C cos
cos . Сравните полученные значения I и u(0, 0 ) с найденны/
2
2
ми в основном тексте.

ОТВЕТЫ И РЕШЕНИЯ
§ 1

Рассуждая, как в тексте, находим
h
yi = − [(i − 1)F1 + (i − 2 )F2 + ... + Fi −1 ] + iy1 ;
P
h
0 = − [( n − 1)F1 + ( n − 2 )F2 + ... + Fn −1 ] + ny1 ,
P
откуда
h( n − i )
hi
yi =
[1F1 + 2 F2 + ... + (i − 1)Fi −1 ] +
[( n − i )Fi + ( n − i − 1)Fi + 1 + ... + 1Fn −1 ].
Pn
Pn

472

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

ОТВЕТЫ И РЕШЕНИЯ

[Гл. XII

x

yI

y II

yточн

x

yI

y II

yточн

0,0
0,1
0,2
0,3
0,4
0,5

0,000
0,080
0,164
0,252
0,346
0,443

0,000
0,085
0,171
0,259
0,349
0,443

0,000
0,085
0,171
0,259
0,350
0,444

0,6
0,7
0,8
0,9
1,0

0,546
0,652
0,764
0,880
1,000

0,541
0,645
0,756
0,874
1,000

0,542
0,645
0,754
0,873
1,000

473

Подстановка в (79) дает
1 1

Таким образом, даже в простейшем варианте метод Ритца дает
в данном примере очень хорошую точность.
Еще лучшую точность дает метод Ритца, если требуется найти не
функцию, реализующую экстремум, а само экстремальное значение
функционала. В самом деле, малая вариация функции вблизи стацио/
нарного значения функционала приводит к еще меньшему изменению
значения функционала. (Сравните изменения независимого и зависи/
мого переменных вблизи стационарного значения функции, например
изменения x и y вблизи значения x = c на рис. 180.) Поэтому по/
грешность в значении функционала будет высшего порядка малости по
сравнению с погрешностью в функции, которая реализует экстремум.
Так, в разобранном только что примере при подстановке функции
y I (x) функционал (75) дает приближенное минимальное значение
1,314, тогда как точное значение равно 1,313. Ошибка составляет 0,1%.
А чтобы уловить ошибку при подстановке y II (x), потребовались бы
вычисления с значительно большей точностью.
Если проделать аналогичные вычисления для функционала
1

I = ∫ ( y′ 2 + xy 2 ) dx,

(78)

0

что мы предоставим сделать читателю, то почти при том же объеме вы/
числений мы также получим приближенное решение с хорошей точ/
ностью, хотя в данном случае точное решение уже не выражается через
элементарные функции. Для прямых методов это обстоятельство не
является препятствием.
Приведем еще пример на экстремальную задачу для функции двух
переменных. Пусть ищется экстремум функционала
⎡ ⎛ ∂u ⎞ 2 ⎛ ∂u ⎞ 2

I = ∫ ∫ ⎢⎜ ⎟ + ⎜ ⎟ + 2 u ⎥ dx dy
⎝ ∂x ⎠
⎝ ∂y ⎠
⎥⎦
−1 −1 ⎢

1 1

(79)

среди функций, обращающихся в нуль на границе квадрата, ограничен/
ного прямыми x = ±1, y = ±1. В этом случае уравнение Эйлера не реша/
ется точно с помощью элементарных функций. Приближенное реше/
ние по методу Ритца ищем в виде
u = C (1 − x 2 )(1 − y 2 ).

I=∫

∫ {[−2Cx(1 − y

−1 −1

2

)]2 + [−2Cy(1 − x 2 )]2 +

}

+2C (1 − x 2 )(1 − y 2 ) dx dy =
2 ⎛ 2 1⎞
2
= 4C 2 ⋅ 2 ⎜1 − + ⎟ + 4C 2 ⋅ 2
3 ⎝ 3 5⎠
3

⎛ 2 1⎞
⎜1 − + ⎟ +
⎝ 3 5⎠

⎛ 1⎞ ⎛ 1⎞ 256 2 32
+2C ⋅ 2 ⎜1 − ⎟ ⋅ 2 ⎜1 − ⎟ =
C + C.
⎝ 3 ⎠ ⎝ 3 ⎠ 45
9

5
. Зна/
16
чит, решение задачи о минимуме функционала (79) при заданных гра/
ничных условиях приближенно имеет вид

Приравнивание производной нулю дает минимум при C = −

u=−

5
(1 − x 2 )(1 − y 2 ).
16

Сравнение с точной формулой (имеющей вид бесконечного ряда) по/
казывает, что погрешность этого приближенного решения в среднем
равна 1,5%; погрешность в значении функционала I около 0,2%.
Упражнения
1. Найдите приближенное решение задачи о минимуме функционала (75)
при условиях (76), выбрав приближенное решение в форме y = x + C sin πx.
Сравните полученные значения I и y(0,5 ) с точными.
2. Найдите приближенное решение задачи о минимуме функционала (78)
при условиях (76), выбрав приближенное решение в виде (77).
3. Найдите приближенное решение разобранной в основном тексте задачи
о минимуме функционала (79), выбрав приближенное решение в виде
πx
πy
u = C cos
cos . Сравните полученные значения I и u(0, 0 ) с найденны/
2
2
ми в основном тексте.

ОТВЕТЫ И РЕШЕНИЯ
§ 1

Рассуждая, как в тексте, находим
h
yi = − [(i − 1)F1 + (i − 2 )F2 + ... + Fi −1 ] + iy1 ;
P
h
0 = − [( n − 1)F1 + ( n − 2 )F2 + ... + Fn −1 ] + ny1 ,
P
откуда
h( n − i )
hi
yi =
[1F1 + 2 F2 + ... + (i − 1)Fi −1 ] +
[( n − i )Fi + ( n − i − 1)Fi + 1 + ... + 1Fn −1 ].
Pn
Pn

474

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

l
x
Полагая n = , i = i , Fi = f ( xi )h, h → 0, получим в пределе
h
h
x

y=

ное значение при условиях (26). Из (34) получаем

l

l −x
x
ξf ( ξ ) dξ + ∫ ( l − ξ) f ( ξ ) dξ (ср. § VI.2).
Pl ∫0
Pl x

§ 2
1

1

2 xδy
dx; 2 y(0 ) δy(0 ) + ∫ ( xδy + 2 y′δy′ ) dx.
y3
0
0

1. δI = − ∫

1

1

2. В данном примере ΔI = ∫ (2 x + αx 2 )2 dx − ∫ (2 x )2 dx = α +
0

0

ОТВЕТЫ И РЕШЕНИЯ

α2
; δI = α .
5

Результаты подсчета:
α

ΔI

δI

относительная ошибка

1
–0,1
0,01

1,2
–0,098
0,01002

1
–0,1
0,01

–17%
–2%
–0,2%

475

1 + y′ 2 −

2 y′y′
2 1 + y′ 2

= C,

откуда y′ = C1 , y = C1 x + C 2 . Это — уравнение прямых.
§ 5
Из уравнения Эйлера получается, что при a ≠ π , 2 π, 3π, ... единственной
функцией, удовлетворяющей граничным условиям и придающей функциона/
лу стационарное значение, служит y ≡ 0. Подставляя y = Cx ( a − x ), получим
a3
(10 − a 2 ), откуда видим, что при a > 10 задача на минимум решения
I =C 2
30
πx
C2 2
не имеет. Подставляя y = C sin , получаем I =
( π − a 2 ), откуда видим,
1a
a
что при a > π задача на минимум решения не имеет. Можно доказать, что так
будет и при a =2π, 3π, ..., а при a < π функция y ≡ 0 служит решением зада/
чи на минимум.
§ 6
b

§ 3
Уравнение (22) в обоих случаях имеет вид (1 − x )2( y − 2 x ) = 0, откуда
y = 2 x. Это решение придает функционалу стационарное значение I = 0, кото/
рое лишь в случае а) является минимальным. В случае б) решение имеет ха/
рактер минимакса (ср. § IV.6), а задача на минимум решения не имеет.

1. Аналогично (27) приходим к равенству

∫ ( F y′δy + F y′ ′δy′ + F y′ ′′δy′′ ) dx = 0.
a

Интегрируя по частям второе слагаемое один раз, а третье — два раза, получим
b



d2

d



∫ ⎜⎝ F y′ − dx F y′ ′ + dx 2 F y′ ′′ ⎟⎠ δy dx = 0,
a

§ 4

откуда приходим к искомому уравнению

d
1. а) Уравнение Эйлера имеет вид 2 y − (2 y′ ) = 0, т.е. y′′ − y = 0, откуда
dx
y = C1 e x + C 2 e − x (см. § VII.3). Из граничных условий получаем 0 = C1 + C2,
ex − e−x
1
1
, C2 = −
и окончательнo y =
;
1 = C1 e + C 2 e −1 , откуда C1 =
−1
−1
e−e
e−e
e − e −1
б) по
формуле
(34) yy′ 2 − 2 yy′ ⋅ y′ = C , yy′ 2 = −C , y dy = ± −C dx,
3
y3 2 = ±
−C x + C 2 = C1 x + C 2 . Из граничных условий p 3 2 = C 2 , q 3 2 = C1 + C 2 ,
2
откуда y 3 2 = ( q 3 2 − p 3 2 )x + p 3 2 и окончательно y = [( q 3 2 − p 3 2 )x + p 3 2 ]2 3 .
2. Подстановка последнего решения в I дает после вычислений значение
4 32
∂I
4
( q − p 3 2 )2 ; отсюда
= − p1 2 ( q 3 2 − p 3 2 ). По формуле, выведенной в тексте,
9
∂p
3
2
∂I
4
3 2
= − (2 yy′ )
= −2 p [( q − p 3 2 )x + p 3 2 ]−1 3 ( q 3 2 − p 3 2 )
= − p1 2 ( q 3 2 −
3
∂p
3
x =0
x =0
− p 3 2 ), т.е. то же.
3. Так как длина графика y = f ( x ) ( a  x b ) равна

b



1 + y′ 2 dx, то зада/

a

ча сводится к определению линии, придающей этому функционалу минималь/

F y′ −

d
d
F y′ +
F y′ = 0.
dx ′ dx 2 ′′

2. Обозначим для краткости z′x = p, z′y = q; получим уравнение
F z′ − F px
′′ − F pz
′′

∂z
∂2 z
∂z
∂2 z
∂2 z
− Fqq
= 0.
− F pp
− 2 F pq
− Fq′′y − Fqz′′
′′
′′
′′
2
∂y
∂x
∂x∂y
∂y 2
∂x

§ 7
а) u* = x 2 − y 2 + z 2 − 2 x − λ ( x + 2 y − z ); отсюда условия стационарности дают
2 x − 2 − λ = 0,

−2 y − 2 λ = 0,

2 z + λ = 0.

Выражая отсюда x, y, z через λ и подставляя в уравнение связи, получаем
λ = −2, откуда координаты точки условного экстремума x = 0, y = 2, z = 1;
б ) u* = x 2 − y 2 + z 2 − 2 x − λ 1 ( x + y − z ) − λ 2 ( x + 2 y ). От сюд а 2 x − 2 − λ 1 −
− λ 2 = 0, −2 y − λ 1 − 2 λ 2 = 0, 2 z + λ 1 = 0. Привлекая уравнения связи, получаем
1
1
3
x= , y= , z= .
2
4
4

474

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

l
x
Полагая n = , i = i , Fi = f ( xi )h, h → 0, получим в пределе
h
h
x

y=

ное значение при условиях (26). Из (34) получаем

l

l −x
x
ξf ( ξ ) dξ + ∫ ( l − ξ) f ( ξ ) dξ (ср. § VI.2).
Pl ∫0
Pl x

§ 2
1

1

2 xδy
dx; 2 y(0 ) δy(0 ) + ∫ ( xδy + 2 y′δy′ ) dx.
y3
0
0

1. δI = − ∫

1

1

2. В данном примере ΔI = ∫ (2 x + αx 2 )2 dx − ∫ (2 x )2 dx = α +
0

0

ОТВЕТЫ И РЕШЕНИЯ

α2
; δI = α .
5

Результаты подсчета:
α

ΔI

δI

относительная ошибка

1
–0,1
0,01

1,2
–0,098
0,01002

1
–0,1
0,01

–17%
–2%
–0,2%

475

1 + y′ 2 −

2 y′y′
2 1 + y′ 2

= C,

откуда y′ = C1 , y = C1 x + C 2 . Это — уравнение прямых.
§ 5
Из уравнения Эйлера получается, что при a ≠ π , 2 π, 3π, ... единственной
функцией, удовлетворяющей граничным условиям и придающей функциона/
лу стационарное значение, служит y ≡ 0. Подставляя y = Cx ( a − x ), получим
a3
(10 − a 2 ), откуда видим, что при a > 10 задача на минимум решения
I =C 2
30
πx
C2 2
не имеет. Подставляя y = C sin , получаем I =
( π − a 2 ), откуда видим,
1a
a
что при a > π задача на минимум решения не имеет. Можно доказать, что так
будет и при a =2π, 3π, ..., а при a < π функция y ≡ 0 служит решением зада/
чи на минимум.
§ 6
b

§ 3
Уравнение (22) в обоих случаях имеет вид (1 − x )2( y − 2 x ) = 0, откуда
y = 2 x. Это решение придает функционалу стационарное значение I = 0, кото/
рое лишь в случае а) является минимальным. В случае б) решение имеет ха/
рактер минимакса (ср. § IV.6), а задача на минимум решения не имеет.

1. Аналогично (27) приходим к равенству

∫ ( F y′δy + F y′ ′δy′ + F y′ ′′δy′′ ) dx = 0.
a

Интегрируя по частям второе слагаемое один раз, а третье — два раза, получим
b



d2

d



∫ ⎜⎝ F y′ − dx F y′ ′ + dx 2 F y′ ′′ ⎟⎠ δy dx = 0,
a

§ 4

откуда приходим к искомому уравнению

d
1. а) Уравнение Эйлера имеет вид 2 y − (2 y′ ) = 0, т.е. y′′ − y = 0, откуда
dx
y = C1 e x + C 2 e − x (см. § VII.3). Из граничных условий получаем 0 = C1 + C2,
ex − e−x
1
1
, C2 = −
и окончательнo y =
;
1 = C1 e + C 2 e −1 , откуда C1 =
−1
−1
e−e
e−e
e − e −1
б) по
формуле
(34) yy′ 2 − 2 yy′ ⋅ y′ = C , yy′ 2 = −C , y dy = ± −C dx,
3
y3 2 = ±
−C x + C 2 = C1 x + C 2 . Из граничных условий p 3 2 = C 2 , q 3 2 = C1 + C 2 ,
2
откуда y 3 2 = ( q 3 2 − p 3 2 )x + p 3 2 и окончательно y = [( q 3 2 − p 3 2 )x + p 3 2 ]2 3 .
2. Подстановка последнего решения в I дает после вычислений значение
4 32
∂I
4
( q − p 3 2 )2 ; отсюда
= − p1 2 ( q 3 2 − p 3 2 ). По формуле, выведенной в тексте,
9
∂p
3
2
∂I
4
3 2
= − (2 yy′ )
= −2 p [( q − p 3 2 )x + p 3 2 ]−1 3 ( q 3 2 − p 3 2 )
= − p1 2 ( q 3 2 −
3
∂p
3
x =0
x =0
− p 3 2 ), т.е. то же.
3. Так как длина графика y = f ( x ) ( a  x b ) равна

b



1 + y′ 2 dx, то зада/

a

ча сводится к определению линии, придающей этому функционалу минималь/

F y′ −

d
d
F y′ +
F y′ = 0.
dx ′ dx 2 ′′

2. Обозначим для краткости z′x = p, z′y = q; получим уравнение
F z′ − F px
′′ − F pz
′′

∂z
∂2 z
∂z
∂2 z
∂2 z
− Fqq
= 0.
− F pp
− 2 F pq
− Fq′′y − Fqz′′
′′
′′
′′
2
∂y
∂x
∂x∂y
∂y 2
∂x

§ 7
а) u* = x 2 − y 2 + z 2 − 2 x − λ ( x + 2 y − z ); отсюда условия стационарности дают
2 x − 2 − λ = 0,

−2 y − 2 λ = 0,

2 z + λ = 0.

Выражая отсюда x, y, z через λ и подставляя в уравнение связи, получаем
λ = −2, откуда координаты точки условного экстремума x = 0, y = 2, z = 1;
б ) u* = x 2 − y 2 + z 2 − 2 x − λ 1 ( x + y − z ) − λ 2 ( x + 2 y ). От сюд а 2 x − 2 − λ 1 −
− λ 2 = 0, −2 y − λ 1 − 2 λ 2 = 0, 2 z + λ 1 = 0. Привлекая уравнения связи, получаем
1
1
3
x= , y= , z= .
2
4
4

476

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 8
1. Пусть Ox — ось вращения, а y = y( x )0 ( a  x b ) — уравнение конту/
ра осевого сечения; тогда объем и поверхность тела вращения выражаются по
b

b

формулам (см. например, ВМ, § III.7) V = π ∫ y 2 dx, S = 2 π ∫ y 1 + y′ 2 dx. Про/
a

a

межуточный интеграл (34) для функции π ( y 2 − 2 λy 1 + y′ 2 ) имеет вид

2 πλyy′
2 λy ⎞⎟
π ( y 2 − 2 λy 1 + y′ 2 ) +
y′ = C1 , т.е. π ⎜ y 2 −
= C1 . Так как у мо/

1 + y′ 2
1 + y′ 2 ⎟⎠


жет равняться, нулю, то C1 = 0, и мы получаем y −
= 0, откуда,
1 + y′ 2
интегрируя, находим ( x + C )2 + y 2 = 4λ2 . Искомым телом является шар.
2. Так как длина L подвешенной нити ( L ) с уравнением y = y( x ) зада/
на, а высота центра тяжести, как вытекает из § XI.2, определяется формулой
1
yц. т. = ∫ y dL, то задача сводится к минимизации интеграла B = ∫ y dL =
L (L )
(L )
=

∫y

1 + y′ 2 dx при заданном L =

(L )



1 + y′ 2 dx. Уравнение Эйлера надо пи/

(L )

сать для функции y 1 + y′ 2 − λ 1 + y′ 2 = ( y − λ ) 1 + y′ 2 , которая после
подстановки y − λ = y переходит в функцию, исследованную в примере § 5.
1
Решением задачи служит цепная линия с уравнением y = [e k ( x + c ) +
2k
+ e − k ( x + c ) ] + λ, где k, C, λ — произвольные постоянные.
1
3. В первом примере λ = , где R — радиус шара. Во втором примере λ
2R
равно разности между ординатой крайней нижней точки цепной линии и ради/
усом кривизны в этой точке.
§ 9
⎛ 1 1⎞
1. Функция z имеет стационарное значение z = 0 в точке ⎜ ; ⎟ . На ка/
⎝ 2 2⎠
1
тетах имеется по одному условному стационарному значению z = в точке
4
1
⎛ 1⎞
⎛1 ⎞
⎜0; ⎟ и z = − в точке ⎜ ; 0⎟ . В вершинах значения равны 0, –2 и 2. Зна/
⎝ 2⎠
⎝2 ⎠
4
чит, z max = 2 достигается в точке (2; 0 ), z min = −2 достигается в точке (0; 2 ).
2. В упражнении 2 § 8 мы получили уравнение висящих участков нити.
Здесь возможны два случая. Если нить достаточно коротка, L < L0 , так что она
e kx + e − kx e k + e − k
не достает до «пола», т.е. прямой y = 0, получаем y =

+ 1.
2k
2k
ek − e−k
При этом L =
, так что при заданном L можно численно найти k. Так/
k
k
2 + 2k − e − e − k
, то L0 определяется по тому k > 0, для которого
как ymin =
2k

ОТВЕТЫ И РЕШЕНИЯ

477

2 + 2k = e k + e − k . Подсчет дает значение L0 = 1616
, . При L > L0 линия состоит из
двух провисающих участков и одного, лежащего на полу. Правый провисающий учас/
e k ( x −C ) e − k ( x −C ) 1
e k (1 −C ) + e − k (1 −C ) 1
ток имеет уравнение y =
+
− , причем
− = 1, от/
2k
2k
2k
k
k
куда можно выразить C через k. Длина всей линии равна L = 2C +
e k (1 −C ) − e − k (1 −C )
.
+
k
§ 10
1. Уравнение эллипса

( x + c )2 + y 2 + ( x − c )2 + y 2 = L, после преобразо/

ваний 4( L2 − 4 c 2 )x 2 + 4 L2 y 2 = L2 ( L2 − 4 c 2 ). Уравнения касательной и нормали
в произвольной точке ( x0 ; y0 ) соответственно
y − y0 = −

( L2 − 4 c 2 )x0
( x − x0 )
L2 y0

y − y0 =

и

L2 y0
( x − x0 ).
( L − 4 c 2 )x0
2

Искомые углы находятся по формуле tg (β − α ) =

tg β − tg α
. Для первого
1 + tg α tg β

y0
L2 y0
, откуда находим после
, tg β = 2
x0 + c
( L − 4 c 2 )x0
4 cy
преобразований tg (β − α ) = 2 0 2 . Тому же оказывается равным тангенс
L − 4c
второго угла, откуда и вытекает последнее утверждение упражнения 1.
2. Если точка N имеет координаты (0; yN ), то

угла надо положить tg α =

L = Y − yK + xK2 + ( yK − yN )2 = Y − xK2 + xK2 + ( xK2 − yN )2 .
1
dL
= 0 находим, что yN = . Уравнения касательной и нормали
4
dx
в точке K имеют соответственно вид

Из условия

y − xK2 = 2 xK ( x − xK )

и

а уравнение прямой NK имеет вид y −

y − xK2 = −

xK2

=

xK2 −

1
( x − xK ),
2 xK

1
4 ( x − x ). Равенство требуе/
K

xK
мых углов доказываем подобно упражнению 1.
3. Пусть
точки И и A имеют
координаты ( −1; 1) и (1; 1).
Тогда
1
2
2
, откуда отражающая об/
L = ( x + 1) + 1 + ( x − 1) + 1, x0 = 0, L′′( x0 ) =
2
5 ⋅ 10 −5
ласть имеет диаметр 2
см = 1,7 ⋅ 10 −2 см = 0,17 мм.
1 2

476

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 8
1. Пусть Ox — ось вращения, а y = y( x )0 ( a  x b ) — уравнение конту/
ра осевого сечения; тогда объем и поверхность тела вращения выражаются по
b

b

формулам (см. например, ВМ, § III.7) V = π ∫ y 2 dx, S = 2 π ∫ y 1 + y′ 2 dx. Про/
a

a

межуточный интеграл (34) для функции π ( y 2 − 2 λy 1 + y′ 2 ) имеет вид

2 πλyy′
2 λy ⎞⎟
π ( y 2 − 2 λy 1 + y′ 2 ) +
y′ = C1 , т.е. π ⎜ y 2 −
= C1 . Так как у мо/

1 + y′ 2
1 + y′ 2 ⎟⎠


жет равняться, нулю, то C1 = 0, и мы получаем y −
= 0, откуда,
1 + y′ 2
интегрируя, находим ( x + C )2 + y 2 = 4λ2 . Искомым телом является шар.
2. Так как длина L подвешенной нити ( L ) с уравнением y = y( x ) зада/
на, а высота центра тяжести, как вытекает из § XI.2, определяется формулой
1
yц. т. = ∫ y dL, то задача сводится к минимизации интеграла B = ∫ y dL =
L (L )
(L )
=

∫y

1 + y′ 2 dx при заданном L =

(L )



1 + y′ 2 dx. Уравнение Эйлера надо пи/

(L )

сать для функции y 1 + y′ 2 − λ 1 + y′ 2 = ( y − λ ) 1 + y′ 2 , которая после
подстановки y − λ = y переходит в функцию, исследованную в примере § 5.
1
Решением задачи служит цепная линия с уравнением y = [e k ( x + c ) +
2k
+ e − k ( x + c ) ] + λ, где k, C, λ — произвольные постоянные.
1
3. В первом примере λ = , где R — радиус шара. Во втором примере λ
2R
равно разности между ординатой крайней нижней точки цепной линии и ради/
усом кривизны в этой точке.
§ 9
⎛ 1 1⎞
1. Функция z имеет стационарное значение z = 0 в точке ⎜ ; ⎟ . На ка/
⎝ 2 2⎠
1
тетах имеется по одному условному стационарному значению z = в точке
4
1
⎛ 1⎞
⎛1 ⎞
⎜0; ⎟ и z = − в точке ⎜ ; 0⎟ . В вершинах значения равны 0, –2 и 2. Зна/
⎝ 2⎠
⎝2 ⎠
4
чит, z max = 2 достигается в точке (2; 0 ), z min = −2 достигается в точке (0; 2 ).
2. В упражнении 2 § 8 мы получили уравнение висящих участков нити.
Здесь возможны два случая. Если нить достаточно коротка, L < L0 , так что она
e kx + e − kx e k + e − k
не достает до «пола», т.е. прямой y = 0, получаем y =

+ 1.
2k
2k
ek − e−k
При этом L =
, так что при заданном L можно численно найти k. Так/
k
k
2 + 2k − e − e − k
, то L0 определяется по тому k > 0, для которого
как ymin =
2k

ОТВЕТЫ И РЕШЕНИЯ

477

2 + 2k = e k + e − k . Подсчет дает значение L0 = 1616
, . При L > L0 линия состоит из
двух провисающих участков и одного, лежащего на полу. Правый провисающий учас/
e k ( x −C ) e − k ( x −C ) 1
e k (1 −C ) + e − k (1 −C ) 1
ток имеет уравнение y =
+
− , причем
− = 1, от/
2k
2k
2k
k
k
кудаможно выразить C через k. Длина всей линии равна L = 2C +
e k (1 −C ) − e − k (1 −C )
.
+
k
§ 10
1. Уравнение эллипса

( x + c )2 + y 2 + ( x − c )2 + y 2 = L, после преобразо/

ваний 4( L2 − 4 c 2 )x 2 + 4 L2 y 2 = L2 ( L2 − 4 c 2 ). Уравнения касательной и нормали
в произвольной точке ( x0 ; y0 ) соответственно
y − y0 = −

( L2 − 4 c 2 )x0
( x − x0 )
L2 y0

y − y0 =

и

L2 y0
( x − x0 ).
( L − 4 c 2 )x0
2

Искомые углы находятся по формуле tg (β − α ) =

tg β − tg α
. Для первого
1 + tg α tg β

y0
L2 y0
, откуда находим после
, tg β = 2
x0 + c
( L − 4 c 2 )x0
4 cy
преобразований tg (β − α ) = 2 0 2 . Тому же оказывается равным тангенс
L − 4c
второго угла, откуда и вытекает последнее утверждение упражнения 1.
2. Если точка N имеет координаты (0; yN ), то

угла надо положить tg α =

L = Y − yK + xK2 + ( yK − yN )2 = Y − xK2 + xK2 + ( xK2 − yN )2 .
1
dL
= 0 находим, что yN = . Уравнения касательной и нормали
4
dx
в точке K имеют соответственно вид

Из условия

y − xK2 = 2 xK ( x − xK )

и

а уравнение прямой NK имеет вид y −

y − xK2 = −

xK2

=

xK2 −

1
( x − xK ),
2 xK

1
4 ( x − x ). Равенство требуе/
K

xK
мых углов доказываем подобно упражнению 1.
3. Пусть
точки И и A имеют
координаты ( −1; 1) и (1; 1).
Тогда
1
2
2
, откуда отражающая об/
L = ( x + 1) + 1 + ( x − 1) + 1, x0 = 0, L′′( x0 ) =
2
5 ⋅ 10 −5
ласть имеет диаметр 2
см = 1,7 ⋅ 10 −2 см = 0,17 мм.
1 2

478

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 11
В данном примере
l

L =T −U =

1
2 ∫0

2

l

 ∂y 
ρ   dx − ∫
 ∂t 

0

 P  ∂y  2 k 2

   + y − f ( x ) y  dx.
2
 2 ∂x


Выписывая интеграл действия, а затем применяя уравнение Эйлера из § 6, по!
∂  ∂y 
∂  ∂y 
лучим искомое уравнение в виде − ky + f ( x ) − ρ  +
P  = 0, т.е.
∂t  ∂t  ∂x  ∂x 
2

2

∂ y P∂ y k
1
=
− y + f ( x ).
ρ
∂t 2 ρ ∂x 2 ρ
§ 12
π2 + 1 2
4 2
1. Подставляя y = x + C sin πx в (75), получаем I = + C +
C . Из
3 π
2
−2
dI
условия
= −0,0588. Значения I и y(0,5 ) полу!
= 0 находим C =
dC
π ( π 2 + 1)
чаются равными 1,315 (ошибка 0,2%) и 0,441 (ошибка 0,7%).
5 C 7C 2
. Из условия минимальности
2. Подставляя, получаем I = +
+
4 10
20
1
87
C =− , I =
= 1247
, .
7
70
π 2C 2 32C
3. Подставляя, получаем I =
+ 2 . Из условия минимальности
2
π
32
C = − 4 = −0,331. Значения I и u(0, 0 ) получаются равными –0,537 и –0,331
π
вместо –0,556 и –0,312.

ГЛАВА XIII
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
§ 1. Постановка вопроса
В природе и в технике часто встречаются явления, изучение кото!
рых требует знания особой отрасли математики, так называемой тео"
рии вероятностей.
Простейший пример, который всегда приводится по этому поводу,
состоит в следующем. Будем подбрасывать монету. При падении она
ложится на стол либо вверх гербом, либо вверх стороной, на которой
обозначена стоимость (решкой). Если бросить монету так, чтобы она
сделала в воздухе много оборотов, то в среднем монета будет падать
одинаково часто вверх гербом и вверх решкой. Если произвести боль!
 1
шое число N подбрасываний, то получим приблизительно   N раз
 2
1
 1
герб и   N раз решку. Множители при N одинаковые и равны
 2
2
как для случая выпадания герба, так и для случая выпадания решки. Их
в данном случае называют вероятностями. Таким образом, говорят,
1
что при отдельном бросании вероятность w г получить герб равна ,
2
1
вероятность w р получить решку также равна .
2
Возьмем еще пример. Рассмотрим кубик, одна грань которого вы!
крашена в белый цвет, а остальные пять сторон — в черный. При броса!
нии такого кубика большое число N раз мы получим приблизительно
 1
 5
  N раз сверху белую сторону и   N раз — черную*. Поэтому
 6
 6
1
говорят, что вероятность появления наверху белой грани w б = , а ве!
6
5
роятность появления наверху черной грани wч= . Ясно, что если есть
6

два взаимно исключающих исхода отдельного испытания (герб или

* Мы предполагаем, что кубик изготовлен из однородного материала.

478

ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

[Гл. XII

§ 11
В данном примере
l

L =T −U =

1
2 ∫0

2

l

 ∂y 
ρ   dx − ∫
 ∂t 

0

 P  ∂y  2 k 2

   + y − f ( x ) y  dx.
2
 2 ∂x


Выписывая интеграл действия, а затем применяя уравнение Эйлера из § 6, по!
∂  ∂y 
∂  ∂y 
лучим искомое уравнение в виде − ky + f ( x ) − ρ  +
P  = 0, т.е.
∂t  ∂t  ∂x  ∂x 
2

2

∂ y P∂ y k
1
=
− y + f ( x ).
ρ
∂t 2 ρ ∂x 2 ρ
§ 12
π2 + 1 2
4 2
1. Подставляя y = x + C sin πx в (75), получаем I = + C +
C . Из
3 π
2
−2
dI
условия
= −0,0588. Значения I и y(0,5 ) полу!
= 0 находим C =
dC
π ( π 2 + 1)
чаются равными 1,315 (ошибка 0,2%) и 0,441 (ошибка 0,7%).
5 C 7C 2
. Из условия минимальности
2. Подставляя, получаем I = +
+
4 10
20
1
87
C =− , I =
= 1247
, .
7
70
π 2C 2 32C
3. Подставляя, получаем I =
+ 2 . Из условия минимальности
2
π
32
C = − 4 = −0,331. Значения I и u(0, 0 ) получаются равными –0,537 и –0,331
π
вместо –0,556 и –0,312.

ГЛАВА XIII
ТЕОРИЯ ВЕРОЯТНОСТЕЙ
§ 1. Постановка вопроса
В природе и в технике часто встречаются явления, изучение кото!
рых требует знания особой отрасли математики, так называемой тео"
рии вероятностей.
Простейший пример, который всегда приводится по этому поводу,
состоит в следующем. Будем подбрасывать монету. При падении она
ложится на стол либо вверх гербом, либо вверх стороной, на которой
обозначена стоимость (решкой). Если бросить монету так, чтобы она
сделала в воздухе много оборотов, то в среднем монета будет падать
одинаково часто вверх гербом и вверх решкой. Если произвести боль!
 1
шое число N подбрасываний, то получим приблизительно   N раз
 2
1
 1
герб и   N раз решку. Множители при N одинаковые и равны
 2
2
как для случая выпадания герба, так и для случая выпадания решки. Их
в данном случае называют вероятностями. Таким образом, говорят,
1
что при отдельном бросании вероятность w г получить герб равна ,
2
1
вероятность w р получить решку также равна .
2
Возьмем еще пример. Рассмотрим кубик, одна грань которого вы!
крашена в белый цвет, а остальные пять сторон — в черный. При броса!
нии такого кубика большое число N раз мы получим приблизительно
 1
 5
  N раз сверху белую сторону и   N раз — черную*. Поэтому
 6
 6
1
говорят, что вероятность появления наверху белой грани w б = , а ве!
6
5
роятность появления наверху черной грани wч= . Ясно, что если есть
6

два взаимно исключающих исхода отдельного испытания (герб или

* Мы предполагаем, что кубик изготовлен из однородного материала.

480

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

§ 1]

ПОСТАНОВКА ВОПРОСА

481

решка в первом примере, белая или черная грань во втором примере),
то сумма их вероятностей равна 1.
Следующий пример связан с вопросом о радиоактивном распаде.
(Подробно радиоактивный распад был рассмотрен в ВМ, гл. V.) Будем
наблюдать за отдельным атомом радиоактивного вещества. Вероят/
ность того, что за малое время τ, прошедшее после того, как мы начали
наблюдать за этим атомом, он распадается, равна wτ, где w — постоян/
ная величина, т.е. эта вероятность пропорциональна продолжительнос/
ти промежутка времени τ. Вероятность того, что за это время
радиоактивного распада не произойдет, равна, следовательно, 1− wτ.
Постоянная w характеризует данное радиоактивное вещество. Она
1
и связана со средним временем жизни T дан/
имеет размерность
сек
1
ного элемента соотношением w = .
T
Ясно, что вероятность распада может быть равна wτ лишь для весь/
ма малых промежутков времени τ. Действительно, для больших τ мы
можем получить, например, wτ > 1, что явно бессмысленно. Поэтому
мы должны рассматривать весьма малый промежуток времени dt. При
этом мы будем иметь дело с весьма малой вероятностью распада w ⋅ dt
и с весьма близкой к единице (1− w dt) вероятностью атома не испы/
тать распада. Отсюда в § 5 получится вероятность a не распасться за
конечное время t, a = (1 − w dt) t dt = e − wt , и вероятность b распада за
это время, b = 1 − a = 1 − e − wt .
Бывает так, что возможно несколько (больше двух) исходов отдель/
ного испытания. Так, например, при бросании обычной игральной кости
(кубика с различными цифрами от 1 до 6 на его гранях) возможны шесть
различных исходов: может выпасть грань с цифрой 1, может грань с циф/
1
рой 2 и т.д. до цифры 6. Вероятность каждого исхода равна .
6
Наконец, результат отдельного испытания может характеризовать/
ся величиной, которая принимает непрерывный ряд значений. Таков,
например, при ловле рыбы удочкой вес р отдельной выловленной
рыбы. Грубо можно подразделить рыб, например, на мальков весом до
100 г*, средних, весом от 100 г до 1 кг, и больших, весом больше 1 кг. Тог/
да возможный исход вытаскивания из пруда одной рыбы будет харак/
теризоваться тремя числами: вероятностью вытащить малька w м ,
вероятностью вытащить среднюю рыбу w с и вероятностью вытащить
большую рыбу w б . При этом

Однако такое описание рыбной ловли является очень грубым. Так,
например, ответ «поймана большая рыба» может означать, что вылов/
лена рыба в 1,1 кг, а может означать, что выловлена рыба в 20 кг.
Вероятность вытащить рыбу, вес которой лежит в пределах от p до
p + dp, где dp — весьма малое приращение веса, будем обозначать через
dw. Естественно, эта вероятность пропорциональна dp. Кроме того, dw
зависит и от p.
В самом деле, нет никаких оснований считать, что вероятность пой/
мать рыбу, вес которой заключен в пределах от 100 до 110 г, такова же,
как вероятность поймать рыбу, вес которой лежит в пределах от 1000 до
1010 г. Положим поэтому

wм + wс + wб = 1.

f ( p ) = kδ( p ) + (1 − k ) F ( p ).

* Мы сознаем, что такое определение малька является довольно спорным с точки
зрения профессионального рыболова.

На нескольких примерах мы обрисовали тот материал, с которым
имеет дело теория вероятностей. Ниже будет рассматриваться ряд воп/
росов, возникающих при этом.

dw = F ( p ) dp.

Входящая сюда функция F ( p) называется плотностью распределения
вероятностей.
Мы знаем, что сумма всех вероятностей выловить ту или иную рыбу
равна 1, это дает


∫ F ( p ) dp = 1.
0

Можно несколько видоизменить задачу и рассматривать не вылавли/
вание какой/либо рыбы, а в качестве отдельного испытания рассматри/
вать забрасывание крючка. Это забрасывание крючка иногда
сопровождается вылавливанием рыбы, а иногда (к сожалению, нередко) и
не приводит к вылавливанию рыбы. Можно ввести вероятность вытаски/
вания пустого крючка k и вероятность вытаскивания рыбы (любого
веса), равную 1− k, а затем уже подразделять случаи вытаскивания той
или иной рыбы в соответствии с функцией F ( p). Можно пойти по друго/
му пути. Вытаскивание пустого крючка можно назвать «вылавливанием
рыбы, вес которой равен нулю». Тогда не надо будет явно упоминать о та/
ком печальном случае, как вытаскивание пустого крючка. При этом полу/
чится новая плотность распределения вероятностей f ( p). Это будет
функция, для которой нуль является особой точкой. Интеграл



∫ f ( p) dp = 1, но в этот интеграл точка

p = 0 дает конечный вклад; это зна/

0

чит, что f ( p) содержит член вида kδ( p) (см. о понятии дельта/функции
в гл. VI). Новая функция f ( p), относящаяся к одному забрасыванию
крючка, связана со старой функцией F ( p) (которая относилась к одной
настоящей, с p > 0, выловленной рыбе) соотношением

480

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

§ 1]

ПОСТАНОВКА ВОПРОСА

481

решка в первом примере, белая или черная грань во втором примере),
то сумма их вероятностей равна 1.
Следующий пример связан с вопросом о радиоактивном распаде.
(Подробно радиоактивный распад был рассмотрен в ВМ, гл. V.) Будем
наблюдать за отдельным атомом радиоактивного вещества. Вероят/
ность того, что за малое время τ, прошедшее после того, как мы начали
наблюдать за этим атомом, он распадается, равна wτ, где w — постоян/
ная величина, т.е. эта вероятность пропорциональна продолжительнос/
ти промежутка времени τ. Вероятность того, что за это время
радиоактивного распада не произойдет, равна, следовательно, 1− wτ.
Постоянная w характеризует данное радиоактивное вещество. Она
1
и связана со средним временем жизни T дан/
имеет размерность
сек
1
ного элемента соотношением w = .
T
Ясно, что вероятность распада может быть равна wτ лишь для весь/
ма малых промежутков времени τ. Действительно, для больших τ мы
можем получить, например, wτ > 1, что явно бессмысленно. Поэтому
мы должны рассматривать весьма малый промежуток времени dt. При
этом мы будем иметь дело с весьма малой вероятностью распада w ⋅ dt
и с весьма близкой к единице (1− w dt) вероятностью атома не испы/
тать распада. Отсюда в § 5 получится вероятность a не распасться за
конечное время t, a = (1 − w dt) t dt = e − wt , и вероятность b распада за
это время, b = 1 − a = 1 − e − wt .
Бывает так, что возможно несколько (больше двух) исходов отдель/
ного испытания. Так, например, при бросании обычной игральной кости
(кубика с различными цифрами от 1 до 6 на его гранях) возможны шесть
различных исходов: может выпасть грань с цифрой 1, может грань с циф/
1
рой 2 и т.д. до цифры 6. Вероятность каждого исхода равна .
6
Наконец, результат отдельного испытания может характеризовать/
ся величиной, которая принимает непрерывный ряд значений. Таков,
например, при ловле рыбы удочкой вес р отдельной выловленной
рыбы. Грубо можно подразделить рыб, например, на мальков весом до
100 г*, средних, весом от 100 г до 1 кг, и больших, весом больше 1 кг. Тог/
да возможный исход вытаскивания из пруда одной рыбы будет харак/
теризоваться тремя числами: вероятностью вытащить малька w м ,
вероятностью вытащить среднюю рыбу w с и вероятностью вытащить
большую рыбу w б . При этом

Однако такое описание рыбной ловли является очень грубым. Так,
например, ответ «поймана большая рыба» может означать, что вылов/
лена рыба в 1,1 кг, а может означать, что выловлена рыба в 20 кг.
Вероятность вытащить рыбу, вес которой лежит в пределах от p до
p + dp, где dp — весьма малое приращение веса, будем обозначать через
dw. Естественно, эта вероятность пропорциональна dp. Кроме того, dw
зависит и от p.
В самом деле, нет никаких оснований считать, что вероятность пой/
мать рыбу, вес которой заключен в пределах от 100 до 110 г, такова же,
как вероятность поймать рыбу, вес которой лежит в пределах от 1000 до
1010 г. Положим поэтому

wм + wс + wб = 1.

f ( p ) = kδ( p ) + (1 − k ) F ( p ).

* Мы сознаем, что такое определение малька является довольно спорным с точки
зрения профессионального рыболова.

На нескольких примерах мы обрисовали тот материал, с которым
имеет дело теория вероятностей. Ниже будет рассматриваться ряд воп/
росов, возникающих при этом.

dw = F ( p ) dp.

Входящая сюда функция F ( p) называется плотностью распределения
вероятностей.
Мы знаем, что сумма всех вероятностей выловить ту или иную рыбу
равна 1, это дает


∫ F ( p ) dp = 1.
0

Можно несколько видоизменить задачу и рассматривать не вылавли/
вание какой/либо рыбы, а в качестве отдельного испытания рассматри/
вать забрасывание крючка. Это забрасывание крючка иногда
сопровождается вылавливанием рыбы, а иногда (к сожалению, нередко) и
не приводит к вылавливанию рыбы. Можно ввести вероятность вытаски/
вания пустого крючка k и вероятность вытаскивания рыбы (любого
веса), равную 1− k, а затем уже подразделять случаи вытаскивания той
или иной рыбы в соответствии с функцией F ( p). Можно пойти по друго/
му пути. Вытаскивание пустого крючка можно назвать «вылавливанием
рыбы, вес которой равен нулю». Тогда не надо будет явно упоминать о та/
ком печальном случае, как вытаскивание пустого крючка. При этом полу/
чится новая плотность распределения вероятностей f ( p). Это будет
функция, для которой нуль является особой точкой. Интеграл



∫ f ( p) dp = 1, но в этот интеграл точка

p = 0 дает конечный вклад; это зна/

0

чит, что f ( p) содержит член вида kδ( p) (см. о понятии дельта/функции
в гл. VI). Новая функция f ( p), относящаяся к одному забрасыванию
крючка, связана со старой функцией F ( p) (которая относилась к одной
настоящей, с p > 0, выловленной рыбе) соотношением

482

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Например, пусть монета брошена пять раз. Какова вероятность того,
что во всех пяти бросаниях выпадает герб? Какова вероятность того,
что в четырех случаях будет герб, а в одном — решка (причем безраз'
лично, в каком именно по порядку бросания появилась решка — в пер'
вом, втором и т.д. или в последнем)? При этом мы считаем, что
1
вероятность получить герб в одном бросании равна . Решение такого
2
рода задач требует известной алгебраической сноровки, а при очень
больших числах бросания приходится применять методы высшей мате'
матики, так как иначе расчеты становятся практически невыполнимы'
ми. Следующий круг вопросов связан c явлением радиоактивного
распада. Основываясь на вероятности распада за время dt, требуется на'
йти вероятность распада за время t, которое может быть каким угодно, а
вовсе не обязательно малым. При решении этого вопроса нам потребует'
ся аппарат высшей математики. (Мы получим, в частности, ряд резуль'
татов ВМ, гл. V, применяя, однако, несколько иной ход рассуждений.)
В главе V ВМ рассматривалось большое число атомов N и получил'
ся закон изменения N со временем. По существу, там рассматривались
только средние величины. Новый подход позволит решить гораздо бо'
лее тонкие вопросы, например: какова вероятность наблюдать в некото'
ром приборе то или иное число распадов, отличающееся от среднего?
В задаче о рыбной ловле можно ставить вопрос о вероятности полу'
чить тот или иной улов в результате вылавливания 2, 3, . . . , n рыб
или в результате забрасывания крючка 2, 3, . . . , n раз. Последняя за'
дача требует довольно высокой математической техники.
При выводе законов теории вероятностей нам понадобится форму'


ла Стирлинга (§ III.3), а также формула

∫e

−x2

dx = π, выведенная

−∞

в § IV.7.
Упражнение
При игре в «подкидного дурака» пользуются колодой из 36 карт, распреде'
ленных по четырем мастям. Какова вероятность того, что первой сданной кар'
той будет карта пиковой масти? дама? дама пик? козырь (козырной служит
масть первой карты, оставшейся после сдачи)?

§ 2. Умножение вероятностей
Основой решения задач, поставленных в § 1, является правило
умножения вероятностей независимых событий.
Поясним это правило на простом примере. Пусть один кубик имеет
одну белую и пять черных граней, так что вероятность появления белой
1
5
грани w б = , а вероятность появления черной грани wч= . Пусть
6
6
имеется еще один кубик, у которого две грани окрашены в зеленый

§ 2]

УМНОЖЕНИЕ ВЕРОЯТНОСТЕЙ

483

цвет, а четыре — в красный. Для этого кубика вероятности появления
зеленой и красной граней соответственно равны
wз =

2 1
= ,
6 3

wк =

4 2
= .
6 3

Положим оба кубика в один стакан, потрясем его и бросим кубики на
стол. Возможны четыре различных исхода опыта, а именно, на одном
кубике белая грань, на другом — зеленая; на одном кубике белая грань,
на другом — красная; на одном кубике черная грань, на другом — зеле'
ная, и, наконец, на одном кубике черная грань, на другом — красная. Бу'
дем эти исходы обозначать коротко так: бз, бк, чз, чк. Число случаев,
в которых осуществляются эти исходы, обозначаем через N бз , N бк ,
N чз, N чк, а соответствующие вероятности через w бз , w бк , wчз, wчк.
Поставим задачу определить эти вероятности.
Пусть, мы проделали очень большое число опытов N . Разделим все
опыты на две группы: те, в которых на первом кубике появилась белая
грань (б) (независимо от цвета грани на втором кубике), и те, в которых
на первом кубике появилась черная грань (ч) (независимо от цвета гра'
N
ни на втором кубике). Таким образом, N = N б + N ч. Так как w б = б ,
N
1
5
то N б = w б ⋅ N = N . Точно так же N ч = wч ⋅N = N .
6
6
С другой стороны, ясно, что N б = N бз + N бк . Дальше нам необходи'
мо воспользоваться понятием независимости событий. Мы предпола'
гаем, что тот факт, что на первом кубике выпала именно белая грань, не
влияет на вероятность появления зеленой или красной грани на вто'
ром кубике. Иначе говоря, мы считаем, что два события — появление
грани определенного цвета на первом кубике и появление грани опре'
деленного цвета на втором кубике — независимы. Исход одного из этих
событий никак не влияет на исход другого. Ввиду этого вероятность
N
появления на втором кубике зеленой грани w з = бз , а вероятность

N бк
появления на втором кубике красной грани w к =
. Отсюда нахо'

N
дим N бз = w з ⋅ N б = w з ⋅ w б ⋅ N . С другой стороны, w бз = бз , поэтому
N
wбз = wб ⋅ wз .

Таким образом, вероятность сложного события (появление на од'
ном кубике белой, а на другом зеленой граней) равна произведению ве'
роятностей простых независимых событий.
Теперь ясно, что
w бк = w б ⋅ w к ,

wчз=wч⋅wз ,

wчк=wч⋅wк .

482

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Например, пусть монета брошена пять раз. Какова вероятность того,
что во всех пяти бросаниях выпадает герб? Какова вероятность того,
что в четырех случаях будет герб, а в одном — решка (причем безраз'
лично, в каком именно по порядку бросания появилась решка — в пер'
вом, втором и т.д. или в последнем)? При этом мы считаем, что
1
вероятность получить герб в одном бросании равна . Решение такого
2
рода задач требует известной алгебраической сноровки, а при очень
больших числах бросания приходится применять методы высшей мате'
матики, так как иначе расчеты становятся практически невыполнимы'
ми. Следующий круг вопросов связан c явлением радиоактивного
распада. Основываясь на вероятности распада за время dt, требуется на'
йти вероятность распада за время t, которое может быть каким угодно, а
вовсе не обязательно малым. При решении этого вопроса нам потребует'
ся аппарат высшей математики. (Мы получим, в частности, ряд резуль'
татов ВМ, гл. V, применяя, однако, несколько иной ход рассуждений.)
В главе V ВМ рассматривалось большое число атомов N и получил'
ся закон изменения N со временем. По существу, там рассматривались
только средние величины. Новый подход позволит решить гораздо бо'
лее тонкие вопросы, например: какова вероятность наблюдать в некото'
ром приборе то или иное число распадов, отличающееся от среднего?
В задаче о рыбной ловле можно ставить вопрос о вероятности полу'
чить тот или иной улов в результате вылавливания 2, 3, . . . , n рыб
или в результате забрасывания крючка 2, 3, . . . , n раз. Последняя за'
дача требует довольно высокой математической техники.
При выводе законов теории вероятностей нам понадобится форму'


ла Стирлинга (§ III.3), а также формула

∫e

−x2

dx = π, выведенная

−∞

в § IV.7.
Упражнение
При игре в «подкидного дурака» пользуются колодой из 36 карт, распреде'
ленных по четырем мастям. Какова вероятность того, что первой сданной кар'
той будет карта пиковой масти? дама? дама пик? козырь (козырной служит
масть первой карты, оставшейся после сдачи)?

§ 2. Умножение вероятностей
Основой решения задач, поставленных в § 1, является правило
умножения вероятностей независимых событий.
Поясним это правило на простом примере. Пусть один кубик имеет
одну белую и пять черных граней, так что вероятность появления белой
1
5
грани w б = , а вероятность появления черной грани wч= . Пусть
6
6
имеется еще один кубик, у которого две грани окрашены в зеленый

§ 2]

УМНОЖЕНИЕ ВЕРОЯТНОСТЕЙ

483

цвет, а четыре — в красный. Для этого кубика вероятности появления
зеленой и красной граней соответственно равны
wз =

2 1
= ,
6 3

wк =

4 2
= .
6 3

Положим оба кубика в один стакан, потрясем его и бросим кубики на
стол. Возможны четыре различных исхода опыта, а именно, на одном
кубике белая грань, на другом — зеленая; на одном кубике белая грань,
на другом — красная; на одном кубике черная грань, на другом — зеле'
ная, и, наконец, на одном кубике черная грань, на другом — красная. Бу'
дем эти исходы обозначать коротко так: бз, бк, чз, чк. Число случаев,
в которых осуществляются эти исходы, обозначаем через N бз , N бк ,
N чз, N чк, а соответствующие вероятности через w бз , w бк , wчз, wчк.
Поставим задачу определить эти вероятности.
Пусть, мы проделали очень большое число опытов N . Разделим все
опыты на две группы: те, в которых на первом кубике появилась белая
грань (б) (независимо от цвета грани на втором кубике), и те, в которых
на первом кубике появилась черная грань (ч) (независимо от цвета гра'
N
ни на втором кубике). Таким образом, N = N б + N ч. Так как w б = б ,
N
1
5
то N б = w б ⋅ N = N . Точно так же N ч = wч ⋅N = N .
6
6
С другой стороны, ясно, что N б = N бз + N бк . Дальше нам необходи'
мо воспользоваться понятием независимости событий. Мы предпола'
гаем, что тот факт, что на первом кубике выпала именно белая грань, не
влияет на вероятность появления зеленой или красной грани на вто'
ром кубике. Иначе говоря, мы считаем, что два события — появление
грани определенного цвета на первом кубике и появление грани опре'
деленного цвета на втором кубике — независимы. Исход одного из этих
событий никак не влияет на исход другого. Ввиду этого вероятность
N
появления на втором кубике зеленой грани w з = бз , а вероятность

N бк
появления на втором кубике красной грани w к =
. Отсюда нахо'

N
дим N бз = w з ⋅ N б = w з ⋅ w б ⋅ N . С другой стороны, w бз = бз , поэтому
N
wбз = wб ⋅ wз .

Таким образом, вероятность сложного события (появление на од'
ном кубике белой, а на другом зеленой граней) равна произведению ве'
роятностей простых независимых событий.
Теперь ясно, что
w бк = w б ⋅ w к ,

wчз=wч⋅wз ,

wчк=wч⋅wк .

484

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Мы уже отмечали, что при одновременном бросании двух кубиков, о ко/
торых идет речь, возможны лишь четыре следующих исхода: бз, бк, чз, чк.
Поэтому должно быть
wбз + wбк + wчз + wчк = 1.

Нетрудно убедиться, что это действительно так. В самом деле,
wбз + wбк + wчз + wчк = wб ⋅ wз + wб ⋅ wк + wч ⋅ wз + wч ⋅ wк =
= wб ⋅ (wз + wк) + wч ⋅ (wз + wк) = (wз + wк) (wб + wч).

В каждой из последних двух скобок написана сумма вероятностей
двух простых событий, каждое из которых исключает другое и какое/то
одно из которых обязательно произойдет. (Если выпадет белая грань, то
не выпадет черная, и наоборот. Либо черная, либо белая грань появятся
обязательно). Ясно, что такая сумма вероятностей равна единице:
(wб + wч) = 1,

(wз + wк) = 1,

откуда и следует, что
wбз + wбк + wчз + wчк = 1.

Перейдем к следующему примеру. Пусть имеется кубик с некото/
рым (неважно, каким именно) количеством белых и некоторым коли/
чеством черных граней. Обозначим вероятности появления белой
и черной граней при одном бросании кубика через α и β соответ/
ственно. Пусть опыт состоит в трехкратном бросании такого кубика.
Так как в каждом бросании возможны два исхода, то в результате наше/
го опыта возможно 2 3 = 8 различных исходов*. Перечислим их в сле/
дующей схеме:
Первое
бросание

Второе
бросание
б

б

485

Проследив за каждой стрелкой схемы, мы видим все восемь возмож/
ных исходов. В предпоследнем столбце схемы эти исходы записаны
кратко: цифра означает номер бросания, а буква — исход этого броса/
ния. Так, например, запись 1ч; 2б; 3ч означает, что в первом бросании
появилась черная грань, во втором бросании — белая, в третьем — опять
черная. В последнем столбце выписаны вероятности каждого из этих
восьми исходов. Эти вероятности легко подсчитываются по правилу
умножения вероятностей.
В составленной выше таблице мы различаем, например, случаи 1б,
2б, Зч и 1ч, 2б, 3б; в обоих этих случаях один раз выпала черная грань
и два раза белая, только в первом случае черная грань появилась при
третьем бросании, а во втором случае — при первом. Обычно в конкрет/
ных задачах такого типа нас интересует только общее количество появ/
лений белой грани и общее количество появлений черной грани,
а порядок появлений безразличен.
С этой точки зрения восемь рассмотренных случаев разбиваются на
четыре группы:
б = 3, ч = 0; б = 2, ч = 1; б = 1, ч = 2; б = 0, ч = 3*.

Исход трех
бросаний

Вероятность
исхода

б

1б; 2б; 3б

3

ч

1б; 2б; 3ч

2

б

1б; 2ч; 3б

2

ч

1б; 2ч; 3ч

2

wб, wч, wк, (wб + wч + wк = 1).

б

1ч; 2б; 3б

2

ч

1ч; 2б; 3ч

2

б

1ч; 2ч; 3б

2

ч

1ч; 2ч; 3ч

3

Третье
бросание

ч
ч

УМНОЖЕНИЕ ВЕРОЯТНОСТЕЙ

Эти обозначения понятны: б = 2, ч=1 означает группу, состоящую из
всех случаев, в которых два раза выпала белая грань и один раз чер/
ная. (Порядок выпадения безразличен.) Составим таблицу, в кото/
рой выписаны все эти группы, все случаи, на которые распадается
каждая группа, вероятности каждого случая и вероятности каждой
группы.
Для того чтобы подсчитать вероятность группы, заметим следую/
щее.
Если какая/нибудь группа событий объединяет несколько несов/
местных случаев, то вероятность группы, т.е. вероятность того, что про/
изойдет какой/либо один из этих случаев, равна сумме вероятностей
независимых случаев, составляющих группу. Поясним сказанное при/
мером. Пусть мы бросаем кубик, у которого есть белые, черные и крас/
ные грани, причем вероятности появления граней этих цветов
соответственно равны

б
ч

§ 2]

* Если опыт состоит в бросании кубика n раз, то возможны 2 n различных исходов.

Рассмотрим группу событий, состоящую в том, что появилась либо бе/
лая, либо черная грань. Вероятность этой группы обозначим через wб + ч.
Найдем wб + ч.

* Если опыт состоит в бросании кубика n раз, то 2 n случаев разбиваются на n + 1
группу
б = n, ч = 0; б = n − 1, ч = 1; б = n − 2, ч = 2; . . . ; б = 0, ч = n.

484

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Мы уже отмечали, что при одновременном бросании двух кубиков, о ко/
торых идет речь, возможны лишь четыре следующих исхода: бз, бк, чз, чк.
Поэтому должно быть
wбз + wбк + wчз + wчк = 1.

Нетрудно убедиться, что это действительно так. В самом деле,
wбз + wбк + wчз + wчк = wб ⋅ wз + wб ⋅ wк + wч ⋅ wз + wч ⋅ wк =
= wб ⋅ (wз + wк) + wч ⋅ (wз + wк) = (wз + wк) (wб + wч).

В каждой из последних двух скобок написана сумма вероятностей
двух простых событий, каждое из которых исключает другое и какое/то
одно из которых обязательно произойдет. (Если выпадет белая грань, то
не выпадет черная, и наоборот. Либо черная, либо белая грань появятся
обязательно). Ясно, что такая сумма вероятностей равна единице:
(wб + wч) = 1,

(wз + wк) = 1,

откуда и следует, что
wбз + wбк + wчз + wчк = 1.

Перейдем к следующему примеру. Пусть имеется кубик с некото/
рым (неважно, каким именно) количеством белых и некоторым коли/
чеством черных граней. Обозначим вероятности появления белой
и черной граней при одном бросании кубика через α и β соответ/
ственно. Пусть опыт состоит в трехкратном бросании такого кубика.
Так как в каждом бросании возможны два исхода, то в результате наше/
го опыта возможно 2 3 = 8 различных исходов*. Перечислим их в сле/
дующей схеме:
Первое
бросание

Второе
бросание
б

б

485

Проследив за каждой стрелкой схемы, мы видим все восемь возмож/
ных исходов. В предпоследнем столбце схемы эти исходы записаны
кратко: цифра означает номер бросания, а буква — исход этого броса/
ния. Так, например, запись 1ч; 2б; 3ч означает, что в первом бросании
появилась черная грань, во втором бросании — белая, в третьем — опять
черная. В последнем столбце выписаны вероятности каждого из этих
восьми исходов. Эти вероятности легко подсчитываются по правилу
умножения вероятностей.
В составленной выше таблице мы различаем, например, случаи 1б,
2б, Зч и 1ч, 2б, 3б; в обоих этих случаях один раз выпала черная грань
и два раза белая, только в первом случае черная грань появилась при
третьем бросании, а во втором случае — при первом. Обычно в конкрет/
ных задачах такого типа нас интересует только общее количество появ/
лений белой грани и общее количество появлений черной грани,
а порядок появлений безразличен.
С этой точки зрения восемь рассмотренных случаев разбиваются на
четыре группы:
б = 3, ч = 0; б = 2, ч = 1; б = 1, ч = 2; б = 0, ч = 3*.

Исход трех
бросаний

Вероятность
исхода

б

1б; 2б; 3б

3

ч

1б; 2б; 3ч

2

б

1б; 2ч; 3б

2

ч

1б; 2ч; 3ч

2

wб, wч, wк, (wб + wч + wк = 1).

б

1ч; 2б; 3б

2

ч

1ч; 2б; 3ч

2

б

1ч; 2ч; 3б

2

ч

1ч; 2ч; 3ч

3

Третье
бросание

ч
ч

УМНОЖЕНИЕ ВЕРОЯТНОСТЕЙ

Эти обозначения понятны: б = 2, ч=1 означает группу, состоящую из
всех случаев, в которых два раза выпала белая грань и один раз чер/
ная. (Порядок выпадения безразличен.) Составим таблицу, в кото/
рой выписаны все эти группы, все случаи, на которые распадается
каждая группа, вероятности каждого случая и вероятности каждой
группы.
Для того чтобы подсчитать вероятность группы, заметим следую/
щее.
Если какая/нибудь группа событий объединяет несколько несов/
местных случаев, то вероятность группы, т.е. вероятность того, что про/
изойдет какой/либо один из этих случаев, равна сумме вероятностей
независимых случаев, составляющих группу. Поясним сказанное при/
мером. Пусть мы бросаем кубик, у которого есть белые, черные и крас/
ные грани, причем вероятности появления граней этих цветов
соответственно равны

б
ч

§ 2]

* Если опыт состоит в бросании кубика n раз, то возможны 2 n различных исходов.

Рассмотрим группу событий, состоящую в том, что появилась либо бе/
лая, либо черная грань. Вероятность этой группы обозначим через wб + ч.
Найдем wб + ч.

* Если опыт состоит в бросании кубика n раз, то 2 n случаев разбиваются на n + 1
группу
б = n, ч = 0; б = n − 1, ч = 1; б = n − 2, ч = 2; . . . ; б = 0, ч = n.

486

ТЕОРИЯ ВЕРОЯТНОСТЕЙ



[Гл. XIII


, то N á = wá ⋅ N , N ÷ = w ÷ ⋅ N , где N — об/
N
N
N + N ÷ wá N + w÷ N
щее число бросаний кубика. Ясно, что wá+ ÷ = á
=
= wá + w÷
Так как wá =

, w÷ =

N

N

Итак, wá+÷ = wá + w ÷ .
Теперь приводим таблицу, о которой шла речь выше.
Группа

Случай

Вероятность случая Вероятность группы

б = 3, ч = 0

1б; 2б; 3б

α3

α3

б = 2, ч = 1

1б; 2б; 3ч
1б; 2ч; 3б
1ч; 2б; 3б

α 2β
α 2β
α 2β

3α 2β

б = 1, ч = 2

1б; 2ч; 3ч
1ч; 2б; 3ч
1ч; 2ч; 3б

αβ 2
αβ 2
αβ 2

3αβ 2

б = 0, ч = 3

1ч; 2ч; 3ч

β3

β3

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

487

б = m, ч = k равна согласно правилу умножения вероятностей α m β k .
Поэтому вероятность группы равна соответствующему члену разложе/
ния по биному Ньютона.
Ясно, что сумма вероятностей всех групп должна быть равна 1, так
как все группы охватывают все возможные случаи. Проверим это.
Так как α + β = 1, то (α + β) n = 1. С другой стороны,
(α + β )n = α n + nα n −1β +

n!
α n − 2β 2 + ... + β n =
( n − 2 )! 2 !

= w ( б = n, ч = 0) + w ( б = n − 1, ч = 1) +
+ w ( б = n − 2, ч = 2) + . . . + w ( б = 0, ч = n)*.

Таким образом,
w ( б = n, ч = 0) + w ( б = n − 1, ч = 1) + . . . + w ( б = 0, ч = n) = 1.

Нетрудно убедиться, что при n/кратном бросании кубика вероятность
появления m белых и k черных граней (m + k = n) при заданном законе
чередования белых и черных граней равна α m β k . Группаб = m, ч = k вклю/
чает в себя все случаи, в которых выпало m белых и k черных граней с раз/
личным порядком чередования белых и черных граней.
Вероятность группы б = m, ч = k равна тому члену разложения би/
нома Ньютона
(α + β )n = α n + nα n −1β +

§ 3]

n!
α n − 2β 2 + ... + β n ,
( n − 2 )! 2 !

n! m k
α β .
m! k!
В самом деле, что представляет собой коэффициент при α m β k
в разложении (α + β) n по формуле бинома Ньютона? Это число спо/
собов, которыми можно набрать m множителей α и k множителей
β, раскрывая скобки в произведении
который содержит множитель α m β k , т.е. равна

(α + β )(α + β )(α + β ) ... (α + β ).
144444
42444444
3
n раз

Точно так же число случаев в группе есть число способов, которыми
можно осуществить m белых граней и k черных граней, чередуя
в различном порядке белые и черные грани. Следовательно, коэффи/
циент при α m β k в разложении (α + β) n по биному Ньютона равен
числу случаев в группе. Вероятность каждого определенного случая

Упражнения
1. Какова вероятность, что при двукратном бросании монеты она оба раза
ляжет гербом вверх.
2. Монета брошена три раза. Какова вероятность, что все три раза монета
ляжет гербом вверх; два раза вверх гербом и один раз вверх решкой?
3. Четыре грани кубика окрашены в черный цвет, а две — в белый. Какова
вероятность, что при двукратном бросании выпадут оба раза белые грани; оба
раза черные грани; один раз белая, другой раз черная грань?
4. Кубик предыдущей задачи бросают три раза. Какова вероятность того,
что два раза появится белая грань и один раз черная; два раза черная и один раз
белая?
5. Производится стрельба по мишени. При каждом выстреле вероятность
попасть равна 0,1, а вероятность промахнуться равна 0,9. Произведено два вы/
стрела. Какова вероятность того, что будет одно попадание и один промах?
6. В условиях упражнения 5 произведено три выстрела. Какова вероят/
ность того, что среди них одно попадание и два промаха; два попадания и один
промах?
7. Производится стрельба, описанная в упражнении 5. Какова вероятность
попасть в мишень один раз, если сделано четыре выстрела; если сделано пять
выстрелов?

§ 3. Анализ результатов многих испытаний
В предыдущем параграфе получены общие формулы для случая n
одинаковых испытаний, в каждом из которых возможны два различ/
ных исхода с вероятностями α и β соответственно.
При небольших значениях числа испытаний n эти формулы доста/
точно просты и наглядны.
* Запись w (б = m , ч = k) означает вероятность той группы, в которой белая грань
появляется m раз, а черная k раз.

486

ТЕОРИЯ ВЕРОЯТНОСТЕЙ



[Гл. XIII


, то N á = wá ⋅ N , N ÷ = w ÷ ⋅ N , где N — об/
N
N
N + N ÷ wá N + w÷ N
щее число бросаний кубика. Ясно, что wá+ ÷ = á
=
= wá + w÷
Так как wá =

, w÷ =

N

N

Итак, wá+÷ = wá + w ÷ .
Теперь приводим таблицу, о которой шла речь выше.
Группа

Случай

Вероятность случая Вероятность группы

б = 3, ч = 0

1б; 2б; 3б

α3

α3

б = 2, ч = 1

1б; 2б; 3ч
1б; 2ч; 3б
1ч; 2б; 3б

α 2β
α 2β
α 2β

3α 2β

б = 1, ч = 2

1б; 2ч; 3ч
1ч; 2б; 3ч
1ч; 2ч; 3б

αβ 2
αβ 2
αβ 2

3αβ 2

б = 0, ч = 3

1ч; 2ч; 3ч

β3

β3

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

487

б = m, ч = k равна согласно правилу умножения вероятностей α m β k .
Поэтому вероятность группы равна соответствующему члену разложе/
ния по биному Ньютона.
Ясно, что сумма вероятностей всех групп должна быть равна 1, так
как все группы охватывают все возможные случаи. Проверим это.
Так как α + β = 1, то (α + β) n = 1. С другой стороны,
(α + β )n = α n + nα n −1β +

n!
α n − 2β 2 + ... + β n =
( n − 2 )! 2 !

= w ( б = n, ч = 0) + w ( б = n − 1, ч = 1) +
+ w ( б = n − 2, ч = 2) + . . . + w ( б = 0, ч = n)*.

Таким образом,
w ( б = n, ч = 0) + w ( б = n − 1, ч = 1) + . . . + w ( б = 0, ч = n) = 1.

Нетрудно убедиться, что при n/кратном бросании кубика вероятность
появления m белых и k черных граней (m + k = n) при заданном законе
чередования белых и черных граней равна α m β k . Группаб = m, ч = k вклю/
чает в себя все случаи, в которых выпало m белых и k черных граней с раз/
личным порядком чередования белых и черных граней.
Вероятность группы б = m, ч = k равна тому члену разложения би/
нома Ньютона
(α + β )n = α n + nα n −1β +

§ 3]

n!
α n − 2β 2 + ... + β n ,
( n − 2 )! 2 !

n! m k
α β .
m! k!
В самом деле, что представляет собой коэффициент при α m β k
в разложении (α + β) n по формуле бинома Ньютона? Это число спо/
собов, которыми можно набрать m множителей α и k множителей
β, раскрывая скобки в произведении
который содержит множитель α m β k , т.е. равна

(α + β )(α + β )(α + β ) ... (α + β ).
144444
42444444
3
n раз

Точно так же число случаев в группе есть число способов, которыми
можно осуществить m белых граней и k черных граней, чередуя
в различном порядке белые и черные грани. Следовательно, коэффи/
циент при α m β k в разложении (α + β) n по биному Ньютона равен
числу случаев в группе. Вероятность каждого определенного случая

Упражнения
1. Какова вероятность, что при двукратном бросании монеты она оба раза
ляжет гербом вверх.
2. Монета брошена три раза. Какова вероятность, что все три раза монета
ляжет гербом вверх; два раза вверх гербом и один раз вверх решкой?
3. Четыре грани кубика окрашены в черный цвет, а две — в белый. Какова
вероятность, что при двукратном бросании выпадут оба раза белые грани; оба
раза черные грани; один раз белая, другой раз черная грань?
4. Кубик предыдущей задачи бросают три раза. Какова вероятность того,
что два раза появится белая грань и один раз черная; два раза черная и один раз
белая?
5. Производится стрельба по мишени. При каждом выстреле вероятность
попасть равна 0,1, а вероятность промахнуться равна 0,9. Произведено два вы/
стрела. Какова вероятность того, что будет одно попадание и один промах?
6. В условиях упражнения 5 произведено три выстрела. Какова вероят/
ность того, что среди них одно попадание и два промаха; два попадания и один
промах?
7. Производится стрельба, описанная в упражнении 5. Какова вероятность
попасть в мишень один раз, если сделано четыре выстрела; если сделано пять
выстрелов?

§ 3. Анализ результатов многих испытаний
В предыдущем параграфе получены общие формулы для случая n
одинаковых испытаний, в каждом из которых возможны два различ/
ных исхода с вероятностями α и β соответственно.
При небольших значениях числа испытаний n эти формулы доста/
точно просты и наглядны.
* Запись w (б = m , ч = k) означает вероятность той группы, в которой белая грань
появляется m раз, а черная k раз.

488

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Однако если n велико, то формулы перестают быть наглядными.
Поэтому необходимо проделать дополнительную работу для того, что/
бы записать эти формулы в удобном и наглядном виде. Только после
такой работы, подобной извлечению драгоценного камня из породы*
и шлифовке его, результаты станут яркими, запоминающимися, зову/
щими к дальнейшим обобщениям.
Рассмотрим сначала простейший случай α = β = 1 2, соответству/
ющий, например, бросанию монеты или бросанию кубика с тремя бе/
лыми и тремя черными гранями.
Возьмем, например, n = 100. Ясно, что вероятность получить при
ста бросаниях монеты все 100 раз герб (или все 100 раз решку) весьма
100
1
1
1
мала. Согласно результатам § 2 она равна  
= 100 ≈ 30 . Если
 2
2
10
машина производит 100 бросаний монеты в секунду,то потребуется
в среднем 1028 сек ≈ 3 ⋅ 1020 лет, чтобы получить один такой случай,
когда 100 раз подряд выпадет герб. Ясно, что в подавляющем больши/
нстве случаев в результате ста бросаний выпадет примерно 50 раз герб
и 50 раз решка. Но совершенно не очевидно, какова вероятность того,
что в ста бросаниях получится т о ч н о 50 раз герб и точно 50 раз решка.
Неясно, какова вероятность исхода, отличного от среднего. Например,
какова вероятность, что выпадет 55 гербов и 45 решек или 60 гербов
и 40 решек?
Постараемся ответить на поставленные вопросы.
Прежде всего заметим, что вероятность каждого определенного слу/
чая появления 50 решек и 50 гербов, например, когда в первом бросании
появляется герб, во втором — решка, затем опять герб, потом опять реш/
1
1
ка и т.д. (герб и решка появляются по очереди), равна 100 ≈ 30 , как
2
10
было установлено в § 2, т.е. эта вероятность равна вероятности появле/
ния герба 100 раз подряд. Значительно большая вероятность появления
50 гербов и 50 решек (в любом порядке) происходит за счет того, что это
событие, эта «группа», как мы говорили в § 2, состоит из очень большого
числа различных случаев разного чередования гербов и решек.
В § 2 мы выяснили, что эта вероятность равна
n! m k
α β ,
m! k !

где α — вероятность герба, β — вероятность решки, n — число броса/
ний, m — число появлений герба, k — число появлений решки
(m + k = n). Будем рассматривать четное n (в нашем конкретном примере

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

n
n
решек и
гербов. Поэтому
2
2

n = 100). Тогда нас интересует появление

n!
n!
,
=
m! k !   n   2
 2  !



а вероятность интересующего нас события есть
n

n
n
n!
 1

w г = , р =  =
  .

2
2   n  2  2 
!
 2  



При больших n это выражение крайне неудобно для вычислений.
Упростим его, используя приближенную формулу Стирлинга для вы/
ражения n! (см. § III.3).
n

n

n
n
n 2
По формуле Стирлинга n! = 2πn   ,   ! = πn   , поэтому
 2e 
 e   2
получаем
n
n

w г = , р =  =

2
2

2
.
πn

2
≈ 008
, . Вероятность
100π
появления 50 гербов и 50 решек в определенном порядке равна прибли/
зительно 10 −30 . Поэтому число различных случаев, в которых в раз/
личном порядке осуществляется одинаковый результат, равно
В частности, для n = 100 находим w =

0,08
= 8 ⋅ 10 28 .
10 −30

Теперь постараемся научиться определять вероятность исхода ис/
пытания, мало отличающегося от наиболее вероятного. (В рассматри/
ваемом примере наиболее вероятный исход — 50 решек и 50 гербов.)
Обозначим через δ отклонение исхода от наиболее вероятного,
n
δ = m − . Так, например, δ = 5 соответствуют 55 гербов, 45 решек,
2
δ = −5 соответствуют 45 гербов, 55 решек, δ = 3 соответствуют 53 гер/
ба, 47 решек и т.д. Вероятность соответствующего исхода испытания
обозначим через w(δ). Наиболее вероятному результату соответствует
δ = 0, так что
w (0 ) =

* «Наука та же добыча радия — в грамм добыча, в год труды, изводишь единой фор/
мулы ради тысячу тонн словесной руды», мог бы сказать Маяковский.

489

2
.
πn

(1)

488

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Однако если n велико, то формулы перестают быть наглядными.
Поэтому необходимо проделать дополнительную работу для того, что/
бы записать эти формулы в удобном и наглядном виде. Только после
такой работы, подобной извлечению драгоценного камня из породы*
и шлифовке его, результаты станут яркими, запоминающимися, зову/
щими к дальнейшим обобщениям.
Рассмотрим сначала простейший случай α = β = 1 2, соответству/
ющий, например, бросанию монеты или бросанию кубика с тремя бе/
лыми и тремя черными гранями.
Возьмем, например, n = 100. Ясно, что вероятность получить при
ста бросаниях монеты все 100 раз герб (или все 100 раз решку) весьма
100
1
1
1
мала. Согласно результатам § 2 она равна  
= 100 ≈ 30 . Если
 2
2
10
машина производит 100 бросаний монеты в секунду, то потребуется
в среднем 1028 сек ≈ 3 ⋅ 1020 лет, чтобы получить один такой случай,
когда 100 раз подряд выпадет герб. Ясно, что в подавляющем больши/
нстве случаев в результате ста бросаний выпадет примерно 50 раз герб
и 50 раз решка. Но совершенно не очевидно, какова вероятность того,
что в ста бросаниях получится т о ч н о 50 раз герб и точно 50 раз решка.
Неясно, какова вероятность исхода, отличного от среднего. Например,
какова вероятность, что выпадет 55 гербов и 45 решек или 60 гербов
и 40 решек?
Постараемся ответить на поставленные вопросы.
Прежде всего заметим, что вероятность каждого определенного слу/
чая появления 50 решек и 50 гербов, например, когда в первом бросании
появляется герб, во втором — решка, затем опять герб, потом опять реш/
1
1
ка и т.д. (герб и решка появляются по очереди), равна 100 ≈ 30 , как
2
10
было установлено в § 2, т.е. эта вероятность равна вероятности появле/
ния герба 100 раз подряд. Значительно большая вероятность появления
50 гербов и 50 решек (в любом порядке) происходит за счет того, что это
событие, эта «группа», как мы говорили в § 2, состоит из очень большого
числа различных случаев разного чередования гербов и решек.
В § 2 мы выяснили, что эта вероятность равна
n! m k
α β ,
m! k !

где α — вероятность герба, β — вероятность решки, n — число броса/
ний, m — число появлений герба, k — число появлений решки
(m + k = n). Будем рассматривать четное n (в нашем конкретном примере

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

n
n
решек и
гербов. Поэтому
2
2

n = 100). Тогда нас интересует появление

n!
n!
,
=
m! k !   n   2
 2  !



а вероятность интересующего нас события есть
n

n
n
n!
 1

w г = , р =  =
  .

2
2   n  2  2 
!
 2  



При больших n это выражение крайне неудобно для вычислений.
Упростим его, используя приближенную формулу Стирлинга для вы/
ражения n! (см. § III.3).
n

n

n
n
n 2
По формуле Стирлинга n! = 2πn   ,   ! = πn   , поэтому
 2e 
 e   2
получаем
n
n

w г = , р =  =

2
2

2
.
πn

2
≈ 008
, . Вероятность
100π
появления 50 гербов и 50 решек в определенном порядке равна прибли/
зительно 10 −30 . Поэтому число различных случаев, в которых в раз/
личном порядке осуществляется одинаковый результат, равно
В частности, для n = 100 находим w =

0,08
= 8 ⋅ 10 28 .
10 −30

Теперь постараемся научиться определять вероятность исхода ис/
пытания, мало отличающегося от наиболее вероятного. (В рассматри/
ваемом примере наиболее вероятный исход — 50 решек и 50 гербов.)
Обозначим через δ отклонение исхода от наиболее вероятного,
n
δ = m − . Так, например, δ = 5 соответствуют 55 гербов, 45 решек,
2
δ = −5 соответствуют 45 гербов, 55 решек, δ = 3 соответствуют 53 гер/
ба, 47 решек и т.д. Вероятность соответствующего исхода испытания
обозначим через w(δ). Наиболее вероятному результату соответствует
δ = 0, так что
w (0 ) =

* «Наука та же добыча радия — в грамм добыча, в год труды, изводишь единой фор/
мулы ради тысячу тонн словесной руды», мог бы сказать Маяковский.

489

2
.
πn

(1)

490

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Подсчитаем вероятность w(δ). Эта вероятность появления m =
n
n
= + δ гербов и k = − δ решек, поэтому она равна
2
2
w (δ) =

n

n


−δ
n!
α 2 β2 ,
n
 n 
 + δ !  − δ !
2
 2


где

1
α =β = .
2

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

2(δ + 1)

малые и, сле/
и
n
n
довательно, логарифмы, стоящие справа в (2), можно разложить
в ряд. Выполним это разложение, ограничиваясь первыми членами
ряда. Получим
вероятного результата. Поэтому величины


 2δ 
ln 1 −  = − ,


n
n

Следовательно,

491

2(δ + 1) 2(δ + 1)

.
ln 1 +
=

n 
n

Формула (2) принимает вид

n

n!
 1
w (δ) =
  .
n
  n   2
 + δ !  − δ !
2
 2


1

4 δ + 

2
.
ln w (δ + 1) − ln w (δ ) = −
n

Увеличим теперь δ на единицу, т.е. подсчитаем w(δ + 1), получим

Заметим, что ln w (δ + 1) − ln w (δ) можно приближенно заменить на
значение производной функции ln w ( z ), вычисленной в середине про/
1
межутка, т.е. при значении аргумента, равном δ + , так что
2

n

n!
 1
w (δ + 1) =
  .
n
 n
  2
 + δ + 1 !  − δ − 1 !
2
 2


Поэтому

ln w (δ + 1) − ln w (δ ) =
n
 n 
 + δ !  − δ !
2
 2

w (δ + 1)
.
=
n
 n

w (δ)
 + δ + 1 !  − δ − 1 !
2
 2



1 

ln w δ + 2   .



1
Конечно, w δ +  — это уже не вероятность того, что отклонение
 2
1
числа гербов от наиболее вероятного станет равным δ + , так как это
2
отклонение обязательно целое: это результат интерполяции (§ II.1)
функции w(δ) с целых значений аргумента на полуцелые. Итак,

Заметим, что
n
 n
n

 + δ + 1 ! =  + δ + 1  + δ !,
2
 2
 2

n  n  n

 − δ ! =  − δ  − δ − 1 !,
2
 2
 2


d


так что

Положим здесь δ +

n

−δ
1−
w (δ + 1)
n .
2
=
=
n
2(δ + 1)
w (δ)
+ δ + 1 1+
n
2

1

4 δ + 


1 

2
.
ln w δ + 2   =
n



1
= z, тогда dδ = dz , получим
2
4z
d
ln w ( z ) = − .
n
dz

это соотношение от z = 0 до z = δ,
2δ 2
, или, потенцируя,
ln w (δ) − ln w (0) = −
n
Проинтегрируем

Логарифмируя правую и левую части, находим
2(δ + 1)
 2δ 

ln w (δ + 1) − ln w (δ ) = ln 1 −  − ln 1 +
.


n
n 

d


(2)

Мы рассматриваем большое число опытов n и предполагаем, кроме
n
того, что величина δ  , т.е. мы изучаем малые уклонения от наиболее
2

w (δ ) = w (0 ) e



2δ 2
n

.

получим

490

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Подсчитаем вероятность w(δ). Эта вероятность появления m =
n
n
= + δ гербов и k = − δ решек, поэтому она равна
2
2
w (δ) =

n

n


−δ
n!
α 2 β2 ,
n
 n 
 + δ !  − δ !
2
 2


где

1
α =β = .
2

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

2(δ + 1)

малые и, сле/
и
n
n
довательно, логарифмы, стоящие справа в (2), можно разложить
в ряд. Выполним это разложение, ограничиваясь первыми членами
ряда. Получим
вероятного результата. Поэтому величины


 2δ 
ln 1 −  = − ,


n
n

Следовательно,

491

2(δ + 1) 2(δ + 1)

.
ln 1 +
=

n 
n

Формула (2) принимает вид

n

n!
 1
w (δ) =
  .
n
  n   2
 + δ !  − δ !
2
 2


1

4 δ + 

2
.
ln w (δ + 1) − ln w (δ ) = −
n

Увеличим теперь δ на единицу, т.е. подсчитаем w(δ + 1), получим

Заметим, что ln w (δ + 1) − ln w (δ) можно приближенно заменить на
значение производной функции ln w ( z ), вычисленной в середине про/
1
межутка, т.е. при значении аргумента, равном δ + , так что
2

n

n!
 1
w (δ + 1) =
  .
n
 n
  2
 + δ + 1 !  − δ − 1 !
2
 2


Поэтому

ln w (δ + 1) − ln w (δ ) =
n
 n 
 + δ !  − δ !
2
 2

w (δ + 1)
.
=
n
 n

w (δ)
 + δ + 1 !  − δ − 1 !
2
 2



1 

ln w δ + 2   .



1
Конечно, w δ +  — это уже не вероятность того, что отклонение
 2
1
числа гербов от наиболее вероятного станет равным δ + , так как это
2
отклонение обязательно целое: это результат интерполяции (§ II.1)
функции w(δ) с целых значений аргумента на полуцелые. Итак,

Заметим, что
n
 n
n

 + δ + 1 ! =  + δ + 1  + δ !,
2
 2
 2

n  n  n

 − δ ! =  − δ  − δ − 1 !,
2
 2
 2


d


так что

Положим здесь δ +

n

−δ
1−
w (δ + 1)
n .
2
=
=
n
2(δ + 1)
w (δ)
+ δ + 1 1+
n
2

1

4 δ + 


1 

2
.
ln w δ + 2   =
n



1
= z, тогда dδ = dz , получим
2
4z
d
ln w ( z ) = − .
n
dz

это соотношение от z = 0 до z = δ,
2δ 2
, или, потенцируя,
ln w (δ) − ln w (0) = −
n
Проинтегрируем

Логарифмируя правую и левую части, находим
2(δ + 1)
 2δ 

ln w (δ + 1) − ln w (δ ) = ln 1 −  − ln 1 +
.


n
n 

d


(2)

Мы рассматриваем большое число опытов n и предполагаем, кроме
n
того, что величина δ  , т.е. мы изучаем малые уклонения от наиболее
2

w (δ ) = w (0 ) e



2δ 2
n

.

получим

492

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Используя (1), находим окончательно
w (δ ) =

2 −
e
πn


n

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

493

ществляться редко. Таким образом, ожидаемыми являются события,
для которых −δ 1 δ δ 1 , где δ 1 определяется из условия w(δ 1 ) =

2

*.

(3)

Легко убедиться, что результат согласуется с требованием
+∞

∫ w (δ ) dδ =1.

(4)

−∞

2

Зная вид зависимости w  e −2 δ n , можно было определить w(0),
не пользуясь формулой Стирлинга, из условия (4). В действительнос/
n
n
ти δ является целым числом и меняется лишь в пределах −  δ  ,
2
2
но w(δ) при большом n меняется столь медленно и на краях так мало´,
что мы не вносим заметной ошибки, заменяя сумму интегралом и ин/
тегрируя от −∞ до +∞.
График зависимости w от δ — это график как раз такого типа, кото/
рый был рассмотрен в § VI.1 в связи с определением дельта/функции.
При n = 2 получается график y (2 ) (x), показанный на рис. 68, а при дру/
n
раз к оси абсцисс и растянуть
гих n график y (2 ) (x) надо сжать в
2
n
в
раз от оси ординат. Кривая, соответствующая формуле (3), назы/
2
вается кривой распределения вероятностей. Она имеет характерный ко/
локолообразный вид. Из формулы (3) видно, что w (−δ) = w (δ). Этого
следовало ожидать: вероятность появления 55 гербов и 45 ре/
шек (δ = 5) равна вероятности появления 45 гербов и 55 решек.
Пользуясь формулой (3), находим для случая n = 100, когда, как мы
знаем, w(0) = 008
, :
w (1) = w (0 ) ⋅ e −0 ,02 = 0,98 w (0 )
w (2 ) = w (0 ) ⋅ e −0 ,08 = 0,92 w (0 )
w (5 ) = w (0 ) ⋅ e −0 ,5 = 0,61w (0 )
w (10 ) = w (0 ) ⋅ e −2 = 0,14 w (0 )
w (20 ) = w (0 ) ⋅ e −8 = 0,00034 w (0 ).

Условимся называть ожидаемыми такие исходы испытания, для ко/
1
торых w (0)  w (δ)  w (0). Случаи с меньшей вероятностью будут осу/
e
* С помощью аналогичных рассуждений, обозначив f (n) = ln(n !) и исходя из раве/
нства f (n + 1) − f (n) = ln(n + 1), можно вывести саму формулу Стирлинга, с точностью
до постоянного множителя. (Проделайте это!)

2 δ2

− 1
2δ 21
1
1
= w(0) (рис. 187). Последнее дает w (0) ⋅ e n = w (0) или
= 1,
e
e
n
1
откуда окончательно δ 1 =
2n. Следовательно, ожидаемы такие ис/
2
ходы, в которых



1
1
2n  δ 
2n.
2
2

В нашем примере наиболее вероя/
тен исход, соответствующий δ = 0
(50 гербов и 50 решек). Однако веро/
ятность его невелика, она равна 0,08 и
ненамного больше вероятности близ/
Рис. 187.
ких исходов. Например, вероятность
получить 51 герб и 49 решек (или 49 гербов и 51 решку) почти такая же,
а именно 0,98 · 0,08=0,078.
Значительно меньше вероятность получить 57 гербов и 43 решки
008
,
(или 43 герба и 57 решек). Эта вероятность равна
= 0029
, . Поэтому
e
можно считать ожидаемым получение результата с числом гербов
в пределах от 43 до 57, т.е. 50 ± δ, где 0  δ  δ 1 = 7.
Величина δ 1 пропорциональна n , поэтому чем больше n, тем
шире границы для ожидаемого исхода. Так, например, для n = 10 000
20 000
получаем δ 1 =
≈ 70, так что следует ожидать результата с чис/
2
лом гербов от 4930 до 5070. Однако доля числа δ 1 по отношению
δ
к числу опытов n убывает с ростом n, так как величина 1 пропорци/
n
1
, т.е. тем меньше, чем больше n.
ональна
n
Пусть мы хотим, бросая монету, установить опытным путем вероят/
ность появления герба. При этом мы заранее не знаем, не является ли
монета погнутой, ввиду чего одна ее сторона выпадает чаще, чем дру/
гая. Пусть на самом деле монета ровная, и вероятность появления герба
w г = 05
,.
Проделав 100 бросаний, мы скорее всего получим от 43 до 57 гербов,
т.е. получим 0,43  w г  057
, . Ошибка в определении вероятности бу/
дет не более 0,07 в ту или другую сторону. Значит, получив, например,
из ста бросаний 44 решки и 56 гербов, не следует делать заключения
о большей вероятности герба, — для этого недостаточно точен опыт, от/

492

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Используя (1), находим окончательно
w (δ ) =

2 −
e
πn


n

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

493

ществляться редко. Таким образом, ожидаемыми являются события,
для которых −δ 1 δ δ 1 , где δ 1 определяется из условия w(δ 1 ) =

2

*.

(3)

Легко убедиться, что результат согласуется с требованием
+∞

∫ w (δ ) dδ =1.

(4)

−∞

2

Зная вид зависимости w  e −2 δ n , можно было определить w(0),
не пользуясь формулой Стирлинга, из условия (4). В действительнос/
n
n
ти δ является целым числом и меняется лишь в пределах −  δ  ,
2
2
но w(δ) при большом n меняется столь медленно и на краях так мало´,
что мы не вносим заметной ошибки, заменяя сумму интегралом и ин/
тегрируя от −∞ до +∞.
График зависимости w от δ — это график как раз такого типа, кото/
рый был рассмотрен в § VI.1 в связи с определением дельта/функции.
При n = 2 получается график y (2 ) (x), показанный на рис. 68, а при дру/
n
раз к оси абсцисс и растянуть
гих n график y (2 ) (x) надо сжать в
2
n
в
раз от оси ординат. Кривая, соответствующая формуле (3), назы/
2
вается кривой распределения вероятностей. Она имеет характерный ко/
локолообразный вид. Из формулы (3) видно, что w (−δ) = w (δ). Этого
следовало ожидать: вероятность появления 55 гербов и 45 ре/
шек (δ = 5) равна вероятности появления 45 гербов и 55 решек.
Пользуясь формулой (3), находим для случая n = 100, когда, как мы
знаем, w(0) = 008
, :
w (1) = w (0 ) ⋅ e −0 ,02 = 0,98 w (0 )
w (2 ) = w (0 ) ⋅ e −0 ,08 = 0,92 w (0 )
w (5 ) = w (0 ) ⋅ e −0 ,5 = 0,61w (0 )
w (10 ) = w (0 ) ⋅ e −2 = 0,14 w (0 )
w (20 ) = w (0 ) ⋅ e −8 = 0,00034 w (0 ).

Условимся называть ожидаемыми такие исходы испытания, для ко/
1
торых w (0)  w (δ)  w (0). Случаи с меньшей вероятностью будут осу/
e
* С помощью аналогичных рассуждений, обозначив f (n) = ln(n !) и исходя из раве/
нства f (n + 1) − f (n) = ln(n + 1), можно вывести саму формулу Стирлинга, с точностью
до постоянного множителя. (Проделайте это!)

2 δ2

− 1
2δ 21
1
1
= w(0) (рис. 187). Последнее дает w (0) ⋅ e n = w (0) или
= 1,
e
e
n
1
откуда окончательно δ 1 =
2n. Следовательно, ожидаемы такие ис/
2
ходы, в которых



1
1
2n  δ 
2n.
2
2

В нашем примере наиболее вероя/
тен исход, соответствующий δ = 0
(50 гербов и 50 решек). Однако веро/
ятность его невелика, она равна 0,08 и
ненамного больше вероятности близ/
Рис. 187.
ких исходов. Например, вероятность
получить 51 герб и 49 решек (или 49 гербов и 51 решку) почти такая же,
а именно 0,98 · 0,08=0,078.
Значительно меньше вероятность получить 57 гербов и 43 решки
008
,
(или 43 герба и 57 решек). Эта вероятность равна
= 0029
, . Поэтому
e
можно считать ожидаемым получение результата с числом гербов
в пределах от 43 до 57, т.е. 50 ± δ, где 0  δ  δ 1 = 7.
Величина δ 1 пропорциональна n , поэтому чем больше n, тем
шире границы для ожидаемого исхода. Так, например, для n = 10 000
20 000
получаем δ 1 =
≈ 70, так что следует ожидать результата с чис/
2
лом гербов от 4930 до 5070. Однако доля числа δ 1 по отношению
δ
к числу опытов n убывает с ростом n, так как величина 1 пропорци/
n
1
, т.е. тем меньше, чем больше n.
ональна
n
Пусть мы хотим, бросая монету, установить опытным путем вероят/
ность появления герба. При этом мы заранее не знаем, не является ли
монета погнутой, ввиду чего одна ее сторона выпадает чаще, чем дру/
гая. Пусть на самом деле монета ровная, и вероятность появления герба
w г = 05
,.
Проделав 100 бросаний, мы скорее всего получим от 43 до 57 гербов,
т.е. получим 0,43  w г  057
, . Ошибка в определении вероятности бу/
дет не более 0,07 в ту или другую сторону. Значит, получив, например,
из ста бросаний 44 решки и 56 гербов, не следует делать заключения
о большей вероятности герба, — для этого недостаточно точен опыт, от/

494

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

клонение от 50 лежит, как говорят, в пределах статистической ошибки.
Можно сказать лишь, что вероятность выпадания герба лежит в преде/
лах w = 056
, ± 007
, , т.е. между 0,49 и 0,63; 0,49  w  063
, ; w = 050
, от/
нюдь не исключено. Для уточнения нужно увеличить число бросаний.
Проделав 10000 бросаний, мы скорее всего получим от 4930 до 5070
. В этом случае ошибка в опре/
гербов, т.е. получим 0,4930  w2  05070
,
делении вероятности будет не более 0,007 в ту или другую сторону.
δ
Ясно, что ошибка 1 в определении вероятности пропорциональна
n
1
. Поэтому для того, чтобы уменьшить в 10 раз ошибку в определении
n
вероятности, надо в 100 раз увеличить число опытов.
Формула (3) получена в предположении, что δ малo´. Поэтому
можно ожидать, что при больших δ эта формула дает значительные
ошибки. Подсчитаем, например, для случая n = 100 вероятность
w(50), т.е. вероятность того, что все 100 раз получится герб и ни одного
раза не выпадет решка. По формуле (3) находим
w(50 ) =

2 ⋅50 2

w(0 ) e 100

= 0,08 e −50 ≈ 10 −23 .

С другой стороны, мы уже вычисляли эту вероятность по точной фор/
муле и нашли, что она равна 10 −30 . Таким образом, приближенная фор/
мула (3) действительно при больших δ дает значительные ошибки.
Однако ошибки эти маловажны, так как при больших δ сами значе/
ния вероятностей ничтожны.
Какова вероятность w ож получить какой/нибудь из ожидаемых
результатов, т.е. такой результат, для которого δ заключена в пределах
от −δ 1 до +δ 1 ? Очевидно, что эта вероятность равна

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

тогда dδ =

n
dt. Интеграл будет в пределах от −t1 до +t1 , где
2
t1 =

∫ w(δ ) dδ



∫e

wож



1
2n
2


1
2

e



2δ 2
n

dδ.

2n

В последнем интеграле выполним замену переменной по формуле
δ=

t n
2

2δ 

t =
,

n





e



t2
2

dt =

2

t2
2

2


2



e



t2
2

dt.

0

dt (она называется интегралом веро

0

ятностей) составлены таблицы. Таблица приведена в конце главы.
Пользуясь таблицей, находим
wож = Φ ( 2 ) = Φ (1414
,
) = 0,842.

Следовательно, те случаи, которые мы назвали ожидаемыми*, состав/
ляют 84% всевозможных исходов испытания, а на долю всех остальных
случаев приходится лишь 16%.
В некоторых задачах представляет интерес вероятность получить
результат, для которого величина δ не превосходит данного δ 0 . Эта
2
πn

вероятность w =

δ0

∫e



2 δ2
2

dδ.

−∞

Выполнив замену переменной, такую же, как в предыдущем случае,
получим
w=

1


t0

∫e



t2
2

dt =

0

w (δ < δ 0 ) =

или, пользуясь (3),
+

2



x

2

Для функции Φ(x) =

+

n
2

2
πn

wож =

1
+
2

1


t0

∫e



t2
2

dt,

где

t0 =

0

2δ 0
,
n

так что

−δ 1

2
=
πn

2δ1
2n
=2
= 2.
n
2 n

Поэтому

+ δ1

wож =

495

1 1
1 1  2δ 
+ Φ ( t 0 ) = + Φ  0  ,
2 2
2 2  n

где Φ см. в таблице.
Рассмотрим теперь случай α ≠ β. Если производится n бросаний
кубика, причем вероятность появления в отдельном бросании белой
грани равна α, а черной β, то вероятность появления m белых и k
n! m k
черных граней (m + k = n) согласно § 2 есть w =
α β .
m! k!
* Ясно, что выражение «ожидаемое» применяется здесь в условном смысле, посколь/
ку вероятность получить не «ожидаемый» результат (вряд ли его можно назвать «неожи/
данным») не так мала, равна 16% при принятом определении.

494

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

клонение от 50 лежит, как говорят, в пределах статистической ошибки.
Можно сказать лишь, что вероятность выпадания герба лежит в преде/
лах w = 056
, ± 007
, , т.е. между 0,49 и 0,63; 0,49  w  063
, ; w = 050
, от/
нюдь не исключено. Для уточнения нужно увеличить число бросаний.
Проделав 10000 бросаний, мы скорее всего получим от 4930 до 5070
. В этом случае ошибка в опре/
гербов, т.е. получим 0,4930  w2  05070
,
делении вероятности будет не более 0,007 в ту или другую сторону.
δ
Ясно, что ошибка 1 в определении вероятности пропорциональна
n
1
. Поэтому для того, чтобы уменьшить в 10 раз ошибку в определении
n
вероятности, надо в 100 раз увеличить число опытов.
Формула (3) получена в предположении, что δ малo´. Поэтому
можно ожидать, что при больших δ эта формула дает значительные
ошибки. Подсчитаем, например, для случая n = 100 вероятность
w(50), т.е. вероятность того, что все 100 раз получится герб и ни одного
раза не выпадет решка. По формуле (3) находим
w(50 ) =

2 ⋅50 2

w(0 ) e 100

= 0,08 e −50 ≈ 10 −23 .

С другой стороны, мы уже вычисляли эту вероятность по точной фор/
муле и нашли, что она равна 10 −30 . Таким образом, приближенная фор/
мула (3) действительно при больших δ дает значительные ошибки.
Однако ошибки эти маловажны, так как при больших δ сами значе/
ния вероятностей ничтожны.
Какова вероятность w ож получить какой/нибудь из ожидаемых
результатов, т.е. такой результат, для которого δ заключена в пределах
от −δ 1 до +δ 1 ? Очевидно, что эта вероятность равна

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

тогда dδ =

n
dt. Интеграл будет в пределах от −t1 до +t1 , где
2
t1 =

∫ w(δ ) dδ



∫e

wож



1
2n
2


1
2

e



2δ 2
n

dδ.

2n

В последнем интеграле выполним замену переменной по формуле
δ=

t n
2

2δ 

t =
,

n





e



t2
2

dt =

2

t2
2

2


2



e



t2
2

dt.

0

dt (она называется интегралом веро

0

ятностей) составлены таблицы. Таблица приведена в конце главы.
Пользуясь таблицей, находим
wож = Φ ( 2 ) = Φ (1414
,
) = 0,842.

Следовательно, те случаи, которые мы назвали ожидаемыми*, состав/
ляют 84% всевозможных исходов испытания, а на долю всех остальных
случаев приходится лишь 16%.
В некоторых задачах представляет интерес вероятность получить
результат, для которого величина δ не превосходит данного δ 0 . Эта
2
πn

вероятность w =

δ0

∫e



2 δ2
2

dδ.

−∞

Выполнив замену переменной, такую же, как в предыдущем случае,
получим
w=

1


t0

∫e



t2
2

dt =

0

w (δ < δ 0 ) =

или, пользуясь (3),
+

2



x

2

Для функции Φ(x) =

+

n
2

2
πn

wож =

1
+
2

1


t0

∫e



t2
2

dt,

где

t0 =

0

2δ 0
,
n

так что

−δ 1

2
=
πn

2δ1
2n
=2
= 2.
n
2 n

Поэтому

+ δ1

wож =

495

1 1
1 1  2δ 
+ Φ ( t 0 ) = + Φ  0  ,
2 2
2 2  n

где Φ см. в таблице.
Рассмотрим теперь случай α ≠ β. Если производится n бросаний
кубика, причем вероятность появления в отдельном бросании белой
грани равна α, а черной β, то вероятность появления m белых и k
n! m k
черных граней (m + k = n) согласно § 2 есть w =
α β .
m! k!
* Ясно, что выражение «ожидаемое» применяется здесь в условном смысле, посколь/
ку вероятность получить не «ожидаемый» результат (вряд ли его можно назвать «неожи/
данным») не так мала, равна 16% при принятом определении.

496

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Найдем максимум w в зависимости от m. Нам удобнее искать не
максимум w, а максимум ln w. (Ясно, что w и ln w достигают макси/
мума при одном и том же значении m.) Имеем ln w = ln n!− ln m!− ln k!+
+ m ln α + k ln β, или, вспоминая, что k = n − m, получаем

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

k = n − m = n(1 − α) = nβ. Итак, наиболее вероятен исход, при котором αn
раз выпадет белая грань и βn раз — черная*.
Обозначим вероятность этого исхода через w (nα). Тогда
w ( nα ) =

ln w = ln n !− ln m!− ln( n − m)!+ m ln α + ( n − m)ln β.

Будем считать, что число бросаний n фиксировано, а потому ln w за/
d ln w
, не смущаясь тем, что
висит только от m. Найдем производную
dm
по смыслу задачи величина m принимает лишь целые значения. По/
лучим

n

 n
n ! = 2πn   ;
 e

 αn 
(αn )! = 2 πnα  
 e

βn

,

 βn 
(βn )! = 2 πnβ   ,
 e

Пользуясь формулой (6), находим
w ( nα ) =

Так как при большом числе опытов n число m чаще всего также бу/
1
1
дет большим, то величиной ln 1 +  ≈
пренебрегаем по сравнению
 m m
с ln m. Следовательно,
d ln m!
= ln m.
dm

1
.
2 πnαβ

(7)

Поставим задачу — определить вероятность исхода, мало отклоня/
ющегося от наиболее вероятного. Более точно, найдем вероятность
того, что число белых граней будет равно m = nα + δ, где δ невелико по
сравнению с n.
Будем исходить из формулы (5), в которой полагаем m = nα + δ,
dm = dδ. Тогда (5) принимает вид
d ln w( nα + δ )
α (βn − δ )
.
= ln

(αn + δ )β

Поэтому
(5)

Преобразуем правую часть следующим образом:

Условие максимума — равенство нулю производной дает
или

αn

поэтому

d ln m! ln( m + 1)!− ln m!
1

=
= ln( m + 1) = ln m + ln 1 +  .

dm
( m + 1) − m
m

α ( n − m)
= 0,


(6)

1
1 1
n!
.
=
(αn )! (βn )!
2 πnαβ α nα β nβ

Первое слагаемое в правой части вычислим так:

ln

n!
α nα ⋅ β nβ .
(αn )! (βn )!

По формуле Стирлинга получаем

d ln w d ln m! d ln( n − m)!
=

+ ln α − ln β.
dm
dm
dm

d ln w
α ( n − m)
.
= − ln m + ln( n − m) + ln α − ln β = ln
dm


497

α (βn − δ )
ln
= ln
(αn + δ )β

α n−m
= 1,
β m

наконец,
m
α
= .
n−m β

Последний результат легко понять: наиболее вероятен такой исход опы/
та, при котором число белых (m) так относится к числу черных (n − m),
как вероятность получения в одном отдельном опыте белого (α) отно/
сится к вероятности получения в одном отдельном опыте черного (β).
Из последнего соотношения находим mβ = α(n − m), откуда
m(α + β) = αn. Так как α + β = 1, то отсюда m = αn. Следовательно,

Так как величины

δ

αβn 1 − 
 βn 
δ
δ 


= ln 1 −  − ln 1 +
.

δ


nβ
nα 
αn 1 +  β

αn 

δ
δ
и
малы по сравнению с единицей, то можно



положить
δ
δ

,
ln 1 −  = −

nβ


δ 
δ

,
ln 1 +
=

nα  nα

* Заметим, что числа αn и βn могут оказаться нецелыми. Тогда наиболее вероят/
ное число появлений белой грани принимаем равным целому числу, ближайшему к αn.

496

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Найдем максимум w в зависимости от m. Нам удобнее искать не
максимум w, а максимум ln w. (Ясно, что w и ln w достигают макси/
мума при одном и том же значении m.) Имеем ln w = ln n!− ln m!− ln k!+
+ m ln α + k ln β, или, вспоминая, что k = n − m, получаем

§ 3]

АНАЛИЗ РЕЗУЛЬТАТОВ МНОГИХ ИСПЫТАНИЙ

k = n − m = n(1 − α) = nβ. Итак, наиболее вероятен исход, при котором αn
раз выпадет белая грань и βn раз — черная*.
Обозначим вероятность этого исхода через w (nα). Тогда
w ( nα ) =

ln w = ln n !− ln m!− ln( n − m)!+ m ln α + ( n − m)ln β.

Будем считать, что число бросаний n фиксировано, а потому ln w за/
d ln w
, не смущаясь тем, что
висит только от m. Найдем производную
dm
по смыслу задачи величина m принимает лишь целые значения. По/
лучим

n

 n
n ! = 2πn   ;
 e

 αn 
(αn )! = 2 πnα  
 e

βn

,

 βn 
(βn )! = 2 πnβ   ,
 e

Пользуясь формулой (6), находим
w ( nα ) =

Так как при большом числе опытов n число m чаще всего также бу/
1
1
дет большим, то величиной ln 1 +  ≈
пренебрегаем по сравнению
 m m
с ln m. Следовательно,
d ln m!
= ln m.
dm

1
.
2 πnαβ

(7)

Поставим задачу — определить вероятность исхода, мало отклоня/
ющегося от наиболее вероятного. Более точно, найдем вероятность
того, что число белых граней будет равно m = nα + δ, где δ невелико по
сравнению с n.
Будем исходить из формулы (5), в которой полагаем m = nα + δ,
dm = dδ. Тогда (5) принимает вид
d ln w( nα + δ )
α (βn − δ )
.
= ln

(αn + δ )β

Поэтому
(5)

Преобразуем правую часть следующим образом:

Условие максимума — равенство нулю производной дает
или

αn

поэтому

d ln m! ln( m + 1)!− ln m!
1

=
= ln( m + 1) = ln m + ln 1 +  .

dm
( m + 1) − m
m

α ( n − m)
= 0,


(6)

1
1 1
n!
.
=
(αn )! (βn )!
2 πnαβ α nα β nβ

Первое слагаемое в правой части вычислим так:

ln

n!
α nα ⋅ β nβ .
(αn )! (βn )!

По формуле Стирлинга получаем

d ln w d ln m! d ln( n − m)!
=

+ ln α − ln β.
dm
dm
dm

d ln w
α ( n − m)
.
= − ln m + ln( n − m) + ln α − ln β = ln
dm


497

α (βn − δ )
ln
= ln
(αn + δ )β

α n−m
= 1,
β m

наконец,
m
α
= .
n−m β

Последний результат легко понять: наиболее вероятен такой исход опы/
та, при котором число белых (m) так относится к числу черных (n − m),
как вероятность получения в одном отдельном опыте белого (α) отно/
сится к вероятности получения в одном отдельном опыте черного (β).
Из последнего соотношения находим mβ = α(n − m), откуда
m(α + β) = αn. Так как α + β = 1, то отсюда m = αn. Следовательно,

Так как величины

δ

αβn 1 − 
 βn 
δ
δ 


= ln 1 −  − ln 1 +
.

δ


nβ
nα 
αn 1 +  β

αn 

δ
δ
и
малы по сравнению с единицей, то можно



положить
δ
δ

,
ln 1 −  = −

nβ


δ 
δ

,
ln 1 +
=

nα  nα

* Заметим, что числа αn и βn могут оказаться нецелыми. Тогда наиболее вероят/
ное число появлений белой грани принимаем равным целому числу, ближайшему к αn.

498

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

d ln w ( nα + δ )
δ
δ
δ
.
=−

=−

nβ nα
nαβ

Итак,
d ln w ( nα + δ )
δ
.
=−

nαβ

Интегрируя последнее равенство от 0 до δ, находим
δ2
,
2 nαβ

w ( nα + δ ) = w ( nα) e

1

Вспоминая, что w (nα) =

2παβn

δ2
2 nαβ

.

, получаем окончательно
δ2

w ( nα + δ ) =


1
e 2 αβn .
2 παβn

(8)

Это и есть вероятность исхода, в котором число белых граней отличает/
ся на δ от наиболее вероятного.
Будем снова условно называть ожидаемыми такие исходы, для ко/
1
торых w (nα)  w (nα + δ)  w (nα), т.е. для которых −δ 1 δ δ 1 , где δ 1
e
1
определяется из условия w (nα + δ 1 ) = w (nα). Пользуясь (7) и (8), по/
e
лучаем
δ 21


1
1
, т.е.
e 2 αβn = e
2 παβn
2 παβn

окончательно δ 1 =

δ12
= 1,
2αβn

2αβn .
+∞

Пользуясь (8), легко проверить, что

499

§ 4. Энтропия

откуда


ЭНТРОПИЯ

2. Монета брошена 1000 раз. Какова вероятность получить при этом не ме/
нее 500 гербов; не менее 510 гербов?
3. Произведено 100 выстрелов, причем вероятность попадания равна 0,1,
а вероятность промаха равна 0,9. Какова вероятность того, что цель будет пора/
жена ровно 10 раз; ровно 8 раз?
4. Какова в условиях упражнения 3 вероятность того, что цель будет пора/
жена не менее 8 раз; не менее 10 раз; не менее 12 раз?
5. По цели выпущено 1000 снарядов, причем вероятность попадания равна
0,01. Какова вероятность того, что хотя бы 8 снарядов поразили цель; 11 снаря/
дов поразили цель?

откуда получаем

ln w ( nα + δ ) − ln w ( nα ) = −

§ 4]

∫ w (nα + δ) dδ = 1. Легко прове/

−∞

рить также, что при α = β = 1 2 мы получаем формулы, выведенные
в начале этого параграфа.
Упражнения
1. Монета брошена 1000 раз. Какова вероятность получить ровно 500 раз
герб; ровно 510 раз герб?

Итак, мы видели, что диапазон ожидаемых исходов пропорциона/
лен n, тогда как диапазон всех мыслимых исходов равен n. При на/
шем определении ожидаемых исходов, когда требовалось, чтобы их
1
от максимальной, они составляют при
вероятность была больше
e
большом числе испытаний 84% от всех исходов. Можно было бы за/
даться другим определением ожидаемых исходов, например, заменив
1
коэффициент
на 0,001; тогда бы мы получили, что δ 1 все равно про/
e
порционально n (с другим коэффициентом пропорциональности),
а ожидаемые исходы составляют уже около 99,98% от всех и т.д. В то же
время интервал ожидаемых исходов при очень больших n составляет
лишь ничтожную часть интервала всех мыслимых исходов, так как
n
→ 0,
n

при

n → ∞.

Этот закон, согласно которому значения случайной величины (в дан/
ном примере число появлений белой грани) при достаточно большом
числе испытаний с как угодно высокой относительной точностью груп/
пируются вокруг ее наиболее вероятного среднего значения, имеет
многие важные приложения в физике. При этом обычно пользуются
принципом, согласно которому взамен большого числа испытаний над
единичным объектом можно провести одно испытание над статисти
ческим массивом, т.е. системой из большого числа одинаковых объек/
тов. Например, вместо многократного бросания одного кубика можно
рассматривать одновременное бросание многих кубиков, при этом чис/
ло выпавших белых граней будет подчиняться тому же закону, т.е. так
же концентрироваться вокруг наиболее вероятного значения.
Рассмотрим сначала простой мысленный пример. Пусть имеется
колода из огромного количества N (например, N = 1012 ) карт, среди
которых αN красных и βN черных (α + β = 1). Карты одного цвета
мы не будем различать друг от друга. Если считать состоянием колоды

498

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

d ln w ( nα + δ )
δ
δ
δ
.
=−

=−

nβ nα
nαβ

Итак,
d ln w ( nα + δ )
δ
.
=−

nαβ

Интегрируя последнее равенство от 0 до δ, находим
δ2
,
2 nαβ

w ( nα + δ ) = w ( nα) e

1

Вспоминая, что w (nα) =

2παβn

δ2
2 nαβ

.

, получаем окончательно
δ2

w ( nα + δ ) =


1
e 2 αβn .
2 παβn

(8)

Это и есть вероятность исхода, в котором число белых граней отличает/
ся на δ от наиболее вероятного.
Будем снова условно называть ожидаемыми такие исходы, для ко/
1
торых w (nα)  w (nα + δ)  w (nα), т.е. для которых −δ 1 δ δ 1 , где δ 1
e
1
определяется из условия w (nα + δ 1 ) = w (nα). Пользуясь (7) и (8), по/
e
лучаем
δ 21


1
1
, т.е.
e 2 αβn = e
2 παβn
2 παβn

окончательно δ 1 =

δ12
= 1,
2αβn

2αβn .
+∞

Пользуясь (8), легко проверить, что

499

§ 4. Энтропия

откуда


ЭНТРОПИЯ

2. Монета брошена 1000 раз. Какова вероятность получить при этом не ме/
нее 500 гербов; не менее 510 гербов?
3. Произведено 100 выстрелов, причем вероятность попадания равна 0,1,
а вероятность промаха равна 0,9. Какова вероятность того, что цель будет пора/
жена ровно 10 раз; ровно 8 раз?
4. Какова в условиях упражнения 3 вероятность того, что цель будет пора/
жена не менее 8 раз; не менее 10 раз; не менее 12 раз?
5. По цели выпущено 1000 снарядов, причем вероятность попадания равна
0,01. Какова вероятность того, что хотя бы 8 снарядов поразили цель; 11 снаря/
дов поразили цель?

откуда получаем

ln w ( nα + δ ) − ln w ( nα ) = −

§ 4]

∫ w (nα + δ) dδ = 1. Легко прове/

−∞

рить также, что при α = β = 1 2 мы получаем формулы, выведенные
в начале этого параграфа.
Упражнения
1. Монета брошена 1000 раз. Какова вероятность получить ровно 500 раз
герб; ровно 510 раз герб?

Итак, мы видели, что диапазон ожидаемых исходов пропорциона/
лен n, тогда как диапазон всех мыслимых исходов равен n. При на/
шем определении ожидаемых исходов, когда требовалось, чтобы их
1
от максимальной, они составляют при
вероятность была больше
e
большом числе испытаний 84% от всех исходов. Можно было бы за/
даться другим определением ожидаемых исходов, например, заменив
1
коэффициент
на 0,001; тогда бы мы получили, что δ 1 все равно про/
e
порционально n (с другим коэффициентом пропорциональности),
а ожидаемые исходы составляют уже около 99,98% от всех и т.д. В то же
время интервал ожидаемых исходов при очень больших n составляет
лишь ничтожную часть интервала всех мыслимых исходов, так как
n
→ 0,
n

при

n → ∞.

Этот закон, согласно которому значения случайной величины (в дан/
ном примере число появлений белой грани) при достаточно большом
числе испытаний с как угодно высокой относительной точностью груп/
пируются вокруг ее наиболее вероятного среднего значения, имеет
многие важные приложения в физике. При этом обычно пользуются
принципом, согласно которому взамен большого числа испытаний над
единичным объектом можно провести одно испытание над статисти
ческим массивом, т.е. системой из большого числа одинаковых объек/
тов. Например, вместо многократного бросания одного кубика можно
рассматривать одновременное бросание многих кубиков, при этом чис/
ло выпавших белых граней будет подчиняться тому же закону, т.е. так
же концентрироваться вокруг наиболее вероятного значения.
Рассмотрим сначала простой мысленный пример. Пусть имеется
колода из огромного количества N (например, N = 1012 ) карт, среди
которых αN красных и βN черных (α + β = 1). Карты одного цвета
мы не будем различать друг от друга. Если считать состоянием колоды

500

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

порядок расположения в ней красных и черных карт, то легко понять,
что общее число Ω = Ω(N , α) возможных состояний равно числу соче*
таний из N элементов по αN , т.е.
Ω=

N!
.
(αN )! (βN )!

Воспользовавшись формулой Стирлинга, получим (см. вычисле*
ния на стр. 497)
Ω=

1
1
1
.
2 πNαβ α αN β βN

Мы видели, что далеко не все эти состояния равновероятны. Напри*
мер, легко подсчитать вероятность того, что при N = 1012 , α = 05
, сред*
няя плотность красных карт в первых 1010 картах больше чем на 1%
превысит (при добросовестном тасовании) среднюю плотность их во всей
колоде, равную 0,5. Так как 1010 составляет лишь небольшую часть от
1012 , то можно принять, что несколько повышенная частота появления
красных карт в этой первой части колоды не меняет вероятности 0,5 каж*
дой следующей карте оказаться красной. Значит, искомая вероятность
равна рассмотренной в § 3 вероятности того, что при 1010 *кратном броса*
нии монеты герб выпадет  101
, ⋅ 05
, ⋅ 1010 = (05
, ⋅ 1010 + 05
, ⋅ 10 8 ) раз. В силу
формулы (3) искомая вероятность равна




0 ,5 ⋅10 3



2
−10
2
1 −t 2
e −2 δ ⋅10 dδ = ∫
e
π ⋅ 1010
2
π
10 3

2

dt =

1
[1 − Φ(10 3 )].
2

(Здесь мы положили 2 ⋅ 10 −5 δ = t.)
Для таких больших значений аргумента значения интеграла вероят*
ностей в нашей таблице отсутствуют, но с помощью метода, описанного
на стр. 65, легко получить, что при больших x
1 − Φ( x ) =

2




∫e

−t 2 2

dt ≈

x

Поэтому искомая вероятность равна

2
2
e−x 2 .
2 πx

1

10 −3 e −10

6

2

5

≈ 10 −2 ⋅10 . Это


число невообразимо мало. Можно быть уверенным, что если колода та*
суется и проверяется миллиарды раз в секунду в течение всего времени
существования солнечной системы, то описанное повышение средней
плотности красных карт в первой части колоды ни разу не представит*
ся. Состояние колоды должно быть таким, что любой ее участок, состо*
ящий из весьма большого числа n карт, содержит примерно αn
красных и βn черных карт с диапазоном ошибкипорядка n. Конеч*

§ 4]

ЭНТРОПИЯ

501

но, при небольшом n, например n = 10 или 100, средняя плотность
красных карт в таком участке может оказаться существенно отличной
от α, т.е. эта плотность может иметь локальные флуктуации.
Назовем энтропией рассматриваемой колоды число S = ln Ω, т.е. ло*
гарифм числа ее возможных состояний. Из предыдущего мы получаем
S ≈ αN ln

1
1 1
1
1⎞

+ βN ln − ln (2 παβN ) ≈ N ⎜α ln + β ln ⎟ ,

α
β 2
α
β⎠

причем в правой части мы пренебрегли членом порядка ln N  N .
S
1
1
Энтропия в расчете на отдельную карту равна
= α ln + β ln .
N
α
β
Представим себе теперь две колоды с характеристиками N 1 , α 1 и
N 2 , α 2 соответственно, причем между этими колодами обмен картами
невозможен. Такая система имеет Ω = Ω 1 Ω 2 возможных состояний
(любое состояние первой колоды комбинируется с любым состоянием
второй колоды), откуда соответствующая энтропия
S = ln Ω = ln Ω1 + ln Ω 2 = S1 + S 2 ,

т.е. энтропия системы из нескольких невзаимодействующих компо*
нент равна сумме энтропии этих компонент. Если же эти две колоды
перетасовываются совместно, то они составляют одну общую колоду
с числом карт N = N 1 + N 2 , из них красных α 1 N 1 + α 2 N 2 = αN , где
α N + α2 N 2
. Соответствующая энтропия равна
α= 1 1
N
1
1⎞

~
S = N ⎜α ln + β ln ⎟ =

α
β⎠
= (α 1 N 1 + α 2 N 2 ) ln

N
N
.
+ (β1 N 1 + β 2 N 2 ) ln
α1 N1 + α 2 N 2
β1 N 1 + β 2 N 2

Легко проверить, что при α 2 = α 1 (и, следовательно, β 2 = β 1 ) будет
S~ = S ; это ясно и из того, что при α 2 = α 1 взаимодействие между коло*
дами, т.е. их совместное перетасовывание ничего нового не дает. Если
же α 2 ≠ α 1 , то, как мы сейчас проверим, обязательно S~ > S . В самом
деле,
~
S − S = (α 1 N 1 + α 2 N 2 )ln

N
N

+ (β1 N 1 + β 2 N 2 ) ln
α1 N1 + α 2 N 2
β1 N 1 + β 2 N 2


1
1⎞
1
1⎞
+ β 2 ln ⎟ .
− N 1 ⎜α 1 ln
+ β1 ln ⎟ − N 2 ⎜α 2 ln
α1
β1 ⎠
α2
β2 ⎠



500

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

порядок расположения в ней красных и черных карт, то легко понять,
что общее число Ω = Ω(N , α) возможных состояний равно числу соче*
таний из N элементов по αN , т.е.
Ω=

N!
.
(αN )! (βN )!

Воспользовавшись формулой Стирлинга, получим (см. вычисле*
ния на стр. 497)
Ω=

1
1
1
.
2 πNαβ α αN β βN

Мы видели, что далеко не все эти состояния равновероятны. Напри*
мер, легко подсчитать вероятность того, что при N = 1012 , α = 05
, сред*
няя плотность красных карт в первых 1010 картах больше чем на 1%
превысит (при добросовестном тасовании) среднюю плотность их во всей
колоде, равную 0,5. Так как 1010 составляет лишь небольшую часть от
1012 , то можно принять, что несколько повышенная частота появления
красных карт в этой первой части колоды не меняет вероятности 0,5 каж*
дой следующей карте оказаться красной. Значит, искомая вероятность
равна рассмотренной в § 3 вероятности того, что при 1010 *кратном броса*
нии монеты герб выпадет  101
, ⋅ 05
, ⋅ 1010 = (05
, ⋅ 1010 + 05
, ⋅ 10 8 ) раз. В силу
формулы (3) искомая вероятность равна




0 ,5 ⋅10 3



2
−10
2
1 −t 2
e −2 δ ⋅10 dδ = ∫
e
π ⋅ 1010
2
π
10 3

2

dt =

1
[1 − Φ(10 3 )].
2

(Здесь мы положили 2 ⋅ 10 −5 δ = t.)
Для таких больших значений аргумента значения интеграла вероят*
ностей в нашей таблице отсутствуют, но с помощью метода, описанного
на стр. 65, легко получить, что при больших x
1 − Φ( x ) =

2




∫e

−t 2 2

dt ≈

x

Поэтому искомая вероятность равна

2
2
e−x 2 .
2 πx

1

10 −3 e −10

6

2

5

≈ 10 −2 ⋅10 . Это


число невообразимо мало. Можно быть уверенным, что если колода та*
суется и проверяется миллиарды раз в секунду в течение всего времени
существования солнечной системы, то описанное повышение средней
плотности красных карт в первой части колоды ни разу не представит*
ся. Состояние колоды должно быть таким, что любой ее участок, состо*
ящий из весьма большого числа n карт, содержит примерно αn
красных и βn черных карт с диапазоном ошибки порядка n. Конеч*

§ 4]

ЭНТРОПИЯ

501

но, при небольшом n, например n = 10 или 100, средняя плотность
красных карт в таком участке может оказаться существенно отличной
от α, т.е. эта плотность может иметь локальные флуктуации.
Назовем энтропией рассматриваемой колоды число S = ln Ω, т.е. ло*
гарифм числа ее возможных состояний. Из предыдущего мы получаем
S ≈ αN ln

1
1 1
1
1⎞

+ βN ln − ln (2 παβN ) ≈ N ⎜α ln + β ln ⎟ ,

α
β 2
α
β⎠

причем в правой части мы пренебрегли членом порядка ln N  N .
S
1
1
Энтропия в расчете на отдельную карту равна
= α ln + β ln .
N
α
β
Представим себе теперь две колоды с характеристиками N 1 , α 1 и
N 2 , α 2 соответственно, причем между этими колодами обмен картами
невозможен. Такая система имеет Ω = Ω 1 Ω 2 возможных состояний
(любое состояние первой колоды комбинируется с любым состоянием
второй колоды), откуда соответствующая энтропия
S = ln Ω = ln Ω1 + ln Ω 2 = S1 + S 2 ,

т.е. энтропия системы из нескольких невзаимодействующих компо*
нент равна сумме энтропии этих компонент. Если же эти две колоды
перетасовываются совместно, то они составляют одну общую колоду
с числом карт N = N 1 + N 2 , из них красных α 1 N 1 + α 2 N 2 = αN , где
α N + α2 N 2
. Соответствующая энтропия равна
α= 1 1
N
1
1⎞

~
S = N ⎜α ln + β ln ⎟ =

α
β⎠
= (α 1 N 1 + α 2 N 2 ) ln

N
N
.
+ (β1 N 1 + β 2 N 2 ) ln
α1 N1 + α 2 N 2
β1 N 1 + β 2 N 2

Легко проверить, что при α 2 = α 1 (и, следовательно, β 2 = β 1 ) будет
S~ = S ; это ясно и из того, что при α 2 = α 1 взаимодействие между коло*
дами, т.е. их совместное перетасовывание ничего нового не дает. Если
же α 2 ≠ α 1 , то, как мы сейчас проверим, обязательно S~ > S . В самом
деле,
~
S − S = (α 1 N 1 + α 2 N 2 )ln

N
N

+ (β1 N 1 + β 2 N 2 ) ln
α1 N1 + α 2 N 2
β1 N 1 + β 2 N 2


1
1⎞
1
1⎞
+ β 2 ln ⎟ .
− N 1 ⎜α 1 ln
+ β1 ln ⎟ − N 2 ⎜α 2 ln
α1
β1 ⎠
α2
β2 ⎠



502

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Если считать N 1 , N 2 и α 1 заданными, а α 2 переменным и учесть,
что β 2 = 1 − α 2 , то легко непосредственно подсчитать, что
~
d (S − S )
(β N + β 2 N 2 )α 2
,
= N 2 ln 1 1
dα 2
(α 1 N 1 + α 2 N 2 )β 2

~
d 2(S − S )
α1 N1 N 2
β1 N 1 N 2
.
=
+
α 2 (α 1 N 1 + α 2 N 2 ) β 2 (β1 N 1 + β 2 N 2 )
( dα 2 )2

d (S~ − S )
При α 2 = α 1 получается S~ − S = 0,
= 0, а так как из выраже*
dα 2
ния второй производной вытекает, что она положительна при всех α 2 ,
а потому график зависимости S~ − S от α 2 выпуклый книзу, то при
α 2 ≠ α 1 будет S~ − S > 0, т.е. S~ > S , что и утверждалось.
Если представить себе, что две колоды с характеристиками N 1 , α 1
и N 2 , α 2 приложены друг к другу, но из*за их большого объема про*
изводится лишь «локальное перетасовывание» сравнительно неболь*
ших участков объединенной колоды, то при α 2 > α 1 по мере такого
перетасовывания будет происходить постепенное «диффундирова*
ние» красных карт из второй колоды в первую, средняя плотность крас*
ных карт будет постепенно выравниваться. Поставив в любой момент
этого процесса перегородку между первыми N 1 и последними N 2
картами, мы можем остановить диффузию и подсчитать энтропию
в промежуточном состоянии после такого разделения. По мере вырав*
нивания средней плотности красных карт эта энтропия возрастает.
После выравнивания энтропия остается практически постоянной.
Конечно, из*за постоянного перемешивания можно представить себе,
что в одной части колоды средняя плотность красных карт станет сущес*
твенно больше, чем во второй. Однако выше мы показали, что при боль*
шом числе карт вероятность такого события невообразимо мала. Таким
образом, процесс возрастания энтропии является необратимым.
Рассмотренная колода является простейшей моделью статистичес*
кой физической системы. Эта модель одномерна (карты расположены
в ряд), а каждая карта могла быть всего в двух состояниях — быть крас*
ной или черной. (Для объекта, который может быть в нескольких со*
стояниях с вероятностями pi , энтропия в расчете на один экземпляр
1
получается равной ∑ pi ln .) Аналогичные свойства имеют более
p
i
i
сложные реальные статистические системы, например система моле*
кул газа, содержащегося в определенном объеме.
Согласно квантовой механике, каждому значению энергии E отве*
чает определенное, весьма большое число Ω квантовых состояний
рассматриваемой системы, внутренняя энергия которой не превосхо*
дит E. Чтобы представить себе порядок этого числа, воспользуемся до*
казываемой в квантовой механике приближенной оценкой числа Ω 1

§ 4]

ЭНТРОПИЯ

503

состояний отдельной молекулы в объеме V , импульс которой не пре*
восходит некоторого значения p: Ω 1 = p 3V 6π 2 h 3 (h ≈ 10 −27 эрг ⋅ сек —
постоянная Планка). Средний импульс одной молекулы связан с тем*
пературой τ газа формулой p = 3kmτ, где k = 138
, ⋅ 10 −16 эрг град —
μ
, где μ —
постоянная Больцмана, а m — масса молекулы, равная
N0
молекулярный вес, а N 0 = 602
, ⋅ 1023 (число Авогадро) — число моле*
3
3
кул в грамм*молекуле газа. Для кислорода (μ = 32) в 1 л = 10 см при
o
o
τ = 0 C = 273 K получаем


32
Ω1 = ⎜3 ⋅ 138
, ⋅ 10 −6 ⋅
⋅ 273⎟


6,02 ⋅ 10 23

3 2

⋅ 10 3 6 π 2 (10 −27 )3 ≈ 2,5 ⋅ 10 29 .

Однако в 1 л газа при нормальных условиях содержится около
N = 3 ⋅ 1022 молекул. Поэтому за общее число всех квантовых состояний
такой порции кислорода можно приближенно принять
Ω = Ω1N = (2,5 ⋅ 10 29 )3 ⋅10

22

24

≈ 1010 .

Это число невообразимо велико. Впрочем, как будет видно из даль*
нейшего, реально в расчеты входит не само оно, а его логарифм (кото*
рый тоже очень велик) и даже, более того, разность значений этого
логарифма для системы в различных условиях.
Величина S = k ln Ω называется энтропией системы; здесь k —
принципиально несущественный коэффициент пропорциональности,
равный постоянной Больцмана. Появление этого коэффициента объ*
ясняется тем, что понятие энтропии было первоначально введено из
других соображений, в связи с изучением тепловых процессов. Поэтому
единица измерения энтропии выбирается такой, чтобы она сохраняла
то же значение, что и в термодинамике. Другими словами, коэффици*
ент k дает возможность получать температуру не в эргах, а в градусах.
При изменении E меняется и Ω, а потому и S, причем в случае не*
dE
изменного объема газа отношение
= τ называется его температу
dS
рой. При совместном рассмотрении двух систем a и b, пока они не
взаимодействуют, для общей системы будет Ω = Ω a Ω b , а потому
S = S a + S b . Если системы могут обмениваться энергией, но в осталь*
ном независимы (порции газа разделены тонкой перегородкой), то со*
храняются те же соотношения, но участвующие величины будут
меняться с течением времени. Если система в целом изолирована от
окружающей среды, то энергия сохраняется, E = E a + E b = const, отку*
да E& a + E& b = 0, где точкой обозначена производная по времени. Отсюда
1
1 & ⎛ 1
1⎞
S& = S&a + S&b = E& a +
E b = ⎜ − ⎟ E& a .
τa
τb
⎝ τa τb ⎠

502

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Если считать N 1 , N 2 и α 1 заданными, а α 2 переменным и учесть,
что β 2 = 1 − α 2 , то легко непосредственно подсчитать, что
~
d (S − S )
(β N + β 2 N 2 )α 2
,
= N 2 ln 1 1
dα 2
(α 1 N 1 + α 2 N 2 )β 2

~
d 2(S − S )
α1 N1 N 2
β1 N 1 N 2
.
=
+
α 2 (α 1 N 1 + α 2 N 2 ) β 2 (β1 N 1 + β 2 N 2 )
( dα 2 )2

d (S~ − S )
При α 2 = α 1 получается S~ − S = 0,
= 0, а так как из выраже*
dα 2
ния второй производной вытекает, что она положительна при всех α 2 ,
а потому график зависимости S~ − S от α 2 выпуклый книзу, то при
α 2 ≠ α 1 будет S~ − S > 0, т.е. S~ > S , что и утверждалось.
Если представить себе, что две колоды с характеристиками N 1 , α 1
и N 2 , α 2 приложены друг к другу, но из*за их большого объема про*
изводится лишь «локальное перетасовывание» сравнительно неболь*
ших участков объединенной колоды, то при α 2 > α 1 по мере такого
перетасовывания будет происходить постепенное «диффундирова*
ние» красных карт из второй колоды в первую, средняя плотность крас*
ных карт будет постепенно выравниваться. Поставив в любой момент
этого процесса перегородку между первыми N 1 и последними N 2
картами, мы можем остановить диффузию и подсчитать энтропию
в промежуточном состоянии после такого разделения. По мере вырав*
нивания средней плотности красных карт эта энтропия возрастает.
После выравнивания энтропия остается практически постоянной.
Конечно, из*за постоянного перемешивания можно представить себе,
что в одной части колоды средняя плотность красных карт станет сущес*
твенно больше, чем во второй. Однако выше мы показали, что при боль*
шом числе карт вероятность такого события невообразимо мала. Таким
образом, процесс возрастания энтропии является необратимым.
Рассмотренная колода является простейшей моделью статистичес*
кой физической системы. Эта модель одномерна (карты расположены
в ряд), а каждая карта могла быть всего в двух состояниях — быть крас*
ной или черной. (Для объекта, который может быть в нескольких со*
стояниях с вероятностями pi , энтропия в расчете на один экземпляр
1
получается равной ∑ pi ln .) Аналогичные свойства имеют более
p
i
i
сложные реальные статистические системы, например система моле*
кул газа, содержащегося в определенном объеме.
Согласно квантовой механике, каждому значению энергии E отве*
чает определенное, весьма большое число Ω квантовых состояний
рассматриваемой системы, внутренняя энергия которой не превосхо*
дит E. Чтобы представить себе порядок этого числа, воспользуемся до*
казываемой в квантовой механике приближенной оценкой числа Ω 1

§ 4]

ЭНТРОПИЯ

503

состояний отдельной молекулы в объеме V , импульс которой не пре*
восходит некоторого значения p: Ω 1 = p 3V 6π 2 h 3 (h ≈ 10 −27 эрг ⋅ сек —
постоянная Планка). Средний импульс одной молекулы связан с тем*
пературой τ газа формулой p = 3kmτ, где k = 138
, ⋅ 10 −16 эрг град —
μ
, где μ —
постоянная Больцмана, а m — масса молекулы, равная
N0
молекулярный вес, а N 0 = 602
, ⋅ 1023 (число Авогадро) — число моле*
3
3
кул в грамм*молекуле газа. Для кислорода (μ = 32) в 1 л = 10 см при
o
o
τ = 0 C = 273 K получаем


32
Ω1 = ⎜3 ⋅ 138
, ⋅ 10 −6 ⋅
⋅ 273⎟


6,02 ⋅ 10 23

3 2

⋅ 10 3 6 π 2 (10 −27 )3 ≈ 2,5 ⋅ 10 29 .

Однако в 1 л газа при нормальных условиях содержится около
N = 3 ⋅ 1022 молекул. Поэтому за общее число всех квантовых состояний
такой порции кислорода можно приближенно принять
Ω = Ω1N = (2,5 ⋅ 10 29 )3 ⋅10

22

24

≈ 1010 .

Это число невообразимо велико. Впрочем, как будет видно из даль*
нейшего, реально в расчеты входит не само оно, а его логарифм (кото*
рый тоже очень велик) и даже, более того, разность значений этого
логарифма для системы в различных условиях.
Величина S = k ln Ω называется энтропией системы; здесь k —
принципиально несущественный коэффициент пропорциональности,
равный постоянной Больцмана. Появление этого коэффициента объ*
ясняется тем, что понятие энтропии было первоначально введено из
других соображений, в связи с изучением тепловых процессов. Поэтому
единица измерения энтропии выбирается такой, чтобы она сохраняла
то же значение, что и в термодинамике. Другими словами, коэффици*
ент k дает возможность получать температуру не в эргах, а в градусах.
При изменении E меняется и Ω, а потому и S, причем в случае не*
dE
изменного объема газа отношение
= τ называется его температу
dS
рой. При совместном рассмотрении двух систем a и b, пока они не
взаимодействуют, для общей системы будет Ω = Ω a Ω b , а потому
S = S a + S b . Если системы могут обмениваться энергией, но в осталь*
ном независимы (порции газа разделены тонкой перегородкой), то со*
храняются те же соотношения, но участвующие величины будут
меняться с течением времени. Если система в целом изолирована от
окружающей среды, то энергия сохраняется, E = E a + E b = const, отку*
да E& a + E& b = 0, где точкой обозначена производная по времени. Отсюда
1
1 & ⎛ 1
1⎞
S& = S&a + S&b = E& a +
E b = ⎜ − ⎟ E& a .
τa
τb
⎝ τa τb ⎠

504

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Значит, при τ a = τ b будет S& = 0, при равных температурах взаимодей/
ствующих порций газа энтропия не меняется. Если же температура сис/
темы a меньше температуры системы b, τ a < τ b , то E& a > 0 и S& > 0, т.е.
система a приобретает энергию от системы b, энтропия общей систе/
мы возрастает. Аналогичное возрастание энтропии будет и в случае
τ a > τ b . Этот процесс перекачки энергии и возрастания энтропии про/
должается до выравнивания температур. После этого энтропия
практически остается постоянной. Логически возможен случай, когда
из/за обмена энергиями в какой/то момент температура одной части сис/
темы снова станет выше температуры другой ее части, однако это еще не/
измеримо менее вероятно, чем разобранное выше изменение плотности
красных карт. Впрочем, в весьма малых порциях газа возможны флукту/
ации температур и связанных с ними скоростей частиц: эти флуктуации
можно наблюдать на известном явлении броуновского движения.
Так как энтропия статистической системы может лишь возрастать
или оставаться постоянной, то процессы, при которых энтропия воз/
растает, являются необратимыми. Эти процессы становятся невозмож/
ными, если, засняв их на кинопленку, прокручивать ленту в обратном
направлении. (Такой способ обращения необратимого процесса был
применен при съемке фильма «Веселые ребята» для показа стада ко/
ров, выстраивающихся по команде пастуха — Леонида Утесова: коров
выстроили в шеренгу, сняли, как они разбежались, а затем заснятую
пленку вклеили в обратном направлении.) Математически обращение
процесса сводится к замене времени t на −t. Таким образом, если за/
кон развития процесса записан в виде линейного дифференциального
уравнения, не содержащего явно времени t, то условие обратимости
заключается в наличии в этом уравнении производных по t только
четного порядка. Это можно проиллюстрировать на примере линейного
осциллятора, рассмотренного в § VII.3: в уравнении (VII.21)
dy
отвечал силе трения в системе, а наличие трения приводит
член h
dt
к диссипации энергии и тем самым к необратимости процесса.
В заключение отметим, что закон неубывания энтропии — так называ/
емый второй закон термодинамики — имеет вероятностный характер и
в конечном счете связан с тем, что каждое состояние встречается в приро/
де тем чаще, чем оно вероятнее. Другими словами, процессы, связанные
с убыванием энтропии, реально не наблюдаются не из/за их логической,
формальной противоречивости, а из/за их крайне малой вероятности.
§ 5. Радиоактивный распад. Формула Пуассона
Рассмотрим явление радиоактивного распада. Как известно (см.,
например, ВМ, § V.3), вероятность того, что один отдельный атом рас/
падается за весьма малое время t I , равна wt I , вероятность того, что за

§ 5]

РАДИОАКТИВНЫЙ РАСПАД. ФОРМУЛА ПУАССОНА

505

это время распада не произойдет, равна 1− wt I . (Здесь w — постоян/
ная, характеризующая данное радиоактивное вещество.)
Рассмотрим большой промежуток времени t. Найдем вероятность
w(t) того, что в течение этого промежутка времени распада не произой/
дет. Для этого разобьем весь промежуток t на малые промежутки дли/
тельности t1 , t2 , ..., t n . Вероятность того, что распад не произошел за
промежуток t i , равна
1 − wt i .

Вероятность w(t) равна произведению вероятностей того, что распад
не произошел ни за один из промежутков времени t1 , t2 , ..., t n . Поэтому
w( t ) = (1 − wt1 ) ⋅ (1 − wt 2 ) ... (1 − wt n ).

Рассмотрим ln w(t). Ясно, что
ln w( t ) = ln(1 − wt1 ) + ln(1 − wt 2 ) + ... + ln (1 − wt n ).

Так как величины wt1 , wt2 , . . . , wt n малы по сравнению с 1, то лога/
рифмы, стоящие справа, можно разложить в ряд. Ограничиваясь пер/
вым членом разложения, находим
ln w( t ) = − wt1 − wt 2 − ... − wt n = − wt.

Потенцируя, получаем
w( t ) = e − wt .

Таким образом, мы получили хорошо известный результат: отношение
числа атомов, не распавшихся за время t, к первоначальному числу
атомов есть e − wt .
Вероятность того, что атом не распадается за время t, обозначим че/
рез β, тогда β = e − wt . Вероятность α того, что за время t атом распа/
дается, есть α = 1 − e − wt .
Если имеется n атомов, то вероятность w(m; n) того, что m из
них распадется, a k = n − m не распадется, выражается формулой
w ( m; n ) =

n! m k
α β ,
m! k !

(9)

где α = 1 − e − wt , β = e − wt (см. § 2).
Рассмотрим важный частный случай: пусть общее число радиоак/
тивных атомов n весьма велико, а вероятность распада за вре/
мя t весьма мала, так что наиболее вероятное число распадов за про/
межуток времени t — конечное число. Обозначим его через µ, тогда
µ = αn, как было установлено в § 3.
Итак, нас интересует, какой вид примет формула (9), если n не/
ограниченно увеличивается, α неограниченно приближается к нулю,
а их произведение αn = µ (как и m) остается конечным числом.

504

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Значит, при τ a = τ b будет S& = 0, при равных температурах взаимодей/
ствующих порций газа энтропия не меняется. Если же температура сис/
темы a меньше температуры системы b, τ a < τ b , то E& a > 0 и S& > 0, т.е.
система a приобретает энергию от системы b, энтропия общей систе/
мы возрастает. Аналогичное возрастание энтропии будет и в случае
τ a > τ b . Этот процесс перекачки энергии и возрастания энтропии про/
должается до выравнивания температур. После этого энтропия
практически остается постоянной. Логически возможен случай, когда
из/за обмена энергиями в какой/то момент температура одной части сис/
темы снова станет выше температуры другой ее части, однако это еще не/
измеримо менее вероятно, чем разобранное выше изменение плотности
красных карт. Впрочем, в весьма малых порциях газа возможны флукту/
ации температур и связанных с ними скоростей частиц: эти флуктуации
можно наблюдать на известном явлении броуновского движения.
Так как энтропия статистической системы может лишь возрастать
или оставаться постоянной, то процессы, при которых энтропия воз/
растает, являются необратимыми. Эти процессы становятся невозмож/
ными, если, засняв их на кинопленку, прокручивать ленту в обратном
направлении. (Такой способ обращения необратимого процесса был
применен при съемке фильма «Веселые ребята» для показа стада ко/
ров, выстраивающихся по команде пастуха — Леонида Утесова: коров
выстроили в шеренгу, сняли, как они разбежались, а затем заснятую
пленку вклеили в обратном направлении.) Математически обращение
процесса сводится к замене времени t на −t. Таким образом, если за/
кон развития процесса записан в виде линейного дифференциального
уравнения, не содержащего явно времени t, то условие обратимости
заключается в наличии в этом уравнении производных по t только
четного порядка. Это можно проиллюстрировать на примере линейного
осциллятора, рассмотренного в § VII.3: в уравнении (VII.21)
dy
отвечал силе трения в системе, а наличие трения приводит
член h
dt
к диссипации энергии и тем самым к необратимости процесса.
В заключение отметим, что закон неубывания энтропии — так называ/
емый второй закон термодинамики — имеет вероятностный характер и
в конечном счете связан с тем, что каждое состояние встречается в приро/
де тем чаще, чем оно вероятнее. Другими словами, процессы, связанные
с убыванием энтропии, реально не наблюдаются не из/за их логической,
формальной противоречивости, а из/за их крайне малой вероятности.
§ 5. Радиоактивный распад. Формула Пуассона
Рассмотрим явление радиоактивного распада. Как известно (см.,
например, ВМ, § V.3), вероятность того, что один отдельный атом рас/
падается за весьма малое время t I , равна wt I , вероятность того, что за

§ 5]

РАДИОАКТИВНЫЙ РАСПАД. ФОРМУЛА ПУАССОНА

505

это время распада не произойдет, равна 1− wt I . (Здесь w — постоян/
ная, характеризующая данное радиоактивное вещество.)
Рассмотрим большой промежуток времени t. Найдем вероятность
w(t) того, что в течение этого промежутка времени распада не произой/
дет. Для этого разобьем весь промежуток t на малые промежутки дли/
тельности t1 , t2 , ..., t n . Вероятность того, что распад не произошел за
промежуток t i , равна
1 − wt i .

Вероятность w(t) равна произведению вероятностей того, что распад
не произошел ни за один из промежутков времени t1 , t2 , ..., t n . Поэтому
w( t ) = (1 − wt1 ) ⋅ (1 − wt 2 ) ... (1 − wt n ).

Рассмотрим ln w(t). Ясно, что
ln w( t ) = ln(1 − wt1 ) + ln(1 − wt 2 ) + ... + ln (1 − wt n ).

Так как величины wt1 , wt2 , . . . , wt n малы по сравнению с 1, то лога/
рифмы, стоящие справа, можно разложить в ряд. Ограничиваясь пер/
вым членом разложения, находим
ln w( t ) = − wt1 − wt 2 − ... − wt n = − wt.

Потенцируя, получаем
w( t ) = e − wt .

Таким образом, мы получили хорошо известный результат: отношение
числа атомов, не распавшихся за время t, к первоначальному числу
атомов есть e − wt .
Вероятность того, что атом не распадается за время t, обозначим че/
рез β, тогда β = e − wt . Вероятность α того, что за время t атом распа/
дается, есть α = 1 − e − wt .
Если имеется n атомов, то вероятность w(m; n) того, что m из
них распадется, a k = n − m не распадется, выражается формулой
w ( m; n ) =

n! m k
α β ,
m! k !

(9)

где α = 1 − e − wt , β = e − wt (см. § 2).
Рассмотрим важный частный случай: пусть общее число радиоак/
тивных атомов n весьма велико, а вероятность распада за вре/
мя t весьма мала, так что наиболее вероятное число распадов за про/
межуток времени t — конечное число. Обозначим его через µ, тогда
µ = αn, как было установлено в § 3.
Итак, нас интересует, какой вид примет формула (9), если n не/
ограниченно увеличивается, α неограниченно приближается к нулю,
а их произведение αn = µ (как и m) остается конечным числом.

506

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

Рассмотрим множитель

[Гл. XIII

n!α m
n!α m
; запишем его так:
=
k!
(n − m)!

§ 5]

РАДИОАКТИВНЫЙ РАСПАД. ФОРМУЛА ПУАССОНА

Убедимся, что сумма вероятностей w µ (m) для всех значений m
равна 1, т.е. что


∑ wµ ( m) = 1.

n !α m
= n( n − 1)( n − 2 ) ... ( n − m + 1) ⋅ α m =
( n − m)!

n=0

В самом деле,

= ( nα )( nα − α )( nα − 2α ) ... [nα − ( m − 1)α ] =
= µ(µ − α )(µ − 2α ) ... [µ − ( m − 1)α ].

Поэтому для весьма больших n при зафиксированном m будет
n !α m
≈µm.
( n − m)!

Теперь рассмотрим величину β k = β n − m = (1 − α) n − m . Так как α —
весьма малая величина, то β близка к единице. Однако показатель сте/
пени n − m велик, поэтому, заменив β n − m на 1, мы можем допустить
значительную ошибку.
Поступим следующим образом:
β n − m = (1 − α )n − m =

(1 − α )n
≈ (1 − α )n ,
(1 − α )m

так как величина (1− α) m близка к 1*. Вспоминая, что nα = µ, находим
n

− 
n
 µ
 µ µ
(1 − α ) = 1 −  = 1 −  


n
n 


n



507

−µ

≈ e−µ ,

n

 µ µ
так как величина 1− 
тем ближе к e, чем больше n.
 n
Окончательно из (9) при n → ∞ находим
w ( m; n ) = wµ ( m; n ) → wµ ( m) =

µ m −µ
e .
m!

(10)

Новое обозначение w µ (m) означает вероятность наблюдать m распа/
дов, если наиболее вероятное число распадов есть µ, а число атомов n
весьма велико, так что число распадов составляет малую долю числа
атомов.
Закон, выражаемый формулой (10), называется распределением Пу
ассона.
* Нас интересует значение m  µ, так как только для таких m вероятность w (m ; n)
не слишком мала; но если m  µ  n и αn  µ конечно, то αm  αn и, следовательно,
в пределе (α → 0 , n → ∞) величина αm → 0.





m =0

m =0



µm

µm

∑ w µ ( m) = ∑ m ! e − µ = e − µ ∑ m !

= e − µ ⋅ e µ = 1.

m =0

Распределение Пуассона показывает, какова вероятность наблю/
дать m распадов, если наиболее вероятное число распадов есть µ, при/
чем отдельные распады независимы, т.е. тот факт, что уже получено
некоторое число распадов, не меняет вероятности получить еще распад
(для этого мы оговорили, что общее число радиоактивных атомов n ве/
лико, так что µ n, m  n).
В отличие от задач предыдущих параграфов, здесь общее число рас/
падов никак не ограничено. В предыдущих параграфах мы рассматрива/
ли случаи, когда проделывается определенное, хотя, может быть, и очень
большое, число опытов n. Это число n мы задавали, и оно входило в
окончательные результаты. В этом параграфе n (число атомов или, что
то же самое, число опытов, причем опыт состоит в испытании — распа/
дется атом или нет) предполагается неограниченным. Следовательно,
неограниченно и число актов распада. В принципе возможно, хотя и ма/
ловероятно, наблюдать любое, сколь угодно большое число распадов
при одном и том же наиболее вероятном числе распадов µ.
Если µ мало´, а именно µ 1, то, пользуясь (10), находим, что веро/
ятность не наблюдать ни одного распада равна e − µ ≈ 1 − µ, т.е. весьма
близка к единице. Вероятность наблюдать один распад значительно
меньше, а именно µ ⋅ e − µ ≈ µ(1 − µ) ≈ µ. Вероятности наблюдать два, три
и т.д. распадов убывают очень быстро (эти вероятности равны µ 2 2,
µ 3 6 и т.д.).
Если µ велико, то наиболее вероятно наблюдать µ распадов. Дей/
ствительно, найдем, при каком m (µ постоянно!) величина w µ (m)
имеет максимум. Удобнее искать максимум ln w µ (m). Так как
ln w µ (m) = −µ + m ln µ − ln m!, то
d ln wµ ( m)
dm

= ln µ −

d
(ln m!) = ln µ − ln m
dm

d ln w µ (m)

= 0 дает m = µ.
dm
На рис. 188 представлены диаграммы распределения Пуассона для
случаев µ = 05
, ; µ = 2; µ = 3. Нужно заметить, что рис. 188, в сущности,
сделан не точно: ведь на самом деле величина w задана только для це/
(см. § 3). Поэтому равенство

506

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

Рассмотрим множитель

[Гл. XIII

n!α m
n!α m
; запишем его так:
=
k!
(n − m)!

§ 5]

РАДИОАКТИВНЫЙ РАСПАД. ФОРМУЛА ПУАССОНА

Убедимся, что сумма вероятностей w µ (m) для всех значений m
равна 1, т.е. что


∑ wµ ( m) = 1.

n !α m
= n( n − 1)( n − 2 ) ... ( n − m + 1) ⋅ α m =
( n − m)!

n=0

В самом деле,

= ( nα )( nα − α )( nα − 2α ) ... [nα − ( m − 1)α ] =
= µ(µ − α )(µ − 2α ) ... [µ − ( m − 1)α ].

Поэтому для весьма больших n при зафиксированном m будет
n !α m
≈µm.
( n − m)!

Теперь рассмотрим величину β k = β n − m = (1 − α) n − m . Так как α —
весьма малая величина, то β близка к единице. Однако показатель сте/
пени n − m велик, поэтому, заменив β n − m на 1, мы можем допустить
значительную ошибку.
Поступим следующим образом:
β n − m = (1 − α )n − m =

(1 − α )n
≈ (1 − α )n ,
(1 − α )m

так как величина (1− α) m близка к 1*. Вспоминая, что nα = µ, находим
n

− 
n
 µ
 µ µ
(1 − α ) = 1 −  = 1 −  


n
n 


n



507

−µ

≈ e−µ ,

n

 µ µ
так как величина 1− 
тем ближе к e, чем больше n.
 n
Окончательно из (9) при n → ∞ находим
w ( m; n ) = wµ ( m; n ) → wµ ( m) =

µ m −µ
e .
m!

(10)

Новое обозначение w µ (m) означает вероятность наблюдать m распа/
дов, если наиболее вероятное число распадов есть µ, а число атомов n
весьма велико, так что число распадов составляет малую долю числа
атомов.
Закон, выражаемый формулой (10), называется распределением Пу
ассона.
* Нас интересует значение m  µ, так как только для таких m вероятность w (m ; n)
не слишком мала; но если m  µ  n и αn  µ конечно, то αm  αn и, следовательно,
в пределе (α → 0 , n → ∞) величина αm → 0.





m =0

m =0



µm

µm

∑ w µ ( m) = ∑ m ! e − µ = e − µ ∑ m !

= e − µ ⋅ e µ = 1.

m =0

Распределение Пуассона показывает, какова вероятность наблю/
дать m распадов, если наиболее вероятное число распадов есть µ, при/
чем отдельные распады независимы, т.е. тот факт, что уже получено
некоторое число распадов, не меняет вероятности получить еще распад
(для этого мы оговорили, что общее число радиоактивных атомов n ве/
лико, так что µ n, m  n).
В отличие от задач предыдущих параграфов, здесь общее число рас/
падов никак не ограничено. В предыдущих параграфах мы рассматрива/
ли случаи, когда проделывается определенное, хотя, может быть, и очень
большое, число опытов n. Это число n мы задавали, и оно входило в
окончательные результаты. В этом параграфе n (число атомов или, что
то же самое, число опытов, причем опыт состоит в испытании — распа/
дется атом или нет) предполагается неограниченным. Следовательно,
неограниченно и число актов распада. В принципе возможно, хотя и ма/
ловероятно, наблюдать любое, сколь угодно большое число распадов
при одном и том же наиболее вероятном числе распадов µ.
Если µ мало´, а именно µ 1, то, пользуясь (10), находим, что веро/
ятность не наблюдать ни одного распада равна e − µ ≈ 1 − µ, т.е. весьма
близка к единице. Вероятность наблюдать один распад значительно
меньше, а именно µ ⋅ e − µ ≈ µ(1 − µ) ≈ µ. Вероятности наблюдать два, три
и т.д. распадов убывают очень быстро (эти вероятности равны µ 2 2,
µ 3 6 и т.д.).
Если µ велико, то наиболее вероятно наблюдать µ распадов. Дей/
ствительно, найдем, при каком m (µ постоянно!) величина w µ (m)
имеет максимум. Удобнее искать максимум ln w µ (m). Так как
ln w µ (m) = −µ + m ln µ − ln m!, то
d ln wµ ( m)
dm

= ln µ −

d
(ln m!) = ln µ − ln m
dm

d ln w µ (m)

= 0 дает m = µ.
dm
На рис. 188 представлены диаграммы распределения Пуассона для
случаев µ = 05
, ; µ = 2; µ = 3. Нужно заметить, что рис. 188, в сущности,
сделан не точно: ведь на самом деле величина w задана только для це/
(см. § 3). Поэтому равенство

508

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Рис. 188.

лых значений m, так что кривая, дающая w(m) при всех m, т.е., в час/
тности, и при дробных m, не имеет смысла. Следовало бы для каждого
µ дать частокол величин w µ (0), w µ (1), w µ (2) и т.д., изображаемых
вертикальными отрезками, опирающимися на целые точки на оси аб/
сцисс. Кривая w µ (m) проходит через вершины этих отрезков.
Вид функции w µ (m) при больших µ будет описан в § 8.
Упражнения
1. Сделайте вывод о максимуме wµ ( m) при данном µ, рассматривая отно/
шение wµ ( m) к wµ ( m − 1).
2. Пусть некоторая величина x может принимать в результате испытания
значения x1 , . . . , xn с вероятностями p1 , . . . , pn . Докажите, что среднее значе/
ние x этой величины в одном испытании равно x1 p1 + . . . + xn pn . Опираясь на
это, докажите, что среднее значение m числа распадов за время t как раз равно µ.

§ 6. Другой вывод распределения Пуассона
Дадим теперь другой вывод распределения Пуассона, исходя из со/
ображений, отличных от тех, которыми мы пользовались в § 5. Пред/
ставим себе большое число приборов (счетчиков), каждый из которых
регистрирует распады в одинаковых образцах, содержащих долгожи/
вущее радиоактивное вещество.
Для удобства вычислений будем считать, что в среднем в единицу
времени в каждом образце происходит один распад. Тогда за время t
в среднем в каждом образце произошло t распадов. Обозначим через
x 0 число счетчиков, которые не зарегистрировали ни одного распада
(m = 0), через x 1 — число счетчиков, которые зарегистрировали по од/
ному распаду (m = 1), через x 2 — число счетчиков, которые зарегис/
трировали по два распада (m = 2), и т.д. Ясно, что величины x 0 ,
x 1 , x 2 , . . . зависят от времени, прошедшего с начала опыта. Пусть
в определенный момент времени t известны величины x 0 (t), x 1 (t),
x 2 (t), . . . , т.е. известно количество счетчиков, зарегистрировавших 0, 1,
2, . . . распадов.

§ 6]

ДРУГОЙ ВЫВОД РАСПРЕДЕЛЕНИЯ ПУАССОНА

509

Как изменятся эти количества счетчиков, когда пройдет малый про/
межуток времени dt?
В любой группе из n счетчиков за единицу времени произойдет n
распадов, а за время dt произойдет ndt распадов. Значит, в этой груп/
пе ndt счетчиков зарегистрируют по одному распаду.
Рассмотрим группу счетчиков, не зарегистрировавших ни одного
распада. В x 0 (t) dt из этих счетчиков произойдет по одному распаду,
и эти счетчики перейдут в другую группу, а именно в группу x 1 . Поэто/
му число счетчиков, не зарегистрировавших ни одного распада по исте/
чении промежутка времени t + dt, есть
x0 ( t + dt ) = x0 ( t ) − x0 ( t ) dt.

Отсюда
x0 ( t + dt ) − x0 ( t ) = − x0 ( t ) dt,

или

dx0
= −x0 .
dt

Рассмотрим группу x 1 (t). Аналогично предыдущему, x 1 (t) dt из
этих счетчиков перейдут в группу x 2 , однако в рассматриваемую груп/
пу перейдут x 0 (t) dt счетчиков из группы x 0 . Поэтому
x1 ( t + dt ) = x1 ( t ) − x1 ( t ) dt + x0 ( t ) dt,

откуда
dx1
= x0 − x1 .
dt

Продолжая эти рассуждения, мы приходим к цепочке дифференци/
альных уравнений
dx0
= −x0 ,
dt
dx1
= x0 − x1 ,
dt
.........









(11)

Ясно, что в начальный момент времени t = 0 будет x 0 = N , где N —
полное число счетчиков, x 1 = x 2 = x 3 = ... = 0. Уравнения (11) легко ре/
шаются одно за другим (см. § VII.2). Получаем

x0 = Ne − t , 
x1 = Nte − t , 

t2

x 2 = N e − t ,
2

t3
x 3 = N e − t ,

3!
K K K K K

508

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Рис. 188.

лых значений m, так что кривая, дающая w(m) при всех m, т.е., в час/
тности, и при дробных m, не имеет смысла. Следовало бы для каждого
µ дать частокол величин w µ (0), w µ (1), w µ (2) и т.д., изображаемых
вертикальными отрезками, опирающимися на целые точки на оси аб/
сцисс. Кривая w µ (m) проходит через вершины этих отрезков.
Вид функции w µ (m) при больших µ будет описан в § 8.
Упражнения
1. Сделайте вывод о максимуме wµ ( m) при данном µ, рассматривая отно/
шение wµ ( m) к wµ ( m − 1).
2. Пусть некоторая величина x может принимать в результате испытания
значения x1 , . . . , xn с вероятностями p1 , . . . , pn . Докажите, что среднее значе/
ние x этой величины в одном испытании равно x1 p1 + . . . + xn pn . Опираясь на
это, докажите, что среднее значение m числа распадов за время t как раз равно µ.

§ 6. Другой вывод распределения Пуассона
Дадим теперь другой вывод распределения Пуассона, исходя из со/
ображений, отличных от тех, которыми мы пользовались в § 5. Пред/
ставим себе большое число приборов (счетчиков), каждый из которых
регистрирует распады в одинаковых образцах, содержащих долгожи/
вущее радиоактивное вещество.
Для удобства вычислений будем считать, что в среднем в единицу
времени в каждом образце происходит один распад. Тогда за время t
в среднем в каждом образце произошло t распадов. Обозначим через
x 0 число счетчиков, которые не зарегистрировали ни одного распада
(m = 0), через x 1 — число счетчиков, которые зарегистрировали по од/
ному распаду (m = 1), через x 2 — число счетчиков, которые зарегис/
трировали по два распада (m = 2), и т.д. Ясно, что величины x 0 ,
x 1 , x 2 , . . . зависят от времени, прошедшего с начала опыта. Пусть
в определенный момент времени t известны величины x 0 (t), x 1 (t),
x 2 (t), . . . , т.е. известно количество счетчиков, зарегистрировавших 0, 1,
2, . . . распадов.

§ 6]

ДРУГОЙ ВЫВОД РАСПРЕДЕЛЕНИЯ ПУАССОНА

509

Как изменятся эти количества счетчиков, когда пройдет малый про/
межуток времени dt?
В любой группе из n счетчиков за единицу времени произойдет n
распадов, а за время dt произойдет ndt распадов. Значит, в этой груп/
пе ndt счетчиков зарегистрируют по одному распаду.
Рассмотрим группу счетчиков, не зарегистрировавших ни одного
распада. В x 0 (t) dt из этих счетчиков произойдет по одному распаду,
и эти счетчики перейдут в другую группу, а именно в группу x 1 . Поэто/
му число счетчиков, не зарегистрировавших ни одного распада по исте/
чении промежутка времени t + dt, есть
x0 ( t + dt ) = x0 ( t ) − x0 ( t ) dt.

Отсюда
x0 ( t + dt ) − x0 ( t ) = − x0 ( t ) dt,

или

dx0
= −x0 .
dt

Рассмотрим группу x 1 (t). Аналогично предыдущему, x 1 (t) dt из
этих счетчиков перейдут в группу x 2 , однако в рассматриваемую груп/
пу перейдут x 0 (t) dt счетчиков из группы x 0 . Поэтому
x1 ( t + dt ) = x1 ( t ) − x1 ( t ) dt + x0 ( t ) dt,

откуда
dx1
= x0 − x1 .
dt

Продолжая эти рассуждения, мы приходим к цепочке дифференци/
альных уравнений
dx0
= −x0 ,
dt
dx1
= x0 − x1 ,
dt
.........









(11)

Ясно, что в начальный момент времени t = 0 будет x 0 = N , где N —
полное число счетчиков, x 1 = x 2 = x 3 = ... = 0. Уравнения (11) легко ре/
шаются одно за другим (см. § VII.2). Получаем

x0 = Ne − t , 
x1 = Nte − t , 

t2

x 2 = N e − t ,
2

t3
x 3 = N e − t ,

3!
K K K K K

510

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Пусть прошло μ единиц времени после начала процесса. За это время
в каждом образце в среднем произошло μ распадов, а в каждом счет(
μ m −μ
чике группы m, численность которой равна x m (μ) = N
e , прои(
m!
зошло по m распадов. Поэтому вероятность того, что в наудачу взятом
счетчике наблюдалось m распадов, равна отношению числа счетчиков
группы x m (μ) к общему числу счетчиков, т.е.
wμ (m) =

x m (μ) μ m −μ
e .
=
N
m!

Мы получили тот же результат, что и в § 5.
Упражнение
Рассмотрите следующее обобщение разобранной задачи. Пусть некоторый
объект может быть в состояниях . . . , C −2 , C −1, C 0 , C1, C2 , . . . , причем в мо(
мент t = 0 он находился в состоянии C 0 , а за время dt он переходит с вероят(
ностью ωdt в следующее состояние и с вероятностью α dt — в предыдущее.
Укажите систему уравнений, которой удовлетворяют вероятности pi (t) нахо(
диться в момент t в состоянии C i , найдите приближенные выражения для
pi (t) по методу последовательных приближений, найдите среднее значение
номера состояния в момент t. При каких значениях α и ω получается разоб(
ранная в основном тексте задача?

§ 7. Непрерывно распределенные величины
Обратимся к задаче о рыбной ловле, которая была поставлена в § 1.
Пусть вероятность вытащить рыбу, вес которой заключен в преде(
лах от p до p + dp, равна f (p) dp*. Функция f (p) называется плот
ностью распределения вероятностей. Она удовлетворяет условию
+∞

∫ f (p) dp = 1,

так как этот интеграл есть сумма вероятностей всех

0

могущих произойти событий.
Заметим, что на самом деле в любом водоеме нет рыб, вес которых
больше некоторого числа P. Однако мы ставим верхний предел интег(
рирования не P, а +∞. Это можно делать, взяв функцию f (p) равной
0 при p > P или, во всяком случае, быстро убывающей при возраста(
нии p и со столь малыми значениями при p > P , что на величину ин(
теграла эти значения практически не влияют**.
* Мы считаем, что вытаскивание пустого крючка — это вылавливание рыбы весом
p = 0; см. грустные шутки по этому поводу на стр. 481.
** В других задачах рассматриваемая величина (в данном случае это вес рыбы) мо(
жет принимать и отрицательные значения. В этом случае f ( p) удовлетворяет условию
+∞

∫ f ( p) dp = 1.

−∞

§ 7]

НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫЕ ВЕЛИЧИНЫ

511

Важно отметить следующее. Мы считаем, что в процессе ловли вы(
лавливается лишь весьма малая часть всей рыбы, имеющейся в водое(
ме. Поэтому вероятность выловить рыбу, вес которой заключен
в пределах от p до p + dp, не зависит от того, сколько рыб и какого веса
уже поймано. Говоря другими словами, функция f (p) не зависит от
того, какие рыбы были уже пойманы. Эта функция характеризует дан(
ный достаточно большой водоем.
Поставим прежде всего следующую задачу. Пусть было выловлено
большое число n рыб (точнее, крючок вынут n раз). Каков будет
средний вес одной выловленной рыбы? Вероятность поймать рыбу, вес
которой лежит в пределах от p до p + dp, где dp малое,равна f (p) dp.
Поэтому из общего числа n в n ⋅ f (p) dp случаях будет поймана рыба
веса p*. Вес всех таких рыб равен p ⋅ nf (p) dp. Интегрируя последнее
выражение по всем p, т.е. от p = 0 до p = +∞, мы получим общий вес
улова после n забросов крючка


Pn = n∫ pf (p) dp.
0

Разделив общий вес улова Pn на число n забросов крючка, мы полу(
чим средний вес рыбы в расчете на один заброс крючка


p1 =

Pn
= pf (p) dp.
n ∫0

(12)

Теперь поставим более сложную задачу. Пусть выловлено n рыб.
Вероятность, что при этом общий вес улова будет заключен в границах
от p до p + dp, есть F n (p) dp. Функция F n (p) является плотностью
распределения по весу улова, состоящего из n рыб. Поставим задачу
найти эту функцию. Для этого прежде всего составим уравнение, свя(
зывающее величины F n +1 (p) и F n (p).
Пусть после n вытаскиваний получилось распределение F n (p).
Каким образом после n +1 вытаскиваний может получиться общий
вес улова, лежащий в пределах от p до p + dp?
Если вес последней (n +1)(й рыбы лежит в пределах от μ до μ + dμ,
где dμ гораздо меньше, чем dp, то для того, чтобы сумма весов n рыб
и (n +1)(й рыбы попала в заданные границы от p до p + dp, нужно,

* Точнее говоря, рыба, вес которой весьма близок к p, а именно находится в интерва(
ле dp около p. Заметьте, что для величины, меняющейся непрерывно, которая не обяза(
на принимать определенные целые (в общем случае — дискретные) значения, бессмыс(
ленно спрашивать, какова вероятность того, что величина примет т о ч н о определенное
значение: эта вероятность, очевидно, равна нулю. Имеет смысл только вероятность по(
пасть в определенный интервал — и эта вероятность пропорциональна длине интервала,
когда интервал мал.

510

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Пусть прошло μ единиц времени после начала процесса. За это время
в каждом образце в среднем произошло μ распадов, а в каждом счет(
μ m −μ
чике группы m, численность которой равна x m (μ) = N
e , прои(
m!
зошло по m распадов. Поэтому вероятность того, что в наудачу взятом
счетчике наблюдалось m распадов, равна отношению числа счетчиков
группы x m (μ) к общему числу счетчиков, т.е.
wμ (m) =

x m (μ) μ m −μ
e .
=
N
m!

Мы получили тот же результат, что и в § 5.
Упражнение
Рассмотрите следующее обобщение разобранной задачи. Пусть некоторый
объект может быть в состояниях . . . , C −2 , C −1, C 0 , C1, C2 , . . . , причем в мо(
мент t = 0 он находился в состоянии C 0 , а за время dt он переходит с вероят(
ностью ωdt в следующее состояние и с вероятностью α dt — в предыдущее.
Укажите систему уравнений, которой удовлетворяют вероятности pi (t) нахо(
диться в момент t в состоянии C i , найдите приближенные выражения для
pi (t) по методу последовательных приближений, найдите среднее значение
номера состояния в момент t. При каких значениях α и ω получается разоб(
ранная в основном тексте задача?

§ 7. Непрерывно распределенные величины
Обратимся к задаче о рыбной ловле, которая была поставлена в § 1.
Пусть вероятность вытащить рыбу, вес которой заключен в преде(
лах от p до p + dp, равна f (p) dp*. Функция f (p) называется плот
ностью распределения вероятностей. Она удовлетворяет условию
+∞

∫ f (p) dp = 1,

так как этот интеграл есть сумма вероятностей всех

0

могущих произойти событий.
Заметим, что на самом деле в любом водоеме нет рыб, вес которых
больше некоторого числа P. Однако мы ставим верхний предел интег(
рирования не P, а +∞. Это можно делать, взяв функцию f (p) равной
0 при p > P или, во всяком случае, быстро убывающей при возраста(
нии p и со столь малыми значениями при p > P , что на величину ин(
теграла эти значения практически не влияют**.
* Мы считаем, что вытаскивание пустого крючка — это вылавливание рыбы весом
p = 0; см. грустные шутки по этому поводу на стр. 481.
** В других задачах рассматриваемая величина (в данном случае это вес рыбы) мо(
жет принимать и отрицательные значения. В этом случае f ( p) удовлетворяет условию
+∞

∫ f ( p) dp = 1.

−∞

§ 7]

НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫЕ ВЕЛИЧИНЫ

511

Важно отметить следующее. Мы считаем, что в процессе ловли вы(
лавливается лишь весьма малая часть всей рыбы, имеющейся в водое(
ме. Поэтому вероятность выловить рыбу, вес которой заключен
в пределах от p до p + dp, не зависит от того, сколько рыб и какого веса
уже поймано. Говоря другими словами, функция f (p) не зависит от
того, какие рыбы были уже пойманы. Эта функция характеризует дан(
ный достаточно большой водоем.
Поставим прежде всего следующую задачу. Пусть было выловлено
большое число n рыб (точнее, крючок вынут n раз). Каков будет
средний вес одной выловленной рыбы? Вероятность поймать рыбу, вес
которой лежит в пределах от p до p + dp, где dp малое, равна f (p) dp.
Поэтому из общего числа n в n ⋅ f (p) dp случаях будет поймана рыба
веса p*. Вес всех таких рыб равен p ⋅ nf (p) dp. Интегрируя последнее
выражение по всем p, т.е. от p = 0 до p = +∞, мы получим общий вес
улова после n забросов крючка


Pn = n∫ pf (p) dp.
0

Разделив общий вес улова Pn на число n забросов крючка, мы полу(
чим средний вес рыбы в расчете на один заброс крючка


p1 =

Pn
= pf (p) dp.
n ∫0

(12)

Теперь поставим более сложную задачу. Пусть выловлено n рыб.
Вероятность, что при этом общий вес улова будет заключен в границах
от p до p + dp, есть F n (p) dp. Функция F n (p) является плотностью
распределения по весу улова, состоящего из n рыб. Поставим задачу
найти эту функцию. Для этого прежде всего составим уравнение, свя(
зывающее величины F n +1 (p) и F n (p).
Пусть после n вытаскиваний получилось распределение F n (p).
Каким образом после n +1 вытаскиваний может получиться общий
вес улова, лежащий в пределах от p до p + dp?
Если вес последней (n +1)(й рыбы лежит в пределах от μ до μ + dμ,
где dμ гораздо меньше, чем dp, то для того, чтобы сумма весов n рыб
и (n +1)(й рыбы попала в заданные границы от p до p + dp, нужно,

* Точнее говоря, рыба, вес которой весьма близок к p, а именно находится в интерва(
ле dp около p. Заметьте, что для величины, меняющейся непрерывно, которая не обяза(
на принимать определенные целые (в общем случае — дискретные) значения, бессмыс(
ленно спрашивать, какова вероятность того, что величина примет т о ч н о определенное
значение: эта вероятность, очевидно, равна нулю. Имеет смысл только вероятность по(
пасть в определенный интервал — и эта вероятность пропорциональна длине интервала,
когда интервал мал.

512

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

чтобы вес n рыб лежал в пределах от p − µ до p + dp − µ (при этом мы
пренебрегаем малой величиной dµ).
Вероятность выловить (n + 1)/ю рыбу весом от µ до µ + dµ равна,
как мы знаем, f (µ) dµ. Вероятность того, что вес n первых рыб лежит
в пределах от p − µ до p − µ + dp, равна Fn ( p − µ)dp.
Вероятность события, состоящего в том, что вес первых n рыб ока/
зался в указанных пределах и вес (n + 1)/й рыбы оказался также в ука/
занных пределах, равна произведению вероятностей этих отдельных
событий и, следовательно, равна
f (µ ) dµ ⋅ Fn ( p − µ ) dp.



0



f (µ ) dµ Fn ( p − µ ) dp = dp ∫ f (µ ) Fn ( p − µ ) dµ.

(14)

0

Но, согласно определению, вероятность того, что общий вес n + 1
рыб лежит в пределах от p до p + dp, равна Fn +1 ( p) dp. Приравнивая
последнее выражение правой части (14) и сокращая на dp, получим


Fn + 1 ( p ) = ∫ f (µ ) Fn ( p − µ ) dµ.

НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫЕ ВЕЛИЧИНЫ

(15)

0

Формула (15) дает возможность, зная функцию F1 (µ) = f (µ) (так как
F1 ( p) относится к случаю улова, состоящего из одной рыбы) и зная Fn ,
находить Fn +1 ( p), т.е. переходить последовательно от индекса n к ин/
дексу n + 1*.
Рассмотрим простейший пример.
1
Пусть f ( p) = , если 0 < p < q и f ( p) = 0 при всех остальных зна/
q
чениях p. Это означает, что в водоеме нет рыб, вес которых больше q,
а вероятность выловить любую рыбу, вес которой заключен в интерва/
ле q1 < p < q2 (0  q1 < p < q2  q) зависит только от разности q2 − q1 ;
* Фактически в формуле (15) выполняется интегрирование от 0 до р, так как
Fn (p − µ ) при µ > p равна нулю, и потому µ может принимать значения только от 0 до
р. Если взамен веса рыбы рассматривается величина, которая может принимать значе/
ния обоих знаков, то в формуле (15) интегрирование проводится от −∞ до +∞.

513

поэтому нет и «нулевых» рыб (в f ( p) нет δ/слагаемого). Средний вес
выловленной рыбы равен
q

p1 = ∫ p
0

q
1
dp = .
q
2



Ясно, что условие

∫ f ( p) dp = 1 выполняется. Действительно,
0



q

0

0

q

1

1

∫ f ( p ) dp = ∫ f ( p ) dp = ∫ q dp = q ⋅ q = 1.

(13)

Заметим, что получить окончательно вес всех выловленных рыб, лежа/
щий в указанных пределах, можно множеством способов, так как вес µ
последней рыбы может иметь всевозможные значения от 0 до +∞. Поэ/
тому общая вероятность того, что вес всех выловленных рыб лежит
в указанных пределах, равна сумме выражений (13), записанных для
различных значений µ. При этом так как µ принимает всевозможные
значения, то вместо суммы появляется интеграл. Таким образом, эта
вероятность есть


§ 7]

0

Как было указано выше, F1 ( p) = f ( p). Найдем F2 ( p). Пользуясь
(15), получаем


F2 ( p ) = ∫ f (µ ) ⋅f ( p − µ ) dµ.
0

Так как f (µ) отлична от нуля и при этом равна

1
только при0 < µ < q,
q

q

1
f ( p − µ ) dµ. В последнем интеграле положим p − µ = t,
q
0

то F2 ( p) = ∫

тогда dt = − dµ; получим
F2 ( p ) = −

1
q

p−q



p

f ( t ) dt =

p

1
f ( t ) dt.
q p∫− q

Теперь рассмотрим отдельно случай 0 < p < q и случай q < p < 2q.
Если 0 < p < q, то p − q < 0. Учитывая, что функция f (t) отлична от
нуля (и при этом равна 1 q) лишь при 0 < t < q, получаем
p
p
1 1
F2 ( p) = ∫ dt = 2 . Если же q < p < 2q, то интегрируем от p − q до q.
q0q
q
q

Поэтому в этом случае F2 ( p) =

2q − p
1
1
. Таким образом,
dt =

q p−q q
q2

 p
если 0 < p < q,
 q 2 ,
F2 ( p ) = 
2q − p

, если q < p < 2 q.
 q 2

Отметим еще, что F2 ( p) ≡ 0, если p < 0 и если p > 2q, так как вес улова
не может быть отрицательным и вес улова, состоящего из двух рыб, не
может быть больше 2q, потому что в водоеме нет рыб, вес которых
больше q. График функции F2 ( p) изображен на рис. 189. Предлагаем

512

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

чтобы вес n рыб лежал в пределах от p − µ до p + dp − µ (при этом мы
пренебрегаем малой величиной dµ).
Вероятность выловить (n + 1)/ю рыбу весом от µ до µ + dµ равна,
как мы знаем, f (µ) dµ. Вероятность того, что вес n первых рыб лежит
в пределах от p − µ до p − µ + dp, равна Fn ( p − µ)dp.
Вероятность события, состоящего в том, что вес первых n рыб ока/
зался в указанных пределах и вес (n + 1)/й рыбы оказался также в ука/
занных пределах, равна произведению вероятностей этих отдельных
событий и, следовательно, равна
f (µ ) dµ ⋅ Fn ( p − µ ) dp.



0



f (µ ) dµ Fn ( p − µ ) dp = dp ∫ f (µ ) Fn ( p − µ ) dµ.

(14)

0

Но, согласно определению, вероятность того, что общий вес n + 1
рыб лежит в пределах от p до p + dp, равна Fn +1 ( p) dp. Приравнивая
последнее выражение правой части (14) и сокращая на dp, получим


Fn + 1 ( p ) = ∫ f (µ ) Fn ( p − µ ) dµ.

НЕПРЕРЫВНО РАСПРЕДЕЛЕННЫЕ ВЕЛИЧИНЫ

(15)

0

Формула (15) дает возможность, зная функцию F1 (µ) = f (µ) (так как
F1 ( p) относится к случаю улова, состоящего из одной рыбы) и зная Fn ,
находить Fn +1 ( p), т.е. переходить последовательно от индекса n к ин/
дексу n + 1*.
Рассмотрим простейший пример.
1
Пусть f ( p) = , если 0 < p < q и f ( p) = 0 при всех остальных зна/
q
чениях p. Это означает, что в водоеме нет рыб, вес которых больше q,
а вероятность выловить любую рыбу, вес которой заключен в интерва/
ле q1 < p < q2 (0  q1 < p < q2  q) зависит только от разности q2 − q1 ;
* Фактически в формуле (15) выполняется интегрирование от 0 до р, так как
Fn (p − µ ) при µ > p равна нулю, и потому µ может принимать значения только от 0 до
р. Если взамен веса рыбы рассматривается величина, которая может принимать значе/
ния обоих знаков, то в формуле (15) интегрирование проводится от −∞ до +∞.

513

поэтому нет и «нулевых» рыб (в f ( p) нет δ/слагаемого). Средний вес
выловленной рыбы равен
q

p1 = ∫ p
0

q
1
dp = .
q
2



Ясно, что условие

∫ f ( p) dp = 1 выполняется. Действительно,
0



q

0

0

q

1

1

∫ f ( p ) dp = ∫ f ( p ) dp = ∫ q dp = q ⋅ q = 1.

(13)

Заметим, что получить окончательно вес всех выловленных рыб, лежа/
щий в указанных пределах, можно множеством способов, так как вес µ
последней рыбы может иметь всевозможные значения от 0 до +∞. Поэ/
тому общая вероятность того, что вес всех выловленных рыб лежит
в указанных пределах, равна сумме выражений (13), записанных для
различных значений µ. При этом так как µ принимает всевозможные
значения, то вместо суммы появляется интеграл. Таким образом, эта
вероятность есть


§ 7]

0

Как было указано выше, F1 ( p) = f ( p). Найдем F2 ( p). Пользуясь
(15), получаем


F2 ( p ) = ∫ f (µ ) ⋅f ( p − µ ) dµ.
0

Так как f (µ) отлична от нуля и при этом равна

1
только при0 < µ < q,
q

q

1
f ( p − µ ) dµ. В последнем интеграле положим p − µ = t,
q
0

то F2 ( p) = ∫

тогда dt = − dµ; получим
F2 ( p ) = −

1
q

p−q



p

f ( t ) dt =

p

1
f ( t ) dt.
q p∫− q

Теперь рассмотрим отдельно случай 0 < p < q и случай q < p < 2q.
Если 0 < p < q, то p − q < 0. Учитывая, что функция f (t) отлична от
нуля (и при этом равна 1 q) лишь при 0 < t < q, получаем
p
p
1 1
F2 ( p) = ∫ dt = 2 . Если же q < p < 2q, то интегрируем от p − q до q.
q0q
q
q

Поэтому в этом случае F2 ( p) =

2q − p
1
1
. Таким образом,
dt =

q p−q q
q2

 p
если 0 < p < q,
 q 2 ,
F2 ( p ) = 
2q − p

, если q < p < 2 q.
 q 2

Отметим еще, что F2 ( p) ≡ 0, если p < 0 и если p > 2q, так как вес улова
не может быть отрицательным и вес улова, состоящего из двух рыб, не
может быть больше 2q, потому что в водоеме нет рыб, вес которых
больше q. График функции F2 ( p) изображен на рис. 189. Предлагаем

514

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

читателю получить функцию
F3 ( p) и построить ее график. (См.
упражнение.)
Сообщим два простейших
свойства функций Fn ( p).

§ 8]

СЛУЧАЙ ВЕСЬМА БОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ

515

мости, равна f ( p) dp ϕ(q) dq; соответствующее же значение ξη равно
pq. Поэтому среднее значение ξη получается по формуле
ξη =

∞ ∞





−∞ −∞

−∞

−∞

∫ ∫ pq [f ( p ) dp ϕ( q) dq] = ∫ pf ( p ) dp ⋅ ∫ qϕ( q) dq = ξ ⋅ η,



∫ Fn ( p) dp = 1 (при любом

n).

что и требовалось доказать.
Рассеяние величины ξ вокруг ее среднего значения характеризует/

Это свойство очевидно, исходя из того, что Fn ( p) есть плотность рас/
пределения вероятностей. Читатель легко проверит, что это соотноше/
ние справедливо для функций F2 ( p), F3 ( p) предыдущего примера.
2. Обозначим через pn +1 средний вес улова, состоящего из (n + 1)
рыб. Это надо понимать так. Пусть мы многократно производили за/
брасывание крючка (n + 1) раз подряд, а затем подсчитали средний вес
улова, состоящего из (n + 1) рыб. Тогда pn +1 = pn + p1 , т.е. средний вес
улова из (n + 1) рыб равен сумме среднего веса улова из nрыб и средне/
го веса улова, состоящего из одной рыбы. Поэтому p2 = p1 + p1 = 2 p1 ;
p3 = p2 + p1 = 3 p1 и т.д., т.е.

ся средним квадратом разности ∆ ξ2 = (ξ − ξ)2 = ∫ ( p − ξ)2 f ( p) dp, кото/

1.

Рис. 189.

0

pn = n p1 .

(16)

Отметим в заключение несколько общих свойств случайных вели
чин, т.е. величин, которые принимают определенные значения в ре/
зультате «испытания». (Например, случайной величиной является вес
рыбы, пойманной при испытании — вытягивании крючка.) Пусть име/
ются две случайные величины ξ и η; обозначим через p и соотве/
тственно q возможные значения этих величин, а через f ( p) и ϕ(q) —
соответствующие плотности распределения. Как мы видели, среднее
значение ξ (можно писать также p) величины ξ можно вычислить
по формуле ξ =



∫ pf ( p) dp, аналогично выражается

η. Легко доказать,

−∞



−∞

рый называется дисперсией величины ξ. (Заметим, что последний
интеграл действительно есть положительное число, так как подынтег/
ральная функция положительна.) Легко проверить, что дисперсия сум/
мы независимых величин равна сумме их дисперсий:
∆ ξ2+ η = [(ξ + η) − (ξ + η)]2 = [(ξ − ξ ) + (η − η)]2 =
= (ξ − ξ )2 + 2(ξ − ξ ) (η − η) + (η − η)2 = ∆ ξ2 + 2 ⋅ 0 ⋅ 0 + ∆ η2 ,

так как (ξ − ξ) = ξ − ξ = ξ − ξ = 0. Это свойство немедленно распростра/
няется на сумму любого числа независимых случайных величин.
Отсюда, в частности, вытекает, что для суммы ξ из η независи/
мых значений величины ξ 1 дисперсия ∆ n2 равна ∆ n2 = n∆ 12 .
Упражнение
Найдите функцию F3 ( p ) для случая
1
 , если 0 < p < q,
.
f ( p) =  q
 0, если p < 0 или p > q.
Постройте график этой функции.

что всегда
ξ + η = ξ + η,

C ξ = C ξ,

(C = const ).

(17)

В самом деле, если обозначить через pi и q i значения величин ξ и η
в i/м испытании, то при весьма большом числе N испытаний можно
написать
ξ + η=

1
N

N

1

N

1

N

∑ ( pi + qi ) = N ∑ pi + N ∑ qi = ξ + η.
i =1

i =1

i =1

Аналогично проверяется второе равенство (17).
Если величины ξ и η независимы, то можно доказать также, что
ξη = ξ ⋅ η. В самом деле, вероятность того, что ξ примет значение между
p и p + dp, а η — значение между q и q + dq, в силу условия независи/

§ 8. Случай весьма большого числа испытаний
В этом параграфе мы рассмотрим вопрос о поведении функции
Fn ( p), введенной в § 7, при весьма больших значениях n. При этом мы
будем для простоты сначала взамен веса рыбы рассматривать какую/то
величину ξ 1 , среднее значение которой равно нулю; конечно, такая ве/
личина может принимать значения обоих знаков. Fn ( p) — это функ/
ция распределения суммы n независимых значений величины ξ 1 .
Будем исходить из полученной в § 7 формулы (15); однако, как
было сказано в сноске на стр. 512, интеграл в этой формуле надо брать
в пределах от −∞ до ∞. Разложим Fn ( p − µ) в ряд по степеням µ,

514

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

читателю получить функцию
F3 ( p) и построить ее график. (См.
упражнение.)
Сообщим два простейших
свойства функций Fn ( p).

§ 8]

СЛУЧАЙ ВЕСЬМА БОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ

515

мости, равна f ( p) dp ϕ(q) dq; соответствующее же значение ξη равно
pq. Поэтому среднее значение ξη получается по формуле
ξη =

∞ ∞





−∞ −∞

−∞

−∞

∫ ∫ pq [f ( p ) dp ϕ( q) dq] = ∫ pf ( p ) dp ⋅ ∫ qϕ( q) dq = ξ ⋅ η,



∫ Fn ( p) dp = 1 (при любом

n).

что и требовалось доказать.
Рассеяние величины ξ вокруг ее среднего значения характеризует/

Это свойство очевидно, исходя из того, что Fn ( p) есть плотность рас/
пределения вероятностей. Читатель легко проверит, что это соотноше/
ние справедливо для функций F2 ( p), F3 ( p) предыдущего примера.
2. Обозначим через pn +1 средний вес улова, состоящего из (n + 1)
рыб. Это надо понимать так. Пусть мы многократно производили за/
брасывание крючка (n + 1) раз подряд, а затем подсчитали средний вес
улова, состоящего из (n + 1) рыб. Тогда pn +1 = pn + p1 , т.е. средний вес
улова из (n + 1) рыб равен сумме среднего веса улова из nрыб и средне/
го веса улова, состоящего из одной рыбы. Поэтому p2 = p1 + p1 = 2 p1 ;
p3 = p2 + p1 = 3 p1 и т.д., т.е.

ся средним квадратом разности ∆ ξ2 = (ξ − ξ)2 = ∫ ( p − ξ)2 f ( p) dp, кото/

1.

Рис. 189.

0

pn = n p1 .

(16)

Отметим в заключение несколько общих свойств случайных вели
чин, т.е. величин, которые принимают определенные значения в ре/
зультате «испытания». (Например, случайной величиной является вес
рыбы, пойманной при испытании — вытягивании крючка.) Пусть име/
ются две случайные величины ξ и η; обозначим через p и соотве/
тственно q возможные значения этих величин, а через f ( p) и ϕ(q) —
соответствующие плотности распределения. Как мы видели, среднее
значение ξ (можно писать также p) величины ξ можно вычислить
по формуле ξ =



∫ pf ( p) dp, аналогично выражается

η. Легко доказать,

−∞



−∞

рый называется дисперсией величины ξ. (Заметим, что последний
интеграл действительно есть положительное число, так как подынтег/
ральная функция положительна.) Легко проверить, что дисперсия сум/
мы независимых величин равна сумме их дисперсий:
∆ ξ2+ η = [(ξ + η) − (ξ + η)]2 = [(ξ − ξ ) + (η − η)]2 =
= (ξ − ξ )2 + 2(ξ − ξ ) (η − η) + (η − η)2 = ∆ ξ2 + 2 ⋅ 0 ⋅ 0 + ∆ η2 ,

так как (ξ − ξ) = ξ − ξ = ξ − ξ = 0. Это свойство немедленно распростра/
няется на сумму любого числа независимых случайных величин.
Отсюда, в частности, вытекает, что для суммы ξ из η независи/
мых значений величины ξ 1 дисперсия ∆ n2 равна ∆ n2 = n∆ 12 .
Упражнение
Найдите функцию F3 ( p ) для случая
1
 , если 0 < p < q,
.
f ( p) =  q
 0, если p < 0 или p > q.
Постройте график этой функции.

что всегда
ξ + η = ξ + η,

C ξ = C ξ,

(C = const ).

(17)

В самом деле, если обозначить через pi и q i значения величин ξ и η
в i/м испытании, то при весьма большом числе N испытаний можно
написать
ξ + η=

1
N

N

1

N

1

N

∑ ( pi + qi ) = N ∑ pi + N ∑ qi = ξ + η.
i =1

i =1

i =1

Аналогично проверяется второе равенство (17).
Если величины ξ и η независимы, то можно доказать также, что
ξη = ξ ⋅ η. В самом деле, вероятность того, что ξ примет значение между
p и p + dp, а η — значение между q и q + dq, в силу условия независи/

§ 8. Случай весьма большого числа испытаний
В этом параграфе мы рассмотрим вопрос о поведении функции
Fn ( p), введенной в § 7, при весьма больших значениях n. При этом мы
будем для простоты сначала взамен веса рыбы рассматривать какую/то
величину ξ 1 , среднее значение которой равно нулю; конечно, такая ве/
личина может принимать значения обоих знаков. Fn ( p) — это функ/
ция распределения суммы n независимых значений величины ξ 1 .
Будем исходить из полученной в § 7 формулы (15); однако, как
было сказано в сноске на стр. 512, интеграл в этой формуле надо брать
в пределах от −∞ до ∞. Разложим Fn ( p − µ) в ряд по степеням µ,

516

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

ограничиваясь членом, содержащим μ 2 . Получим
Fn ( p − μ ) = Fn ( p ) − μ

2

dFn ( p ) 1 2 d Fn ( p )
.
+ μ
dp
2
dp 2

(18)

Пользуясь этим разложением, из (15) находим


Fn + 1 ( p ) = Fn ( p ) ∫ f (μ ) dμ −
−∞





dFn ( p )
1 d 2 Fn ( p )
2
f (μ ) μdμ +

∫ f (μ )μ dμ.
dp −∞
2 dp 2 −∞

(19)



∫ f (μ) dμ = 1, так как

Заметим, что

−∞

f ( p) — плотность распределе*

∫ f (μ)μ dμ = 0, так как в силу § 7 этот

−∞

интеграл равен среднему значению величины ξ 1 . Наконец, введем дис*


∫μ

2

ПОСТАНОВКА ВОПРОСА

f (μ) dμ величины ξ 1 .

−∞

Теперь формула (19) дает
Fn + 1 ( p ) = Fn ( p ) +

1 2 d 2 Fn ( p )
.
Δ
2 1 dp 2

(20)

Будем теперь рассматривать Fn ( p) как функцию двух переменных
p и n и записывать Fn ( p) = F ( p; n). При этом мы будем пользоваться
частными производными как по p, так и по n, не смущаясь тем, что n
принимает только целые значения, так как при больших n изменение
n на одну единицу можно считать весьма малым по сравнению с n.
Формулу (20) перепишем так:
F ( p; n + 1) = F ( p; n ) +

1 2 ∂2F
.
Δ1
2
∂p 2

(21)

Разложим теперь левую часть по формуле Тейлора, ограничиваясь
двумя первыми членами, это даст
F ( p; n + 1) = F ( p; n ) +

∂F
⋅ 1.
∂n

(22)

Приравнивая правые части (21) и (22), а затем отбрасывая слагаемое
F ( p; n), приходим к основному уравнению для функции F:
∂F 1 2 ∂ 2 F
.
= Δ
∂n 2 1 ∂p 2

(23)

Прежде чем указать решение этого уравнения, проведем дополни*
тельное исследование функции F ( p; n), которое внесет бо´льшую яс*
ность в применение формулы Тейлора. Рассмотрим график функции

517

F ( p; n) = Fn ( p), которая является плотностью распределения случай*
ной величины ξ. Так как ξ = nξ 1 = 0, то центр тяжести графика при
всех n расположен в начале координат. За ширину графика можно
принять среднее квадратичное уклонение Δ n = Δ2n , имеющее ту же
размерность, что ξ. Однако в конце § 7 мы показали, что Δ2n = nΔ21 , т.е.
Δ n = n Δ 1 ; ширина графика имеет порядок n. Но тогда из условия
∂F
нормировки ∫ F dp = 1 вытекает, что F  n −1 2 . Отсюда
 n −3 2 ,
∂n
∂2 F
−5 2
и т.д. А из оценки ширины графика вытекает, что
n
∂n2



ния вероятностей. Кроме того,

персию Δ 12 =

§ 1]

∂F
 n −1 2 : n = n −1 ,
∂p

∂2F
 n −1 : n = n − 3 2 и т.д.
∂n 2

Значит, разложения (21) и (22) доведены до членов одного асимптоти*
ческого порядка, а потому уравнение (23) является асимптотически
точным.
Любопытно, что асимптотический порядок ширины графика Fn
можно было бы получить непосредственно из уравнения (23) с по*
мощью дифференцирования по параметру под знаком интеграла
(§ III.6) и интегрирования по частям:
∂F
∂2F
d 2 d
1
dp = Δ12 ∫ p 2 2 dp =
p 2 Fn ( p ) dp = ∫ p 2
Δn =

∂n
dn
dn
2
∂p
⎡ ∂F
1
= Δ12 ⎢ p 2
2
⎣ ∂p


−∞

− ∫2p



∂F
dp ⎥ = − Δ12 ⎢ pF
∂p




−∞


− ∫ F dp ⎥ = Δ12 .


(При этом мы принимаем, что F → 0 достаточно быстро при p → ±∞.)
Отсюда Δ n2  nΔ 12 .
Не надо жалеть времени, потраченного на такой анализ. С одной сто*
роны, попутно было получено еще без решения важное общее свойство
F, а именно выражение n Δ 1 ширины. Кроме того, — и это немаловаж*
но,— повысилась Ваша бдительность. Вы лучше усвоили общее правило:
чтобы вводить приближения (оставлять одни члены и отбрасывать дру*
гие в ряде Тейлора), нужно узнать о функции все, что возможно.
Обратимся к решению уравнения (23). Можно показать, что асим*
птотически при больших n решением уравнения (23) является функ*
1 − p 2 2 nΔ21
, где A — любая постоянная. Мы сообщаем
ция F ( p; n) = A
e
n
это без вывода. Тот факт, что указанная функция удовлетворяет (23),
нетрудно проверить, составляя ∂F ∂n, ∂ 2 F ∂p 2 и подставляя полу*

516

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

ограничиваясь членом, содержащим μ 2 . Получим
Fn ( p − μ ) = Fn ( p ) − μ

2

dFn ( p ) 1 2 d Fn ( p )
.
+ μ
dp
2
dp 2

(18)

Пользуясь этим разложением, из (15) находим


Fn + 1 ( p ) = Fn ( p ) ∫ f (μ ) dμ −
−∞





dFn ( p )
1 d 2 Fn ( p )
2
f (μ ) μdμ +

∫ f (μ )μ dμ.
dp −∞
2 dp 2 −∞

(19)



∫ f (μ) dμ = 1, так как

Заметим, что

−∞

f ( p) — плотность распределе*

∫ f (μ)μ dμ = 0, так как в силу § 7 этот

−∞

интеграл равен среднему значению величины ξ 1 . Наконец, введем дис*


∫μ

2

ПОСТАНОВКА ВОПРОСА

f (μ) dμ величины ξ 1 .

−∞

Теперь формула (19) дает
Fn + 1 ( p ) = Fn ( p ) +

1 2 d 2 Fn ( p )
.
Δ
2 1 dp 2

(20)

Будем теперь рассматривать Fn ( p) как функцию двух переменных
p и n и записывать Fn ( p) = F ( p; n). При этом мы будем пользоваться
частными производными как по p, так и по n, не смущаясь тем, что n
принимает только целые значения, так как при больших n изменение
n на одну единицу можно считать весьма малым по сравнению с n.
Формулу (20) перепишем так:
F ( p; n + 1) = F ( p; n ) +

1 2 ∂2F
.
Δ1
2
∂p 2

(21)

Разложим теперь левую часть по формуле Тейлора, ограничиваясь
двумя первыми членами, это даст
F ( p; n + 1) = F ( p; n ) +

∂F
⋅ 1.
∂n

(22)

Приравнивая правые части (21) и (22), а затем отбрасывая слагаемое
F ( p; n), приходим к основному уравнению для функции F:
∂F 1 2 ∂ 2 F
.
= Δ
∂n 2 1 ∂p 2

(23)

Прежде чем указать решение этого уравнения, проведем дополни*
тельное исследование функции F ( p; n), которое внесет бо´льшую яс*
ность в применение формулы Тейлора. Рассмотрим график функции

517

F ( p; n) = Fn ( p), которая является плотностью распределения случай*
ной величины ξ. Так как ξ = nξ 1 = 0, то центр тяжести графика при
всех n расположен в начале координат. За ширину графика можно
принять среднее квадратичное уклонение Δ n = Δ2n , имеющее ту же
размерность, что ξ. Однако в конце § 7 мы показали, что Δ2n = nΔ21 , т.е.
Δ n = n Δ 1 ; ширина графика имеет порядок n. Но тогда из условия
∂F
нормировки ∫ F dp = 1 вытекает, что F  n −1 2 . Отсюда
 n −3 2 ,
∂n
∂2 F
−5 2
и т.д. А из оценки ширины графика вытекает, что
n
∂n2



ния вероятностей. Кроме того,

персию Δ 12 =

§ 1]

∂F
 n −1 2 : n = n −1 ,
∂p

∂2F
 n −1 : n = n − 3 2 и т.д.
∂n 2

Значит, разложения (21) и (22) доведены до членов одного асимптоти*
ческого порядка, а потому уравнение (23) является асимптотически
точным.
Любопытно, что асимптотический порядок ширины графика Fn
можно было бы получить непосредственно из уравнения (23) с по*
мощью дифференцирования по параметру под знаком интеграла
(§ III.6) и интегрирования по частям:
∂F
∂2F
d 2 d
1
dp = Δ12 ∫ p 2 2 dp =
p 2 Fn ( p ) dp = ∫ p 2
Δn =

∂n
dn
dn
2
∂p
⎡ ∂F
1
= Δ12 ⎢ p 2
2
⎣ ∂p


−∞

− ∫2p



∂F
dp ⎥ = − Δ12 ⎢ pF
∂p




−∞


− ∫ F dp ⎥ = Δ12 .


(При этом мы принимаем, что F → 0 достаточно быстро при p → ±∞.)
Отсюда Δ n2  nΔ 12 .
Не надо жалеть времени, потраченного на такой анализ. С одной сто*
роны, попутно было получено еще без решения важное общее свойство
F, а именно выражение n Δ 1 ширины. Кроме того, — и это немаловаж*
но,— повысилась Ваша бдительность. Вы лучше усвоили общее правило:
чтобы вводить приближения (оставлять одни члены и отбрасывать дру*
гие в ряде Тейлора), нужно узнать о функции все, что возможно.
Обратимся к решению уравнения (23). Можно показать, что асим*
птотически при больших n решением уравнения (23) является функ*
1 − p 2 2 nΔ21
, где A — любая постоянная. Мы сообщаем
ция F ( p; n) = A
e
n
это без вывода. Тот факт, что указанная функция удовлетворяет (23),
нетрудно проверить, составляя ∂F ∂n, ∂ 2 F ∂p 2 и подставляя полу*

518

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

§ 8]

СЛУЧАЙ ВЕСЬМА БОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ

519

ченные выражения в (23). Значение постоянной A выберем из усло*
вия, чтобы выполнялось требование ∫ F dp = 1:


A
− p2
∫e
n −∞

2 nΔ 21

dp = 1.

(24)

Выполним замену переменной p Δ 1 2n = t, dp Δ 1 2n = dt. Тогда


2
A
e− p

n −∞

2 nΔ 21



2

dp = AΔ1 2 ∫ e − t dt = A ⋅ Δ1 2 ⋅ π = 1.
−∞

Рис. 190.

Итак, AΔ 1 2π = 1, откуда A = 1 Δ 1 2π, и окончательно:
F ( p; n ) =

2
1
e− p
Δ1 2 π

2 nΔ 21

.

(25)

Рассмотрим теперь случай, когда среднее значение ξ 1 не обяза*
тельно равно нулю. Тогда обозначим ξ 1 − ξ 1 = ξ 1′ , откуда ξ 1 = ξ 1 + ξ 1′ ,
где ξ ′ 1 = 0. Поэтому сумма ξ из n независимых значений величины
ξ 1 равна результату сложения постоянной n ξ 1 с суммой ξ ′ из n не*
зависимых значений величины ξ 1′ . При большом n сумма ξ ′ имеет
закон распределения (25). Но если к случайной величине прибавить
постоянную, то соответствующая плотность распределения просто
сдвинется на эту постоянную, т.е. в результате мы получим плотность
распределения
F ( p; n ) =

2
1
e − ( p − np 1 )
Δ1 2 πn

2 nΔ 21

,

(26)

где мы вернулись к обозначению § 7: p1 вместо ξ 1 .
Можно было бы получить решение (26) непосредственно, минуя
частный случай (25). Для этого нужно с помощью разложений (19)
и (22) получить уравнение для функции F, уже не предполагая, что
p1 = 0. Это уравнение имеет вид
∂F
∂F 1 2 ∂ 2 F
= − p1
+ Δ1
∂n
∂p 2
∂p 2

(27)

(при p1 = 0 оно переходит в уравнение (23)). После этого уже нетруд*
но проверить непосредственной подстановкой, что функция (26) удов*
летворяет уравнению (27),
На рис. 190 дан график F ( p; n) для случая n = 4, Δ 1 = 1, p1 = 1; для
наглядности на осях выбраны разные масштабы.
Функция F ( p; n) при каждом конкретном n представляет собой
колоколообразную кривую, симметричную относительно вертикаль*
ной прямой, проходящей через точку максимума. Максимум получает*
ся, как видно из (26), при p = np1 , что совпадает с найденным в § 7

средним значением pn . Высота максимума есть 1 Δ 1 2πn, т.е. пропор*
циональна 1 n, как было сказано выше. Таким образом, при увеличе*
нии n максимум смещается вправо.
Определим ширину кривой, т.е. узнаем, насколько следует отсту*
пить от pmax = np1 , чтобы высота кривой уменьшилась в e раз по
сравнению с максимальной. Для этого надо определить р из условия

1
e
Δ1 2 πn

( p − np 1 ) 2
2 nΔ 21

=

1
1
,
Δ1 2 πn e

( p − np1 )2
= 1, или p − np1 = ± Δ 1 2n .
2nΔ21
Таким образом, p − pmax = ± Δ 1 2n , т.е. ширина кривой пропорцио*

откуда

нальна

n , как указывалось выше. Естественно, что высота максиму*

ма обратно пропорциональна ширине кривой, как и должно быть при
сохранении площади под кривой.
Отметим, что даже если по своему смыслу изучаемая величина при*
нимает лишь положительные значения, то функция (26) дает отличные
от нуля значения при p < 0, что, конечно, не соответствует действи*
тельности. Однако F ( p; n) при p < 0 настолько малo´ при сколько*ни*
будь больших n, что этот недостаток не имеет практического значения.
На рис. 191 показано, как точные кривые F ( p; n), полученные по
формуле (15) и показанные сплошными линиями, сближаются с при*
ближенными кривыми, полученными из формулы (26) при n = 1, n = 2,
n = 3 и показанными пунктиром*. Эти рисунки соответствуют случаю
⎧ 1, если 0 < p < 1,
f ( p) = ⎨
⎩ 0, если p > 1 ( см. пример § 7 ).
* На рис. 191 было трудно показать, что F (p; 1) — функция разрывная — изобража*
ется ступенькой с вертикальным падением при p = 1. Функция F (p; 2) изображается
прямоугольным треугольником, лежащим на гипотенузе. Точки p = 1, F = 1 у F (p; 1) и
F (p; 2) совпадают.

518

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

§ 8]

СЛУЧАЙ ВЕСЬМА БОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ

519

ченные выражения в (23). Значение постоянной A выберем из усло*
вия, чтобы выполнялось требование ∫ F dp = 1:


A
− p2
∫e
n −∞

2 nΔ 21

dp = 1.

(24)

Выполним замену переменной p Δ 1 2n = t, dp Δ 1 2n = dt. Тогда


2
A
e− p

n −∞

2 nΔ 21



2

dp = AΔ1 2 ∫ e − t dt = A ⋅ Δ1 2 ⋅ π = 1.
−∞

Рис. 190.

Итак, AΔ 1 2π = 1, откуда A = 1 Δ 1 2π, и окончательно:
F ( p; n ) =

2
1
e− p
Δ1 2 π

2 nΔ 21

.

(25)

Рассмотрим теперь случай, когда среднее значение ξ 1 не обяза*
тельно равно нулю. Тогда обозначим ξ 1 − ξ 1 = ξ 1′ , откуда ξ 1 = ξ 1 + ξ 1′ ,
где ξ ′ 1 = 0. Поэтому сумма ξ из n независимых значений величины
ξ 1 равна результату сложения постоянной n ξ 1 с суммой ξ ′ из n не*
зависимых значений величины ξ 1′ . При большом n сумма ξ ′ имеет
закон распределения (25). Но если к случайной величине прибавить
постоянную, то соответствующая плотность распределения просто
сдвинется на эту постоянную, т.е. в результате мы получим плотность
распределения
F ( p; n ) =

2
1
e − ( p − np 1 )
Δ1 2 πn

2 nΔ 21

,

(26)

где мы вернулись к обозначению § 7: p1 вместо ξ 1 .
Можно было бы получить решение (26) непосредственно, минуя
частный случай (25). Для этого нужно с помощью разложений (19)
и (22) получить уравнение для функции F, уже не предполагая, что
p1 = 0. Это уравнение имеет вид
∂F
∂F 1 2 ∂ 2 F
= − p1
+ Δ1
∂n
∂p 2
∂p 2

(27)

(при p1 = 0 оно переходит в уравнение (23)). После этого уже нетруд*
но проверить непосредственной подстановкой, что функция (26) удов*
летворяет уравнению (27),
На рис. 190 дан график F ( p; n) для случая n = 4, Δ 1 = 1, p1 = 1; для
наглядности на осях выбраны разные масштабы.
Функция F ( p; n) при каждом конкретном n представляет собой
колоколообразную кривую, симметричную относительно вертикаль*
ной прямой, проходящей через точку максимума. Максимум получает*
ся, как видно из (26), при p = np1 , что совпадает с найденным в § 7

средним значением pn . Высота максимума есть 1 Δ 1 2πn, т.е. пропор*
циональна 1 n, как было сказано выше. Таким образом, при увеличе*
нии n максимум смещается вправо.
Определим ширину кривой, т.е. узнаем, насколько следует отсту*
пить от pmax = np1 , чтобы высота кривой уменьшилась в e раз по
сравнению с максимальной. Для этого надо определить р из условия

1
e
Δ1 2 πn

( p − np 1 ) 2
2 nΔ 21

=

1
1
,
Δ1 2 πn e

( p − np1 )2
= 1, или p − np1 = ± Δ 1 2n .
2nΔ21
Таким образом, p − pmax = ± Δ 1 2n , т.е. ширина кривой пропорцио*

откуда

нальна

n , как указывалось выше. Естественно, что высота максиму*

ма обратно пропорциональна ширине кривой, как и должно быть при
сохранении площади под кривой.
Отметим, что даже если по своему смыслу изучаемая величина при*
нимает лишь положительные значения, то функция (26) дает отличные
от нуля значения при p < 0, что, конечно, не соответствует действи*
тельности. Однако F ( p; n) при p < 0 настолько малo´ при сколько*ни*
будь больших n, что этот недостаток не имеет практического значения.
На рис. 191 показано, как точные кривые F ( p; n), полученные по
формуле (15) и показанные сплошными линиями, сближаются с при*
ближенными кривыми, полученными из формулы (26) при n = 1, n = 2,
n = 3 и показанными пунктиром*. Эти рисунки соответствуют случаю
⎧ 1, если 0 < p < 1,
f ( p) = ⎨
⎩ 0, если p > 1 ( см. пример § 7 ).
* На рис. 191 было трудно показать, что F (p; 1) — функция разрывная — изобража*
ется ступенькой с вертикальным падением при p = 1. Функция F (p; 2) изображается
прямоугольным треугольником, лежащим на гипотенузе. Точки p = 1, F = 1 у F (p; 1) и
F (p; 2) совпадают.

520

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Рассмотрим еще пример, когда случайная величина ξ 1 может при*
нимать лишь два значения: 1 с некоторой вероятностью α (0 < α < 1) и 0
с вероятностью β = 1 − α. Тогда сумму ξ из n независимых значений

§ 8]

СЛУЧАЙ ВЕСЬМА БОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ

521

Заменяя в последнем выражении для F ( p; n) αβ на Δ 12 , а nα на np1 ,
мы вновь приходим к формуле (26), полностью доказав ее, таким обра*
зом, для случайных величин рассматриваемого специального вида.
Пусть величины ξ 1 , ξ 2 , . . . , ξ n независимо принимают случай*
ные значения из промежутка −∞, ∞, причем каждая из этих величин
имеет свою плотность вероятностей
f1 ( x ), f2 ( x ), ... , fn ( x ).

Их сумма ξ = ξ 1 + ξ 2 + ... + ξ n также будет принимать те или иные слу*
чайные значения. Пусть ее плотность вероятности есть F (x).
В теории вероятностей доказывается, что в этом случае, если n ве*
лико, то

1
F (x) =
e
Δ 2π

Рис. 191.

величины ξ 1 можно истолковать как количество появлений некото*
рого события при n независимых испытаниях, если вероятность его
появления при каждом испытании равна α. Задача о вычислении веро*
ятности различных значений для ξ была решена в пп. 2 и 3. В п. 3 с по*
мощью формулы Стирлинга мы показали (формула (8)), что для
больших n вероятность того, чтобы ξ приняла некоторое целое зна*
чение nα + δ от 0 до n, равна
2
1
w ( nα + δ ) =
e−δ
2 παβn

2 αβn



w ( nα + δ ) =

.

1
2
1
2

Сравнивая две последние формулы и обозначая nα + δ = p, получаем
F ( p; n ) =

2
1
e − ( p − nα )
2 παβn

2 αβn

.

Однако для рассматриваемой случайной величины будет
p1 = ξ1 = 1 ⋅ α + 0 ⋅ β = α,
Δ12

.

(28)

Такой закон распределения вероятностей носит название нормального
закона. Для того чтобы задать формулу (28), нужно указать две величи*
ны: x и Δ.
Множитель, стоящий перед e



( x − x )2
2 Δ2

, определяется из условия

+∞

∫ F (x) dx = 1. Действительно, пусть F (x) = Ae
+∞

F ( p; n ) dp =F ( nα + δ; n ).

nα + δ −

2 Δ2



( x − x )2
2 Δ2

+∞

, тогда

−∞

Так как при больших n расстояния между соседними возможными
значениями величины ξ малы по сравнению с интервалом всех ее зна*
чений и даже с интервалом ее ожидаемых значений (см. § 3), то при та*
ких n можно считать ξ непрерывной случайной величиной с плот*
ностью распределения F ( p; n). Тогда вероятность того, что ξ примет
значение nα + δ, можно приближенно подсчитать по формуле
nα + δ +

(x −x )2

= ( ξ1 − ξ1 )2 = (1 − α )2 α + (0 − α )2 β = αβ.

= A∫ e



∫ F (x) dx =

−∞

( x − x )2
2 Δ2

dx. Найдем последний интеграл. Полагая

−∞

dx = Δ 2 dt, получим

+∞

∫e

−∞

+∞

∫ F (x) dx = 1 находим



( x − x )2
2 Δ2

+∞

x−x
Δ 2

= t,

2

dx = Δ 2 ∫ e − t dt = Δ 2π. Из условия
−∞

A⋅ Δ 2π = 1, откуда A =

1

.
Δ 2π
Предлагаем читателю проверить (см. упражнения), что для F(x),
определенной формулой (28), справедливы соотношения

−∞

+∞

+∞

−∞

−∞

∫ xF ( x ) dx = x , ∫ ( x − x )

2

F ( x ) dx = Δ2 ,

т.е. x и Δ2 представляют собой среднее значение и дисперсию слу*
чайной величины ξ.
Выше все эти соотношения были выведены для частного случая
суммы n величин с одинаковой плотностью вероятностей f ( p).

520

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Рассмотрим еще пример, когда случайная величина ξ 1 может при*
нимать лишь два значения: 1 с некоторой вероятностью α (0 < α < 1) и 0
с вероятностью β = 1 − α. Тогда сумму ξ из n независимых значений

§ 8]

СЛУЧАЙ ВЕСЬМА БОЛЬШОГО ЧИСЛА ИСПЫТАНИЙ

521

Заменяя в последнем выражении для F ( p; n) αβ на Δ 12 , а nα на np1 ,
мы вновь приходим к формуле (26), полностью доказав ее, таким обра*
зом, для случайных величин рассматриваемого специального вида.
Пусть величины ξ 1 , ξ 2 , . . . , ξ n независимо принимают случай*
ные значения из промежутка −∞, ∞, причем каждая из этих величин
имеет свою плотность вероятностей
f1 ( x ), f2 ( x ), ... , fn ( x ).

Их сумма ξ = ξ 1 + ξ 2 + ... + ξ n также будет принимать те или иные слу*
чайные значения. Пусть ее плотность вероятности есть F (x).
В теории вероятностей доказывается, что в этом случае, если n ве*
лико, то

1
F (x) =
e
Δ 2π

Рис. 191.

величины ξ 1 можно истолковать как количество появлений некото*
рого события при n независимых испытаниях, если вероятность его
появления при каждом испытании равна α. Задача о вычислении веро*
ятности различных значений для ξ была решена в пп. 2 и 3. В п. 3 с по*
мощью формулы Стирлинга мы показали (формула (8)), что для
больших n вероятность того, чтобы ξ приняла некоторое целое зна*
чение nα + δ от 0 до n, равна
2
1
w ( nα + δ ) =
e−δ
2 παβn

2 αβn



w ( nα + δ ) =

.

1
2
1
2

Сравнивая две последние формулы и обозначая nα + δ = p, получаем
F ( p; n ) =

2
1
e − ( p − nα )
2 παβn

2 αβn

.

Однако для рассматриваемой случайной величины будет
p1 = ξ1 = 1 ⋅ α + 0 ⋅ β = α,
Δ12

.

(28)

Такой закон распределения вероятностей носит название нормального
закона. Для того чтобы задать формулу (28), нужно указать две величи*
ны: x и Δ.
Множитель, стоящий перед e



( x − x )2
2 Δ2

, определяется из условия

+∞

∫ F (x) dx = 1. Действительно, пусть F (x) = Ae
+∞

F ( p; n ) dp =F ( nα + δ; n ).

nα + δ −

2 Δ2



( x − x )2
2 Δ2

+∞

, тогда

−∞

Так как при больших n расстояния между соседними возможными
значениями величины ξ малы по сравнению с интервалом всех ее зна*
чений и даже с интервалом ее ожидаемых значений (см. § 3), то при та*
ких n можно считать ξ непрерывной случайной величиной с плот*
ностью распределения F ( p; n). Тогда вероятность того, что ξ примет
значение nα + δ, можно приближенно подсчитать по формуле
nα + δ +

(x −x )2

= ( ξ1 − ξ1 )2 = (1 − α )2 α + (0 − α )2 β = αβ.

= A∫ e



∫ F (x) dx =

−∞

( x − x )2
2 Δ2

dx. Найдем последний интеграл. Полагая

−∞

dx = Δ 2 dt, получим

+∞

∫e

−∞

+∞

∫ F (x) dx = 1 находим



( x − x )2
2 Δ2

+∞

x−x
Δ 2

= t,

2

dx = Δ 2 ∫ e − t dt = Δ 2π. Из условия
−∞

A⋅ Δ 2π = 1, откуда A =

1

.
Δ 2π
Предлагаем читателю проверить (см. упражнения), что дляF(x),
определенной формулой (28), справедливы соотношения

−∞

+∞

+∞

−∞

−∞

∫ xF ( x ) dx = x , ∫ ( x − x )

2

F ( x ) dx = Δ2 ,

т.е. x и Δ2 представляют собой среднее значение и дисперсию слу*
чайной величины ξ.
Выше все эти соотношения были выведены для частного случая
суммы n величин с одинаковой плотностью вероятностей f ( p).

522

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Упражнения
+∞

1. Найдите

∫ xF ( x ) dx

−∞

2.

+∞

и

∫ (x − x )

2

F ( x ) dx, где F ( x ) дается формулой (28).

−∞

⎧1
⎪ , если 0 < p < q,
f ( p) = ⎨ q
⎩⎪ 0, если p > q и если p < 0.

Найдите по формуле (26) плотность вероятностей F ( p; n ) для случая
n = 10, n = 20.
У к а з а н и е. Предварительно найдите величины p1 и Δ12 .
3. Рыболов ловит рыбу в пруду, где имеются рыбы весом не более 2 кг.
Пусть при каждом забрасывании крючка равновероятно поймать любую рыбу
весом от 0 до 2 кг.
а) Каков средний вес улова, состоящего в забрасывании крючка 20 раз подряд?
б) Какова вероятность того, что при 20 забрасываниях крючка вес улова
будет не больше 20 кг; 22 кг; 25 кг?

§ 9. Корреляционная зависимость
Теория вероятностей имеет важные приложения к изучению зави*
симостей величин друг от друга. До сих пор мы рассматривали только
функциональные зависимости, т.е. такие, при которых, задав значения
одних величин, мы полностью, точно получали значения других. Одна*
ко рассмотрим, например, такие величины, как длина l и вес p вы*
ловленной рыбы. Естественно ожидать, что чем больше l, тем больше
и p, т.е. какая*то зависимость здесь имеется. Однако эта зависимость
осуществляется лишь «в среднем», так как длина l рыбы не определя*
ет ее вес p однозначно — рыбы одинаковой длины могут иметь разный
вес, длинная рыба может оказаться настолько тощей, что ее вес будет
меньше веса короткой, и т.д.
Такая «мягкая» зависимость между величинами, которая осуще*
ствляется лишь в среднем, называется корреляционной, в отличие от
«жесткой», функциональной. Корреляционными являются зависимос*
ти между возрастом человека и его ростом, между знаниями студента
и его оценкой на экзамене и т.д.; утверждают также, что имеется корре*
ляционная зависимость между успехами в картах и в любви.
Корреляционная зависимость получается в случае, когда сказывается
влияние факторов, которые почему*либо не учитываются, например из*за
сложного характера этого влияния. Однако такая зависимость может по*
лучиться и по необходимости, независимо от сложности этих факторов.
Дело в том, что если, скажем, две величины x и y функционально зави*
сят от одного параметра: x = x(t), y = y(t), то эти два соотношения опре*
деляют жесткую функциональную зависимость между x и y (см.
стр. 113). Но если таких параметров два или более, т.е.
x = x( t1 , t 2 , ..., t n ) , y = y( t1 , t 2 , ..., t n ),

§ 9]

КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ

523

то эти соотношения в п р и н ц и п е уже не определяют функциональ*
ной зависимости между x и y. И только если учитывать частоту реа*
лизаций различных комбинаций значений параметров t1 , t2 , ..., t n , то
можно говорить о зависимости между x и y, которая, однако, будет
лишь корреляционной. Именно такова ситуация для величин l и p,
указанных выше, где, впрочем, полный набор существенных парамет*
ров было бы трудно указать.
Важный пример корреляционной зависимости получается при под*
боре эмпирических формул (§ II.3–4). Даже если истинная зависи*
мость y = f (x) между физическими величинами x и y является
функциональной, зависимость между измеренными значениями x и y
при наличии ошибок измерения оказывается лишь корреляционной.
Рассмотрим общий случай. Пусть имеются две случайные величи*
ны ξ и η, как*то связанные между собой. Как мы доказали выше, если
эти величины независимы, то ξη = ξ η, т.е. ξη − ξ η = 0. Поэтому по*
следнюю разность можно принять за самую грубую меру зависимости
между ξ и η. Однако чаще переходят к безразмерному коэффициенту
корреляции
r = r ( ξ, η) =

ξη − ξ η
,
Δξ Δη

где в знаменателе стоят средние квадратичные уклонения величин ξ и η.
В силу сказанного выше, для независимых величин этот коэффициент
равен нулю. (Обратное, вообще говоря, неверно.) Рассмотрим теперь дру*
гой крайний случай, когда между ξ и η имеется функциональная и
притом линейная зависимость, т.е. η = aξ + b, где a и b — постоянные.
Тогда легко проверить, что Δ 2η = a 2 Δ 2ξ , т.е. Δ η = a Δ ξ ; из равенства
2
2
Δ 2ξ = (ξ − ξ)2 = ξ 2 − 2ξξ + ξ = ξ 2 − ξ вытекает, что
2

ξη − ξ η ( aξ 2 − bξ ) − ξ ( aξ + b ) a ξ 2 + bξ − aξ − bξ a
,
=
=
=
a
Δξ Δη
Δξ a Δξ
a Δ ξ2

т.е. r(ξ, η) = 1, если a > 0, и r(ξ, η) = −1, если a < 0.
Можно доказать (мы не будем этого делать), что во всех случаях,
кроме линейной функциональной зависимости, коэффициент корре*
ляции заключен с т р о г о между –1 и 1, −1 < r(ξ, η) < 1. Этот коэффи*
циент характеризует степень отклонения зависимости между ξ и η от
линейной функциональной.
Рассмотрим пример. Пусть физические величины x и y связаны
между собой линейной зависимостью y = ax + b, однако значения ко*
эффициентов a и b нам неизвестны и получаются в результате экс*
перимента, в котором мы задаемся значениями x и измеряем
значения y. Будем для простоты считать, что значения x известны со*

522

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

Упражнения
+∞

1. Найдите

∫ xF ( x ) dx

−∞

2.

+∞

и

∫ (x − x )

2

F ( x ) dx, где F ( x ) дается формулой (28).

−∞

⎧1
⎪ , если 0 < p < q,
f ( p) = ⎨ q
⎩⎪ 0, если p > q и если p < 0.

Найдите по формуле (26) плотность вероятностей F ( p; n ) для случая
n = 10, n = 20.
У к а з а н и е. Предварительно найдите величины p1 и Δ12 .
3. Рыболов ловит рыбу в пруду, где имеются рыбы весом не более 2 кг.
Пусть при каждом забрасывании крючка равновероятно поймать любую рыбу
весом от 0 до 2 кг.
а) Каков средний вес улова, состоящего в забрасывании крючка 20 раз подряд?
б) Какова вероятность того, что при 20 забрасываниях крючка вес улова
будет не больше 20 кг; 22 кг; 25 кг?

§ 9. Корреляционная зависимость
Теория вероятностей имеет важные приложения к изучению зави*
симостей величин друг от друга. До сих пор мы рассматривали только
функциональные зависимости, т.е. такие, при которых, задав значения
одних величин, мы полностью, точно получали значения других. Одна*
ко рассмотрим, например, такие величины, как длина l и вес p вы*
ловленной рыбы. Естественно ожидать, что чем больше l, тем больше
и p, т.е. какая*то зависимость здесь имеется. Однако эта зависимость
осуществляется лишь «в среднем», так как длина l рыбы не определя*
ет ее вес p однозначно — рыбы одинаковой длины могут иметь разный
вес, длинная рыба может оказаться настолько тощей, что ее вес будет
меньше веса короткой, и т.д.
Такая «мягкая» зависимость между величинами, которая осуще*
ствляется лишь в среднем, называется корреляционной, в отличие от
«жесткой», функциональной. Корреляционными являются зависимос*
ти между возрастом человека и его ростом, между знаниями студента
и его оценкой на экзамене и т.д.; утверждают также, что имеется корре*
ляционная зависимость между успехами в картах и в любви.
Корреляционная зависимость получается в случае, когда сказывается
влияние факторов, которые почему*либо не учитываются, например из*за
сложного характера этого влияния. Однако такая зависимость может по*
лучиться и по необходимости, независимо от сложности этих факторов.
Дело в том, что если, скажем, две величины x и y функционально зави*
сят от одного параметра: x = x(t), y = y(t), то эти два соотношения опре*
деляют жесткую функциональную зависимость между x и y (см.
стр. 113). Но если таких параметров два или более, т.е.
x = x( t1 , t 2 , ..., t n ) , y = y( t1 , t 2 , ..., t n ),

§ 9]

КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ

523

то эти соотношения в п р и н ц и п е уже не определяют функциональ*
ной зависимости между x и y. И только если учитывать частоту реа*
лизаций различных комбинаций значений параметров t1 , t2 , ..., t n , то
можно говорить о зависимости между x и y, которая, однако, будет
лишь корреляционной. Именно такова ситуация для величин l и p,
указанных выше, где, впрочем, полный набор существенных парамет*
ров было бы трудно указать.
Важный пример корреляционной зависимости получается при под*
боре эмпирических формул (§ II.3–4). Даже если истинная зависи*
мость y = f (x) между физическими величинами x и y является
функциональной, зависимость между измеренными значениями x и y
при наличии ошибок измерения оказывается лишь корреляционной.
Рассмотрим общий случай. Пусть имеются две случайные величи*
ны ξ и η, как*то связанные между собой. Как мы доказали выше, если
эти величины независимы, то ξη = ξ η, т.е. ξη − ξ η = 0. Поэтому по*
следнюю разность можно принять за самую грубую меру зависимости
между ξ и η. Однако чаще переходят к безразмерному коэффициенту
корреляции
r = r ( ξ, η) =

ξη − ξ η
,
Δξ Δη

где в знаменателе стоят средние квадратичные уклонения величин ξ и η.
В силу сказанного выше, для независимых величин этот коэффициент
равен нулю. (Обратное, вообще говоря, неверно.) Рассмотрим теперь дру*
гой крайний случай, когда между ξ и η имеется функциональная и
притом линейная зависимость, т.е. η = aξ + b, где a и b — постоянные.
Тогда легко проверить, что Δ 2η = a 2 Δ 2ξ , т.е. Δ η = a Δ ξ ; из равенства
2
2
Δ 2ξ = (ξ − ξ)2 = ξ 2 − 2ξξ + ξ = ξ 2 − ξ вытекает, что
2

ξη − ξ η ( aξ 2 − bξ ) − ξ ( aξ + b ) a ξ 2 + bξ − aξ − bξ a
,
=
=
=
a
Δξ Δη
Δξ a Δξ
a Δ ξ2

т.е. r(ξ, η) = 1, если a > 0, и r(ξ, η) = −1, если a < 0.
Можно доказать (мы не будем этого делать), что во всех случаях,
кроме линейной функциональной зависимости, коэффициент корре*
ляции заключен с т р о г о между –1 и 1, −1 < r(ξ, η) < 1. Этот коэффи*
циент характеризует степень отклонения зависимости между ξ и η от
линейной функциональной.
Рассмотрим пример. Пусть физические величины x и y связаны
между собой линейной зависимостью y = ax + b, однако значения ко*
эффициентов a и b нам неизвестны и получаются в результате экс*
перимента, в котором мы задаемся значениями x и измеряем
значения y. Будем для простоты считать, что значения x известны со*

524

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

вершенно точно, а степень точности в определении соответствующего
значения y одна и та же при всех x. Обозначив через ξ измеренное
значение x, а через η измеренное значение y (ξ, η — это случайные
величины), примем, что ξ с равной вероятностью принимает все зна/
чения между −l и l, т.е. соответствующая плотность распределения
имеет вид
 1
( − l  x  l ),

ϕ( x ) =  2 l
 0 ( x > l ).

(29)

Кроме того, примем, что при каждом значении ξ = x величина η рас/
пределена по нормальному закону вокруг значения ax + b с дисперсией
∆2 , не зависящей от x. (Предположение о нормальности закона распре/
деления естественно принять, если ошибка в определении y склады/
вается из большого числа независимых ошибок, объясняющихся
различными причинами.) Плотность распределения величины η при
заданном значении ξ = x будем обозначать ψ x (y), так что
2
1
ψ x ( y) =
e −[ y − ( ax + b )]
∆ 2π

2 ∆2

.

[ψ x ( y ) dy] N 1 = ψ x ( y )ϕ ( x ) dx dy ⋅ N .

Приравнивая оба результата, получаем, что f (x, y) = ϕ(x) ψ x (y),
т.е. в наших предположениях
2 ∆2

( x  l ),

КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ

(30)

( x > l ).

Вычислим коэффициент корреляции r(ξ, η). Из соображений сим/
метрии ясно, что ξ = 0, η = b. Среднее значение ξη вычисляется по
общему правилу (сумма произведений значений случайной величины

525

на их вероятности), т.е. ξη = ∫∫ xy f (x, y) dx dy, или


l

2
xy
e −[ y − ( ax + b )]
2 l∆ 2 π
−∞

ξη = ∫ dx ∫
−l

2 ∆2

l

Из формул (29) получаем ∆ 2ξ = ∫ x 2
−l

dy =

1
2l

l

l2

∫ x( ax + b ) dx = 3 a .

−l

1
l2
dx = . Чтобы вычислить ∆ η ,
2l
3

найдем сначала плотность распределения ψ(y) величины η (это не
то же самое, что ψ x (y)!). Так как ψ(y) dy есть вероятность того,
что η окажется между у и y + dy, a ξ примет произвольное значение,


то ψ(y) dy = ∫ [ f (x, y) dy] dx. Поэтому
−∞



ψ( y) =

l

∫ f ( x, y ) dx = ∫ 2 l∆

−∞

−l

1


e −[ y − ( ax + b )]

2

2 ∆2

dx,

откуда


Обозначим, далее, через f (x, y) плотность совместного распределе
ния величин ξ, η; это значит, что вероятность одновременного попада/
ния ξ между х и x + dx, а η — между у и y + dy равна f (x, y) dx dy.
Для подсчета функции f (x, y) заметим, что если произведено большое
число N испытаний, то число случаев одновременного попадания ξ
между х и x + dx, а η — между у и y + dy равно [ f (x, y) dx dy] N .
С другой стороны, можно рассуждать так: при N испытаниях число
случаев, когда ξ попадет между х и x + dx, равно N 1 = [ϕ(x) dx] N .
Но из этих N 1 случаев число случаев, когда η попадет между у и
y + dy, равно

2
1

e −[ y − ( ax + b )]

f ( x, y ) =  2 l∆ 2 π
 0

§ 9]

∆ η2 = ∫ ( y − b )2 ψ ( y ) dy =
−∞



l

∫ dy ∫ ( y − b )

2

−∞

−l

2
1
e −[ y − ( ax + b )]
2 l∆ 2 π

2 ∆2

dx.

После перестановки порядка интегрирования и вычислений, которые
l 2 a2
. Отсюда на/
мы предоставляем читателю, получается ∆ η2 = ∆2 +
3
ходим искомый коэффициент
r ( ξ, η) =

l 2a
l 2  2 l 2a 2 
3
∆ +

3 
3 

=

al

2

.

 al 
  +3
 ∆

al
→ ∞ (например, при a = const ≠ 0,

l = const, ∆ → 0) будет r → ±1, т.е. корреляция экстремальна; при
al
→ 0 (например, при a = const, b = const, ∆ → ∞) будет r → 0, корре/

ляция теряется.
Пусть в результате эксперимента, после N замеров, мы получили
при значениях x = x 1 , x 2 , ... , x N соответствующие значения y = y 1 ,
y 2 , ... , y N . Если замеры независимы, то такой набор значений имеет
плотность совместного распределения, равную в силу (30)
Хорошо видно, что r < 1; при

f ( x1 , y1 ) ⋅ f ( x2 , y2 ) ⋅ ... ⋅ f ( xN , yN ) =

1
− [ y − ( ax i + b )]2
e ∑ i
N
(2 l∆ 2 π )

2 ∆2

.

(31)

524

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

вершенно точно, а степень точности в определении соответствующего
значения y одна и та же при всех x. Обозначив через ξ измеренное
значение x, а через η измеренное значение y (ξ, η — это случайные
величины), примем, что ξ с равной вероятностью принимает все зна/
чения между −l и l, т.е. соответствующая плотность распределения
имеет вид
 1
( − l  x  l ),

ϕ( x ) =  2 l
 0 ( x > l ).

(29)

Кроме того, примем, что при каждом значении ξ = x величина η рас/
пределена по нормальному закону вокруг значения ax + b с дисперсией
∆2 , не зависящей от x. (Предположение о нормальности закона распре/
деления естественно принять, если ошибка в определении y склады/
вается из большого числа независимых ошибок, объясняющихся
различными причинами.) Плотность распределения величины η при
заданном значении ξ = x будем обозначать ψ x (y), так что
2
1
ψ x ( y) =
e −[ y − ( ax + b )]
∆ 2π

2 ∆2

.

[ψ x ( y ) dy] N 1 = ψ x ( y )ϕ ( x ) dx dy ⋅ N .

Приравнивая оба результата, получаем, что f (x, y) = ϕ(x) ψ x (y),
т.е. в наших предположениях
2 ∆2

( x  l ),

КОРРЕЛЯЦИОННАЯ ЗАВИСИМОСТЬ

(30)

( x > l ).

Вычислим коэффициент корреляции r(ξ, η). Из соображений сим/
метрии ясно, что ξ = 0, η = b. Среднее значение ξη вычисляется по
общему правилу (сумма произведений значений случайной величины

525

на их вероятности), т.е. ξη = ∫∫ xy f (x, y) dx dy, или


l

2
xy
e −[ y − ( ax + b )]
2 l∆ 2 π
−∞

ξη = ∫ dx ∫
−l

2 ∆2

l

Из формул (29) получаем ∆ 2ξ = ∫ x 2
−l

dy =

1
2l

l

l2

∫ x( ax + b ) dx = 3 a .

−l

1
l2
dx = . Чтобы вычислить ∆ η ,
2l
3

найдем сначала плотность распределения ψ(y) величины η (это не
то же самое, что ψ x (y)!). Так как ψ(y) dy есть вероятность того,
что η окажется между у и y + dy, a ξ примет произвольное значение,


то ψ(y) dy = ∫ [ f (x, y) dy] dx. Поэтому
−∞



ψ( y) =

l

∫ f ( x, y ) dx = ∫ 2 l∆

−∞

−l

1


e −[ y − ( ax + b )]

2

2 ∆2

dx,

откуда


Обозначим, далее, через f (x, y) плотность совместного распределе
ния величин ξ, η; это значит, что вероятность одновременного попада/
ния ξ между х и x + dx, а η — между у и y + dy равна f (x, y) dx dy.
Для подсчета функции f (x, y) заметим, что если произведено большое
число N испытаний, то число случаев одновременного попадания ξ
между х и x + dx, а η — между у и y + dy равно [ f (x, y) dx dy] N .
С другой стороны, можно рассуждать так: при N испытаниях число
случаев, когда ξ попадет между х и x + dx, равно N 1 = [ϕ(x) dx] N .
Но из этих N 1 случаев число случаев, когда η попадет между у и
y + dy, равно

2
1

e −[ y − ( ax + b )]

f ( x, y ) =  2 l∆ 2 π
 0

§ 9]

∆ η2 = ∫ ( y − b )2 ψ ( y ) dy =
−∞



l

∫ dy ∫ ( y − b )

2

−∞

−l

2
1
e −[ y − ( ax + b )]
2 l∆ 2 π

2 ∆2

dx.

После перестановки порядка интегрирования и вычислений, которые
l 2 a2
. Отсюда на/
мы предоставляем читателю, получается ∆ η2 = ∆2 +
3
ходим искомый коэффициент
r ( ξ, η) =

l 2a
l 2  2 l 2a 2 
3
∆ +

3 
3 

=

al

2

.

 al 
  +3
 ∆

al
→ ∞ (например, при a = const ≠ 0,

l = const, ∆ → 0) будет r → ±1, т.е. корреляция экстремальна; при
al
→ 0 (например, при a = const, b = const, ∆ → ∞) будет r → 0, корре/

ляция теряется.
Пусть в результате эксперимента, после N замеров, мы получили
при значениях x = x 1 , x 2 , ... , x N соответствующие значения y = y 1 ,
y 2 , ... , y N . Если замеры независимы, то такой набор значений имеет
плотность совместного распределения, равную в силу (30)
Хорошо видно, что r < 1; при

f ( x1 , y1 ) ⋅ f ( x2 , y2 ) ⋅ ... ⋅ f ( xN , yN ) =

1
− [ y − ( ax i + b )]2
e ∑ i
N
(2 l∆ 2 π )

2 ∆2

.

(31)

526

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

(Здесь суммирование ∑ производится по i от 1 до N .) Если нам из/
вестен результат эксперимента, и мы исходим из линейной зависимос/
ти y = ax + b, но коэффициенты a и b неизвестны, то естественно их
выбрать так, чтобы этот результат оказался в зоне наибольшей возмож/
ной плотности распределения, т.е. чтобы он был в определенном смысле
наиболее вероятным. Это означает, что коэффициенты a и b подби/
раются из условия максимизации правой части (31), т.е. минимизации
2
суммы ∑ [y i − (ax i + b)] . Мы приходим к методу наименьших квадра/
тов, уже разобранному в § II.3. Итак, метод наименьших квадратов по/
лучает обоснование на основе соображений теории вероятности.
После указанного эксперимента коэффициент корреляции можно
вычислить по формуле (заметим, что ξη − ξ η = (ξ − ξ)(η − η)):
r=

( ξ − ξ )( η − η)
( ξ − ξ )2 ( η − η)2



∑ ( xi − x )( yi − y ) N ,
∑ ( xi − x )2 ∑ ( yi − y )2 N 2

где x = ∑ x i N , y = ∑ y i N . Умножив на N числитель и знамена/
тель, получаем
r ≈ rN =

∑ ( xi − x )( yi − y ) .
∑ ( xi − x )2 ∑ ( yi − y )2

Если rN получится малым, то может возникнуть подозрение, что
на самом деле r = 0, а отличие rN от нуля получилось из/за естествен/
ного разброса экспериментальных значений. Можно доказать (мы это/
го делать не будем), что если истинное значение r = 0, то при большом
N наблюдаемое значение rN приближенно подчиняется нормально/
1
му закону со средним значением rN = 0 и дисперсией ∆ N2 =
. Рас/
N −1
суждая, как в § 3, получаем, что вероятность неравенства rN < ε равна
ε

∫ ∆N

−ε

1


e

− r 2 2 ∆ 2N

 ε 
 = Φ( ε N − 1 ).
dr = Φ 
 ∆N 

Приравняв, например, правую часть 0,95, мы по таблице находим, что
с вероятностью 0,95 будет rN < ε, где ε N − 1 = 196
, ≈ 2. Итак, если в ре/
2
, то с вероятностью,
зультате эксперимента получится, что rN 
N −1
не меньшей 0,95, можно утверждать, что коэффициент корреляции меж/
ду изучаемыми физическими величинами отличен от нуля, т.е. между
этими величинами имеется определенная корреляционная зависимость.
Подчеркнем в заключение, что если коэффициент корреляции ока/
зывается равным нулю, то это еще не говорит об отсутствии зависимос/
ти, так как эта зависимость может оказаться нелинейной. Поэтому

§ 10]

О РАСПРЕДЕЛЕНИИ ПРОСТЫХ ЧИСЕЛ

527

эмпирическое выявление зависимости y(x) всегда надо начинать
с нанесения результатов эксперимента на координатную плоскость x,
y. При этом может оказаться, что эмпирические точки с достаточной
точностью лягут на параболу или на какую/либо иную простую линию;
тогда эта линия определит функциональную зависимость y(x).
И лишь если эмпирические точки образуют «облако», то надо прово/
дить их статистическую обработку. При этом применение понятия кор/
реляции целесообразно, если это «облако» напоминает линейную
зависимость, как на рис. 12. Нелинейную зависимость можно исследо/
вать на небольших интервалах изменения x, приближенно полагая ее
линейной, либо же можно добиться линейности с помощью предвари/
тельного преобразования переменных по методам § II.4.
§ 10. О распределении простых чисел
Приведем интересный пример применения теории вероятностей
к теории чисел. Рассмотрим вопрос о распределении простых чисел в
натуральном ряде чисел. Этот вопрос очень сложный, и поэтому наши
рассуждения не будут вполне строгими, но они все же правильно пере/
дают общую картину.
Еще в древности было доказано, что не существует самого большого
простого числа, т.е. что простых чисел существует бесчисленное мно/
жество. Даже беглый взгляд на несколько первых сотен чисел нату/
рального ряда убеждает нас в том, что простые числа распределены
крайне неравномерно. Так, например, после простого числа 113 идет 13
составных чисел, а четырнадцатое число 127 — простое. Между 127
и следующим простым числом 131 находятся лишь три составных
числа. Между соседними простыми числами 131 и 137 имеется пять чи/
сел, а после 137 через одно число идет опять простое число 139.
Поэтому интересен такой вопрос. Сколько простых чисел имеется
между числами n и n + ∆? Отношение числа простых чисел, лежащих
между n и n + ∆, к числу ∆ мы будем называть плотностью распреде/
ления простых чисел. Определению зависимости плотности распреде/
ления простых чисел от n и посвящен этот параграф.
Будем считать, что ∆ мало по сравнению с n, но значительно боль/
ше 1. (Тем самым мы предполагаем, что n достаточно большое число.)
При этом предположении между n и n + ∆ имеется много простых
чисел. Обозначим плотность распределения простых чисел через f (n).
Тогда в промежутке от n до n + ∆ содержится f (n)∆ простых чисел.
Можно составить список всех простых чисел, не превышающих
данного числа n, следующим образом.
Напишем подряд все натуральные числа от 2 до n. Затем вычеркнем
все числа, делящиеся на 2 (не считая самого числа 2), после этого вы/
черкнем все числа, делящиеся на 3 (не считая числа 3), затем все числа,
делящиеся на 5 (не считая числа 5) и т.д. В итоге все составные числа

526

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

(Здесь суммирование ∑ производится по i от 1 до N .) Если нам из/
вестен результат эксперимента, и мы исходим из линейной зависимос/
ти y = ax + b, но коэффициенты a и b неизвестны, то естественно их
выбрать так, чтобы этот результат оказался в зоне наибольшей возмож/
ной плотности распределения, т.е. чтобы он был в определенном смысле
наиболее вероятным. Это означает, что коэффициенты a и b подби/
раются из условия максимизации правой части (31), т.е. минимизации
2
суммы ∑ [y i − (ax i + b)] . Мы приходим к методу наименьших квадра/
тов, уже разобранному в § II.3. Итак, метод наименьших квадратов по/
лучает обоснование на основе соображений теории вероятности.
После указанного эксперимента коэффициент корреляции можно
вычислить по формуле (заметим, что ξη − ξ η = (ξ − ξ)(η − η)):
r=

( ξ − ξ )( η − η)
( ξ − ξ )2 ( η − η)2



∑ ( xi − x )( yi − y ) N ,
∑ ( xi − x )2 ∑ ( yi − y )2 N 2

где x = ∑ x i N , y = ∑ y i N . Умножив на N числитель и знамена/
тель, получаем
r ≈ rN =

∑ ( xi − x )( yi − y ) .
∑ ( xi − x )2 ∑ ( yi − y )2

Если rN получится малым, то может возникнуть подозрение, что
на самом деле r = 0, а отличие rN от нуля получилось из/за естествен/
ного разброса экспериментальных значений. Можно доказать (мы это/
го делать не будем), что если истинное значение r = 0, то при большом
N наблюдаемое значение rN приближенно подчиняется нормально/
1
му закону со средним значением rN = 0 и дисперсией ∆ N2 =
. Рас/
N −1
суждая, как в § 3, получаем, что вероятность неравенства rN < ε равна
ε

∫ ∆N

−ε

1


e

− r 2 2 ∆ 2N

 ε 
 = Φ( ε N − 1 ).
dr = Φ 
 ∆N 

Приравняв, например, правую часть 0,95, мы по таблице находим, что
с вероятностью 0,95 будет rN < ε, где ε N − 1 = 196
, ≈ 2. Итак, если в ре/
2
, то с вероятностью,
зультате эксперимента получится, что rN 
N −1
не меньшей 0,95, можно утверждать, что коэффициент корреляции меж/
ду изучаемыми физическими величинами отличен от нуля, т.е. между
этими величинами имеется определенная корреляционная зависимость.
Подчеркнем в заключение, что если коэффициент корреляции ока/
зывается равным нулю, то это еще не говорит об отсутствии зависимос/
ти, так как эта зависимость может оказаться нелинейной. Поэтому

§ 10]

О РАСПРЕДЕЛЕНИИ ПРОСТЫХ ЧИСЕЛ

527

эмпирическое выявление зависимости y(x) всегда надо начинать
с нанесения результатов эксперимента на координатную плоскость x,
y. При этом может оказаться, что эмпирические точки с достаточной
точностью лягут на параболу или на какую/либо иную простую линию;
тогда эта линия определит функциональную зависимость y(x).
И лишь если эмпирические точки образуют «облако», то надо прово/
дить их статистическую обработку. При этом применение понятия кор/
реляции целесообразно, если это «облако» напоминает линейную
зависимость, как на рис. 12. Нелинейную зависимость можно исследо/
вать на небольших интервалах изменения x, приближенно полагая ее
линейной, либо же можно добиться линейности с помощью предвари/
тельного преобразования переменных по методам § II.4.
§ 10. О распределении простых чисел
Приведем интересный пример применения теории вероятностей
к теории чисел. Рассмотрим вопрос о распределении простых чисел в
натуральном ряде чисел. Этот вопрос очень сложный, и поэтому наши
рассуждения не будут вполне строгими, но они все же правильно пере/
дают общую картину.
Еще в древности было доказано, что не существует самого большого
простого числа, т.е. что простых чисел существует бесчисленное мно/
жество. Даже беглый взгляд на несколько первых сотен чисел нату/
рального ряда убеждает нас в том, что простые числа распределены
крайне неравномерно. Так, например, после простого числа 113 идет 13
составных чисел, а четырнадцатое число 127 — простое. Между 127
и следующим простым числом 131 находятся лишь три составных
числа. Между соседними простыми числами 131 и 137 имеется пять чи/
сел, а после 137 через одно число идет опять простое число 139.
Поэтому интересен такой вопрос. Сколько простых чисел имеется
между числами n и n + ∆? Отношение числа простых чисел, лежащих
между n и n + ∆, к числу ∆ мы будем называть плотностью распреде/
ления простых чисел. Определению зависимости плотности распреде/
ления простых чисел от n и посвящен этот параграф.
Будем считать, что ∆ мало по сравнению с n, но значительно боль/
ше 1. (Тем самым мы предполагаем, что n достаточно большое число.)
При этом предположении между n и n + ∆ имеется много простых
чисел. Обозначим плотность распределения простых чисел через f (n).
Тогда в промежутке от n до n + ∆ содержится f (n)∆ простых чисел.
Можно составить список всех простых чисел, не превышающих
данного числа n, следующим образом.
Напишем подряд все натуральные числа от 2 до n. Затем вычеркнем
все числа, делящиеся на 2 (не считая самого числа 2), после этого вы/
черкнем все числа, делящиеся на 3 (не считая числа 3), затем все числа,
делящиеся на 5 (не считая числа 5) и т.д. В итоге все составные числа

528

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

будут зачеркнуты и останутся лишь простые числа. Этот способ извес$
тен под названием решето Эратосфена.
Ясно, что 1/2 всех чисел от 2 до n делится на 2; на 3 делится лишь
1/3 этих чисел; на 5 делится 1/5 часть и т.д. Таким образом, если мы рас$
⎛ 1⎞
сматриваем натуральные числа от 2 до n, то ⎜ ⎟ $я часть их делится на
⎝ p⎠
⎛ 1⎞
простое число p, а ⎜1 − ⎟ $я часть не делится на p. При этом мы пред$
⎝ p⎠
полагаем, что p  n.
Пусть даны два простых числа, p1 и p2 . Возьмем любое нату$
ральное число n. Оно может делиться на p1 , а может и не делиться
на него. Точно так же оно либо делится на p2 , либо нет. Будем счи$
тать, что два события, первое из которых состоит в том, что n не де$
лится на p1 , а второе в том, что n не делится на p2 , являются
независимыми.
⎛ 1⎞
Среди чисел от 2 до n доля чисел, не делящихся на 2, равна ⎜1 − ⎟ ,
⎝ 2⎠
1


доля чисел, не делящихся на 3, равна ⎜1 − ⎟ , доля чисел, не делящихся
⎝ 3⎠
⎛ 1⎞
на 5, равна ⎜1 − ⎟ , вообще доля чисел, не делящихся на простое число
⎝ 5⎠
⎛ 1⎞
p, равна ⎜1 − ⎟ . Так как события, состоящие в том, что число не делит$
⎝ p⎠
ся на различные меньшие его простые числа, мы предполагаем незави$
симыми, то по правилу умножения вероятностей доля простых чисел,
содержащихся между 2 и n, равна
1⎞
⎛ 1⎞ ⎛ 1⎞ ⎛ 1⎞ ⎛
f ( n ) = ⎜1 − ⎟ ⎜1 − ⎟ ⎜1 − ⎟ ... ⎜1 − ⎟ .
⎝ 2⎠ ⎝ 3⎠ ⎝ 5⎠ ⎝
p⎠

(32)

(Мы приравняли эту долю плотности распределения простых чисел
f (n) на основании приближенного равенства F (n) n ≈ F ′(n), если
n1, а F (n) сходна с функцией n / ln n, см. далее.)
1

1
Если p > 1, то e p ≈ 1 − (мы пренебрегаем членами 1 p2 , 1 p 3 , . . .).
p
Поэтому







1 ⎪

1
1− ≈ e p. ⎪
⎪⎭
p
1


1
≈ e 2,
2
1

1
1− ≈ e 3,
3
..........

1−

§ 10]

О РАСПРЕДЕЛЕНИИ ПРОСТЫХ ЧИСЕЛ

Формула (32) принимает вид f (n) = e



1
2

⋅e



1
3

... e

1

p

529

, откуда

⎛ 1⎞
1
⎛ 1⎞ ⎛ 1⎞
ln f ( n ) = ⎜ − ⎟ + ⎜ − ⎟ + ... + ⎜ − ⎟ = − ∑ .
⎝ 2⎠ ⎝ 3⎠
⎝ p⎠
i pi

(33)

В промежутке от ν до ν + dν (где dν мало по сравнению с ν) имеет$
ся f (ν) dν простых чисел. Ввиду того, что длина промежутка невелика,
можно считать, что все простые числа из этого промежутка приблизитель$
1
1
1
для этого промежутка есть . Тогда ∑ для чи$
но равны ν, и поэтому
pi
ν
i pi
1
сел из промежутка от ν до ν + dν принимает вид f (ν) dν. Следователь$
ν
1
но, для суммы ∑ , соответствующей промежутку от 2 до n, получаем
i pi
b

1

∑ p =∫
i
i

a

f (ν)
dν.
ν

Каковы пределы интегрирования в этом интеграле? Нас интересу$
ют все простые числа, не превосходящие n. Поэтому верхний предел
1


1
= e pi
pi
хорошо только при больших pi . Если pi невелико, то последняя фор$
мула дает заметные ошибки. Так, например, для p = 2 получаем
1

1
1 − = 05
, ; e 2 = 061
, (ошибка более 20%). Замена суммы интегралом
2
тоже хороша лишь для тех промежутков, где pi достаточно велико.
Поэтому указать величину нижнего предела интегрирования не пред$
ставляется возможным. Оставим нижний предел неопределенным.
Формула (33) принимает вид

интегрирования берем равным n. Заметим, что равенство 1 −

n

ln f ( n ) = ∫

a

f (ν)
dν.
ν

(34)

Возьмем производную от обеих частей этого равенства, получим
f (n)
1 df (n)
. Мы получили уравнение с разделяющимися пере$
=−
f (n) dn
n
менными, которое нетрудно решить. Перепишем его так:
df ( n )
dn
=− .
2
n
f ( n)

Проинтегрируем обе части от n0 до n, получим
n

df

n

∫ f2 = −∫

n0

n0

dn
,
n

или



1
1
+
= − ln n + ln n0 ,
f ( n ) f ( n0 )

528

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

будут зачеркнуты и останутся лишь простые числа. Этот способ извес$
тен под названием решето Эратосфена.
Ясно, что 1/2 всех чисел от 2 до n делится на 2; на 3 делится лишь
1/3 этих чисел; на 5 делится 1/5 часть и т.д. Таким образом, если мы рас$
⎛ 1⎞
сматриваем натуральные числа от 2 до n, то ⎜ ⎟ $я часть их делится на
⎝ p⎠
⎛ 1⎞
простое число p, а ⎜1 − ⎟ $я часть не делится на p. При этом мы пред$
⎝ p⎠
полагаем, что p  n.
Пусть даны два простых числа, p1 и p2 . Возьмем любое нату$
ральное число n. Оно может делиться на p1 , а может и не делиться
на него. Точно так же оно либо делится на p2 , либо нет. Будем счи$
тать, что два события, первое из которых состоит в том, что n не де$
лится на p1 , а второе в том, что n не делится на p2 , являются
независимыми.
⎛ 1⎞
Среди чисел от 2 до n доля чисел, не делящихся на 2, равна ⎜1 − ⎟ ,
⎝ 2⎠
1


доля чисел, не делящихся на 3, равна ⎜1 − ⎟ , доля чисел, не делящихся
⎝ 3⎠
⎛ 1⎞
на 5, равна ⎜1 − ⎟ , вообще доля чисел, не делящихся на простое число
⎝ 5⎠
⎛ 1⎞
p, равна ⎜1 − ⎟ . Так как события, состоящие в том, что число не делит$
⎝ p⎠
ся на различные меньшие его простые числа, мы предполагаем незави$
симыми, то по правилу умножения вероятностей доля простых чисел,
содержащихся между 2 и n, равна
1⎞
⎛ 1⎞ ⎛ 1⎞ ⎛ 1⎞ ⎛
f ( n ) = ⎜1 − ⎟ ⎜1 − ⎟ ⎜1 − ⎟ ... ⎜1 − ⎟ .
⎝ 2⎠ ⎝ 3⎠ ⎝ 5⎠ ⎝
p⎠

(32)

(Мы приравняли эту долю плотности распределения простых чисел
f (n) на основании приближенного равенства F (n) n ≈ F ′(n), если
n1, а F (n) сходна с функцией n / ln n, см. далее.)
1

1
Если p > 1, то e p ≈ 1 − (мы пренебрегаем членами 1 p2 , 1 p 3 , . . .).
p
Поэтому







1 ⎪

1
1− ≈ e p. ⎪
⎪⎭
p
1


1
≈ e 2,
2
1

1
1− ≈ e 3,
3
..........

1−

§ 10]

О РАСПРЕДЕЛЕНИИ ПРОСТЫХ ЧИСЕЛ

Формула (32) принимает вид f (n) = e



1
2

⋅e



1
3

... e

1

p

529

, откуда

⎛ 1⎞
1
⎛ 1⎞ ⎛ 1⎞
ln f ( n ) = ⎜ − ⎟ + ⎜ − ⎟ + ... + ⎜ − ⎟ = − ∑ .
⎝ 2⎠ ⎝ 3⎠
⎝ p⎠
i pi

(33)

В промежутке от ν до ν + dν (где dν мало по сравнению с ν) имеет$
ся f (ν) dν простых чисел. Ввиду того, что длина промежутка невелика,
можно считать, что все простые числа из этого промежутка приблизитель$
1
1
1
для этого промежутка есть . Тогда ∑ для чи$
но равны ν, и поэтому
pi
ν
i pi
1
сел из промежутка от ν до ν + dν принимает вид f (ν) dν. Следователь$
ν
1
но, для суммы ∑ , соответствующей промежутку от 2 до n, получаем
i pi
b

1

∑ p =∫
i
i

a

f (ν)
dν.
ν

Каковы пределы интегрирования в этом интеграле? Нас интересу$
ют все простые числа, не превосходящие n. Поэтому верхний предел
1


1
= e pi
pi
хорошо только при больших pi . Если pi невелико, то последняя фор$
мула дает заметные ошибки. Так, например, для p = 2 получаем
1

1
1 − = 05
, ; e 2 = 061
, (ошибка более 20%). Замена суммы интегралом
2
тоже хороша лишь для тех промежутков, где pi достаточно велико.
Поэтому указать величину нижнего предела интегрирования не пред$
ставляется возможным. Оставим нижний предел неопределенным.
Формула (33) принимает вид

интегрирования берем равным n. Заметим, что равенство 1 −

n

ln f ( n ) = ∫

a

f (ν)
dν.
ν

(34)

Возьмем производную от обеих частей этого равенства, получим
f (n)
1 df (n)
. Мы получили уравнение с разделяющимися пере$
=−
f (n) dn
n
менными, которое нетрудно решить. Перепишем его так:
df ( n )
dn
=− .
2
n
f ( n)

Проинтегрируем обе части от n0 до n, получим
n

df

n

∫ f2 = −∫

n0

n0

dn
,
n

или



1
1
+
= − ln n + ln n0 ,
f ( n ) f ( n0 )

530

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

откуда

§ 10]

О РАСПРЕДЕЛЕНИИ ПРОСТЫХ ЧИСЕЛ

531

Заметим, что при больших n
1
1
=
− ln n0 + ln n = C + ln n,
f ( n ) f ( n0 )


1
1
1
1  ln y ln 2 y
=

=
+ 2 − ... .
1 −
ln
y
ln n + ln y ln n 1 +
ln n  ln n ln n

ln n

1
− ln n0 .
f ( n0 )
Окончательно получаем

где положено C =

Поэтому

f ( n) =

1
.
C + ln n

A( n ) =
(35)

n

При больших n постоянной C можно пренебречь по сравнению с
ln n. Поэтому при весьма больших n будет
f ( n) =

1
.
ln n

Ясно, что A(n) = ∫ f (ν) dν, где нижний предел интегрирования a нам
a

неизвестен. Итак,
n

A( n ) = ∫

a


.
ln ν

Ограничиваясь первым членом разложения и заменяя

a
при боль/
n

ших n на 0, получаем отсюда

(36)

Наш вывод был весьма груб, и легко указать некоторые его неточ/
ности. Например, нужно ли испытывать, делится ли n на все простые
числа меньше n? Конечно, нет. На самом деле достаточно испытать
лишь те простые числа, которые не превосходят n. Действительно,
пусть n не делится ни на одно простое число, меньшее n. Допустим,
что n делится на простое число p1 > n. Тогда n p1 = k, причем, так
как p1 > n, то k < n. Заметим, что n = p1 k, откуда n k = p1 . Следова/
тельно, n делится на k < n, что противоречит условию.
Оказывается, что выражение (36) удовлетворяет (если отбросить
все члены, кроме главного) также и видоизмененному соотношению
(34), в котором верхний предел n интеграла заменен на n. Исходя из
совершенно иных идей, гораздо более сложным путем показано, что
точность формулы (36) при больших n весьма велика, лучше, чем это
могло бы следовать из наших рассуждений. В частности, оказалось, что
формула (35) дает наилучшее асимптотическое представление f (n)
именно при C = 0.
Часто рассматривается вопрос не о плотности простых чисел,
а о числе A(n) простых чисел, не превосходящих данного числа n.
n

1

n  ln y ln 2 y
+ 2 − ...  dy.
1 −

ln n a  ln n ln n


A( n ) =

n
.
ln n

(37)

Если взять большое число членов, то получим более точную форму/
лу. Например, ограничиваясь тремя членами разложения, находим
A( n ) =

1
2 

1 + ln n + ln 2 n  *.

n
ln n

(38)

Оказывается, что ошибка любой из таких формул асимптотически
мала по сравнению с последним «точным» членом.
Упражнения
1. Подсчитайте приближенно количество простых чисел, содержащихся
в промежутке от 3000 до 3100; от 3000 до 3200; от 3000 до 3500. Сравните ре/
зультат с истинным, подсчитав количество простых чисел в указанных проме/
жутках при помощи таблицы простых чисел.
2. Найдите количество простых чисел, меньших 4000, по формуле (37). За/
тем уточните результат, удерживая в формуле (38) сперва член, содержащий
1
1
. Результат сравните с точным подсчи/
, а затем и член, содержащий
ln n
(ln n )2
тав количество простых чисел, меньших 4000, по таблице простых чисел.
3. Подсчитайте количество простых чисел, содержащихся в промежутке от
2000 до 5000. Выполните подсчет различными способами:
а) считая, что n = 2000, ∆ = 3000;
б) находя разность между A (5000 ) и A (2000 ). Последние величины
подсчитайте сперва по формуле (37), а затем более точно, удерживая член, со/
1
.
держащий
ln n

Положим здесь ν = ny, dν = n dy, тогда
1

A( n ) = n ∫

a
n

dy
.
ln n + ln y

1

1

* При этом нам пришлось находить

∫ ln y dy
0

и

∫ ln

2

y dy . Оба интеграла легко берут/

0

ся интегрированием по частям. Следует учесть, что y ln k y = 0 при y = 0 для любого k.

530

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

откуда

§ 10]

О РАСПРЕДЕЛЕНИИ ПРОСТЫХ ЧИСЕЛ

531

Заметим, что при больших n
1
1
=
− ln n0 + ln n = C + ln n,
f ( n ) f ( n0 )


1
1
1
1  ln y ln 2 y
=

=
+ 2 − ... .
1 −
ln
y
ln n + ln y ln n 1 +
ln n  ln n ln n

ln n

1
− ln n0 .
f ( n0 )
Окончательно получаем

где положено C =

Поэтому

f ( n) =

1
.
C + ln n

A( n ) =
(35)

n

При больших n постоянной C можно пренебречь по сравнению с
ln n. Поэтому при весьма больших n будет
f ( n) =

1
.
ln n

Ясно, что A(n) = ∫ f (ν) dν, где нижний предел интегрирования a нам
a

неизвестен. Итак,
n

A( n ) = ∫

a


.
ln ν

Ограничиваясь первым членом разложения и заменяя

a
при боль/
n

ших n на 0, получаем отсюда

(36)

Наш вывод был весьма груб, и легко указать некоторые его неточ/
ности. Например, нужно ли испытывать, делится ли n на все простые
числа меньше n? Конечно, нет. На самом деле достаточно испытать
лишь те простые числа, которые не превосходят n. Действительно,
пусть n не делится ни на одно простое число, меньшее n. Допустим,
что n делится на простое число p1 > n. Тогда n p1 = k, причем, так
как p1 > n, то k < n. Заметим, что n = p1 k, откуда n k = p1 . Следова/
тельно, n делится на k < n, что противоречит условию.
Оказывается, что выражение (36) удовлетворяет (если отбросить
все члены, кроме главного) также и видоизмененному соотношению
(34), в котором верхний предел n интеграла заменен на n. Исходя из
совершенно иных идей, гораздо более сложным путем показано, что
точность формулы (36) при больших n весьма велика, лучше, чем это
могло бы следовать из наших рассуждений. В частности, оказалось, что
формула (35) дает наилучшее асимптотическое представление f (n)
именно при C = 0.
Часто рассматривается вопрос не о плотности простых чисел,
а о числе A(n) простых чисел, не превосходящих данного числа n.
n

1

n  ln y ln 2 y
+ 2 − ...  dy.
1 −

ln n a  ln n ln n


A( n ) =

n
.
ln n

(37)

Если взять большое число членов, то получим более точную форму/
лу. Например, ограничиваясь тремя членами разложения, находим
A( n ) =

1
2 

1 + ln n + ln 2 n  *.

n
ln n

(38)

Оказывается, что ошибка любой из таких формул асимптотически
мала по сравнению с последним «точным» членом.
Упражнения
1. Подсчитайте приближенно количество простых чисел, содержащихся
в промежутке от 3000 до 3100; от 3000 до 3200; от 3000 до 3500. Сравните ре/
зультат с истинным, подсчитав количество простых чисел в указанных проме/
жутках при помощи таблицы простых чисел.
2. Найдите количество простых чисел, меньших 4000, по формуле (37). За/
тем уточните результат, удерживая в формуле (38) сперва член, содержащий
1
1
. Результат сравните с точным подсчи/
, а затем и член, содержащий
ln n
(ln n )2
тав количество простых чисел, меньших 4000, по таблице простых чисел.
3. Подсчитайте количество простых чисел, содержащихся в промежутке от
2000 до 5000. Выполните подсчет различными способами:
а) считая, что n = 2000, ∆ = 3000;
б) находя разность между A (5000 ) и A (2000 ). Последние величины
подсчитайте сперва по формуле (37), а затем более точно, удерживая член, со/
1
.
держащий
ln n

Положим здесь ν = ny, dν = n dy, тогда
1

A( n ) = n ∫

a
n

dy
.
ln n + ln y

1

1

* При этом нам пришлось находить

∫ ln y dy
0

и

∫ ln

2

y dy . Оба интеграла легко берут/

0

ся интегрированием по частям. Следует учесть, что y ln k y = 0 при y = 0 для любого k.

532

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

ОТВЕТЫ И РЕШЕНИЯ

533

Таблица интеграла вероятности
Φ( x ) =

2


x



t2

e 2

П р о д о л ж е н и е табл.
x

dt

0

Φ(x )

x

Φ( x )

x

Φ( x )

x

Φ( x)

0,00
01
02
03
04
05

0,000
0,008
0,016
0,024
0,032
0,040

0,36
37
38
39
40

0,281
0,289
0,296
0,303
0,311

0,71
72
73
74
75

0,522
0,528
0,535
0,541
0,547

1,06
07
08
09
10

0,711
0,715
0,720
0,724
0,729

06
07
08
09
10

0,048
0,056
0,064
0,072
0,080

41
42
43
44
45

0,318
0,326
0,333
0,340
0,347

76
77
78
79
80

0,553
0,559
0,565
0,570
0,576

11
12
13
14
15

0,733
0,737
0,742
0,746
0,750

11
12
13
14
15

0,088
0,096
0,103
0,111
0,119

46
47
48
49
50

0,354
0,362
0,369
0,376
0,383

81
82
83
84
85

0,582
0,588
0,593
0,599
0,605

16
17
18
19
20

0,754
0,758
0,762
0,766
0,770

16
17
18
19
20

0,127
0,135
0,143
0,151
0,159

51
52
53
54
55

0,390
0,397
0,404
0,411
0,418

86
87
88
89
90

0,610
0,616
0,621
0,627
0,632

21
22
23
24
25

0,774
0,778
0,781
0,785
0,789

21
22
23
24
25

0,166
0,174
0,182
0,190
0,197

56
57
58
59
60

0,425
0,431
0,438
0,445
0,451

91
92
93
94
95

0,637
0,642
0,648
0,653
0,658

26
27
28
29
30

0,792
0,796
0,799
0,803
0,806

26
27
28
29
30

0,205
0,213
0,221
0,228
0,236

61
62
63
64
65

0,458
0,465
0,471
0,478
0,484

96
97
98
99
1,00

0,663
0,668
0,673
0,678
0,683

31
32
33
34
35

0,810
0,813
0,816
0,820
0,823

31
32
33
34
35

0,243
0,251
0,259
0,266
0,274

66
67
68
69
70

0,491
0,497
0,503
0,510
0,516

01
02
03
04
05

0,687
0,692
0,697
0,702
0,706

36
37
38
39
40

0,826
0,829
0,832
0,835
0,838

x

Φ(x )

x

Φ( x )

x

Φ( x )

x

Φ( x )

1,41
42
43
44
45

0,841
0,844
0,847
0,850
0,853

1,66
67
68
69
70

0,903
0,905
0,907
0,909
0,911

1,91
92
93
94
95

0,944
0,945
0,946
0,948
0,949

2,55
60
65
70
80

0,989
0,991
0,992
0,993
0,995

46
47
48
49
50

0,856
0,858
0,861
0,864
0,866

71
72
73
74
75

0,913
0,915
0,916
0,918
0,920

96
97
98
99
2,00

0,950
0,951
0,952
0,953
0,954

90
3,00
10
20
30

0,996
0,997
0,998
0,999
0,999

51
52
53
54
55

0,869
0,871
0,874
0,876
0,879

76
77
78
79
80

0,922
0,923
0,925
0,927
0,928

05
10
15
20
25

0,960
0,964
0,968
0,972
0,976

40
3,50
3,9
4,4
4,9
5,3

0,999
–3
1–0,5·10
–4
1–10
1–10–5
1–10–6
1–10–7

56
57
58
59
60

0,881
0,884
0,886
0,888
0,890

81
82
83
84
85

0,930
0,931
0,933
0,934
0,936

30
35
40
45
50

0,979
0,981
0,984
0,986
0,988

61
62
63
64
65

0,893
0,895
0,897
0,899
0,901

86
87
88
89
90

0,937
0,939
0,940
0,941
0,943

ОТВЕТЫ И РЕШЕНИЯ
§ 1
9 1 4 1 1 8
;
.
= ;
= ;
36 4 36 9 36 35
§ 2
1
1 3
1. . 2. ; .
4
8 8
3. Вероятность появления черной грани равна
4 2
wч = = ,
6 3
а вероятность появления белой грани
1
wб = .
3

532

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

ОТВЕТЫ И РЕШЕНИЯ

533

Таблица интеграла вероятности
Φ( x ) =

2


x



t2

e 2

П р о д о л ж е н и е табл.
x

dt

0

Φ(x )

x

Φ( x )

x

Φ( x )

x

Φ( x )

0,00
01
02
03
04
05

0,000
0,008
0,016
0,024
0,032
0,040

0,36
37
38
39
40

0,281
0,289
0,296
0,303
0,311

0,71
72
73
74
75

0,522
0,528
0,535
0,541
0,547

1,06
07
08
09
10

0,711
0,715
0,720
0,724
0,729

06
07
08
09
10

0,048
0,056
0,064
0,072
0,080

41
42
43
44
45

0,318
0,326
0,333
0,340
0,347

76
77
78
79
80

0,553
0,559
0,565
0,570
0,576

11
12
13
14
15

0,733
0,737
0,742
0,746
0,750

11
12
13
14
15

0,088
0,096
0,103
0,111
0,119

46
47
48
49
50

0,354
0,362
0,369
0,376
0,383

81
82
83
84
85

0,582
0,588
0,593
0,599
0,605

16
17
18
19
20

0,754
0,758
0,762
0,766
0,770

16
17
18
19
20

0,127
0,135
0,143
0,151
0,159

51
52
53
54
55

0,390
0,397
0,404
0,411
0,418

86
87
88
89
90

0,610
0,616
0,621
0,627
0,632

21
22
23
24
25

0,774
0,778
0,781
0,785
0,789

21
22
23
24
25

0,166
0,174
0,182
0,190
0,197

56
57
58
59
60

0,425
0,431
0,438
0,445
0,451

91
92
93
94
95

0,637
0,642
0,648
0,653
0,658

26
27
28
29
30

0,792
0,796
0,799
0,803
0,806

26
27
28
29
30

0,205
0,213
0,221
0,228
0,236

61
62
63
64
65

0,458
0,465
0,471
0,478
0,484

96
97
98
99
1,00

0,663
0,668
0,673
0,678
0,683

31
32
33
34
35

0,810
0,813
0,816
0,820
0,823

31
32
33
34
35

0,243
0,251
0,259
0,266
0,274

66
67
68
69
70

0,491
0,497
0,503
0,510
0,516

01
02
03
04
05

0,687
0,692
0,697
0,702
0,706

36
37
38
39
40

0,826
0,829
0,832
0,835
0,838

x

Φ(x )

x

Φ( x )

x

Φ( x )

x

Φ( x )

1,41
42
43
44
45

0,841
0,844
0,847
0,850
0,853

1,66
67
68
69
70

0,903
0,905
0,907
0,909
0,911

1,91
92
93
94
95

0,944
0,945
0,946
0,948
0,949

2,55
60
65
70
80

0,989
0,991
0,992
0,993
0,995

46
47
48
49
50

0,856
0,858
0,861
0,864
0,866

71
72
73
74
75

0,913
0,915
0,916
0,918
0,920

96
97
98
99
2,00

0,950
0,951
0,952
0,953
0,954

90
3,00
10
20
30

0,996
0,997
0,998
0,999
0,999

51
52
53
54
55

0,869
0,871
0,874
0,876
0,879

76
77
78
79
80

0,922
0,923
0,925
0,927
0,928

05
10
15
20
25

0,960
0,964
0,968
0,972
0,976

40
3,50
3,9
4,4
4,9
5,3

0,999
–3
1–0,5·10
–4
1–10
1–10–5
1–10–6
1–10–7

56
57
58
59
60

0,881
0,884
0,886
0,888
0,890

81
82
83
84
85

0,930
0,931
0,933
0,934
0,936

30
35
40
45
50

0,979
0,981
0,984
0,986
0,988

61
62
63
64
65

0,893
0,895
0,897
0,899
0,901

86
87
88
89
90

0,937
0,939
0,940
0,941
0,943

ОТВЕТЫ И РЕШЕНИЯ
§ 1
9 1 4 1 1 8
;
.
= ;
= ;
36 4 36 9 36 35
§ 2
1
1 3
1. . 2. ; .
4
8 8
3. Вероятность появления черной грани равна
4 2
wч = = ,
6 3
а вероятность появления белой грани
1
wб = .
3

534

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

1
Так как wбб = wб ⋅ wб , то wбб = . Аналогично
9
4
wчч = wч · wч = .
9

1
w=


§ 3
1. Пользуясь формулой (3) и полагая в ней n = 1000, δ = 0, а за/
тем n = 1000, δ = 10, получаем 0,025; 0,020.
2. Вероятность того, что выпадает какое/то количество гербов, не превос/
ходящее 500, равна
w=

1


0

∫e



t
2

1


dt =

−∞

+∞

∫e



2

t
2

dt =

0

1 2
2 2π



∫e
0



2

t
2

1
dt = .
2

Вероятность получить не меньше 500 гербов равна
1 1
1− = .
2 2

w=

1




dt =

−∞

1


0 ,63

=



t2

e 2

−∞

1 2
2 2π

t2
t2
0 ,63
0


1  − 2
dt =
e dt + ∫ e 2 dt =


2 π  −∞

0




t2

e 2

dt +

0

1 2
2 2π

0 ,63



t2

e 2

ложено t 0 =

−∞

dt = 0,5 +

0

1
⋅ 0,471 = 0,74.
2

δ2

δ
1
= t, dδ = nαβ dt, получим w =
nαβ


1
dt =


+∞

∫e



t2
2

dt =

0 ,67

t2
t2
0 ,67
+∞



1 
 ∫ e 2 dt − ∫ e 2 dt  = 0,5 − 0,5Φ (0,67 ) = 0,25.
2π  0

0



=

Следовательно, вероятность того, что число попаданий не меньше 8, равна 1
– 0,25 = 0,75.
Для двух других случаев вероятности соответственно равны 0,5 и 0,25.
5. 0,73; 0,37.
§ 5
1.

µ m e − µ ( m − 1)! µ
= . Отсюда wµ ( m) > wµ ( m − 1), пока m < µ, и
wµ ( m − 1)
m
m!µ m −1 e − µ
w µ ( m)

=

wµ ( m) < wµ ( m − 1), когда m > µ. Значит, если µ не целое, то wµ ( m) наиболь/
шее, когда m равно целой части µ. Если же µ = 1, 2, . . . , то наибольшими яв/
ляются wµ (µ − 1) = wµ (µ ).
2. Если проведено большое число N испытаний, то величина x приняла
p1 N раз значение x1 , p2 N раз значение x2 , . . . , pn N раз значение xn . Поэ/
тому среднее ее значение, в расчете на одно испытание, равно
p1 N ⋅ x1 + p2 N ⋅ x2 + ... + pn N ⋅ xn
= p1 x1 + p2 x2 + ... + pn xn .
N


µm



µm



µ k +1
= e − µ µe µ = µ,
!
k
k =0

∑ m! e − µ m = e − µ ∑ ( m − 1)! = e − µ ∑

m =0

m =1

где положено m − 1 = k.
§ 6
Система уравнений имеет вид
dpi
= −(α + ω ) pi + ωpi −1 + αpi + 1 (i = ... ,−2, − 1, 0, 1, 2, ... ).
dt
Эту систему надо решить при начальном условии p0 (0 ) = 1, pi (0 ) = 0 (i ≠ 0 ).
При применении метода последовательных приближений удобно сначала сде/
лать замену переменных pi = e − ( α + ω ) t qi , откуда
dqi
= ωqi −1 + αqi + 1 (i = ... ,−2, − 1, 0, 1, 2, ... ).
dt

0 −
1
w=
e 2 nαβ dδ.

2 πnαβ −∞

Полагая здесь

e

t2
2

m=

Поэтому вероятность получить число гербов не меньше 510 равна 1 – 0,74 =
= 0,26.
3. Полагая в (8) δ = 0 (10 попаданий), получаем w = 0,13; полагая δ = −2
(8 попаданий), получаем w = 0,11.
4. Обозначим через δ отклонение числа попаданий от наиболее вероят/
ного числа. Тогда вероятность того, что осуществится одно из событий, для ко/
торого δ < δ 0 , равна
δ





Для закона Пуассона это дает

2
t2

e 2

−0 ,67

x=

Вероятность получить не больше 510 гербов (δ = 10) равна
10

535

Наиболее вероятное число попаданий есть nα = 100 ⋅ 0,1 = 10. Подсчитаем, ка/
кова вероятность того, что число попаданий не более 8 (δ = −2). Получим

Вероятность того, что один раз появится белая грань) а другой раз — черная
(безразлично, в каком порядке), можно подсчитать по общей формуле
n! m k
4
α β . Получим .
m! k !
9
2 4
4. Пользуясь общей формулой, находим , .
9 9
5. 0,18. 6. 0,243; 0,027. 7. 0,29; 0,33.

2

ОТВЕТЫ И РЕШЕНИЯ

t0

∫e

−∞



t2
2

Нулевое приближение:
dt, где по/

δ0
. В рассматриваемом случае n = 100; α = 0,1; β = 0,9.
nαβ

q0 = 1,

прочие

qi = 0.

q0 = 1,

q1 = ωt,

прочие

Первое приближение:
q−1 = αt,

qi = 0.

534

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

[Гл. XIII

1
Так как wбб = wб ⋅ wб , то wбб = . Аналогично
9
4
wчч = wч · wч = .
9

1
w=


§ 3
1. Пользуясь формулой (3) и полагая в ней n = 1000, δ = 0, а за/
тем n = 1000, δ = 10, получаем 0,025; 0,020.
2. Вероятность того, что выпадает какое/то количество гербов, не превос/
ходящее 500, равна
w=

1


0

∫e



t
2

1


dt =

−∞

+∞

∫e



2

t
2

dt =

0

1 2
2 2π



∫e
0



2

t
2

1
dt = .
2

Вероятность получить не меньше 500 гербов равна
1 1
1− = .
2 2

w=

1




dt =

−∞

1


0 ,63

=



t2

e 2

−∞

1 2
2 2π

t2
t2
0 ,63
0


1  − 2
dt =
e dt + ∫ e 2 dt =


2 π  −∞

0




t2

e 2

dt +

0

1 2
2 2π

0 ,63



t2

e 2

ложено t 0 =

−∞

dt = 0,5 +

0

1
⋅ 0,471 = 0,74.
2

δ2

δ
1
= t, dδ = nαβ dt, получим w =
nαβ


1
dt =


+∞

∫e



t2
2

dt =

0 ,67

t2
t2
0 ,67
+∞



1 
 ∫ e 2 dt − ∫ e 2 dt  = 0,5 − 0,5Φ (0,67 ) = 0,25.
2π  0

0



=

Следовательно, вероятность того, что число попаданий не меньше 8, равна 1
– 0,25 = 0,75.
Для двух других случаев вероятности соответственно равны 0,5 и 0,25.
5. 0,73; 0,37.
§ 5
1.

µ m e − µ ( m − 1)! µ
= . Отсюда wµ ( m) > wµ ( m − 1), пока m < µ, и
wµ ( m − 1)
m
m!µ m −1 e − µ
w µ ( m)

=

wµ ( m) < wµ ( m − 1), когда m > µ. Значит, если µ не целое, то wµ ( m) наиболь/
шее, когда m равно целой части µ. Если же µ = 1, 2, . . . , то наибольшими яв/
ляются wµ (µ − 1) = wµ (µ ).
2. Если проведено большое число N испытаний, то величина x приняла
p1 N раз значение x1 , p2 N раз значение x2 , . . . , pn N раз значение xn . Поэ/
тому среднее ее значение, в расчете на одно испытание, равно
p1 N ⋅ x1 + p2 N ⋅ x2 + ... + pn N ⋅ xn
= p1 x1 + p2 x2 + ... + pn xn .
N


µm



µm



µ k +1
= e − µ µe µ = µ,
!
k
k =0

∑ m! e − µ m = e − µ ∑ ( m − 1)! = e − µ ∑

m =0

m =1

где положено m − 1 = k.
§ 6
Система уравнений имеет вид
dpi
= −(α + ω ) pi + ωpi −1 + αpi + 1 (i = ... ,−2, − 1, 0, 1, 2, ... ).
dt
Эту систему надо решить при начальном условии p0 (0 ) = 1, pi (0 ) = 0 (i ≠ 0 ).
При применении метода последовательных приближений удобно сначала сде/
лать замену переменных pi = e − ( α + ω ) t qi , откуда
dqi
= ωqi −1 + αqi + 1 (i = ... ,−2, − 1, 0, 1, 2, ... ).
dt

0 −
1
w=
e 2 nαβ dδ.

2 πnαβ −∞

Полагая здесь

e

t2
2

m=

Поэтому вероятность получить число гербов не меньше 510 равна 1 – 0,74 =
= 0,26.
3. Полагая в (8) δ = 0 (10 попаданий), получаем w = 0,13; полагая δ = −2
(8 попаданий), получаем w = 0,11.
4. Обозначим через δ отклонение числа попаданий от наиболее вероят/
ного числа. Тогда вероятность того, что осуществится одно из событий, для ко/
торого δ < δ 0 , равна
δ





Для закона Пуассона это дает

2
t2

e 2

−0 ,67

x=

Вероятность получить не больше 510 гербов (δ = 10) равна
10

535

Наиболее вероятное число попаданий есть nα = 100 ⋅ 0,1 = 10. Подсчитаем, ка/
кова вероятность того, что число попаданий не более 8 (δ = −2). Получим

Вероятность того, что один раз появится белая грань) а другой раз — черная
(безразлично, в каком порядке), можно подсчитать по общей формуле
n! m k
4
α β . Получим .
m! k !
9
2 4
4. Пользуясь общей формулой, находим , .
9 9
5. 0,18. 6. 0,243; 0,027. 7. 0,29; 0,33.

2

ОТВЕТЫ И РЕШЕНИЯ

t0

∫e

−∞



t2
2

Нулевое приближение:
dt, где по/

δ0
. В рассматриваемом случае n = 100; α = 0,1; β = 0,9.
nαβ

q0 = 1,

прочие

qi = 0.

q0 = 1,

q1 = ωt,

прочие

Первое приближение:
q−1 = αt,

qi = 0.

536

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

α 2t 2
,
2

q0 = 1 + αωt 2 ,

q−1 = αt,

q1 = ωt,

q2 =

ω2t 2
,
2

прочие

qi = 0

и т.д. Среднее значение номера состояния i = (ω − α )t. Задача, разобранная
в основном тексте, получается при α = 0, ω = 1.
§ 7
⎧ p
⎪ 2 q 3 , если 0 < p < q,

⎪ 1
F3 ( p ) = ⎨ 3 ( −2 p 2 + 6 pq − 3 q 2 ), если q < p < 2 q,
⎪ 2q
⎪ 1
2
2
⎪ 2 q 3 ( p − 6 pq + 9 q ), если 2 q < p < 3 q.

2

Если p < 0 и если p > 3 q, то F3 ( p ) ≡ 0. График функции F3 ( p ) при q = 1 см.
на рис. 191.
§ 8

∫ xF ( x ) dx =

−∞

1
Δ 2π

+∞



x⋅e



(x −x )2
2 Δ2

3( p −5q)2
5q2

1 3 −
F ( p; 20 ) =
e
q 10π

;

3 ( p −10 q ) 2
10 q 2

3. а) Так как p1 = 1 кг, a pn = np1 , то p20 = 20 ⋅ 1 кг = 20 кг.
б) Воспользуемся результатом пункта а), полагая в
дляF ( p; 20 ) величину q равной 2. Получим
F ( p; 20 ) =

1 3 −
e
2 10π

.

выражении

3 ( p − 20 ) 2
40

,

или
2

F ( p; 20 ) = 0,154 e −0 ,075 ( p − 20 ) .
Вероятность того, что вес улова будет не больше 20 кг, есть w =
20

2

= 0,154 ∫ e −0 ,075 ( p − 20 ) dp. Чтобы свести этот интеграл к табличной функции
Φ( x ),

dx.

−∞

x−x
Положим
= t, dx = Δ 2 dt. Тогда последний интеграл принимает вид
Δ 2
1
π
+∞

Интеграл

1 3 −
F ( p; 10 ) =
e
q 5π

0

+∞

1.

537

q2
q
2. Находим p1 = ; Δ12 = , поэтому
12
2

Второе приближение:
q−2 =

ОТВЕТЫ И РЕШЕНИЯ

[Гл. XIII

+∞

∫ (x + Δ

2

2 t ) e − t dt = x +

−∞

Δ 2
π

+∞

∫ te

−t 2

dt.

−∞

2

−t
∫ t e dt = 0, потому что подынтегральная функция нечетная, так

−∞

положим

1 2
x = 0,075( p − 20 )2 ,
2

откуда x = 0,387( p − 20 ), dx = 0,387 dp.

Поэтому
0

w=


0,154
e

0,387 −7 ,7

x2
2

7 ,7

dx = 0,4 ∫ e



x2
2

dx = 0,4

0

Вероятность того, что вес улова окажется не больше 22 кг, равна
+0 ,77

w = 0,4



−7 , 7

e



x2
2

x2
0 ,77
⎛ 0 −x2


dx = 0,4 ⎜ ∫ e 2 dx + ∫ e 2 dx⎟ =


⎝ −7 , 7

0

что ее график симметричен относительно начала координат.
(x −x )2

+∞


1
2
Для нахождения ∫ ( x − x )
e 2 Δ dx выполним замену перемен4
Δ 2π
−∞
x−x
ной
= t, dx = Δ 2 dt. Тогда исходный интеграл перейдет в такой:
Δ 2
+∞
2 Δ2
−t 2
2 −t 2
∫ t e dt. Проинтегрируем по частям, полагая t e dt = dg, t = f . Тогда
π −∞
1 2
g = − e − t , df = dt. Получаем
2
2

2 Δ2
π

+∞

∫t

−∞

2 −t 2

e

dt =

2 Δ2
π

⎡ 1 −t 2
⎢− te
⎣ 2

+∞
−∞

+

+∞
⎤ 2
1
−t 2
∫ e dt ⎥ = Δ .
2 −∞



Φ( 7,7 ) = 0,5.
2

= 0,4


[Φ( 7,7 ) + Φ(0,77 )] = 0,78.
2

Вероятность того, что вес улова будет не больше 25 кг, равна 0,98.
§ 10
1. Приняв n = 3000, Δ = 100, 200, 500, получаем приближенные значения
12, 25, 62. Точные значения соответственно равны 12, 22, 59.
2. По формуле (37) А(4000) = 482. По сокращенной формуле (38) А =
= 540. По полной формуле (38) А = 554. Точное значение А(4000) = 550.
3. Приняв n = 2000, Δ = 3000, получаем количество N = 395. По формуле
(37) N = 322. По сокращенной формуле (38) N = 358. Точное значение N = 366.

536

ТЕОРИЯ ВЕРОЯТНОСТЕЙ

α 2t 2
,
2

q0 = 1 + αωt 2 ,

q−1 = αt,

q1 = ωt,

q2 =

ω2t 2
,
2

прочие

qi = 0

и т.д. Среднее значение номера состояния i = (ω − α )t. Задача, разобранная
в основном тексте, получается при α = 0, ω = 1.
§ 7
⎧ p
⎪ 2 q 3 , если 0 < p < q,

⎪ 1
F3 ( p ) = ⎨ 3 ( −2 p 2 + 6 pq − 3 q 2 ), если q < p < 2 q,
⎪ 2q
⎪ 1
2
2
⎪ 2 q 3 ( p − 6 pq + 9 q ), если 2 q < p < 3 q.

2

Если p < 0 и если p > 3 q, то F3 ( p ) ≡ 0. График функции F3 ( p ) при q = 1 см.
на рис. 191.
§ 8

∫ xF ( x ) dx =

−∞

1
Δ 2π

+∞



x⋅e



(x −x )2
2 Δ2

3( p −5q)2
5q2

1 3 −
F ( p; 20 ) =
e
q 10π

;

3 ( p −10 q ) 2
10 q 2

3. а) Так как p1 = 1 кг, a pn = np1 , то p20 = 20 ⋅ 1 кг = 20 кг.
б) Воспользуемся результатом пункта а), полагая в
дляF ( p; 20 ) величину q равной 2. Получим
F ( p; 20 ) =

1 3 −
e
2 10π

.

выражении

3 ( p − 20 ) 2
40

,

или
2

F ( p; 20 ) = 0,154 e −0 ,075 ( p − 20 ) .
Вероятность того, что вес улова будет не больше 20 кг, есть w =
20

2

= 0,154 ∫ e −0 ,075 ( p − 20 ) dp. Чтобы свести этот интеграл к табличной функции
Φ( x ),

dx.

−∞

x−x
Положим
= t, dx = Δ 2 dt. Тогда последний интеграл принимает вид
Δ 2
1
π
+∞

Интеграл

1 3 −
F ( p; 10 ) =
e
q 5π

0

+∞

1.

537

q2
q
2. Находим p1 = ; Δ12 = , поэтому
12
2

Второе приближение:
q−2 =

ОТВЕТЫ И РЕШЕНИЯ

[Гл. XIII

+∞

∫ (x + Δ

2

2 t ) e − t dt = x +

−∞

Δ 2
π

+∞

∫ te

−t 2

dt.

−∞

2

−t
∫ t e dt = 0, потому что подынтегральная функция нечетная, так

−∞

положим

1 2
x = 0,075( p − 20 )2 ,
2

откуда x = 0,387( p − 20 ), dx = 0,387 dp.

Поэтому
0

w=


0,154
e

0,387 −7 ,7

x2
2

7 ,7

dx = 0,4 ∫ e



x2
2

dx = 0,4

0

Вероятность того, что вес улова окажется не больше 22 кг, равна
+0 ,77

w = 0,4



−7 , 7

e



x2
2

x2
0 ,77
⎛ 0 −x2


dx = 0,4 ⎜ ∫ e 2 dx + ∫ e 2 dx⎟ =


⎝ −7 , 7

0

что ее график симметричен относительно начала координат.
(x −x )2

+∞


1
2
Для нахождения ∫ ( x − x )
e 2 Δ dx выполним замену перемен4
Δ 2π
−∞
x−x
ной
= t, dx = Δ 2 dt. Тогда исходный интеграл перейдет в такой:
Δ 2
+∞
2 Δ2
−t 2
2 −t 2
∫ t e dt. Проинтегрируем по частям, полагая t e dt = dg, t = f . Тогда
π −∞
1 2
g = − e − t , df = dt. Получаем
2
2

2 Δ2
π

+∞

∫t

−∞

2 −t 2

e

dt =

2 Δ2
π

⎡ 1 −t 2
⎢− te
⎣ 2

+∞
−∞

+

+∞
⎤ 2
1
−t 2
∫ e dt ⎥ = Δ .
2 −∞



Φ( 7,7 ) = 0,5.
2

= 0,4


[Φ( 7,7 ) + Φ(0,77 )] = 0,78.
2

Вероятность того, что вес улова будет не больше 25 кг, равна 0,98.
§ 10
1. Приняв n = 3000, Δ = 100, 200, 500, получаем приближенные значения
12, 25, 62. Точные значения соответственно равны 12, 22, 59.
2. По формуле (37) А(4000) = 482. По сокращенной формуле (38) А =
= 540. По полной формуле (38) А = 554. Точное значение А(4000) = 550.
3. Приняв n = 2000, Δ = 3000, получаем количество N = 395. По формуле
(37) N = 322. По сокращенной формуле (38) N = 358. Точное значение N = 366.

§ 1]

ВВЕДЕНИЕ

539

могут получаться функции значительно более сложного вида. Набор
рассматриваемых здесь частот ω k называется спектром функции f (t);
в данном случае мы имеем дискретный спектр*. Можно пользоваться
также суммами синусов или косинусов с различными частотами и ам
плитудами, так как по формуле (1) можно перейти от экспонент к коси
нусам и синусам, а по формулам

ГЛАВА XIV
ПРЕОБРАЗОВАНИЕ ФУРЬЕ*

cos ωt =

§ 1. Введение
В главах VII–VIII, при рассмотрении линейных дифференциаль
ных уравнений с постоянными коэффициентами, а также систем таких
уравнений (другими словами, при рассмотрении линейных однород
ных во времени процессов с конечным числом степеней свободы), мы
видели, какую важную роль играет функция e pt . Дело в том, что если
подставить эту функцию в левую часть уравнения и произвести все де
йствия, то в результате получится эта же функция, умноженная на не
который постоянный множитель. Поэтому решение однородного
уравнения выражалось через функции вида e pt , через них же выража
лась функция Грина, да и решение неоднородного уравнения имело на
иболее простой вид, когда в правой части стояла функция e pt . Мы
включаем сюда как частный случай и функции вида cosωt или
e γt sin ωt, которые по формуле Эйлера непосредственно выражаются
через экспоненты e pt с комплексным р (см. формулы (3)).
Во многих задачах независимая переменная t, которой обычно слу
жит время, может принимать всевозможные значения, т.е. −∞ < t < ∞,
причем рассматриваемые решения, по смыслу задачи, должны оста
ваться конечными как при конечных t, так и при t → ±∞. Так как при
p = γ + iω e pt = e γt (cos ωt + i sin ωt), cos ωt + i sin ωt = 1, то при γ > 0 бу
дет e pt → ∞, а при γ < 0 будет e pt → ∞. Значит, если требовать
t→ ∞

t→ −∞

ограниченности экспоненты e pt при t → ±∞, то должно быть γ = 0,
т.е. надо пользоваться лишь «гармониками», функциями
e iωt = cosωt + i sin ωt.

(1)

При наложении друг на друга гармоник с различными амплитуда
ми и частотами, т. е. при рассмотрении сумм вида
f(t ) = ∑ ak e

iω k t

(2)

k

* В этой главе нам потребуются сведения о комплексных числах (§§ V.1–3) и
о δфункции (§§ VI.1–3). В § 7 применяется понятие многомерного векторного простра
нства (§ IX.6).

e iωt + e − iωt
,
2

sin ωt =

e iωt − e − iωt
2i

(3)

— от косинусов и синусов к экспонентам. Мы будем для единообразия
в основном пользоваться экспонентами (ср. § V.5).
Еще более широкий класс функций f (t) получится, если вместо
суммы по отдельным частотам воспользоваться интегралом по всем
частотам, т.е. воспользоваться представлением вида


f(t ) =

∫ F (ω )e

iωt

dω.

(4)

−∞

Здесь мы имеем непрерывный спектр; он может занимать всю ось ω, но
может занимать и некоторый интервал J этой оси, если вне этого ин
тервала функция F(ω) равна нулю, т.е. фактически интегрирование
(4) производится лишь по J (тогда J называется носителем функ
ции F(ω)). Впрочем, в § VI.1 мы видели, что если функция F(ω) пред
ставляет собой сумму дельтообразных слагаемых, то и весь интеграл
(4) переходит в сумму (2), т.е. спектр будет дискретным и будет состо
ять из набора тех значений ω, в которых дельтообразные слагаемые
имеют особенности. В общем случае спектр может обладать как непре
рывной, так и дискретной частями.
Нетрудно понять смысл функции F(ω) в представлении (4). Так
как в этом представлении на малый интервал частот от ω до ω + dω
приходится слагаемое F (ω)e iωt dω = [F (ω) dω] e iωt , то, сравнивая с (2),
мы видим, что F (ω) dω — это амплитуда, отвечающая указанному ин
тервалу частот. Значит, F(ω) можно рассматривать как «плотность
амплитуды», отвечающей малому интервалу частот и рассчитанной на
единицу длины этого интервала. Поэтому функцию F(ω) называют
спектральной плотностью функции f (t). Переход от суммы (2) к ин
тегралу (4) аналогичен переходу (ср. § ХII.1) от дискретной модели
струны в виде упруго связанных друг с другом бусинок к непрерывной
модели, у которой масса «размазана» по всей длине струны с опреде
ленной плотностью. Так и в представлении (4) амплитуда гармоник
«размазана» по всему спектру частот с плотностью F(ω).
* От спектра функции, с которым мы будем иметь дело в этой главе, надо отличать
спектр краевой задачи (стр. 278).

§ 1]

ВВЕДЕНИЕ

539

могут получаться функции значительно более сложного вида. Набор
рассматриваемых здесь частот ω k называется спектром функции f (t);
в данном случае мы имеем дискретный спектр*. Можно пользоваться
также суммами синусов или косинусов с различными частотами и ам
плитудами, так как по формуле (1) можно перейти от экспонент к коси
нусам и синусам, а по формулам

ГЛАВА XIV
ПРЕОБРАЗОВАНИЕ ФУРЬЕ*

cos ωt =

§ 1. Введение
В главах VII–VIII, при рассмотрении линейных дифференциаль
ных уравнений с постоянными коэффициентами, а также систем таких
уравнений (другими словами, при рассмотрении линейных однород
ных во времени процессов с конечным числом степеней свободы), мы
видели, какую важную роль играет функция e pt . Дело в том, что если
подставить эту функцию в левую часть уравнения и произвести все де
йствия, то в результате получится эта же функция, умноженная на не
который постоянный множитель. Поэтому решение однородного
уравнения выражалось через функции вида e pt , через них же выража
лась функция Грина, да и решение неоднородного уравнения имело на
иболее простой вид, когда в правой части стояла функция e pt . Мы
включаем сюда как частный случай и функции вида cosωt или
e γt sin ωt, которые по формуле Эйлера непосредственно выражаются
через экспоненты e pt с комплексным р (см. формулы (3)).
Во многих задачах независимая переменная t, которой обычно слу
жит время, может принимать всевозможные значения, т.е. −∞ < t < ∞,
причем рассматриваемые решения, по смыслу задачи, должны оста
ваться конечными как при конечных t, так и при t → ±∞. Так как при
p = γ + iω e pt = e γt (cos ωt + i sin ωt), cos ωt + i sin ωt = 1, то при γ > 0 бу
дет e pt → ∞, а при γ < 0 будет e pt → ∞. Значит, если требовать
t→ ∞

t→ −∞

ограниченности экспоненты e pt при t → ±∞, то должно быть γ = 0,
т.е. надо пользоваться лишь «гармониками», функциями
e iωt = cosωt + i sin ωt.

(1)

При наложении друг на друга гармоник с различными амплитуда
ми и частотами, т. е. при рассмотрении сумм вида
f(t ) = ∑ ak e

iω k t

(2)

k

* В этой главе нам потребуются сведения о комплексных числах (§§ V.1–3) и
о δфункции (§§ VI.1–3). В § 7 применяется понятие многомерного векторного простра
нства (§ IX.6).

e iωt + e − iωt
,
2

sin ωt =

e iωt − e − iωt
2i

(3)

— от косинусов и синусов к экспонентам. Мы будем для единообразия
в основном пользоваться экспонентами (ср. § V.5).
Еще более широкий класс функций f (t) получится, если вместо
суммы по отдельным частотам воспользоваться интегралом по всем
частотам, т.е. воспользоваться представлением вида


f(t ) =

∫ F (ω )e

iωt

dω.

(4)

−∞

Здесь мы имеем непрерывный спектр; он может занимать всю ось ω, но
может занимать и некоторый интервал J этой оси, если вне этого ин
тервала функция F(ω) равна нулю, т.е. фактически интегрирование
(4) производится лишь по J (тогда J называется носителем функ
ции F(ω)). Впрочем, в § VI.1 мы видели, что если функция F(ω) пред
ставляет собой сумму дельтообразных слагаемых, то и весь интеграл
(4) переходит в сумму (2), т.е. спектр будет дискретным и будет состо
ять из набора тех значений ω, в которых дельтообразные слагаемые
имеют особенности. В общем случае спектр может обладать как непре
рывной, так и дискретной частями.
Нетрудно понять смысл функции F(ω) в представлении (4). Так
как в этом представлении на малый интервал частот от ω до ω + dω
приходится слагаемое F (ω)e iωt dω = [F (ω) dω] e iωt , то, сравнивая с (2),
мы видим, что F (ω) dω — это амплитуда, отвечающая указанному ин
тервалу частот. Значит, F(ω) можно рассматривать как «плотность
амплитуды», отвечающей малому интервалу частот и рассчитанной на
единицу длины этого интервала. Поэтому функцию F(ω) называют
спектральной плотностью функции f (t). Переход от суммы (2) к ин
тегралу (4) аналогичен переходу (ср. § ХII.1) от дискретной модели
струны в виде упруго связанных друг с другом бусинок к непрерывной
модели, у которой масса «размазана» по всей длине струны с опреде
ленной плотностью. Так и в представлении (4) амплитуда гармоник
«размазана» по всему спектру частот с плотностью F(ω).
* От спектра функции, с которым мы будем иметь дело в этой главе, надо отличать
спектр краевой задачи (стр. 278).

540

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

В физических задачах мы в большинстве случаев встречаемся с ве
щественными функциями f (t), например, когда f (t) представляет
собой силу f , действующую на какуюто систему в зависимости от
времени t.
Условие вещественности f (t) можно записать так:
+∞

f ( t ) ≡ f *( t ),

т.е.

∫ F (ω )e

iωt

+∞

dω =

−∞

∫ F *(ω )e

− iωt

dω.

−∞

У величины ω знак сопряжения мы не ставим, так как подразумевает
ся, что ω вещественно. Для того чтобы были равны суммы гармоник
при любых значениях t, нужно, чтобы были равны соответствующие
амплитуды. Найдем множитель при e iω 0 t ; в левом интеграле это F(ω 0 ).
В правом интеграле из условия e − iωt = e iω 0 t найдем ω = −ω 0 ; значит,
множитель при e iω 0 t в правом интеграле равен F *(ω) = F *(−ω 0 ).
Итак, условие вещественности функции f (t) дает
F *( −ω 0 ) = F (ω 0 ).

§ 1]

ВВЕДЕНИЕ

541

Рассмотрим частный, но важный случай вещественной функции
f (t). Тогда условия (6) приведут к обращению в нуль двух последних
интегралов. В них входит произведение четной функции на нечетную,
так что

0



+∞

−∞

0

−∞

∫ k dω = − ∫ k dω ,

∫ k dω = 0, где

k — подынтегральная функ

ция третьего или четвертого интегралов.
Напротив, в первых двух интегралах подынтегральное выражение
симметрично,


0

n(ω ) = n( −ω ),

∫ n (ω ) dω = ∫ n (ω ) dω ,

−∞

0

+∞



−∞

0

∫ n (ω ) dω = 2 ∫ n (ω ) dω ,

так что окончательно




0

0

Это равенство относится к любому ω 0 , так что можно опустить индекс
«0» и записать

f ( t ) = 2 ∫ A(ω ) cos ωt dω − 2 ∫ B(ω )sin ωt dω .

F *( −ω ) = F (ω ).

Итак, вещественная функция f (t) представляется в виде интеграла от
вещественных функций cosωt и sinωt, причем соответствующая
спектральная плотность A(ω) и B(ω) тоже вещественна. Интегриро
вание в этом случае ведется только по положительным частотам с ω,
меняющимся от 0 до ∞.
Замечательно, что в форме (4) оказывается возможным предста
вить практически любую функцию f (t), остающуюся конечной при
t → ±∞. Это будет показано в § 2, где будет также дан ответ на основной
вопрос: как найти спектральную плотность F(ω) заданной функции
f (t)? Мы сейчас увидим, что вопрос имеет далеко не только теорети
ческий интерес.
Напомним простые факты из теории колебаний (§ VII.3, 5; см. также
ВМ, гл. VI и VIII). Пусть рассматривается осциллятор с малым затуха
нием, т.е. малым трением, если речь идет о механической колебательной
системе, или с малым сопротивлением, если это — электрический коле
бательный контур, и т.д. Если такой осциллятор испытывает гармони
ческое внешнее воздействие с частотой ω k , то в нем возбуждаются гар
монические вынужденные колебания с той же частотой. Амплитуда этих
колебаний тем больше, чем ω ближе к частоте ω 0 собственных коле
баний осциллятора. Эта «избирательность» осциллятора по отношению
к частоте внешнего воздействия тем резче выражена, чем затухание
меньше. В пределе, когда рассматривается осциллятор без затухания,
при ω = ω 0 наступает резонанс, т.е. амплитуда вынужденных колеба
ний возрастает неограниченно.

Функция F(ω) — комплексная. Запишем в явном виде ее вещест.
венную и мнимую части с помощью двух вещественных функций
A(ω) и B(ω):
F (ω ) = A(ω ) + iB(ω ).

Условие вещественности исходной функции f (t), которое нам дало
формулу (5), приводит к
A( −ω ) − iB( −ω ) = A(ω ) + iB(ω ),

т.е.
A( −ω ) = A(ω ),

B( −ω ) = − B(ω ).

(6)

Итак, вещественная часть F есть четная функция ω, а мнимая часть
F — нечетная функция ω.
Теперь перейдем от представления с помощью e iωt к представле
нию с помощью cos ωt и sinωt:
+∞

f(t ) =

+∞

iωt
∫ F (ω )e dω = ∫ [A(ω ) + iB(ω )][cos ωt + i sin ωt] dω =

−∞

−∞

=

+∞

+∞

−∞

−∞

∫ A(ω ) cos ωt dω − ∫ B(ω ) sin ωt dω +
+∞

+∞

−∞

−∞

+ i ∫ A(ω ) sin ωt dω + i ∫ B(ω ) cos ωt dω .

(7)

540

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

В физических задачах мы в большинстве случаев встречаемся с ве
щественными функциями f (t), например, когда f (t) представляет
собой силу f , действующую на какуюто систему в зависимости от
времени t.
Условие вещественности f (t) можно записать так:
+∞

f ( t ) ≡ f *( t ),

т.е.

∫ F (ω )e

iωt

+∞

dω =

−∞

∫ F *(ω )e

− iωt

dω.

−∞

У величины ω знак сопряжения мы не ставим, так как подразумевает
ся, что ω вещественно. Для того чтобы были равны суммы гармоник
при любых значениях t, нужно, чтобы были равны соответствующие
амплитуды. Найдем множитель при e iω 0 t ; в левом интеграле это F(ω 0 ).
В правом интеграле из условия e − iωt = e iω 0 t найдем ω = −ω 0 ; значит,
множитель при e iω 0 t в правом интеграле равен F *(ω) = F *(−ω 0 ).
Итак, условие вещественности функции f (t) дает
F *( −ω 0 ) = F (ω 0 ).

§ 1]

ВВЕДЕНИЕ

541

Рассмотрим частный, но важный случай вещественной функции
f (t). Тогда условия (6) приведут к обращению в нуль двух последних
интегралов. В них входит произведение четной функции на нечетную,
так что

0



+∞

−∞

0

−∞

∫ k dω = − ∫ k dω ,

∫ k dω = 0, где

k — подынтегральная функ

ция третьего или четвертого интегралов.
Напротив, в первых двух интегралах подынтегральное выражение
симметрично,


0

n(ω ) = n( −ω ),

∫ n (ω ) dω = ∫ n (ω ) dω ,

−∞

0

+∞



−∞

0

∫ n (ω ) dω = 2 ∫ n (ω ) dω ,

так что окончательно




0

0

Это равенство относится к любому ω 0 , так что можно опустить индекс
«0» и записать

f ( t ) = 2 ∫ A(ω ) cos ωt dω − 2 ∫ B(ω )sin ωt dω .

F *( −ω ) = F (ω ).

Итак, вещественная функция f (t) представляется в виде интеграла от
вещественных функций cosωt и sinωt, причем соответствующая
спектральная плотность A(ω) и B(ω) тоже вещественна. Интегриро
вание в этом случае ведется только по положительным частотам с ω,
меняющимся от 0 до ∞.
Замечательно, что в форме (4) оказывается возможным предста
вить практически любую функцию f (t), остающуюся конечной при
t → ±∞. Это будет показано в § 2, где будет также дан ответ на основной
вопрос: как найти спектральную плотность F(ω) заданной функции
f (t)? Мы сейчас увидим, что вопрос имеет далеко не только теорети
ческий интерес.
Напомним простые факты из теории колебаний (§ VII.3, 5; см. также
ВМ, гл. VI и VIII). Пусть рассматривается осциллятор с малым затуха
нием, т.е. малым трением, если речь идет о механической колебательной
системе, или с малым сопротивлением, если это — электрический коле
бательный контур, и т.д. Если такой осциллятор испытывает гармони
ческое внешнее воздействие с частотой ω k , то в нем возбуждаются гар
монические вынужденные колебания с той же частотой. Амплитуда этих
колебаний тем больше, чем ω ближе к частоте ω 0 собственных коле
баний осциллятора. Эта «избирательность» осциллятора по отношению
к частоте внешнего воздействия тем резче выражена, чем затухание
меньше. В пределе, когда рассматривается осциллятор без затухания,
при ω = ω 0 наступает резонанс, т.е. амплитуда вынужденных колеба
ний возрастает неограниченно.

Функция F(ω) — комплексная. Запишем в явном виде ее вещест.
венную и мнимую части с помощью двух вещественных функций
A(ω) и B(ω):
F (ω ) = A(ω ) + iB(ω ).

Условие вещественности исходной функции f (t), которое нам дало
формулу (5), приводит к
A( −ω ) − iB( −ω ) = A(ω ) + iB(ω ),

т.е.
A( −ω ) = A(ω ),

B( −ω ) = − B(ω ).

(6)

Итак, вещественная часть F есть четная функция ω, а мнимая часть
F — нечетная функция ω.
Теперь перейдем от представления с помощью e iωt к представле
нию с помощью cos ωt и sinωt:
+∞

f(t ) =

+∞

iωt
∫ F (ω )e dω = ∫ [A(ω ) + iB(ω )][cos ωt + i sin ωt] dω =

−∞

−∞

=

+∞

+∞

−∞

−∞

∫ A(ω ) cos ωt dω − ∫ B(ω ) sin ωt dω +
+∞

+∞

−∞

−∞

+ i ∫ A(ω ) sin ωt dω + i ∫ B(ω ) cos ωt dω .

(7)

542

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Пусть теперь гармоническое внешнее воздействие прилагается
к системе осцилляторов с малым затуханием, обладающих различны
ми собственными частотами. Тогда на это воздействие «отзовется» на
иболее сильно тот осциллятор, собственная частота которого равна
частоте внешнего воздействия. Если, наконец, на такую систему осцил
ляторов воздействует «смесь» гармоник, т.е. функция вида (2), то на их
воздействие отзовутся те осцилляторы, собственная частота которых
совпадает с какойлибо из внешних частот ω k . При этом амплитуда
~
вынужденных колебаний осциллятора с собственной частотой ω
0
пропорциональна амплитуде воздействия, т.е. пропорциональна тому
~ . Таким образом, указанная система осцилля
a k , для которого ω k = ω
0
торов осуществит «гармонический анализ» (говорят также «спек
тральный анализ») внешнего воздействия, как бы разложит его на
гармоники. Аналогичная картина получится при наложении внешнего
воздействия вида (4). Амплитуда осциллятора с собственной частотой
~ ), где F — спектральная плотность (см.
~ пропорциональна F(ω
ω
0
0
формулу (4)).; Точная формулировка условий, необходимых для этого,
будет дана ниже. Располагая набором осцилляторов со всевозможны
~ , можно «прощупать», т.е. определить весь ход
ми значениями ω
0
функции F(ω).
Описанный гармонический анализ может быть реально осущест
влен. Например, в акустике пользуются системой «резонаторов», каж
дый из которых настроен на определенную частоту. Если на эту
систему воздействует акустическое (звуковое) колебание, которое
всегда можно представить как смесь «чистых звуков», т. е. гармоничес
ких колебаний, то откликнутся те резонаторы, собственная частота ко
торых отвечает спектру этого воздействия. Определяя амплитуду
колебания резонаторов, мы тем самым осуществляем гармонический
анализ внешнего воздействия.

§ 2]

ФОРМУЛЫ ПРЕОБРАЗОВАНИЯ ФУРЬЕ

543

Хотя этот интеграл и расходящийся (§ III.1), но его можно представить
как предел интеграла по конечному промежутку
I ( t ) = lim I N ( t ),
N→ ∞

где
N

IN ( t ) =

∫e

iωt

dω =

−N

e i tN − e − i tN
sin tN
=2
it
t

(в последнем переходе мы пользовались второй формулой (3)). Полу
ченный результат можно представить в виде
I N ( t ) = 2 πN

sin tN
= 2 πNF1 ( tN ),
πtN

(8)

sin t
.
πt
График функции F1 (t) показан на рис. 192. Можно показать (см.
решение упражнения 2 § III.6), что
где F1 (t) =



sin t
∫ t dt = π,
−∞



т.е.

∫ F1 ( t ) dt =

−∞



sin t
dt = 1.
πt
−∞



1
Функция F1 имеет главный максимум при t = 0, F1 (0) = ; слева и
π
справа она, колеблясь, убывает (см. рис. 192).

Упражнения
1. Чему должна быть равна функция F (ω ), чтобы интеграл (4) перешел
в сумму (2)?
2. При каком условии сумма (2) будет периодической функцией t?

§ 2. Формулы преобразования Фурье
Начнем с выяснения вопроса, который нам понадобится в дальней
шем: что будет, если амплитуда колебания равномерно «размазана» по
всей оси частот, другими словами, какая функция f (t) в формуле (4)
имеет спектральную плотность F(ω) ≡ 1. Это значит, что нам надо ис
следовать интеграл


I( t ) =

∫e

−∞

iωt

dω.

Рис. 192.

Из формул (8) мы видим, что I N (t), с точностью до постоянного
множителя 2π, получается из функции F1 (t) в результате того самого
преобразования, которое в § VI. 1 привело к понятию дельтафункции.
Таким образом, переходя к пределу, мы получаем


∫e

iωt

dω = I ( t ) = 2 πδ( t ).

(9)

−∞

В этом выводе два пункта нуждаются в уточнении. Прежде всего,
при определении дельтафункции в § VI. 1 мы пользовались в качестве
примеров только функциями, не принимающими отрицательных зна
чений. Однако это условие, по существу, не использовалось, так что от

542

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Пусть теперь гармоническое внешнее воздействие прилагается
к системе осцилляторов с малым затуханием, обладающих различны
ми собственными частотами. Тогда на это воздействие «отзовется» на
иболее сильно тот осциллятор, собственная частота которого равна
частоте внешнего воздействия. Если, наконец, на такую систему осцил
ляторов воздействует «смесь» гармоник, т.е. функция вида (2), то на их
воздействие отзовутся те осцилляторы, собственная частота которых
совпадает с какойлибо из внешних частот ω k . При этом амплитуда
~
вынужденных колебаний осциллятора с собственной частотой ω
0
пропорциональна амплитуде воздействия, т.е. пропорциональна тому
~ . Таким образом, указанная система осцилля
a k , для которого ω k = ω
0
торов осуществит «гармонический анализ» (говорят также «спек
тральный анализ») внешнего воздействия, как бы разложит его на
гармоники. Аналогичная картина получится при наложении внешнего
воздействия вида (4). Амплитуда осциллятора с собственной частотой
~ ), где F — спектральная плотность (см.
~ пропорциональна F(ω
ω
0
0
формулу (4)).; Точная формулировка условий, необходимых для этого,
будет дана ниже. Располагая набором осцилляторов со всевозможны
~ , можно «прощупать», т.е. определить весь ход
ми значениями ω
0
функции F(ω).
Описанный гармонический анализ может быть реально осущест
влен. Например, в акустике пользуются системой «резонаторов», каж
дый из которых настроен на определенную частоту. Если на эту
систему воздействует акустическое (звуковое) колебание, которое
всегда можно представить как смесь «чистых звуков», т. е. гармоничес
ких колебаний, то откликнутся те резонаторы, собственная частота ко
торых отвечает спектру этого воздействия. Определяя амплитуду
колебания резонаторов, мы тем самым осуществляем гармонический
анализ внешнего воздействия.

§ 2]

ФОРМУЛЫ ПРЕОБРАЗОВАНИЯ ФУРЬЕ

543

Хотя этот интеграл и расходящийся (§ III.1), но его можно представить
как предел интеграла по конечному промежутку
I ( t ) = lim I N ( t ),
N→ ∞

где
N

IN ( t ) =

∫e

iωt

dω =

−N

e i tN − e − i tN
sin tN
=2
it
t

(в последнем переходе мы пользовались второй формулой (3)). Полу
ченный результат можно представить в виде
I N ( t ) = 2 πN

sin tN
= 2 πNF1 ( tN ),
πtN

(8)

sin t
.
πt
График функции F1 (t) показан на рис. 192. Можно показать (см.
решение упражнения 2 § III.6), что
где F1 (t) =



sin t
∫ t dt = π,
−∞



т.е.

∫ F1 ( t ) dt =

−∞



sin t
dt = 1.
πt
−∞



1
Функция F1 имеет главный максимум при t = 0, F1 (0) = ; слева и
π
справа она, колеблясь, убывает (см. рис. 192).

Упражнения
1. Чему должна быть равна функция F (ω ), чтобы интеграл (4) перешел
в сумму (2)?
2. При каком условии сумма (2) будет периодической функцией t?

§ 2. Формулы преобразования Фурье
Начнем с выяснения вопроса, который нам понадобится в дальней
шем: что будет, если амплитуда колебания равномерно «размазана» по
всей оси частот, другими словами, какая функция f (t) в формуле (4)
имеет спектральную плотность F(ω) ≡ 1. Это значит, что нам надо ис
следовать интеграл


I( t ) =

∫e

−∞

iωt

dω.

Рис. 192.

Из формул (8) мы видим, что I N (t), с точностью до постоянного
множителя 2π, получается из функции F1 (t) в результате того самого
преобразования, которое в § VI. 1 привело к понятию дельтафункции.
Таким образом, переходя к пределу, мыполучаем


∫e

iωt

dω = I ( t ) = 2 πδ( t ).

(9)

−∞

В этом выводе два пункта нуждаются в уточнении. Прежде всего,
при определении дельтафункции в § VI. 1 мы пользовались в качестве
примеров только функциями, не принимающими отрицательных зна
чений. Однако это условие, по существу, не использовалось, так что от

544

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

рицательные значения можно допускать. Вовторых, что более важно,
функция F1 (t) не является быстро убывающей. В самом деле, при боль
шом N график функции FN (t) = NF1 (Nt) показан на рис. 193; мы ви
дим, что на любом конечном фиксированном интервале t1 , t2 , не
содержащем точки t = 0, он часто колеблется, но амплитуда колебаний
не является малой, т.е. функция FN (t) не близка к нулю, как в примерах
+∞

§ VI.1. Если бы мы взяли



FN dt,

−∞

то такой интеграл расходился бы.

§ 2]

ФОРМУЛЫ ПРЕОБРАЗОВАНИЯ ФУРЬЕ

545

подставляя в (4), найдем


∫ Ae

iωτ iωt

e

−∞



dω =A ∫ e iω ( t + τ) dω =2 πAδ( t + τ).
−∞

Обратно, отсюда следует, что функции f (t) = Bδ (t − τ) соответствует
B − iωτ
.
плотность F (ω) =
e

Теперь можно перейти к случаю произвольной функции f (t) в ин
теграле (4). Как мы видели в § VI.2, каждую функцию f (t) можно пред
ставить в виде суммы (более точно, интеграла) дельтообразных функций
f ( t ) = ∑ [ f ( τ ) dτ] δ( t − τ ).
τ

В силу только что доказанного каждому слагаемому отвечает спек
f (τ) dτ − iωτ
тральная плотность
; значит, всей сумме, т.е. функции f (t),
e

отвечает спектральная плотность
Рис. 194.

Рис. 193.

Однако и это несущественно, так как интеграл от функции FN (t) при
увеличении N ведет себя следующим образом
t

t

∫ FN ( t ) dt = ∫ N

−∞

−∞

Nt

 0 ( t < 0 ),
sin Nt
sin s
dt = ∫ N
ds → 
N


πNt
πs
 1 ( t > 0 ).
−∞

F (ω ) = ∑
τ

Если вспомнить, что на самом деле это не сумма, а интеграл, и, кроме
того, обозначить переменную интегрирования через t, мы приходим
к формуле


F (ω ) =

График этого интеграла показан на рис. 194. Таким образом, при боль
ших N будет
t

∫ FN ( t ) dt ≈ e ( t )

(см. § VI.3),

т.е.

FN ( t ) ≈ e′ ( t ) = δ ( t ).

−∞

Итак, дельтообразность функции FN (t) при больших N обеспечива
ется не ее быстрым убыванием, а ее частыми колебаниями, изза кото
рых она на конечном расстоянии от t = 0 при интегрировании «все
равно что тождественный нуль».
Точно такими же рассуждениями можно было бы показать, что

+∞

∫ Q (t) FN (t − t 0 ) dt → Q (t 0 )

при N → ∞ в соответствии со свойствами

1
− iωt
∫ f ( t ) e dt.
2 π −∞

(10)

Формулы (10) и (4) называются формулами преобразования Фурье.
По ним мы переходим от любой функции f (t), конечной при t → ±∞
(это нужно для того, чтобы интеграл (10) имел смысл), к ее спектраль
ной плотности и, обратно, по спектральной плотности восстанавливаем
функцию. Эти формулы удивительно симметричны, с точностью до
1
и знака в показателе.
постоянного множителя

Если f (t) стремится к нулю при t → −∞ и при t → +∞, то интег
рал (10) в принципе всегда можно вычислить, хотя бы численно.
Рассмотрим частный случай вещественной функции f (t). Запишем

−∞

дельтафункции. В таком интеграле вклад дает главный максимум FN
при t = t 0 , где FN = N π; «крылья», т.е. области t < t 0 − ε и t > t 0 + ε,
дают мало, потому что мал интеграл от знакопеременной функции.
С помощью формулы (9) легко рассмотреть случай спектральной
плотности, заданной выражением F (ω) = Ae iωτ (A = const, τ = const):

f ( τ ) dτ − iωτ
.
e


e − iωt = cos ωt − i sin ωt,

получим


F (ω ) =



1
i
∫ f ( t )cos ωt dt − 2 π ∫ f ( t )sin ωt dt.
2 π −∞
−∞

544

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

рицательные значения можно допускать. Вовторых, что более важно,
функция F1 (t) не является быстро убывающей. В самом деле, при боль
шом N график функции FN (t) = NF1 (Nt) показан на рис. 193; мы ви
дим, что на любом конечном фиксированном интервале t1 , t2 , не
содержащем точки t = 0, он часто колеблется, но амплитуда колебаний
не является малой, т.е. функция FN (t) не близка к нулю, как в примерах
+∞

§ VI.1. Если бы мы взяли



FN dt,

−∞

то такой интеграл расходился бы.

§ 2]

ФОРМУЛЫ ПРЕОБРАЗОВАНИЯ ФУРЬЕ

545

подставляя в (4), найдем


∫ Ae

iωτ iωt

e

−∞



dω =A ∫ e iω ( t + τ) dω =2 πAδ( t + τ).
−∞

Обратно, отсюда следует, что функции f (t) = Bδ (t − τ) соответствует
B − iωτ
.
плотность F (ω) =
e

Теперь можно перейти к случаю произвольной функции f (t) в ин
теграле (4). Как мы видели в § VI.2, каждую функцию f (t) можно пред
ставить в виде суммы (более точно, интеграла) дельтообразных функций
f ( t ) = ∑ [ f ( τ ) dτ] δ( t − τ ).
τ

В силу только что доказанного каждому слагаемому отвечает спек
f (τ) dτ − iωτ
тральная плотность
; значит, всей сумме, т.е. функции f (t),
e

отвечает спектральная плотность
Рис. 194.

Рис. 193.

Однако и это несущественно, так как интеграл от функции FN (t) при
увеличении N ведет себя следующим образом
t

t

∫ FN ( t ) dt = ∫ N

−∞

−∞

Nt

 0 ( t < 0 ),
sin Nt
sin s
dt = ∫ N
ds → 
N


πNt
πs
 1 ( t > 0 ).
−∞

F (ω ) = ∑
τ

Если вспомнить, что на самом деле это не сумма, а интеграл, и, кроме
того, обозначить переменную интегрирования через t, мы приходим
к формуле


F (ω ) =

График этого интеграла показан на рис. 194. Таким образом, при боль
ших N будет
t

∫ FN ( t ) dt ≈ e ( t )

(см. § VI.3),

т.е.

FN ( t ) ≈ e′ ( t ) = δ ( t ).

−∞

Итак, дельтообразность функции FN (t) при больших N обеспечива
ется не ее быстрым убыванием, а ее частыми колебаниями, изза кото
рых она на конечном расстоянии от t = 0 при интегрировании «все
равно что тождественный нуль».
Точно такими же рассуждениями можно было бы показать, что

+∞

∫ Q (t) FN (t − t 0 ) dt → Q (t 0 )

при N → ∞ в соответствии со свойствами

1
− iωt
∫ f ( t ) e dt.
2 π −∞

(10)

Формулы (10) и (4) называются формулами преобразования Фурье.
По ним мы переходим от любой функции f (t), конечной при t → ±∞
(это нужно для того, чтобы интеграл (10) имел смысл), к ее спектраль
ной плотности и, обратно, по спектральной плотности восстанавливаем
функцию. Эти формулы удивительно симметричны, с точностью до
1
и знака в показателе.
постоянного множителя

Если f (t) стремится к нулю при t → −∞ и при t → +∞, то интег
рал (10) в принципе всегда можно вычислить, хотя бы численно.
Рассмотрим частный случай вещественной функции f (t). Запишем

−∞

дельтафункции. В таком интеграле вклад дает главный максимум FN
при t = t 0 , где FN = N π; «крылья», т.е. области t < t 0 − ε и t > t 0 + ε,
дают мало, потому что мал интеграл от знакопеременной функции.
С помощью формулы (9) легко рассмотреть случай спектральной
плотности, заданной выражением F (ω) = Ae iωτ (A = const, τ = const):

f ( τ ) dτ − iωτ
.
e


e − iωt = cos ωt − i sin ωt,

получим


F (ω ) =



1
i
∫ f ( t )cos ωt dt − 2 π ∫ f ( t )sin ωt dt.
2 π −∞
−∞

546

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Каждый из интегралов представляет собой вещественную функцию.
Вспомним, как мы писали F (ω) = A(ω) + iB(ω). Ясно, что
+∞

1
f ( t )cos ωt dt, 

2 π −∞


+∞
1

B(ω ) = −
∫ f ( t )sin ωt dt. 
2 π −∞


A(ω ) =

(11)

Отсюда легко проверить свойства (5) и (6) плотности F(ω) при ве
щественной функции f (t).
Сравнивая (7) и (11), убеждаемся, что коэффициент при cosωt, т.е.
A(ω), в свою очередь, выражается через интеграл от функции f (t),
умноженной на cos ωt; аналогичное утверждение относится к B(ω).
Отметим два частных случая интеграла (10). Пусть f (t) = C = const.
Из формулы
f ( t ) = C = ∫ F (ω ) e iωt dω
i 0t

, нужно

iωt
i0t
∫ δ(ω )e dω = e ≡ 1.

Аналогично разберем f (t) = De iω 0 t . В этом случае F (ω) = Dδ(ω − ω 0 ),
что также легко проверить подстановкой в (4). Те же результаты можно
получить и с помощью формулы (9):
+∞

+∞

D
iω t − iω t
∫ e 0 e dt = Dδ(ω − ω 0 ).
2 π −∞

Однако такие интегралы взять непосредственно нельзя, приходится
рассматривать незатухающую функцию C или De iω 0 t как предел за
2
iω t − α t
при α → 0. Получается
тухающей, например Ce − αt или De 0
довольно длинная и сложная цепь рассуждений. Лучше получить эти
формулы как выше, из (9), и запомнить их.
Пусть на осциллятор без затухания с собственной частотой ω 0 де
йствует сила f (t), так что уравнение движения имеет вид
m

d 2x
= − mω 20 x + f ( t ).
dt 2

Предполагаем, что f (t) = 0 при t = −∞, и осциллятор покоился в положе
dx
нии равновесия, x =
= 0. Легко построить решение задачи (ср. § VII.5)
dt
x=

1
mω 0

t

∫ sin ω 0 ( t − τ ) f ( τ ) dτ.

−∞

547

Это решение построено с помощью функции Грина этой задачи: тол
чок, т.е. сила δ(t − τ), подействовавший на покоящийся осциллятор,
1
придает ему скорость , и начинаются свободные колебания,
m
1
x(t > τ) =
sin ω 0 (t − τ).
mω 0
Пусть сила f (t) действует в течение ограниченного времени, f = 0
при t > T . Как будет колебаться осциллятор по окончании действия
силы? Разложим
sin ω 0 ( t − τ ) = sin ω 0 t cosω 0 τ − cosω 0 t sin ω 0 τ,

получим
x( t ) =

T
T

1 
sin ω 0 t ∫ f ( τ )cosω 0 τ dτ − cosω 0 t ∫ f ( τ )sin ω 0 τ dτ .
mω 0 
−∞
−∞


T

яснo, что для того, чтобы получить слева C, т.е. Ce = Ce
взять F (ω) = Cδ(ω). По общему правилу

C
− iωt
∫ e dt = Cδ( −ω ) = Cδ(ω ),
2π −∞

ФОРМУЛЫ ПРЕОБРАЗОВАНИЯ ФУРЬЕ

Так как f (τ) = 0 при t > T , то можно вместо
0

∫ δ(ω ) ψ (ω ) dω = ψ (0 ),

§ 2]

∫ f (τ)cos ωτ dτ

писать

−∞



∫ f (τ)cos ωτ dτ; то же относится к интегралу с синусом. Вспоминая фор

−∞

мулы (11), получим для колебаний после окончания действия силы
x( t ) =


[A(ω 0 )sin ω 0 t + B(ω 0 )cosω 0 t]
mω 0

при

t >T.

(12)

Амплитуда незатухающих колебаний осциллятора с собственной час
тотой ω 0 по окончании действия силы равна
xm =



A 2 (ω 0 ) + B2 (ω 0 ) =
F (ω 0 ) .
mω 0
mω 0

(13)

Амплитуда зависит, следовательно, только от спектральной плотности
действующей силы F(ω) при резонансной частоте, т.е. при ω = ω 0 .
Это и доказывает сделанные в § 1 утверждения.
2
В физике часто называют спектральной плотностью именно F(ω) ,
а не F(ω). Если сила f (t) есть, например, давление в звуковой волне
2
или электрическое поле в электромагнитной волне, то F (ω) dω есть
величина, пропорциональная энергии звуковых или электромагнитных
колебаний, приходящихся на участок спектра от ω до ω + dω.
После элементарных преобразований можно переписать (12) в виде
π

[F (ω 0 ) e iω 0 t − F ( −ω 0 )e − iω 0 t ],

imω 0
 (t > T )
dx
iω 0 t
− iω 0 t

+ F ( −ω 0 )e
]
m
= π [F (ω 0 ) e

dt
x( t ) =

(14)

546

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Каждый из интегралов представляет собой вещественную функцию.
Вспомним, как мы писали F (ω) = A(ω) + iB(ω). Ясно, что
+∞

1
f ( t )cos ωt dt, 

2 π −∞


+∞
1

B(ω ) = −
∫ f ( t )sin ωt dt. 
2 π −∞


A(ω ) =

(11)

Отсюда легко проверить свойства (5) и (6) плотности F(ω) при ве
щественной функции f (t).
Сравнивая (7) и (11), убеждаемся, что коэффициент при cosωt, т.е.
A(ω), в свою очередь, выражается через интеграл от функции f (t),
умноженной на cos ωt; аналогичное утверждение относится к B(ω).
Отметим два частных случая интеграла (10). Пусть f (t) = C = const.
Из формулы
f ( t ) = C = ∫ F (ω ) e iωt dω
i 0t

, нужно

iωt
i0t
∫ δ(ω )e dω = e ≡ 1.

Аналогично разберем f (t) = De iω 0 t . В этом случае F (ω) = Dδ(ω − ω 0 ),
что также легко проверить подстановкой в (4). Те же результаты можно
получить и с помощью формулы (9):
+∞

+∞

D
iω t − iω t
∫ e 0 e dt = Dδ(ω − ω 0 ).
2 π −∞

Однако такие интегралы взять непосредственно нельзя, приходится
рассматривать незатухающую функцию C или De iω 0 t как предел за
2
iω t − α t
при α → 0. Получается
тухающей, например Ce − αt или De 0
довольно длинная и сложная цепь рассуждений. Лучше получить эти
формулы как выше, из (9), и запомнить их.
Пусть на осциллятор без затухания с собственной частотой ω 0 де
йствует сила f (t), так что уравнение движения имеет вид
m

d 2x
= − mω 20 x + f ( t ).
dt 2

Предполагаем, что f (t) = 0 при t = −∞, и осциллятор покоился в положе
dx
нии равновесия, x =
= 0. Легко построить решение задачи (ср. § VII.5)
dt
x=

1
mω 0

t

∫ sin ω 0 ( t − τ ) f ( τ ) dτ.

−∞

547

Это решение построено с помощью функции Грина этой задачи: тол
чок, т.е. сила δ(t − τ), подействовавший на покоящийся осциллятор,
1
придает ему скорость , и начинаются свободные колебания,
m
1
x(t > τ) =
sin ω 0 (t − τ).
mω 0
Пусть сила f (t) действует в течение ограниченного времени, f = 0
при t > T . Как будет колебаться осциллятор по окончании действия
силы? Разложим
sin ω 0 ( t − τ ) = sin ω 0 t cosω 0 τ − cosω 0 t sin ω 0 τ,

получим
x( t ) =

T
T

1 
sin ω 0 t ∫ f ( τ )cosω 0 τ dτ − cosω 0 t ∫ f ( τ )sin ω 0 τ dτ .
mω 0 
−∞
−∞


T

яснo, что для того, чтобы получить слева C, т.е. Ce = Ce
взять F (ω) = Cδ(ω). По общему правилу

C
− iωt
∫ e dt = Cδ( −ω ) = Cδ(ω ),
2π −∞

ФОРМУЛЫ ПРЕОБРАЗОВАНИЯ ФУРЬЕ

Так как f (τ) = 0 при t > T , то можно вместо
0

∫ δ(ω ) ψ (ω ) dω = ψ (0 ),

§ 2]

∫ f (τ)cos ωτ dτ

писать

−∞



∫ f (τ)cos ωτ dτ; то же относится к интегралу с синусом. Вспоминая фор

−∞

мулы (11), получим для колебаний после окончания действия силы
x( t ) =


[A(ω 0 )sin ω 0 t + B(ω 0 )cosω 0 t]
mω 0

при

t >T.

(12)

Амплитуда незатухающих колебаний осциллятора с собственной час
тотой ω 0 по окончании действия силы равна
xm =



A 2 (ω 0 ) + B2 (ω 0 ) =
F (ω 0 ) .
mω 0
mω 0

(13)

Амплитуда зависит, следовательно, только от спектральной плотности
действующей силы F(ω) при резонансной частоте, т.е. при ω = ω 0 .
Это и доказывает сделанные в § 1 утверждения.
2
В физике часто называют спектральной плотностью именно F(ω) ,
а не F(ω). Если сила f (t) есть, например, давление в звуковой волне
2
или электрическое поле в электромагнитной волне, то F (ω) dω есть
величина, пропорциональная энергии звуковых или электромагнитных
колебаний, приходящихся на участок спектра от ω до ω + dω.
После элементарных преобразований можно переписать (12) в виде
π

[F (ω 0 ) e iω 0 t − F ( −ω 0 )e − iω 0 t ],

imω 0
 (t > T )
dx
iω 0 t
− iω 0 t

+ F ( −ω 0 )e
]
m
= π [F (ω 0 ) e

dt
x( t ) =

(14)

548

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Попробуем решить задачу о колебаниях осциллятора непосредственно
с помощью интеграла Фурье. Для этого запишем
+∞

x( t ) =

∫ X(ω ) e

iω t



§ 3]

ПРИЧИННОСТЬ И ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ

F2 (ω) = F1 (ω)e iϕ( ω ) , где ϕ — любая вещественная функция. Таким
двум Фурье7образам соответствуют различного вида f1 (t) и f2 (t):
f1 ( t ) = ∫ F1 (ω ) e iω t dω,

(15)

−∞

и подставим это выражение в уравнение колебаний. Чтобы не за бо7
титься об условии покоя при t = −∞, рассмотрим осциллятор с затуха7
нием: ясно, что движение такого осциллятора не зависит от того, что
было в далеком прошлом.
Итак, мы рассматриваем уравнение
m

d 2x
dx
= − mω 20 x − h
+ f ( t ).
dt
dt 2

∫ X(ω )( −mω

−∞

2

+ mω 02 + iωh )e iω t dω =

+∞

∫ F (ω ) e

f2 ( t ) = ∫ F2 (ω ) e iω t dω.

Однако если f (t) есть давление воздуха в звуковой волне, то наш слух
воспримет одинаковые звуки, не сумеет отличить f1 (t) и f2 (t). Чтобы
отличить f1 от f2 , кривую f (t) нужно записать быстродействую7
щим манометром. Лишь в последнее время начались энергичные поис7
ки способов изучения фазы F(ω) в случае световых волн.
К вопросу о роли фазы мы вернемся в § 8.
Упражнения

(16)

−α t

1. Найдите спектральную плотность функции f ( t ) = e
(α > 0 ). Перей7
дя к пределу при α → +0, получите спектральную плотность функции f ( t ) ≡ 1.
Из формулы (4) для этого примера выведите формулу (I.1).
2. Получите в явной форме ограниченное при t → ±∞ решение уравнения
(16).

Подставляя x и f в виде Фурье7интегралов, получим
+∞

549

iω t

dω.

−∞

Отсюда сразу находим

§ 3. Причинность и дисперсионные соотношения
F (ω )
.
X (ω ) =
m(ω 20 − ω 2 ) + iωh

(17)

Если затухание малo´, то X(ω) особенно велико при тех значениях ω,
при которых в знаменателе остается только малая величина iωh. Это
происходит при ω 20 − ω 2 = 0, т.е. при ω = ±ω 0 . Следовательно,
в Фурье7образе функции x(t) особенно велики X(ω 0 ) и X(−ω 0 ).
В пределе при незатухающих колебаниях, т.е. при h → 0, методами тео7
рии комплексного переменного можно получить из (15) и (17) выраже7
ние (14). Подробнее мы на этом здесь не останавливаемся.
Последнее замечание, относящееся к спектральному анализу, заклю7
чается в том, что приборы обычно регистрируют только а м п л и т у д у
колебания различной частоты. Согласно (13) это значит, что определя7
ется только абсолютная величина* (модуль) Фурье7образа исследуе7
мой силы F(ω) . Это относится к уху как регистратору звуковых
колебаний, и к глазу, и к спектроскопу: ведь в спектроскопе определяет7
ся только интенсивность света различной частоты.
При этом мы теряем информацию, теряем сведения о фазе F(ω).
Представим еебе, например, две функции F1 (ω) и F2 (ω) такие, что
F1 (ω) = F2 (ω) , но сами F1 и F2 различны. Это значит, что

* Напомним, что для вещественной силы F (−ω) = F * (ω), так что F (−ω) ≡ F (ω) ,
знак ω несуществен, достаточно рассмотреть ω > 0.

В § VII.5 мы видели, что решение уравнения (16) получается из ре7
шения G(t, τ) (так называемой функции Грина) аналогичного уравне7
ния со специальным неоднородным членом
m

d 2x
dx
+h
+ mω 20 x = δ( t − τ )
dt
dt 2

по формуле


x( t ) = ∫ G ( t, τ ) f ( τ ) dτ.
−∞

На основании § VI.2 подобный же вид имеет решение любой линейной
задачи; при этом f (t) играет роль входного сигнала, a x(t) — роль
«отклика» рассматриваемой системы на этот сигнал. Функция G(t; τ)
тогда представляет собой отклик на единичный мгновенный импульс,
подействовавший на систему в момент τ.
В § VI.2 мы видели, что аналогичный вид имеет результат возде7
йствия на линейную систему и в случае, когда независимой перемен7
ной служит пространственная координата (именно этот случай там
разбирался более подробно). Оказывается, что если независимой пере7
менной служит время с его специфической односторонней направлен7
ностью, то соответствующая функция Грина обладает важными
свойствами совершенно общего характера, к обсуждению которых мы
сейчас переходим.

548

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Попробуем решить задачу о колебаниях осциллятора непосредственно
с помощью интеграла Фурье. Для этого запишем
+∞

x( t ) =

∫ X(ω ) e

iω t



§ 3]

ПРИЧИННОСТЬ И ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ

F2 (ω) = F1 (ω)e iϕ( ω ) , где ϕ — любая вещественная функция. Таким
двум Фурье7образам соответствуют различного вида f1 (t) и f2 (t):
f1 ( t ) = ∫ F1 (ω ) e iω t dω,

(15)

−∞

и подставим это выражение в уравнение колебаний. Чтобы не за бо7
титься об условии покоя при t = −∞, рассмотрим осциллятор с затуха7
нием: ясно, что движение такого осциллятора не зависит от того, что
было в далеком прошлом.
Итак, мы рассматриваем уравнение
m

d 2x
dx
= − mω 20 x − h
+ f ( t ).
dt
dt 2

∫ X(ω )( −mω

−∞

2

+ mω 02 + iωh )e iω t dω =

+∞

∫ F (ω ) e

f2 ( t ) = ∫ F2 (ω ) e iω t dω.

Однако если f (t) есть давление воздуха в звуковой волне, то наш слух
воспримет одинаковые звуки, не сумеет отличить f1 (t) и f2 (t). Чтобы
отличить f1 от f2 , кривую f (t) нужно записать быстродействую7
щим манометром. Лишь в последнее время начались энергичные поис7
ки способов изучения фазы F(ω) в случае световых волн.
К вопросу о роли фазы мы вернемся в § 8.
Упражнения

(16)

−α t

1. Найдите спектральную плотность функции f ( t ) = e
(α > 0 ). Перей7
дя к пределу при α → +0, получите спектральную плотность функции f ( t ) ≡ 1.
Из формулы (4) для этого примера выведите формулу (I.1).
2. Получите в явной форме ограниченное при t → ±∞ решение уравнения
(16).

Подставляя x и f в виде Фурье7интегралов, получим
+∞

549

iω t

dω.

−∞

Отсюда сразу находим

§ 3. Причинность и дисперсионные соотношения
F (ω )
.
X (ω ) =
m(ω 20 − ω 2 ) + iωh

(17)

Если затухание малo´, то X(ω) особенно велико при тех значениях ω,
при которых в знаменателе остается только малая величина iωh. Это
происходит при ω 20 − ω 2 = 0, т.е. при ω = ±ω 0 . Следовательно,
в Фурье7образе функции x(t) особенно велики X(ω 0 ) и X(−ω 0 ).
В пределе при незатухающих колебаниях, т.е. при h → 0, методами тео7
рии комплексного переменного можно получить из (15) и (17) выраже7
ние (14). Подробнее мы на этом здесь не останавливаемся.
Последнее замечание, относящееся к спектральному анализу, заклю7
чается в том, что приборы обычно регистрируют только а м п л и т у д у
колебания различной частоты. Согласно (13) это значит, что определя7
ется только абсолютная величина* (модуль) Фурье7образа исследуе7
мой силы F(ω) . Это относится к уху как регистратору звуковых
колебаний, и к глазу, и к спектроскопу: ведь в спектроскопе определяет7
ся только интенсивность света различной частоты.
При этом мы теряем информацию, теряем сведения о фазе F(ω).
Представим еебе, например, две функции F1 (ω) и F2 (ω) такие, что
F1 (ω) = F2 (ω) , но сами F1 и F2 различны. Это значит, что

* Напомним, что для вещественной силы F (−ω) = F * (ω), так что F (−ω) ≡ F (ω) ,
знак ω несуществен, достаточно рассмотреть ω > 0.

В § VII.5 мы видели, что решение уравнения (16) получается из ре7
шения G(t, τ) (так называемой функции Грина) аналогичного уравне7
ния со специальным неоднородным членом
m

d 2x
dx
+h
+ mω 20 x = δ( t − τ )
dt
dt 2

по формуле


x( t ) = ∫ G ( t, τ ) f ( τ ) dτ.
−∞

На основании § VI.2 подобный же вид имеет решение любой линейной
задачи; при этом f (t) играет роль входного сигнала, a x(t) — роль
«отклика» рассматриваемой системы на этот сигнал. Функция G(t; τ)
тогда представляет собой отклик на единичный мгновенный импульс,
подействовавший на систему в момент τ.
В § VI.2 мы видели, что аналогичный вид имеет результат возде7
йствия на линейную систему и в случае, когда независимой перемен7
ной служит пространственная координата (именно этот случай там
разбирался более подробно). Оказывается, что если независимой пере7
менной служит время с его специфической односторонней направлен7
ностью, то соответствующая функция Грина обладает важными
свойствами совершенно общего характера, к обсуждению которых мы
сейчас переходим.

550

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Если параметры рассматриваемой линейной системы (например,
осциллятора), на которую воздействуют сигналы, не меняются с течением
времени, то все воздействия и соответствующие отклики допускают про
извольный сдвиг во времени. Это значит, что тогда G = G(t − τ) и потому


x( t ) = ∫ G ( t − τ ) f ( τ ) dτ.

(18)

−∞

Введем в рассмотрение спектральные плотности функций x(t), f (t)
и 2πG(t) (множитель 2π поставлен для упрощения последующих
формул):
x( t ) = ∫ X (ω ) e iω t dω,
f ( t ) = ∫ F (ω ) e iω t dω,

2πG ( t ) = ∫ L(ω ) e iω t dω,

(19)

все интегралы берутся от −∞ до ∞. Естественно, что при этом мы бу
дем считать все участвующие функции времени конечными при
t → ±∞, так как только для таких функций мы рассматриваем
Фурьепредставление. (Это требование конечности неявно фигуриро
вало и при построении решения (17), именно оно выделило нужное
нам решение уравнения (16) из двухпараметрического семейства всех
его решений.) Подставляя (19) в (18) и меняя порядок интегрирова
ния, получим

∫ X(ω ) e

iω t

[

]

dω = ∫ G ( t − τ )∫ F (ω )e iω τ dω dτ =

[∫ G ( t − τ) e

= ∫∫ G ( t − τ )F (ω )e iω τ dω dτ = ∫ F (ω )

iω τ

]

dτ dω.

Положив здесь t − τ = τ1 , получим

∫ F (ω )[∫ G ( τ1 ) e

iω ( t − τ 1 )

]

dτ1 dω =

= ∫ F (ω ) e

iω t

1

− iω τ 1
dτ1  dω = ∫ F (ω ) L(ω ) e iω t dω.
 ∫ [2 πG ( τ1 )] e
2 π


Сравнивая последний интеграл с исходным, заключаем, что

Итак, Фурьеобразы входного и выходного сигналов связаны очень
просто: второй получается из первого умножением на передаточную
функцию L(ω). Например, из формулы (17) видно, что для простейше
го линейного осциллятора передаточная функция имеет вид
1
.
m(ω 20 − ω 2 ) + ihω

ПРИЧИННОСТЬ И ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ

(20)

551

Обратно, задаваясь передаточной функцией L(ω) и вычисляя
функцию Грина G(t), можно перейти к формуле (18) для преобразова
ния сигналов. При этом возникает следующий интересный вопрос.
Пусть L(ω) представляет собой передаточную функцию р е а л ь н о г о
преобразователя сигналов. Тогда должен выполняться закон причин
ности, согласно которому отклик не должен возникнуть раньше, чем
был послан сигнал. Математически этот закон равносилен требованию,
чтобы G(t − τ) ≡ 0 при t < τ, т.е. G(t) ≡ 0 при t < 0. (Поэтому верхний
предел интеграла (18) для реальных систем равен не ∞, а t, как мы
и писали в § VII.5.) Каким требованиям должна удовлетворять функ
ция L(ω), чтобы выполнялся закон причинности? Естественно, что та
кие требования надо положить в основу теории даже до вывода
соответствующих уравнений.
Ограничимся для простоты случаем, когда L(ω) имеет вид отно
P(ω)
, причем степень знаменателя пре
шения многочленов: L(ω) =
Q (ω)
восходит степень числителя по крайней мере на 2. (На самом деле
аналогичные рассмотрения можно провести для значительно более
широкого класса функций L(ω).) Кроме того, будем считать, что Q(ω)
не имеет вещественных нулей. Тогда для вычисления интеграла


G(t ) =

1
iωt
∫ L(ω ) e dω
2π −∞

при t > 0 можно применить в точности тот самый прием, посредством
которого мы вычислили интеграл (V.36), однако взамен комплексной
плоскости z теперь надо рассматривать комплексную плоскость ω.
При этом «замыкающая» полуокружность проводится, подобно
рис. 67, в верхней полуплоскости ω, так как при t > 0 в этой полуплос
кости будет e iωt 1 (тогда как в нижней полуплоскости e iωt при
нимает как угодно большие значения). На основании общей теоремы
(V.31) о вычетах получаем, что при t > 0
G(t ) = i



Выч ω = ω

lm ω k > 0

X (ω ) = L(ω )F (ω ).

L(ω ) =

§ 3]

{L(ω ) e }
iωt

k

( t > 0 ),

(21)

причем в правой части суммирование производится по всем особым
точкам (полюсам) функции L(ω), т.е. нулям многочлена Q(ω), лежа
щим в верхней полуплоскости, lmω > 0.
Аналогично рассматривается случай t < 0. Тогда на рис. 67 надо вос
пользоваться не верхней, а нижней полуокружностью, что даст
G ( t ) = −i



Выч ω = ω

lm ω k < 0

{L(ω ) e }
iωt

k

( t < 0 ).

(22)

550

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Если параметры рассматриваемой линейной системы (например,
осциллятора), на которую воздействуют сигналы, не меняются с течением
времени, то все воздействия и соответствующие отклики допускают про
извольный сдвиг во времени. Это значит, что тогда G = G(t − τ) и потому


x( t ) = ∫ G ( t − τ ) f ( τ ) dτ.

(18)

−∞

Введем в рассмотрение спектральные плотности функций x(t), f (t)
и 2πG(t) (множитель 2π поставлен для упрощения последующих
формул):
x( t ) = ∫ X (ω ) e iω t dω,
f ( t ) = ∫ F (ω ) e iω t dω,

2πG ( t ) = ∫ L(ω ) e iω t dω,

(19)

все интегралы берутся от −∞ до ∞. Естественно, что при этом мы бу
дем считать все участвующие функции времени конечными при
t → ±∞, так как только для таких функций мы рассматриваем
Фурьепредставление. (Это требование конечности неявно фигуриро
вало и при построении решения (17), именно оно выделило нужное
нам решение уравнения (16) из двухпараметрического семейства всех
его решений.) Подставляя (19) в (18) и меняя порядок интегрирова
ния, получим

∫ X(ω ) e

iω t

[

]

dω = ∫ G ( t − τ )∫ F (ω )e iω τ dω dτ =

[∫ G ( t − τ) e

= ∫∫ G ( t − τ )F (ω )e iω τ dω dτ = ∫ F (ω )

iω τ

]

dτ dω.

Положив здесь t − τ = τ1 , получим

∫ F (ω )[∫ G ( τ1 ) e

iω ( t − τ 1 )

]

dτ1 dω =

= ∫ F (ω ) e

iω t

1

− iω τ 1
dτ1  dω = ∫ F (ω ) L(ω ) e iω t dω.
 ∫ [2 πG ( τ1 )] e
2 π


Сравнивая последний интеграл с исходным, заключаем, что

Итак, Фурьеобразы входного и выходного сигналов связаны очень
просто: второй получается из первого умножением на передаточную
функцию L(ω). Например, из формулы (17) видно, что для простейше
го линейного осциллятора передаточная функция имеет вид
1
.
m(ω 20 − ω 2 ) + ihω

ПРИЧИННОСТЬ И ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ

(20)

551

Обратно, задаваясь передаточной функцией L(ω) и вычисляя
функцию Грина G(t), можно перейти к формуле (18) для преобразова
ния сигналов. При этом возникает следующий интересный вопрос.
Пусть L(ω) представляет собой передаточную функцию р е а л ь н о г о
преобразователя сигналов. Тогда должен выполняться закон причин
ности, согласно которому отклик не должен возникнуть раньше, чем
был послан сигнал. Математически этот закон равносилен требованию,
чтобы G(t − τ) ≡ 0 при t < τ, т.е. G(t) ≡ 0 при t < 0. (Поэтому верхний
предел интеграла (18) для реальных систем равен не ∞, а t, как мы
и писали в § VII.5.) Каким требованиям должна удовлетворять функ
ция L(ω), чтобы выполнялся закон причинности? Естественно, что та
кие требования надо положить в основу теории даже до вывода
соответствующих уравнений.
Ограничимся для простоты случаем, когда L(ω) имеет вид отно
P(ω)
, причем степень знаменателя пре
шения многочленов: L(ω) =
Q (ω)
восходит степень числителя по крайней мере на 2. (На самом деле
аналогичные рассмотрения можно провести для значительно более
широкого класса функций L(ω).) Кроме того, будем считать, что Q(ω)
не имеет вещественных нулей. Тогда для вычисления интеграла


G(t ) =

1
iωt
∫ L(ω ) e dω
2π −∞

при t > 0 можно применить в точности тот самый прием, посредством
которого мы вычислили интеграл (V.36), однако взамен комплексной
плоскости z теперь надо рассматривать комплексную плоскость ω.
При этом «замыкающая» полуокружность проводится, подобно
рис. 67, в верхней полуплоскости ω, так как при t > 0 в этой полуплос
кости будет e iωt 1 (тогда как в нижней полуплоскости e iωt при
нимает как угодно большие значения). На основании общей теоремы
(V.31) о вычетах получаем, что при t > 0
G(t ) = i



Выч ω = ω

lm ω k > 0

X (ω ) = L(ω )F (ω ).

L(ω ) =

§ 3]

{L(ω ) e }
iωt

k

( t > 0 ),

(21)

причем в правой части суммирование производится по всем особым
точкам (полюсам) функции L(ω), т.е. нулям многочлена Q(ω), лежа
щим в верхней полуплоскости, lmω > 0.
Аналогично рассматривается случай t < 0. Тогда на рис. 67 надо вос
пользоваться не верхней, а нижней полуокружностью, что даст
G ( t ) = −i



Выч ω = ω

lm ω k < 0

{L(ω ) e }
iωt

k

( t < 0 ).

(22)

552

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Отсюда, в силу произвольности t, заключаем, что условием выпол%
нения закона причинности, т.е. G(t) ≡ 0 при t < 0, является отсутствие
особых точек у передаточной функции L(ω) в нижней полуплоскости:
lmω < 0. В частности, нетрудно проверить, что передаточная функция
(20) удовлетворяет этому условию.
Полученное условие можно истолковать еще следующим образом.
Так как функция влияния G(t) при t ≠ 0 удовлетворяет однородному
уравнению, то из формул (21) и (22) видно, что каждой особой точке
ω k = α k + iβ k передаточной функции отвечает слагаемое вида
iω t
− β t iα t
e k = e k e k в решениях однородного уравнения. Если
все ω k находятся в верхней полуплоскости, то все β k > 0, и потому все
эти слагаемые затухают при t → ∞. Так и должно быть, если система
только преобразует сигналы и не име%
ет собственных источников энергии.
Таким образом, физический эквива%
лент условия о расположении особых
точек передаточной функции состоит
во внутренней энергетической устой%
чивости системы, т.е. в затухании воз%
буждающейся в ней энергии. (Отме%
Рис. 195.
тим, что можно было бы рассматри%
вать и линейные системы с внутренними источниками энергии, т.е. не%
устойчивые; тогда для соблюдения закона причинности пришлось бы
отказаться от требования ограниченности решений при t → ∞.)
Можно указать еще одно важное условие, равносильное выполне%
нию закона причинности. Для вывода его рассмотрим интеграл
I=

L(ω )
dω,
ω
− ω0
(L )



(23)

распространенный по контуру рис. 195, где ω 0 — фиксированное ве%
щественное значение ω. Выполнение закона причинности равносиль%
но отсутствию особых точек внутри ( L), а потому, в силу
произвольности ω 0 , условию I = 0. Пусть теперь R → ∞, а радиус ма%
ленькой окружности ε → 0. Тогда, рассуждая как в § V.9, получим, что
интеграл по большой окружности стремится к нулю. Интеграл по гори%
зонтальным отрезкам стремится к


L(ω )
dω,
ω
− ω0
−∞

− V. p. ∫

(24)

где буквами V.p. (от английского value principal, главное значение) обозна%
чено так называемое главное значение по Коши, т.е., по определению,
⎡ω 0 − ε ∞ ⎤
L(ω )
dω = lim ⎢ ∫ + ∫ ⎥.
ω − ω0
ε→ 0 ⎢ −∞
−∞
ω 0 + ε⎥




V. p. ∫

§ 3]

ПРИЧИННОСТЬ И ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ

553

(Такое осложнение вызвано расходимостью интеграла (24) при ω = ω 0
в обычном смысле § III. 1.) Наконец, интеграл по маленькой полуок%
ружности стремится к
L(ω 0 )∫


= − πiL(ω 0 ).
ω − ω0

Переходя в равенстве (23) к пределу при R → ∞, ε → 0, получаем

L(ω)
− V.p. ∫
dω − πiL(ω 0 ) = 0, т.е.
ω
−ω0
−∞


L(ω 0 ) =

i
L(ω )
V. p. ∫
dω.
π
ω
− ω0
−∞

Представляя L(ω) в виде Re L(ω) + i Im L(ω) и отделяя в последнем
равенстве вещественную часть от мнимой, получаем так называемые
дисперсионные соотношения для передаточной функции


Re L(ω 0 ) = −

1
Im L(ω )
dω,
V. p. ∫
π
ω − ω0
−∞


Im L(ω ) =

Re L(ω )
1
V. p. ∫
dω,
π
ω − ω0
−∞

эквивалентные, как мы видим, закону причинности. Эти соотношения
играют важную роль в квантовой механике. Они позволяют получить
полезные утверждения даже для систем, для которых соответствую%
щая теория еще не разработана, и потому вид уравнений неизвестен.
На законе причинности основана неосуществимость шуточного
приспособления, предложенного в статье Р. Х а г е д о р н а «Причин%
ность и дисперсионные соотношения» (Успехи физ. наук, 91 (1967),
стр. 151), для фотографирования в полной темноте, когда источник
света еще не включен. Пусть в темноте произведена кратковременная
вспышка. Она описывается дельта%функцией, спектральное представ%
ление которой содержит гармоники вида e iωt , присутствующие во все
моменты времени. В статье предлагается установить фильтр, отсеиваю%
щий все гармоники, кроме какой%то определенной, в результате чего
мы получим монохроматический свет, действующий не только после,
но и до вспышки! Но это явно абсурдно, невозможность предлагаемого
фильтрования вытекает из закона причинности. Можно показать и на
основе дисперсионных соотношений, что фильтр, пропускающий лишь
одну частоту, невозможен. Закон пропускания всякого фильтра таков,
что сумма гармоник от любой вспышки должна тождественно равнять%
ся нулю до вспышки.

552

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Отсюда, в силу произвольности t, заключаем, что условием выпол%
нения закона причинности, т.е. G(t) ≡ 0 при t < 0, является отсутствие
особых точек у передаточной функции L(ω) в нижней полуплоскости:
lmω < 0. В частности, нетрудно проверить, что передаточная функция
(20) удовлетворяет этому условию.
Полученное условие можно истолковать еще следующим образом.
Так как функция влияния G(t) при t ≠ 0 удовлетворяет однородному
уравнению, то из формул (21) и (22) видно, что каждой особой точке
ω k = α k + iβ k передаточной функции отвечает слагаемое вида
iω t
− β t iα t
e k = e k e k в решениях однородного уравнения. Если
все ω k находятся в верхней полуплоскости, то все β k > 0, и потому все
эти слагаемые затухают при t → ∞. Так и должно быть, если система
только преобразует сигналы и не име%
ет собственных источников энергии.
Таким образом, физический эквива%
лент условия о расположении особых
точек передаточной функции состоит
во внутренней энергетической устой%
чивости системы, т.е. в затухании воз%
буждающейся в ней энергии. (Отме%
Рис. 195.
тим, что можно было бы рассматри%
вать и линейные системы с внутренними источниками энергии, т.е. не%
устойчивые; тогда для соблюдения закона причинности пришлось бы
отказаться от требования ограниченности решений при t → ∞.)
Можно указать еще одно важное условие, равносильное выполне%
нию закона причинности. Для вывода его рассмотрим интеграл
I=

L(ω )
dω,
ω
− ω0
(L )



(23)

распространенный по контуру рис. 195, где ω 0 — фиксированное ве%
щественное значение ω. Выполнение закона причинности равносиль%
но отсутствию особых точек внутри ( L), а потому, в силу
произвольности ω 0 , условию I = 0. Пусть теперь R → ∞, а радиус ма%
ленькой окружности ε → 0. Тогда, рассуждая как в § V.9, получим, что
интеграл по большой окружности стремится к нулю. Интеграл по гори%
зонтальным отрезкам стремится к


L(ω )
dω,
ω
− ω0
−∞

− V. p. ∫

(24)

где буквами V.p. (от английского value principal, главное значение) обозна%
чено так называемое главное значение по Коши, т.е., по определению,
⎡ω 0 − ε ∞ ⎤
L(ω )
dω = lim ⎢ ∫ + ∫ ⎥.
ω − ω0
ε→ 0 ⎢ −∞
−∞
ω 0 + ε⎥




V. p. ∫

§ 3]

ПРИЧИННОСТЬ И ДИСПЕРСИОННЫЕ СООТНОШЕНИЯ

553

(Такое осложнение вызвано расходимостью интеграла (24) при ω = ω 0
в обычном смысле § III. 1.) Наконец, интеграл по маленькой полуок%
ружности стремится к
L(ω 0 )∫


= − πiL(ω 0 ).
ω − ω0

Переходя в равенстве (23) к пределу при R → ∞, ε → 0, получаем

L(ω)
− V.p. ∫
dω − πiL(ω 0 ) = 0, т.е.
ω
−ω0
−∞


L(ω 0 ) =

i
L(ω )
V. p. ∫
dω.
π
ω
− ω0
−∞

Представляя L(ω) в виде Re L(ω) + i Im L(ω) и отделяя в последнем
равенстве вещественную часть от мнимой, получаем так называемые
дисперсионные соотношения для передаточной функции


Re L(ω 0 ) = −

1
Im L(ω )
dω,
V. p. ∫
π
ω − ω0
−∞


Im L(ω ) =

Re L(ω )
1
V. p. ∫
dω,
π
ω − ω0
−∞

эквивалентные, как мы видим, закону причинности. Эти соотношения
играют важную роль в квантовой механике. Они позволяют получить
полезные утверждения даже для систем, для которых соответствую%
щая теория еще не разработана, и потому вид уравнений неизвестен.
На законе причинности основана неосуществимость шуточного
приспособления, предложенного в статье Р. Х а г е д о р н а «Причин%
ность и дисперсионные соотношения» (Успехи физ. наук, 91 (1967),
стр. 151), для фотографирования в полной темноте, когда источник
света еще не включен. Пусть в темноте произведена кратковременная
вспышка. Она описывается дельта%функцией, спектральное представ%
ление которой содержит гармоники вида e iωt , присутствующие во все
моменты времени. В статье предлагается установить фильтр, отсеиваю%
щий все гармоники, кроме какой%то определенной, в результате чего
мы получим монохроматический свет, действующий не только после,
но и до вспышки! Но это явно абсурдно, невозможность предлагаемого
фильтрования вытекает из закона причинности. Можно показать и на
основе дисперсионных соотношений, что фильтр, пропускающий лишь
одну частоту, невозможен. Закон пропускания всякого фильтра таков,
что сумма гармоник от любой вспышки должна тождественно равнять%
ся нулю до вспышки.

554

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

§ 4. Свойства преобразования Фурье
Будем называть функцию f (t) прообразом, а соответствующую ей
функцию F(ω) — ее образом при преобразовании Фурье. Само преоб
разование Фурье (иначе говорят оператор Фурье, ср. § VI.2) определя
ется формулой (10), по ней мы переходим от прообраза к образу.
Формула (4), по которой мы переходим от образа к прообразу, опреде
ляет обратное преобразование Фурье.
Рассмотрим некоторые свойства преобразования Фурье. Прежде все
го оно линейно, т.е. при сложении прообразов складываются и образы,
при умножении прообраза на константу образ множится на ту же кон
станту. Это свойство сразу вытекает из аналогичных свойств интеграла
и было уже, по существу, применено нами в § 2, когда мы воспользовались
принципом суперпозиции при выводе формулы (10). (Физически оно
вытекает из линейности рассматриваемых осцилляторов.) Естественно,
что и обратное преобразование также является линейным.
При «сдвиге» прообраза на постоянную a его образ умножается на
e − iaω . В самом деле, после сдвига получается функция f (t − a), а ее
спектральная плотность равна




1
1
− iω ( τ + a )
− iωt
dτ =
∫ f ( t − a ) e dt = 2 π ∫ f ( τ ) e
2 π −∞
−∞
= e − iωa



1
− iωτ
− iaω
∫ f ( τ ) e dτ = e F (ω )
2 π −∞

(сделана подстановка t − a = τ).
Это свойство особенно ясно на отдельных гармониках: ведь если
гармонику e iω 0 t сдвинуть на а, то получится e iω 0 ( t − a ) = e − iaω 0 e iω 0 t ,
т.е. она умножится на e − iaω 0 ; поэтому и ее образ, т.е. δ (ω − ω 0 ), умно
жится на e − iaω 0 или, что то же для этой функции, на e − iaω . А посколь
ку все эти образы получают одинаковый множитель, то и их сумма, т.е.
F(ω), получит тот же множитель.
Аналогично проверяется, что если образ сдвинуть на а, то прообраз
умножится на e i at . Именно это свойство инвариантности, с точностью
до постоянного множителя, функции e i ωt относительно сдвигов,
вместе с возможностью суперпозиции, и является причиной того, что
эта функция играет такую роль в преобразовании Фурье. Естественно,
что при изучении процессов, подчиняющихся линейным уравнениям,
однородным во времени, надо опираться на функции, которые сами до
пускают сдвиг во времени*.
* При этом сами уравнения могут быть не только дифференциальными. Типичное
интегральное уравнение, однородное во времени:
f (t ) =



∫ k(t − τ) f (τ) dτ.

−∞

§ 4]

СВОЙСТВА ПРЕОБРАЗОВАНИЯ ФУРЬЕ

555

Более подробно, будем рассматривать преобразования семейства
решений поставленной задачи. Принято называть некоторую совокуп
ность преобразований группой преобразований, если она вместе с лю
быми
двумя
преобразованиями
содержит
преобразование,
получающееся в результате их последовательного выполнения, и вмес
те с каждым преобразованием содержит обратное преобразование.
Например, группу преобразований образует совокупность умножений
на константы, отличные от нуля (последнее нужно для существования
обратного преобразования); при этом преобразовании каждая функ
ция f (t) переходит в Cf (t). Другим важным примером служит группа
сдвигов, при которых каждая функция f (t) переходит в f (t + τ) (по
стоянная τ 0 определяет сдвиг). Если изучается линейная задача, од
<
нородная во времени, то ее общее решение (т.е. семейство всех
решений) должно быть инвариантным относительно обеих этих групп
преобразований. В линейной алгебре доказывается, что это общее ре
шение, включающее, вообще говоря, много параметров, можно пред
ставить в виде суммыоднопараметрических семейств решений, причем
эти семейства также инвариантны относительно указанных групп пре
образований (исключения будут указаны ниже).
Однако нетрудно проверить, что однопараметрическое семейство
функций, обладающее такой инвариантностью, обязательно имеет вид
Ce pt (С произвольно, оно служит параметром внутри семейства, р
фиксировано, оно служит параметром самого семейства). В самом
деле, так как семейство однопараметрическое и инвариантное относи
тельно умножения на постоянные, то оно исчерпывается функциями
вида Cf (t), где C произвольное, а f (t) — какаято одна функция се
мейства. Но из инвариантности относительно сдвигов вытекает, что
f (t + τ) = C τ f (t), откуда
f ′( t ) = lim

τ→ 0

f (t + τ) − f (t )
C f(t ) − f(t ) 
C − 1
= lim τ
=  lim τ
f ( t ).
τ→ 0
τ
τ
 τ → 0 τ 

Обозначив предел, стоящий в квадратных скобках, буквой р, прихо
дим к дифференциальному уравнению f ′(t) = pf (t), откуда f (t) = e pt ,
с точностью до постоянного множителя.
Отсюда получаем, что если семейство функций инвариантно отно
сительно обеих указанных групп преобразований и имеет, например,
две степени свободы, то оно имеет вид C1 e p 1 t + C2 e p 2 t , где C1 и C2 —
произвольные постоянные. Однако если изучаемая задача содержит
параметры и при некоторых значениях этих параметров получится
p1 = p2 , то вид двухпараметрического семейства решений меняется.
В этом случае аналогично § VII.3 можно показать, что указанное семей
ство приобретает вид C1 e p 1 t + C2 te p 1 t . (При этом однопараметрическое

554

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

§ 4. Свойства преобразования Фурье
Будем называть функцию f (t) прообразом, а соответствующую ей
функцию F(ω) — ее образом при преобразовании Фурье. Само преоб
разование Фурье (иначе говорят оператор Фурье, ср. § VI.2) определя
ется формулой (10), по ней мы переходим от прообраза к образу.
Формула (4), по которой мы переходим от образа к прообразу, опреде
ляет обратное преобразование Фурье.
Рассмотрим некоторые свойства преобразования Фурье. Прежде все
го оно линейно, т.е. при сложении прообразов складываются и образы,
при умножении прообраза на константу образ множится на ту же кон
станту. Это свойство сразу вытекает из аналогичных свойств интеграла
и было уже, по существу, применено нами в § 2, когда мы воспользовались
принципом суперпозиции при выводе формулы (10). (Физически оно
вытекает из линейности рассматриваемых осцилляторов.) Естественно,
что и обратное преобразование также является линейным.
При «сдвиге» прообраза на постоянную a его образ умножается на
e − iaω . В самом деле, после сдвига получается функция f (t − a), а ее
спектральная плотность равна




1
1
− iω ( τ + a )
− iωt
dτ =
∫ f ( t − a ) e dt = 2 π ∫ f ( τ ) e
2 π −∞
−∞
= e − iωa



1
− iωτ
− iaω
∫ f ( τ ) e dτ = e F (ω )
2 π −∞

(сделана подстановка t − a = τ).
Это свойство особенно ясно на отдельных гармониках: ведь если
гармонику e iω 0 t сдвинуть на а, то получится e iω 0 ( t − a ) = e − iaω 0 e iω 0 t ,
т.е. она умножится на e − iaω 0 ; поэтому и ее образ, т.е. δ (ω − ω 0 ), умно
жится на e − iaω 0 или, что то же для этой функции, на e − iaω . А посколь
ку все эти образы получают одинаковый множитель, то и их сумма, т.е.
F(ω), получит тот же множитель.
Аналогично проверяется, что если образ сдвинуть на а, то прообраз
умножится на e i at . Именно это свойство инвариантности, с точностью
до постоянного множителя, функции e i ωt относительно сдвигов,
вместе с возможностью суперпозиции, и является причиной того, что
эта функция играет такую роль в преобразовании Фурье. Естественно,
что при изучении процессов, подчиняющихся линейным уравнениям,
однородным во времени, надо опираться на функции, которые сами до
пускают сдвиг во времени*.
* При этом сами уравнения могут быть не только дифференциальными. Типичное
интегральное уравнение, однородное во времени:
f (t ) =



∫ k(t − τ) f (τ) dτ.

−∞

§ 4]

СВОЙСТВА ПРЕОБРАЗОВАНИЯ ФУРЬЕ

555

Более подробно, будем рассматривать преобразования семейства
решений поставленной задачи. Принято называть некоторую совокуп
ность преобразований группой преобразований, если она вместе с лю
быми
двумя
преобразованиями
содержит
преобразование,
получающееся в результате их последовательного выполнения, и вмес
те с каждым преобразованием содержит обратное преобразование.
Например, группу преобразований образует совокупность умножений
на константы, отличные от нуля (последнее нужно для существования
обратного преобразования); при этом преобразовании каждая функ
ция f (t) переходит в Cf (t). Другим важным примером служит группа
сдвигов, при которых каждая функция f (t) переходит в f (t + τ) (по
стоянная τ 0 определяет сдвиг). Если изучается линейная задача, од
<
нородная во времени, то ее общее решение (т.е. семейство всех
решений) должно быть инвариантным относительно обеих этих групп
преобразований. В линейной алгебре доказывается, что это общее ре
шение, включающее, вообще говоря, много параметров, можно пред
ставить в виде суммы однопараметрических семейств решений, причем
эти семейства также инвариантны относительно указанных групп пре
образований (исключения будут указаны ниже).
Однако нетрудно проверить, что однопараметрическое семейство
функций, обладающее такой инвариантностью, обязательно имеет вид
Ce pt (С произвольно, оно служит параметром внутри семейства, р
фиксировано, оно служит параметром самого семейства). В самом
деле, так как семейство однопараметрическое и инвариантное относи
тельно умножения на постоянные, то оно исчерпывается функциями
вида Cf (t), где C произвольное, а f (t) — какаято одна функция се
мейства. Но из инвариантности относительно сдвигов вытекает, что
f (t + τ) = C τ f (t), откуда
f ′( t ) = lim

τ→ 0

f (t + τ) − f (t )
C f(t ) − f(t ) 
C − 1
= lim τ
=  lim τ
f ( t ).
τ→ 0
τ
τ
 τ → 0 τ 

Обозначив предел, стоящий в квадратных скобках, буквой р, прихо
дим к дифференциальному уравнению f ′(t) = pf (t), откуда f (t) = e pt ,
с точностью до постоянного множителя.
Отсюда получаем, что если семейство функций инвариантно отно
сительно обеих указанных групп преобразований и имеет, например,
две степени свободы, то оно имеет вид C1 e p 1 t + C2 e p 2 t , где C1 и C2 —
произвольные постоянные. Однако если изучаемая задача содержит
параметры и при некоторых значениях этих параметров получится
p1 = p2 , то вид двухпараметрического семейства решений меняется.
В этом случае аналогично § VII.3 можно показать, что указанное семей
ство приобретает вид C1 e p 1 t + C2 te p 1 t . (При этом однопараметрическое

556

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

семейство C2 te p 1 t само по себе не инвариантно относительно сдвигов.)
Если совпадают три значения p1 = p2 = p3 , то трехпараметрическое се
мейство решений приобретает вид C1 e p 1 t + C2 te p 1 t + C 3 t 2 e p 1 t и т.д.
Из доказанных свойств следует, что при дифференцировании
функции f (t) ее Фурьеобраз умножается на iω. В самом деле, обра
f (t + h) − f (t)
служит
зом функции
h


e ihω − 1
(iω )2
1 ihω
1
e F (ω ) − F (ω ) =
F (ω ) = iω +
h + ... F (ω ).
h
h
h
2



Переходя к пределу при h → 0, получаем наше утверждение. Ана
логично проверяется, что при дифференцировании образа прообраз
умножается на −it. В этих свойствах можно убедиться и непосре
дственно, составляя производную от интеграла по параметру,
df d
=
F (ω ) e iωt dt = ∫ iω F (ω ) e iωt dt
dt dt ∫

1
f ( t ) e − iωt dt,
2π ∫

dF
i
=−
tf ( t ) e − iωt dt.

2π ∫

( − mω + hωi +

mω 20 )X (ω) = 0,

= C1 (ω 2 − ω 20 )δ (ω − ω 0 ) + C 2 (ω 2 − ω 20 )δ (ω + ω 0 ) =
= C1 (ω 20 − ω 20 )δ (ω − ω 0 ) + C 2 [( −ω 0 )2 − ω 20 ] δ (ω + ω 0 ) = 0.

Из (27) по формуле обращения (4) получаем
x( t ) = ∫ [C1δ (ω − ω 0 ) + C 2δ (ω + ω 0 )] e iωt dω = C1 e iω 0 t + C 2 e − iω 0 t .

Мы приходим к решению, известному из § VII.3.
Рассмотрим теперь Фурьеобразы некоторых функций, о которых
говорилось в § VI.3; при этом оператор Фурье будем обозначать буквой
F . Формула (9) означает, что

F [δ( t )] =

1
;


N

т.е.

(ω 2 − ω 20 )X (ω) = 0.

(25)

График этой функции, умноженной на i, показан на рис. 196; при боль
1
шом N он часто осциллирует вокруг графика
. Поэтому на осно
πω
вании тех же соображений, что в § 2, естественно предположить, что

F [sign t] =

1
,
π iω

(26)

Могло бы показаться, что отсюда тоже вытекает X(ω) ≡ 0. Но на самом
деле уравнению (26) удовлетворяет функция
X (ω) = C1δ(ω − ω 0 ) + C 2δ(ω + ω 0 ),

(28)

N
 1 − cos ωN
 0 − iωt
.
− ∫ e dt + ∫ e − iωt dt  =
π iω

0
 − N

откуда X(ω) ≡ 0 и x(t) ≡ 0. Мы получаем только тривиальное (нуле
вое) решение. Решения, найденные нами в § VII.3, были неограничен
ными (экспоненциально большими) при t → −∞ и потому с помощью
преобразования Фурье они не получаются; поэтому и в § 2 при реше
нии уравнения (16) у нас получилось только одно решение, не включа
ющее произвольных постоянных. Пусть теперь трение отсутствует, т.е.
h = 0. Тогда взамен (25) получаем
( − mω 2 + mω 20 )X (ω) = 0,

557

(ω 2 − ω 20 )[C1δ(ω − ω 0 ) + C 2δ(ω + ω 0 )] =

1
1
sign t ⋅ e − iωt dt =

2π −N


Описанные свойства преобразования Фурье имеют замечательное
применение к решению линейных дифференциальных уравнений с по
стоянными коэффициентами. Мы использовали их в § 2 при рассмот
рении задачи о вынужденных колебаниях осциллятора с трением.
Интересно рассмотреть уравнение свободных колебаний, т.е. урав
нение (16) при f (t) ≡ 0. Совершая преобразование Фурье, получаем
2

СВОЙСТВА ПРЕОБРАЗОВАНИЯ ФУРЬЕ

нетрудно проверить, что, и обратно, F [1] = δ (ω).
Чтобы вычислить F [sign t] (см. § VI.3), заменим сначала в правой
части (10) пределы интегрирования на ±N , где N велико. Мы получим

и также для обратного преобразования
F (ω ) =

§ 4]

(27)

где C1 и C2 — произвольные постоянные. Действительно (см. § VI.1),

Рис. 196.

(29)

556

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

семейство C2 te p 1 t само по себе не инвариантно относительно сдвигов.)
Если совпадают три значения p1 = p2 = p3 , то трехпараметрическое се
мейство решений приобретает вид C1 e p 1 t + C2 te p 1 t + C 3 t 2 e p 1 t и т.д.
Из доказанных свойств следует, что при дифференцировании
функции f (t) ее Фурьеобраз умножается на iω. В самом деле, обра
f (t + h) − f (t)
служит
зом функции
h


e ihω − 1
(iω )2
1 ihω
1
e F (ω ) − F (ω ) =
F (ω ) = iω +
h + ... F (ω ).
h
h
h
2



Переходя к пределу при h → 0, получаем наше утверждение. Ана
логично проверяется, что при дифференцировании образа прообраз
умножается на −it. В этих свойствах можно убедиться и непосре
дственно, составляя производную от интеграла по параметру,
df d
=
F (ω ) e iωt dt = ∫ iω F (ω ) e iωt dt
dt dt ∫

1
f ( t ) e − iωt dt,
2π ∫

dF
i
=−
tf ( t ) e − iωt dt.

2π ∫

( − mω + hωi +

mω 20 )X (ω) = 0,

= C1 (ω 2 − ω 20 )δ (ω − ω 0 ) + C 2 (ω 2 − ω 20 )δ (ω + ω 0 ) =
= C1 (ω 20 − ω 20 )δ (ω − ω 0 ) + C 2 [( −ω 0 )2 − ω 20 ] δ (ω + ω 0 ) = 0.

Из (27) по формуле обращения (4) получаем
x( t ) = ∫ [C1δ (ω − ω 0 ) + C 2δ (ω + ω 0 )] e iωt dω = C1 e iω 0 t + C 2 e − iω 0 t .

Мы приходим к решению, известному из § VII.3.
Рассмотрим теперь Фурьеобразы некоторых функций, о которых
говорилось в § VI.3; при этом оператор Фурье будем обозначать буквой
F . Формула (9) означает, что

F [δ( t )] =

1
;


N

т.е.

(ω 2 − ω 20 )X (ω) = 0.

(25)

График этой функции, умноженной на i, показан на рис. 196; при боль
1
шом N он часто осциллирует вокруг графика
. Поэтому на осно
πω
вании тех же соображений, что в § 2, естественно предположить, что

F [sign t] =

1
,
π iω

(26)

Могло бы показаться, что отсюда тоже вытекает X(ω) ≡ 0. Но на самом
деле уравнению (26) удовлетворяет функция
X (ω) = C1δ(ω − ω 0 ) + C 2δ(ω + ω 0 ),

(28)

N
 1 − cos ωN
 0 − iωt
.
− ∫ e dt + ∫ e − iωt dt  =
π iω

0
 − N

откуда X(ω) ≡ 0 и x(t) ≡ 0. Мы получаем только тривиальное (нуле
вое) решение. Решения, найденные нами в § VII.3, были неограничен
ными (экспоненциально большими) при t → −∞ и потому с помощью
преобразования Фурье они не получаются; поэтому и в § 2 при реше
нии уравнения (16) у нас получилось только одно решение, не включа
ющее произвольных постоянных. Пусть теперь трение отсутствует, т.е.
h = 0. Тогда взамен (25) получаем
( − mω 2 + mω 20 )X (ω) = 0,

557

(ω 2 − ω 20 )[C1δ(ω − ω 0 ) + C 2δ(ω + ω 0 )] =

1
1
sign t ⋅ e − iωt dt =

2π −N


Описанные свойства преобразования Фурье имеют замечательное
применение к решению линейных дифференциальных уравнений с по
стоянными коэффициентами. Мы использовали их в § 2 при рассмот
рении задачи о вынужденных колебаниях осциллятора с трением.
Интересно рассмотреть уравнение свободных колебаний, т.е. урав
нение (16) при f (t) ≡ 0. Совершая преобразование Фурье, получаем
2

СВОЙСТВА ПРЕОБРАЗОВАНИЯ ФУРЬЕ

нетрудно проверить, что, и обратно, F [1] = δ (ω).
Чтобы вычислить F [sign t] (см. § VI.3), заменим сначала в правой
части (10) пределы интегрирования на ±N , где N велико. Мы получим

и также для обратного преобразования
F (ω ) =

§ 4]

(27)

где C1 и C2 — произвольные постоянные. Действительно (см. § VI.1),

Рис. 196.

(29)

560

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

где sign t =

d t
dt

=

t
t

[Гл. XIV

§ 5] ПРЕОБРАЗОВАНИЕ КОЛОКОЛА И ПРИНЦИП НЕОПРЕДЕЛЕННОСТИ

561

. Значит,
F (ω ) =

1 i
2π ω



sign t
e − iωt dt.
t )2

∫ (1 +

−∞

(30)

Здесь подынтегральная функция уже имеет скачок при t = 0, равный 2,
поэтому вторичное интегрирование по частям дает дельта-слагаемое,
которое порождает главный член асимптотической формулы

Рис. 197.

выше, при как угодно большом фиксированном N функция
N

∞ − iωt
1 i ⎧
e
F (ω ) =
⎨− ∫
2 π ω ⎩⎪ −∞ −iω


−2 ⎤ ⎫
⎢2δ ( t ) +
⎥ dt ⎬ =
1
(
+
t )3 ⎦ ⎭

1⎡ 1
2
= ⎢ 2 − 2
π ⎢⎣ω


FN (ω ) =

аппроксимирующая F (ω) = F∞ (ω), при ω → ±∞ имеет порядок ω




1
− iωt
∫ (1 + t )3 e dt ⎥⎥.

−∞

(31)

Так как последний интеграл при ω → ±∞ стремится к нулю, то мы получаем асимптотическое выражение
F (ω ) ≈

1
,
πω 2

(32)

которое является более точным, чем общее утверждение, что F(ω) при
1
ω → ±∞ должно иметь порядок 2 .
ω
Выражение (32) можно уточнить с помощью повторного интегрирования по частям последнего интеграла в правой части (31). Вычисления, которые мы предоставляем читателю, дают
F (ω ) =



1 ⎡ 1
6
12
1
e − iωt dt ⎥,
⎢ 2 − 4 + 4 ∫
5
π ⎢⎣ω
ω
ω −∞ (1 + t )
⎥⎦

что приводит к асимптотическому выражению
F (ω ) ≈

1
π

6⎞
⎛ 1
⎜ 2 − 4 ⎟,
⎝ω
ω ⎠

более точному, чем (32). Этот процесс можно продолжать.
Остановимся еще на следующем вопросе. В § 5 будет показано, что
2
1
Фурье-образом функции f (t) = e − t служит функция F(ω) =
×
2 π
−ω2 4

2
1
e − t e − iωt dt,
2 π −∫N

. Здесь f (t) и ее производные совсем не имеют особенностей,
×e
поэтому и получилось, что F(ω) при ω → ±∞ стремится к нулю быстрее любой отрицательной степени ω . В то же время, в силу сказанного

−1

.

Как это согласовать?
Дело здесь в том, что при больших N коэффициенты разложения
функции FN (ω) по отрицательным степеням ω становятся весьма
малыми, так что члены с ω −1 , ω −2 и т.д. в пределе пропадают. Это разложение легко получить с помощью интегрирования по частям, оно начинается с членов
FN (ω )~

2 cos Nω
1 − N 2 sin Nω 2
e
− Ne − N
+ ...
π
ω
π
ω2

Например, уже при N = 5 коэффициент при ω −1 имеет порядок
10 −12 , т.е. весьма мал. Графики функций F(ω) и FN (ω) схематически
показаны на рис. 197. Различие в характере их «крыльев» при больших N практически не играет роли, так как сами значения получаются
очень малыми.
Упражнения
1. Докажите, что если образом функции f ( t ) служит F (ω ), то образом
1 ⎛ ω⎞
функции f ( at ) ( a = const ) служит
F ⎜ ⎟.
a ⎝ a⎠
e

2. Пользуясь упражнением 1 к § 2, найдите Фурье-образы функций
−α t
te
,
(α > 0 ).
t

iβ t − α t − t 0

§ 5. Преобразование колокола и принцип неопределенности
Интересный пример преобразования Фурье дает функция
f ( t ) = Ce − at

2

(C , a = const > 0 )

(график ее имеет вид колокола, см. рис. 187). Формула (10) дает


F (ω ) =



2
2
C
1
Ce − at e − iωt dt =
e − at − iωt dt.


2 π −∞
2 π −∞

(33)

560

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

где sign t =

d t
dt

=

t
t

[Гл. XIV

§ 5] ПРЕОБРАЗОВАНИЕ КОЛОКОЛА И ПРИНЦИП НЕОПРЕДЕЛЕННОСТИ

561

. Значит,
F (ω ) =

1 i
2π ω



sign t
e − iωt dt.
t )2

∫ (1 +

−∞

(30)

Здесь подынтегральная функция уже имеет скачок при t = 0, равный 2,
поэтому вторичное интегрирование по частям дает дельта-слагаемое,
которое порождает главный член асимптотической формулы

Рис. 197.

выше, при как угодно большом фиксированном N функция
N

∞ − iωt
1 i ⎧
e
F (ω ) =
⎨− ∫
2 π ω ⎩⎪ −∞ −iω


−2 ⎤ ⎫
⎢2δ ( t ) +
⎥ dt ⎬ =
1
(
+
t )3 ⎦ ⎭

1⎡ 1
2
= ⎢ 2 − 2
π ⎢⎣ω


FN (ω ) =

аппроксимирующая F (ω) = F∞ (ω), при ω → ±∞ имеет порядок ω




1
− iωt
∫ (1 + t )3 e dt ⎥⎥.

−∞

(31)

Так как последний интеграл при ω → ±∞ стремится к нулю, то мы получаем асимптотическое выражение
F (ω ) ≈

1
,
πω 2

(32)

которое является более точным, чем общее утверждение, что F(ω) при
1
ω → ±∞ должно иметь порядок 2 .
ω
Выражение (32) можно уточнить с помощью повторного интегрирования по частям последнего интеграла в правой части (31). Вычисления, которые мы предоставляем читателю, дают
F (ω ) =



1 ⎡ 1
6
12
1
e − iωt dt ⎥,
⎢ 2 − 4 + 4 ∫
5
π ⎢⎣ω
ω
ω −∞ (1 + t )
⎥⎦

что приводит к асимптотическому выражению
F (ω ) ≈

1
π

6⎞
⎛ 1
⎜ 2 − 4 ⎟,
⎝ω
ω ⎠

более точному, чем (32). Этот процесс можно продолжать.
Остановимся еще на следующем вопросе. В § 5 будет показано, что
2
1
Фурье-образом функции f (t) = e − t служит функция F(ω) =
×
2 π
−ω2 4

2
1
e − t e − iωt dt,
2 π −∫N

. Здесь f (t) и ее производные совсем не имеют особенностей,
×e
поэтому и получилось, что F(ω) при ω → ±∞ стремится к нулю быстрее любой отрицательной степени ω . В то же время, в силу сказанного

−1

.

Как это согласовать?
Дело здесь в том, что при больших N коэффициенты разложения
функции FN (ω) по отрицательным степеням ω становятся весьма
малыми, так что члены с ω −1 , ω −2 и т.д. в пределе пропадают. Это разложение легко получить с помощью интегрирования по частям, оно начинается с членов
FN (ω )~

2 cos Nω
1 − N 2 sin Nω 2
e
− Ne − N
+ ...
π
ω
π
ω2

Например, уже при N = 5 коэффициент при ω −1 имеет порядок
10 −12 , т.е. весьма мал. Графики функций F(ω) и FN (ω) схематически
показаны на рис. 197. Различие в характере их «крыльев» при больших N практически не играет роли, так как сами значения получаются
очень малыми.
Упражнения
1. Докажите, что если образом функции f ( t ) служит F (ω ), то образом
1 ⎛ ω⎞
функции f ( at ) ( a = const ) служит
F ⎜ ⎟.
a ⎝ a⎠
e

2. Пользуясь упражнением 1 к § 2, найдите Фурье-образы функций
−α t
te
,
(α > 0 ).
t

iβ t − α t − t 0

§ 5. Преобразование колокола и принцип неопределенности
Интересный пример преобразования Фурье дает функция
f ( t ) = Ce − at

2

(C , a = const > 0 )

(график ее имеет вид колокола, см. рис. 187). Формула (10) дает


F (ω ) =



2
2
C
1
Ce − at e − iωt dt =
e − at − iωt dt.


2 π −∞
2 π −∞

(33)

562

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

2

ω2
iω 
iω 


− at 2 − iωt = − a  t 2 + t = − a  t +
 −


2a 
4a
a 


a  t +  = z , получаем
 2a 
iω 





2

ω2

∆t ∆ω = 8 = const.

ω2

−a t +



2
C
C

2a 
F (ω ) =
e
e 4 a dt =
e 4 a ∫ e − z dz,

2 π −∞
2π a
(L )

(34)

где ( L) — прямая в комплексной плоскости z, параллельная ве
ω
щественной оси и проходящая через точку z =
i = yi.
2 a
Сейчас мы покажем, что интеграл
2

−z
∫ e dz =

(L )



∫e

− ( x + iy ) 2

dx = I y

(35)

−∞

на самом деле не зависит от y. Для этого продифференцируем I y по
параметру y (см. § Ш.6), получим
∂I y
∂y



=



2
∂ − ( x + iy ) 2
e
dx = −2i ∫ e − ( x + iy ) ( x + iy ) dx.

y
−∞
−∞



Однако последний интеграл берeтся, т.е.
dI y
dy

= ie − ( x + iy )

2


x =−∞

= ie − x

2

+ y2

e −2 ixy


x =−∞

=0

(полученная после интегрирования функция обращается в нуль на об
оих пределах). Итак, I y = const = I y y = 0 . Полагая y = 0 в (35), мы
приводим к известному интегралу (§ IV.7), т.е.

∫e

(L )

−z2



dz =

∫e

−x 2

dx =

π.

−∞

Подставляя найденное значение в (34), находим спектральную
плотность «колокола» (33):
ω2


C
F (ω ) =
e 4a .
2 πa

563

в нуль. Тем не менее можно разумно определить ширину колокола (ср.
§ III.2). Например, если принять за ширину колокола тот его участок, на
котором его высота понижается в е раз от максимальной, то ширина ко
локола (33) равна ∆t = 2 a , тогда как ширина преобразованного коло
кола (36) равна ∆ω = 4 a. Таким образом, если менять a, то один из
колоколов становится уже, а другой — во столько же раз шире, так что

Преобразуя показатель по формуле

и обозначая

§ 5] ПРЕОБРАЗОВАНИЕ КОЛОКОЛА И ПРИНЦИП НЕОПРЕДЕЛЕННОСТИ

(36)

Мы видим, что зависимость плотности от ω получилась аналогичная,
колоколообразная, но с другими коэффициентами.
Из формул (33) и (36) вытекает важное следствие. Колоколообраз
ная функция ни при каком значении переменной не обращается точно

(37)

Можно показать, что аналогичное правило справедливо при любой
форме преобразуемых функций. Этот результат имеет принципиаль
ное значение. Допустим, что мы рассматриваем, как в § 2, воздействие,
силы f (t) на систему осцилляторов с различными собственными час
тотами. Мы видим, что чем более «локализована» (сжата) внешняя
сила во времени, тем более «размазан» ее спектр, т.е. тем большее число
осцилляторов с различными частотами эта сила возбудит с примерно
одинаковой амплитудой. Обратно, увеличивая эту избирательность, т.е.
сокращая спектр, мы вынуждены размазывать внешнее воздействие во
времени. Эта невозможность одновременно и локализовать внешнее
воздействие во времени и усилить избирательность этого воздействия —
одно из проявлений так называемого принципа неопределенности, иг
рающего фундаментальную роль в современной физике.
Из принципа неопределенности вытекает, в частности, что если неко
торая система колеблется с переменной частотой, то бессмысленно гово
рить о значении частоты в данный момент времени: например,
в акустике нельзя говорить о т о ч н о й высоте звука в данный момент
времени и т.п. Интервал времени, на протяжении которого определяется
эта частота, нельзя брать значительно меньшим периода колебаний, звук
определенной высоты не может продолжаться слишком мало времени!
В квантовой механике энергия частицы связана с частотой волно
вой функции. Волновая функция ψ частицы с определенной энергией
Е пропорциональна e − iEt h , где h = 105
, ⋅ 10 −27 эрг ⋅ сек — постоянная
Планка (сам Планк ввел в физику величину h = 66
, ⋅ 10 −27 эрг ⋅ сек;
удобнее писать формулы с h = h 2π). Если частица наблюдается в тече
ние малого интервала времени ∆t, то, как следует из предыдущего, час
тоту ее волновой функции, т.е. величину E h, можно узнать лишь с
малой точностью. Получается соотношение
∆E ⋅ ∆t имеет порядок h.

Аналогично у частицы с определенным количеством движения по оси
x, p = mv x , волновая функция пропорциональна e ipx h . Если известно,
что частица находится в определенном промежутке между x и x + ∆x,
то волновая функция частицы отлична от нуля только в этом проме
жутке. Раскладывая волновую функцию в интеграл Фурье, мы придем

562

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

2

ω2
iω 
iω 


− at 2 − iωt = − a  t 2 + t = − a  t +
 −


2a 
4a
a 


a  t +  = z , получаем
 2a 
iω 





2

ω2

∆t ∆ω = 8 = const.

ω2

−a t +



2
C
C

2a 
F (ω ) =
e
e 4 a dt =
e 4 a ∫ e − z dz,

2 π −∞
2π a
(L )

(34)

где ( L) — прямая в комплексной плоскости z, параллельная ве
ω
щественной оси и проходящая через точку z =
i = yi.
2 a
Сейчас мы покажем, что интеграл
2

−z
∫ e dz =

(L )



∫e

− ( x + iy ) 2

dx = I y

(35)

−∞

на самом деле не зависит от y. Для этого продифференцируем I y по
параметру y (см. § Ш.6), получим
∂I y
∂y



=



2
∂ − ( x + iy ) 2
e
dx = −2i ∫ e − ( x + iy ) ( x + iy ) dx.

y
−∞
−∞



Однако последний интеграл берeтся, т.е.
dI y
dy

= ie − ( x + iy )

2


x =−∞

= ie − x

2

+ y2

e −2 ixy


x =−∞

=0

(полученная после интегрирования функция обращается в нуль на об
оих пределах). Итак, I y = const = I y y = 0 . Полагая y = 0 в (35), мы
приводим к известному интегралу (§ IV.7), т.е.

∫e

(L )

−z2



dz =

∫e

−x 2

dx =

π.

−∞

Подставляя найденное значение в (34), находим спектральную
плотность «колокола» (33):
ω2


C
F (ω ) =
e 4a .
2 πa

563

в нуль. Тем не менее можно разумно определить ширину колокола (ср.
§ III.2). Например, если принять за ширину колокола тот его участок, на
котором его высота понижается в е раз от максимальной, то ширина ко
локола (33) равна ∆t = 2 a , тогда как ширина преобразованного коло
кола (36) равна ∆ω = 4 a. Таким образом, если менять a, то один из
колоколов становится уже, а другой — во столько же раз шире, так что

Преобразуя показатель по формуле

и обозначая

§ 5] ПРЕОБРАЗОВАНИЕ КОЛОКОЛА И ПРИНЦИП НЕОПРЕДЕЛЕННОСТИ

(36)

Мы видим, что зависимость плотности от ω получилась аналогичная,
колоколообразная, но с другими коэффициентами.
Из формул (33) и (36) вытекает важное следствие. Колоколообраз
ная функция ни при каком значении переменной не обращается точно

(37)

Можно показать, что аналогичное правило справедливо при любой
форме преобразуемых функций. Этот результат имеет принципиаль
ное значение. Допустим, что мы рассматриваем, как в § 2, воздействие,
силы f (t) на систему осцилляторов с различными собственными час
тотами. Мы видим, что чем более «локализована» (сжата) внешняя
сила во времени, тем более «размазан» ее спектр, т.е. тем большее число
осцилляторов с различными частотами эта сила возбудит с примерно
одинаковой амплитудой. Обратно, увеличивая эту избирательность, т.е.
сокращая спектр, мы вынуждены размазывать внешнее воздействие во
времени. Эта невозможность одновременно и локализовать внешнее
воздействие во времени и усилить избирательность этого воздействия —
одно из проявлений так называемого принципа неопределенности, иг
рающего фундаментальную роль в современной физике.
Из принципа неопределенности вытекает, в частности, что если неко
торая система колеблется с переменной частотой, то бессмысленно гово
рить о значении частоты в данный момент времени: например,
в акустике нельзя говорить о т о ч н о й высоте звука в данный момент
времени и т.п. Интервал времени, на протяжении которого определяется
эта частота, нельзя брать значительно меньшим периода колебаний, звук
определенной высоты не может продолжаться слишком мало времени!
В квантовой механике энергия частицы связана с частотой волно
вой функции. Волновая функция ψ частицы с определенной энергией
Е пропорциональна e − iEt h , где h = 105
, ⋅ 10 −27 эрг ⋅ сек — постоянная
Планка (сам Планк ввел в физику величину h = 66
, ⋅ 10 −27 эрг ⋅ сек;
удобнее писать формулы с h = h 2π). Если частица наблюдается в тече
ние малого интервала времени ∆t, то, как следует из предыдущего, час
тоту ее волновой функции, т.е. величину E h, можно узнать лишь с
малой точностью. Получается соотношение
∆E ⋅ ∆t имеет порядок h.

Аналогично у частицы с определенным количеством движения по оси
x, p = mv x , волновая функция пропорциональна e ipx h . Если известно,
что частица находится в определенном промежутке между x и x + ∆x,
то волновая функция частицы отлична от нуля только в этом проме
жутке. Раскладывая волновую функцию в интеграл Фурье, мы придем

564

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

к выводу, что количество движения частицы известно лишь с опреде'
ленной точностью Δp: в интеграле Фурье будут велики члены с e ipx h ,
где p1 < p < p1 + Δp. Из сказанного следует, что Δp ⋅ Δx имеет порядок h.
Из формул (33) и (36) на основании описанных в § 4 свойств преоб'
разования Фурье вытекает, что
если

f ( t ) = Ce

− at 2 + iω 0 t

,

то


C
F (ω ) =
e
2 πa

( ω −ω 0 ) 2
4a

§ 5] ПРЕОБРАЗОВАНИЕ КОЛОКОЛА И ПРИНЦИП НЕОПРЕДЕЛЕННОСТИ

(2 π )n −1 η =

1 − iωξ
,
e


т.е. в силу предыдущего абзаца среднее значение величины (2π) n −1 η
служит Фурье'образом функции распределения ϕ n (x) величины ξ.
В § XIII.7 мы видели, что при умножения независимых случайных
величин их средние значения также перемножаются. Значит,

.

Вещественная часть функции f (t) и функция F(ω) показаны на
рис. 198. Ширина Δt «волнового пакета» (определяемая аналогично
тому, как для функции (33)) и ширина Δω соответствующего спектра
связаны соотношением неопределенности (37), независимо от частоты
ω 0 колебаний. От этой частоты зависит сдвиг спектра по оси частот.

565

(2 π )n −1 η = (2 π )n −1 η1 η2 ... ηn = (2 π )n −1 [Φ(ω )]n .

Легко проверить, что функция Φ(ω) при ω = 0 имеет максимум.
В самом деле,


Φ(0 ) =

1
1
∫ ϕ ( x ) dx = 2 π ,
2 π −∞

тогда как при прочих ω


Φ(ω ) =





1
1
1
1
− iωx
− iωx
∫ e ϕ ( x ) dx  2 π ∫ e ϕ ( x ) dx = 2 π ∫ ϕ ( x ) dx = 2π .
2 π −∞
−∞
−∞

Однако на стр. 76–77 мы видели, что в этом случае функцию [Φ(ω)] n
2
при больших n можно приближенно заменить на Ae − cω , где
1
A = e nψ ( 0 ) , c = − nψ ′′(0), ψ(ω) = ln Φ(ω).
2
В нашем примере получаем
Рис. 198.

Отметим замечательное приложение преобразования колокола
к выводу нормального закона теории вероятностей (§ ХШ.8). Пусть
случайные величины ξ 1 , ξ 2 , . . . , ξ n независимы, но распределены
по одному и тому же закону с плотностью распределения ϕ(x); для
простоты будем считать, что среднее значение ξ1 = 0. Рассмотрим слу'
1 − iωξ k
чайную величину ηk =
, где ω — заданная вещественная по'
e

1 − i ωx
стоянная. Так как величина ηk принимает значения
с
e

плотностью вероятности ϕ(x), то ее среднее значение


1
− iωx
ηk =
∫ e ϕ( x ) dx = Φ(ω ),
2 π −∞

т.е. это как раз Фурье'образ функции ϕ(x).
Обозначив буквой η произведение величин ηk , получим
η = η1 η2 ... ηn =

1
e − iω ( ξ 1 + ξ 2 +
(2 π )n

... + ξn )

где обозначено ξ = ξ 1 + ξ 2 + ... + ξ n . Отсюда

=

1
e − iωξ ,
(2 π )n

Φ(0 ) =

1
,




Φ′(0 ) = 0,

Φ′′(0 ) = −

1
Δ2
x 2ϕ ( x ) dx = −

2 π −∞


(Δ2 — дисперсия величины ξ 1 , см. § XIII.8), откуда
ψ (0 ) = ln

1
,


ψ ′′(0 ) =

Φ′′(0 ) Φ (0 ) − [Φ′(0 )]2
= − Δ2
Φ 2 (0 )

и потому
(2 π )n −1 [Φ(ω )]n ≈ (2 π )n −1 e

n ln

1


e

1
− n Δ2 ω 2
2

1

=

1 − 2 n Δ2 ω 2
e
.


В силу сказанного выше, получился Фурье'образ функции ϕ n (x).
Как видим, он имеет вид колокола. Согласно формулам (33) и (36)
C
1 1
1
1
nΔ2
, C=
) полу'
, откуда a =
(в которых
= ,
=
2
2
2nΔ
2 π a 2π 4a
2πn Δ
чаем функцию распределения величины ξ:
ϕn(x) =

2
1
e−x
2 πn Δ

2 nΔ 2

.

Мы пришли к нормальному закону (XIII.25).

564

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

к выводу, что количество движения частицы известно лишь с опреде'
ленной точностью Δp: в интеграле Фурье будут велики члены с e ipx h ,
где p1 < p < p1 + Δp. Из сказанного следует, что Δp ⋅ Δx имеет порядок h.
Из формул (33) и (36) на основании описанных в § 4 свойств преоб'
разования Фурье вытекает, что
если

f ( t ) = Ce

− at 2 + iω 0 t

,

то


C
F (ω ) =
e
2 πa

( ω −ω 0 ) 2
4a

§ 5] ПРЕОБРАЗОВАНИЕ КОЛОКОЛА И ПРИНЦИП НЕОПРЕДЕЛЕННОСТИ

(2 π )n −1 η =

1 − iωξ
,
e


т.е. в силу предыдущего абзаца среднее значение величины (2π) n −1 η
служит Фурье'образом функции распределения ϕ n (x) величины ξ.
В § XIII.7 мы видели, что при умножения независимых случайных
величин их средние значения также перемножаются. Значит,

.

Вещественная часть функции f (t) и функция F(ω) показаны на
рис. 198. Ширина Δt «волнового пакета» (определяемая аналогично
тому, как для функции (33)) и ширина Δω соответствующего спектра
связаны соотношением неопределенности (37), независимо от частоты
ω 0 колебаний. От этой частоты зависит сдвиг спектра по оси частот.

565

(2 π )n −1 η = (2 π )n −1 η1 η2 ... ηn = (2 π )n −1 [Φ(ω )]n .

Легко проверить, что функция Φ(ω) при ω = 0 имеет максимум.
В самом деле,


Φ(0 ) =

1
1
∫ ϕ ( x ) dx = 2 π ,
2 π −∞

тогда как при прочих ω


Φ(ω ) =





1
1
1
1
− iωx
− iωx
∫ e ϕ ( x ) dx  2 π ∫ e ϕ ( x ) dx = 2 π ∫ ϕ ( x ) dx = 2π .
2 π −∞
−∞
−∞

Однако на стр. 76–77 мы видели, что в этом случае функцию [Φ(ω)] n
2
при больших n можно приближенно заменить на Ae − cω , где
1
A = e nψ ( 0 ) , c = − nψ ′′(0), ψ(ω) = ln Φ(ω).
2
В нашем примере получаем
Рис. 198.

Отметим замечательное приложение преобразования колокола
к выводу нормального закона теории вероятностей (§ ХШ.8). Пусть
случайные величины ξ 1 , ξ 2 , . . . , ξ n независимы, но распределены
по одному и тому же закону с плотностью распределения ϕ(x); для
простоты будем считать, что среднее значение ξ1 = 0. Рассмотрим слу'
1 − iωξ k
чайную величину ηk =
, где ω — заданная вещественная по'
e

1 − i ωx
стоянная. Так как величина ηk принимает значения
с
e

плотностью вероятности ϕ(x), то ее среднее значение


1
− iωx
ηk =
∫ e ϕ( x ) dx = Φ(ω ),
2 π −∞

т.е. это как раз Фурье'образ функции ϕ(x).
Обозначив буквой η произведение величин ηk , получим
η = η1 η2 ... ηn =

1
e − iω ( ξ 1 + ξ 2 +
(2 π )n

... + ξn )

где обозначено ξ = ξ 1 + ξ 2 + ... + ξ n . Отсюда

=

1
e − iωξ ,
(2 π )n

Φ(0 ) =

1
,




Φ′(0 ) = 0,

Φ′′(0 ) = −

1
Δ2
x 2ϕ ( x ) dx = −

2 π −∞


(Δ2 — дисперсия величины ξ 1 , см. § XIII.8), откуда
ψ (0 ) = ln

1
,


ψ ′′(0 ) =

Φ′′(0 ) Φ (0 ) − [Φ′(0 )]2
= − Δ2
Φ 2 (0 )

и потому
(2 π )n −1 [Φ(ω )]n ≈ (2 π )n −1 e

n ln

1


e

1
− n Δ2 ω 2
2

1

=

1 − 2 n Δ2 ω 2
e
.


В силу сказанного выше, получился Фурье'образ функции ϕ n (x).
Как видим, он имеет вид колокола. Согласно формулам (33) и (36)
C
1 1
1
1
nΔ2
, C=
) полу'
, откуда a =
(в которых
= ,
=
2
2
2nΔ
2 π a 2π 4a
2πn Δ
чаем функцию распределения величины ξ:
ϕn(x) =

2
1
e−x
2 πn Δ

2 nΔ 2

.

Мы пришли к нормальному закону (XIII.25).

566

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Упражнения
1. Докажите принцип неопределенности для функции f ( t ), постоянной
и отличной от нуля лишь на конечном интервале.
2. Установите связь принципа неопределенности с результатом упражне
ния 1 к § 4.

§ 6. Спектральный анализ периодической функции

СПЕКТРАЛЬНЫЙ АНАЛИЗ ПЕРИОДИЧЕСКОЙ ФУНКЦИИ

Для нахождения коэффициента a k надо обе части (40) помножить
2 kπi
t
T

(при некотором фиксированном k), после чего взять сред
на e
ние значения обеих частей. Рассуждая, как в предыдущем абзаце, полу
чим

(38)
a k = f ( t )e

Тогда в ее разложении (4) по гармоникам будут участвовать только
гармоники e iωt , обладающие тем же свойством (38). Отсюда
e iω ( t + T ) ≡ e iωt ,

e iωT = 1,

т.е.

iωT = 2 kπi

(см. § V.4), и мы получаем, что частота ω может принимать значения
только
ω = ωk =

2 kπ
( k =... , − 2, − 1, 0, 1, 2, ... ).
T

(39)

Таким образом, периодическая функция имеет дискретный спектр, а
потому дельтообразную спектральную плотность
F (ω ) =




2 kπ 
a kδ ω −
.

T 
k =−∞





2 kπi
t
T



∑ ak e

2 kπi
t
T .



2 kπ
2 kπ 
t =
t + i ( a k − a − k ) sin
= a 0 + ∑ ( a k + a − k ) cos
T 
T
k =1 

T

a0 =

1
f ( t ) dt.
T ∫0

−N

1 e iωt
2 N iω

N
t =− N

=

sin ωN
N
→ 0.
→∞


(42)

При этом коэффициенты, в силу (41), равны
(40)

В правой части среднее значение каждой гармоники равно нулю, так
как и при ω ≠ 0
iωt
∫ e dt =

(41)

dt

2 kπi
2 kπi
∞ 
t

t
f ( t ) = a 0 + ∑  a k e T + a − k e T  =

k =1 

Ak = a k + a − k =

1
f ( t ) dt,
T ∫0

2 kπi
T
 − 2 kπi t
t
1
2
 e T + e T  dt =
f
(
t
)



T 0
T



T

∫ f ( t ) cos
0

2 kπ
t dt
T

( k = 1, 2, ... ),

T

N

2 kπi
t
T



2 kπ
2 kπ 
t .
t + Bk sin
= a 0 + ∑  Ak cos

T 
T
k =1

Это — так называемый ряд Фурье, в который разлагается периодичес
кая функция.
Для вычисления коэффициентов ряда (40) возьмем средние значе
ния обеих частей формулы (40). В силу периодичности функции f (t)
среднее значение левой части равно

1
2N


1
f(t )e

T 0

Если функция f (t) вещественная, то часто пользуются другой, ве
щественной формой ряда Фурье. Для этого в разложении (40) объеди
няют симметричные члены

k =−∞

f=

T

=

( k = 0, ± 1, ± 2, ... )

Подставляя в (4), находим
f(t ) =

567

Однако одно слагаемее в правой части (40) при k = 0 просто равно по
стоянной a 0 , и его среднее значение, конечно, тоже равно a 0 . Поэтому
T
1
из (40) получаем f = ∫ f (t) dt = a 0 .
T 0


Пусть внешнее воздействие f (t) представляет собой периодичес
кую функцию с некоторым периодом T > 0, т.е.
f ( t + T ) ≡ f ( t ).

§ 6]

Bk = i( a k − a − k ) =

i
T

T



∫ f ( t )  e



2 kπi
t
T

−e

(43)

2 kπi
t
T 

0

2
 dt = T


T

∫ f ( t ) sin
0

2 kπ
t dt
T

( k = 1, 2, ... ).

В правых частях (42) все величины вещественные.
Приведем пример разложения в ряд (42). Рассмотрим «периодичес
кую ступеньку», показанную на рис. 199 жирными линиями. Здесь

566

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Упражнения
1. Докажите принцип неопределенности для функции f ( t ), постоянной
и отличной от нуля лишь на конечном интервале.
2. Установите связь принципа неопределенности с результатом упражне
ния 1 к § 4.

§ 6. Спектральный анализ периодической функции

СПЕКТРАЛЬНЫЙ АНАЛИЗ ПЕРИОДИЧЕСКОЙ ФУНКЦИИ

Для нахождения коэффициента a k надо обе части (40) помножить
2 kπi
t
T

(при некотором фиксированном k), после чего взять сред
на e
ние значения обеих частей. Рассуждая, как в предыдущем абзаце, полу
чим

(38)
a k = f ( t )e

Тогда в ее разложении (4) по гармоникам будут участвовать только
гармоники e iωt , обладающие тем же свойством (38). Отсюда
e iω ( t + T ) ≡ e iωt ,

e iωT = 1,

т.е.

iωT = 2 kπi

(см. § V.4), и мы получаем, что частота ω может принимать значения
только
ω = ωk =

2 kπ
( k =... , − 2, − 1, 0, 1, 2, ... ).
T

(39)

Таким образом, периодическая функция имеет дискретный спектр, а
потому дельтообразную спектральную плотность
F (ω ) =




2 kπ 
a kδ ω −
.

T 
k =−∞





2 kπi
t
T



∑ ak e

2 kπi
t
T .



2 kπ
2 kπ 
t =
t + i ( a k − a − k ) sin
= a 0 + ∑ ( a k + a − k ) cos
T 
T
k =1 

T

a0 =

1
f ( t ) dt.
T ∫0

−N

1 e iωt
2 N iω

N
t =− N

=

sin ωN
N
→ 0.
→∞


(42)

При этом коэффициенты, в силу (41), равны
(40)

В правой части среднее значение каждой гармоники равно нулю, так
как и при ω ≠ 0
iωt
∫ e dt =

(41)

dt

2 kπi
2 kπi
∞ 
t

t
f ( t ) = a 0 + ∑  a k e T + a − k e T  =

k =1 

Ak = a k + a − k =

1
f ( t ) dt,
T ∫0

2 kπi
T
 − 2 kπi t
t
1
2
 e T + e T  dt =
f
(
t
)



T 0
T



T

∫ f ( t ) cos
0

2 kπ
t dt
T

( k = 1, 2, ... ),

T

N

2 kπi
t
T



2 kπ
2 kπ 
t .
t + Bk sin
= a 0 + ∑  Ak cos

T 
T
k =1

Это — так называемый ряд Фурье, в который разлагается периодичес
кая функция.
Для вычисления коэффициентов ряда (40) возьмем средние значе
ния обеих частей формулы (40). В силу периодичности функции f (t)
среднее значение левой части равно

1
2N


1
f(t )e

T 0

Если функция f (t) вещественная, то часто пользуются другой, ве
щественной формой ряда Фурье. Для этого в разложении (40) объеди
няют симметричные члены

k =−∞

f=

T

=

( k = 0, ± 1, ± 2, ... )

Подставляя в (4), находим
f(t ) =

567

Однако одно слагаемее в правой части (40) при k = 0 просто равно по
стоянной a 0 , и его среднее значение, конечно, тоже равно a 0 . Поэтому
T
1
из (40) получаем f = ∫ f (t) dt = a 0 .
T 0


Пусть внешнее воздействие f (t) представляет собой периодичес
кую функцию с некоторым периодом T > 0, т.е.
f ( t + T ) ≡ f ( t ).

§ 6]

Bk = i( a k − a − k ) =

i
T

T



∫ f ( t )  e



2 kπi
t
T

−e

(43)

2 kπi
t
T 

0

2
 dt = T


T

∫ f ( t ) sin
0

2 kπ
t dt
T

( k = 1, 2, ... ).

В правых частях (42) все величины вещественные.
Приведем пример разложения в ряд (42). Рассмотрим «периодичес
кую ступеньку», показанную на рис. 199 жирными линиями. Здесь

568

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

a0 = f =

M
. По формулам (43)
2
Ak =

Bk =

[Гл. XIV

T

2
T

∫ M sin
T

2
T

T

∫ M cos

T
2

2 kπ
2M T
2 kπ T
t
t dt =
sin
= 0,
T 2 kπ
T t = T2
T

2 kπ
2 M T 
2 kπ
t dt =
− cos
t
T
T 2 kπ 
T

T
T
t=
2


 = − M (1 − cos kπ ).




2

Отсюда
B1 = −

2M
,


B2 = 0,

B3 = −

2M
,


B4 = 0,

B5 = −

2M
, ...,


т.е. мы получаем разложение
f(t ) =

M 2M  1
2 πt 1
6 πt 1
10πt


+ sin
+ sin
+ ... .
 sin

2
π 1
T
3
T
5
T

Вторая частичная сумма S 2 (t) и третья частичная сумма S 3 (t) этого
ряда показаны на рис. 199 пунктиром, причем для простоты они пока
заны только на периоде, по обе стороны они продолжаются периоди
чески. Интересно, что в точках разрыва сумма ряда оказывается равной
среднему арифметическому (т.е. полусумме) предельных значений
функции f (t) слева и справа*.

Рис. 199.


= ω 1 (см.
T
(39)), то из формул (39) и (40) (или (42)) мы видим, что общее, негар
моническое колебание с частотой ω = ω 1 получается в результате сло
жения гармонических колебаний с частотами ω 1 , ω 2 = 2ω 1 , ω 3 = 3ω 1
и т.д. Первая частота, т.е. ω 1 , являющаяся частотой самого колебания,
Так как периоду колебаний T отвечает частота ω =

* Обратите также внимание, что частичные суммы Sn (t ) для функции f (t ) (рис.
199) на границе ступенек довольно сильно «выскакивают» из них. Это общее свойство
Sn (t ) называется явлением Гиббса.

§ 6]

СПЕКТРАЛЬНЫЙ АНАЛИЗ ПЕРИОДИЧЕСКОЙ ФУНКЦИИ

569

называется основной, и соответствующая ей гармоника также называ
ется основной; остальные частоты и гармоники называются верхними.
Полученные результаты имеют важное значение, в частности, в акус
тике. Хорошо известно, что высота звука соответствует частоте колеба
ний воздуха: например, ноте «ля» так называемойпервой октавы
отвечает частота 440 гц, т.е. 440 колебаний в секунду. Однако известно
также, что одна и та же нота, взятая на различных инструментах, имеет
различный тембр, т.е. «окраску». От чего же зависит этот тембр? Оказы
вается, что от верхних гармоник, наложенных на основную. Каждая из
них входит в колебание с определенной амплитудой, и если менять про
порции между этими амплитудами, то будет изменяться и тембр.
Из наших результатов получается еще одно интересное следствие.
Мы знаем, что если осциллятор с собственной частотой ω 0 возбуж
дать внешней силой с частотой ω, то при ω = ω 0 наступает резонанс.
Однако на практике оказывается, что резонанс наступает и при
ω ω ω
ω = 0 , 0 , 0 и т.д. При этом существенно, чтобы возбуждающая
2
3
4
ω t
сила, будучи периодической, не была гармонической! Сила f = cos 0
2
не возбуждает осциллятора с собственной частотой ω 0 . Но возьмем дру
гой типичный пример. Пусть осциллятор с частотой ω 0 возбуждается
отдельными толчками; лучший способ — давать по одному толчку на каж
dx
dx
дом колебании. Лучший момент, когда x = 0,
максимально,
> 0,
dt
dt
будет максимальна и работа силы (мы предполагаем, что сила действует
в сторону увеличения x). Ясно, что если сила действует по одному разу
в каждом периоде, то частота силы совпадает с частотой ω 0 колебаний.
Теперь изменим действие силы. Пусть сила действует «через раз»,
например каждое нечетное колебание. Ясно, что и при таком способе
действий колебания будут неограниченно усиливаться, будет иметь
место резонанс, хотя ω = ω 0 2. Здесь дело в том, что сила
f = ∑ δ(t − nT ) (n — целое), состоящая из отдельных толчков, опреде
ленных интервалом T , особенно богата обертонами. В первом случае

2π 2π
; во втором случае редких толчков T = 2 ⋅
T =
= , частота силы
ω0
ω0
ω
ω = ω 0 2, но и во втором случае в разложение f (t) входит член c
e iω 0 t = e i2 ωt . Это объясняется как раз наличием верхних частот. Если
ω
же сила действует с частотой 0 , то она состоит из смеси гармоник
3
ω0 ω0 ω0
ω0
с частотами
, 2 , 3 , 4
и т.д. Из них третья c частотой
3
3
3
3
ω
3 0 = ω 0 как раз и возбуждает резонанс.
3

568

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

a0 = f =

M
. По формулам (43)
2
Ak =

Bk =

[Гл. XIV

T

2
T

∫ M sin
T

2
T

T

∫ M cos

T
2

2 kπ
2M T
2 kπ T
t
t dt =
sin
= 0,
T 2 kπ
T t = T2
T

2 kπ
2 M T 
2 kπ
t dt =
− cos
t
T
T 2 kπ 
T

T
T
t=
2


 = − M (1 − cos kπ ).




2

Отсюда
B1 = −

2M
,


B2 = 0,

B3 = −

2M
,


B4 = 0,

B5 = −

2M
, ...,


т.е. мы получаем разложение
f(t ) =

M 2M  1
2 πt 1
6 πt 1
10πt


+ sin
+ sin
+ ... .
 sin

2
π 1
T
3
T
5
T

Вторая частичная сумма S 2 (t) и третья частичная сумма S 3 (t) этого
ряда показаны на рис. 199 пунктиром, причем для простоты они пока
заны только на периоде, по обе стороны они продолжаются периоди
чески. Интересно, что в точках разрыва сумма ряда оказывается равной
среднему арифметическому (т.е. полусумме) предельных значений
функции f (t) слева и справа*.

Рис. 199.


= ω 1 (см.
T
(39)), то из формул (39) и (40) (или (42)) мы видим, что общее, негар
моническое колебание с частотой ω = ω 1 получается в результате сло
жения гармонических колебаний с частотами ω 1 , ω 2 = 2ω 1 , ω 3 = 3ω 1
и т.д. Первая частота, т.е. ω 1 , являющаяся частотой самого колебания,
Так как периоду колебаний T отвечает частота ω =

* Обратите также внимание, что частичные суммы Sn (t ) для функции f (t ) (рис.
199) на границе ступенек довольно сильно «выскакивают» из них. Это общее свойство
Sn (t ) называется явлением Гиббса.

§ 6]

СПЕКТРАЛЬНЫЙ АНАЛИЗ ПЕРИОДИЧЕСКОЙ ФУНКЦИИ

569

называется основной, и соответствующая ей гармоника также называ
ется основной; остальные частоты и гармоники называются верхними.
Полученные результаты имеют важное значение, в частности, в акус
тике. Хорошо известно, что высота звука соответствует частоте колеба
ний воздуха: например, ноте «ля» так называемой первой октавы
отвечает частота 440 гц, т.е. 440 колебаний в секунду. Однако известно
также, что одна и та же нота, взятая на различных инструментах, имеет
различный тембр, т.е. «окраску». От чего же зависит этот тембр? Оказы
вается, что от верхних гармоник, наложенных на основную. Каждая из
них входит в колебание с определенной амплитудой, и если менять про
порции между этими амплитудами, то будет изменяться и тембр.
Из наших результатов получается еще одно интересное следствие.
Мы знаем, что если осциллятор с собственной частотой ω 0 возбуж
дать внешней силой с частотой ω, то при ω = ω 0 наступает резонанс.
Однако на практике оказывается, что резонанс наступает и при
ω ω ω
ω = 0 , 0 , 0 и т.д. При этом существенно, чтобы возбуждающая
2
3
4
ω t
сила, будучи периодической, не была гармонической! Сила f = cos 0
2
не возбуждает осциллятора с собственной частотой ω 0 . Но возьмем дру
гой типичный пример. Пусть осциллятор с частотой ω 0 возбуждается
отдельными толчками; лучший способ — давать по одному толчку на каж
dx
dx
дом колебании. Лучший момент, когда x = 0,
максимально,
> 0,
dt
dt
будет максимальна и работа силы (мы предполагаем, что сила действует
в сторону увеличения x). Ясно, что если сила действует по одному разу
в каждом периоде, то частота силы совпадает с частотой ω 0 колебаний.
Теперь изменим действие силы. Пусть сила действует «через раз»,
например каждое нечетное колебание. Ясно, что и при таком способе
действий колебания будут неограниченно усиливаться, будет иметь
место резонанс, хотя ω = ω 0 2. Здесь дело в том, что сила
f = ∑ δ(t − nT ) (n — целое), состоящая из отдельных толчков, опреде
ленных интервалом T , особенно богата обертонами. В первом случае

2π 2π
; во втором случае редких толчков T = 2 ⋅
T =
= , частота силы
ω0
ω0
ω
ω = ω 0 2, но и во втором случае в разложение f (t) входит член c
e iω 0 t = e i2 ωt . Это объясняется как раз наличием верхних частот. Если
ω
же сила действует с частотой 0 , то она состоит из смеси гармоник
3
ω0 ω0 ω0
ω0
с частотами
, 2 , 3 , 4
и т.д. Из них третья c частотой
3
3
3
3
ω
3 0 = ω 0 как раз и возбуждает резонанс.
3

570

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Напротив, периодическая внешняя сила с частотой 2ω 0 , 3ω 0 , . . .
не вызывает резонанса, а возбуждает в рассматриваемом осцилляторе
только верхние гармоники,
Упражнение
Разложите в ряд Фурье функцию: а) A sin αt ; б) периодическую с пери


одом T и равную ht при 0 < t < Т; в)

∑ Aδ( t − 2 nT ).

§ 7]

ПРОСТРАНСТВО ГИЛЬБЕРТА

При «сгущении» узловых значений t k nмерное пространство перехо
дит в бесконечномерное, а сумма (45), естественно, заменяется на ин
теграл (44).
Согласно формуле (44) и правилам векторной алгебры вводится
«модуль вектора f », называемый нормой функции f и обозначаемый
f , по формуле
f

n =−∞

571

b

2

= ( f , f ) = ∫ [ f ( t )]2 dt.

(46)

a

§ 7. Пространство Гильберта
Разложения, указанные в § 6, имеют замечательное геометрическое
истолкование. Мы уже указывали в § IX.6, что любую совокупность объ
ектов, в которой можно производить линейные действия (сложение
этих объектов и умножение их на скаляры, т.е. числа), можно истолко
вать как многомерное векторное пространство. Но ведь над функциями
f (t), рассматриваемыми на некотором интервале оси t (этот интервал
может быть конечным или бесконечным и, в частности, может совпадать
со всей осью, но он должен быть одним и тем же для всех рассматривае
мых функций), такие действия возможно производить! Значит, эти
функции можно рассматривать как векторы, они образуют векторное
пространство. Однако характерной особенностью пространства функций
является его бесконечномерность: ведь при выборе произвольной функ
ции f имеется бесконечное число степеней свободы, так как если, на
пример, указать любое конечное число значений f (t k ), то эту функцию
еще можно выбрать многими способами при остальных значениях t.
Будем сначала считать, что рассматриваемые функции принимают
вещественные значения.
В пространстве функций можно ввести скалярное произведение по
формуле
b

( f ,ϕ ) = ∫ f ( t ) ϕ ( t ) dt,

(44)

где a и b — начало и конец того интервала оси t, на котором рассмат
риваются функции. Естественность этой формулы вытекает из следу
ющих соображений. Выберем n значений независимой переменной
t = t1 , t 2 , ..., t n

(47)

a

Две ортогональные функции подобны двум перпендикулярным друг
другу векторам. Если имеется ортогональная система функций, т.е. со
вокупность попарно ортогональных функций
(48)

то часто возникает задача о разложении любой заданной функции f (t)
по этим функциям, т.е. о разложении f (t) в ряд вида


f ( t ) = ∑ a k g k ( t ).

(49)

k =1

и будем рассматривать значения любой функции f только в этих точ
ках f (t1 ) , f (t2 ), . . . , f (t n ). Тогда мы будем иметь n степеней свободы,
т.е. такие функции образуют nмерное векторное пространство, в кото
ром согласно § IX.6 скалярное произведение можно ввести по формуле
n

k =1

b

∫ g1 ( t ) g 2 ( t ) dt = 0.

g1 ( t ), g 2 ( t ), ..., g n ( t ), ...,

a

( f ,ϕ ) = ∑ f ( t k ) ϕ ( t k ).

Пространство функций со скалярным произведением (44) и, стало
быть, с нормой (46) называется гильбертовым пространством (более
полно, вещественным гильбертовым пространством функций на задан
ном интервале с концами a, b). В него входят как непрерывные, так
и разрывные и даже неограниченные функции. Однако так как каждый
вектор должен иметь конечный модуль, то в пространство включаются
только функции, для которых интеграл (46) либо «собственный», либо
несобственный сходящийся (см. § III.1), т.е. обязательно имеет конеч
ное значение. В частности, дельтафункция в пространство Гильберта
не входит, так как интеграл от ее квадрата равен бесконечности (поче
му?). В дальнейшем мы ограничимся функциями с конечной нормой.
В гильбертовом пространстве естественно вводится понятие орто
гональности: две функции g 1 (t) и g 2 (t) ортогональны друг другу (на
интервале с концами a, b), если их скалярное произведение равно
нулю, т.е. если

(45)

В гл. IX мы рассматривали задачу о разложении вектора в обычном
(трехмерном) пространстве по ортогональным, т.е. перпендикулярным
векторам. Если этих ортогональных векторов три, то по ним можно раз
ложить любой вектор; такая тройка векторов называется полной, как
говорят, ее можно принять за базис в пространстве. Если же ортого
нальных векторов два, то по ним можно разложить не любой вектор,

570

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Напротив, периодическая внешняя сила с частотой 2ω 0 , 3ω 0 , . . .
не вызывает резонанса, а возбуждает в рассматриваемом осцилляторе
только верхние гармоники,
Упражнение
Разложите в ряд Фурье функцию: а) A sin αt ; б) периодическую с пери


одом T и равную ht при 0 < t < Т; в)

∑ Aδ( t − 2 nT ).

§ 7]

ПРОСТРАНСТВО ГИЛЬБЕРТА

При «сгущении» узловых значений t k nмерное пространство перехо
дит в бесконечномерное, а сумма (45), естественно, заменяется на ин
теграл (44).
Согласно формуле (44) и правилам векторной алгебры вводится
«модуль вектора f », называемый нормой функции f и обозначаемый
f , по формуле
f

n =−∞

571

b

2

= ( f , f ) = ∫ [ f ( t )]2 dt.

(46)

a

§ 7. Пространство Гильберта
Разложения, указанные в § 6, имеют замечательное геометрическое
истолкование. Мы уже указывали в § IX.6, что любую совокупность объ
ектов, в которой можно производить линейные действия (сложение
этих объектов и умножение их на скаляры, т.е. числа), можно истолко
вать как многомерное векторное пространство. Но ведь над функциями
f (t), рассматриваемыми на некотором интервале оси t (этот интервал
может быть конечным или бесконечным и, в частности, может совпадать
со всей осью, но он должен быть одним и тем же для всех рассматривае
мых функций), такие действия возможно производить! Значит, эти
функции можно рассматривать как векторы, они образуют векторное
пространство. Однако характерной особенностью пространства функций
является его бесконечномерность: ведь при выборе произвольной функ
ции f имеется бесконечное число степеней свободы, так как если, на
пример, указать любое конечное число значений f (t k ), то эту функцию
еще можно выбрать многими способами при остальных значениях t.
Будем сначала считать, что рассматриваемые функции принимают
вещественные значения.
В пространстве функций можно ввести скалярное произведение по
формуле
b

( f ,ϕ ) = ∫ f ( t ) ϕ ( t ) dt,

(44)

где a и b — начало и конец того интервала оси t, на котором рассмат
риваются функции. Естественность этой формулы вытекает из следу
ющих соображений. Выберем n значений независимой переменной
t = t1 , t 2 , ..., t n

(47)

a

Две ортогональные функции подобны двум перпендикулярным друг
другу векторам. Если имеется ортогональная система функций, т.е. со
вокупность попарно ортогональных функций
(48)

то часто возникает задача о разложении любой заданной функции f (t)
по этим функциям, т.е. о разложении f (t) в ряд вида


f ( t ) = ∑ a k g k ( t ).

(49)

k =1

и будем рассматривать значения любой функции f только в этих точ
ках f (t1 ) , f (t2 ), . . . , f (t n ). Тогда мы будем иметь n степеней свободы,
т.е. такие функции образуют nмерное векторное пространство, в кото
ром согласно § IX.6 скалярное произведение можно ввести по формуле
n

k =1

b

∫ g1 ( t ) g 2 ( t ) dt = 0.

g1 ( t ), g 2 ( t ), ..., g n ( t ), ...,

a

( f ,ϕ ) = ∑ f ( t k ) ϕ ( t k ).

Пространство функций со скалярным произведением (44) и, стало
быть, с нормой (46) называется гильбертовым пространством (более
полно, вещественным гильбертовым пространством функций на задан
ном интервале с концами a, b). В него входят как непрерывные, так
и разрывные и даже неограниченные функции. Однако так как каждый
вектор должен иметь конечный модуль, то в пространство включаются
только функции, для которых интеграл (46) либо «собственный», либо
несобственный сходящийся (см. § III.1), т.е. обязательно имеет конеч
ное значение. В частности, дельтафункция в пространство Гильберта
не входит, так как интеграл от ее квадрата равен бесконечности (поче
му?). В дальнейшем мы ограничимся функциями с конечной нормой.
В гильбертовом пространстве естественно вводится понятие орто
гональности: две функции g 1 (t) и g 2 (t) ортогональны друг другу (на
интервале с концами a, b), если их скалярное произведение равно
нулю, т.е. если

(45)

В гл. IX мы рассматривали задачу о разложении вектора в обычном
(трехмерном) пространстве по ортогональным, т.е. перпендикулярным
векторам. Если этих ортогональных векторов три, то по ним можно раз
ложить любой вектор; такая тройка векторов называется полной, как
говорят, ее можно принять за базис в пространстве. Если же ортого
нальных векторов два, то по ним можно разложить не любой вектор,

572

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

а только такие, которые лежат в плоскости этих двух векторов; такая
пара векторов в трехмерном пространстве не является полной, она ста
новится полной только после присоединения к ней третьего вектора.
Подобно этому ортогональная система функций (48) называется
полной, если по ней можно разложить любую функцию f (t) в ряд вида
(49); любая такая система функций образует базис в пространстве
Гильберта. Если же система (48) неполна, то по ней можно разложить
не все функции, а только функции, удовлетворяющие определенным
соотношениям; оказывается, что любую ортогональную неполную сис
тему функций можно «расширить» до ортогональной полной системы,
присоединив к исходной системе некоторое (быть может, бесконеч
ное!) количество функций.
В конечномерном векторном пространстве полнота или неполнота
системы ортогональных векторов выясняется очень просто: если число
векторов в системе равно размерности пространства, то система полная,
а если это число меньше размерности пространства, то система непол
ная. В отличие от этого в бесконечномерном пространстве и неполная
система может содержать бесконечное количество векторов, так что
только по этому количеству установить полноту системы нельзя. Обыч
но установить полноту системы (48) бывает далеко не просто.
Если все же полнота системы функций (48) так или иначе установ
лена, то найти коэффициенты разложения заданной функции f (x)
в ряд (49) очень легко. Для этого надо обе части равенства
f ( t ) = a1 g1 ( t ) + a 2 g 2 ( t ) + a 3 g 3 ( t ) + ...

(50)

скалярно помножить на одну из функций g k (t). При этом в правой
части равенства (50) в силу соотношения ортогональности все члены
обратятся в нуль, кроме одного, в котором функция множится сама на
себя. Мы получим равенство ( f , g k ) = a k ( g k , g k ), т.е.
b

( f , gk )
ak =
=
( gk , gk )

∫ f ( t ) g k ( t ) dt
a

b



(51)

g k2 ( t ) dt

§ 7]

ПРОСТРАНСТВО ГИЛЬБЕРТА

системе (52) — это не что иное, как разложение (42), а мы видели, что оно
возможно для любой функции f (t) (ведь периодическая с перио
дом T функция может при 0 < t < T принимать совершенно произволь
ные значения). Если же вычислить коэффициенты разложения по систе
ме (52) с помощью общей формулы (51) и легко проверяемых равенств
T

T

2
∫ 1 dt = T ,

2
∫ cos

0







t, sin
t, cos
t, sin
t, cos
t, sin
t, ...
T
T
T
T
T
T

∫ sin
0

2 kπ
T
t dt =
T
2

( f , f ) = a12 ( g1 , g1 ) + a 22 ( g 2 , g 2 ) + ...,

т.е.
f

2

2

= a12 g1

2

+ a 22 g 2

2

+ a 32 g 3

+ ...

(53)

Здесь слева стоит квадрат модуля вектора f , а справа — сумма квадра
тов его проекций на базисные векторы g 1 , g 2 , . . .
Если рассматривается комплексное гильбертово пространство, т.е.
рассматриваемые функции от вещественного аргумента могут прини
мать комплексные значения, то формула для скалярного произведе
ния, взамен (44), будет иметь вид
b

( f , ϕ ) = ∫ f ( t ) [ϕ ( t )]* dt,
a

где звездочкой обозначена комплексно сопряженная величина (см.
§ V.2 и IX.6). Поэтому и формула для нормы изменится:
2

b

b

2

= ( f , f ) = ∫ f ( t ) [ f ( t )]* dt = ∫ f ( t ) dt.
a

a

Аналогичные изменения получат и дальнейшие формулы. Важным
примером полной ортогональной системы функций в комплексном
гильбертовом пространстве на интервале 0 t T служит совокуп
ность функций

(52)

Ортогональность этой системы можно получить с помощью непосред
ственного вычисления интегралов вида (47) (см. упражнение 1). Пол
нота этой системы, по существу, показана в § 5, так как разложение по

2

то мы получим как раз формулы (43).
Интересное обобщение теоремы Пифагора на пространство Гильбер
та получится, если левую, а также правую части равенства (50) скалярно
помножить саму на себя. При этом в правой части все попарные скаляр
ные произведения равны нулю в силу соотношения ортогональности,
а останутся только скалярные квадраты всех слагаемых и мы получим

a

1, cos

0

T

2 kπ
T
t dt = ,
T
2
( k = 1, 2, ... ),

f

(ср. формулу (IX.28)).
Важный пример ортогональной полной системы функций на конеч
ном интервале 0 t T дает система

573

..., e



4 πi
t
T ,

e



2 πi
t
T ,

1, e

2 πi
t
T ,

e

4 πi
t
T ,

... , e



2 kπi
t
T ,

...

(54)

Разложение по этой системе функций — это как раз разложение (40)
из § 6.

572

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

а только такие, которые лежат в плоскости этих двух векторов; такая
пара векторов в трехмерном пространстве не является полной, она ста
новится полной только после присоединения к ней третьего вектора.
Подобно этому ортогональная система функций (48) называется
полной, если по ней можно разложить любую функцию f (t) в ряд вида
(49); любая такая система функций образует базис в пространстве
Гильберта. Если же система (48) неполна, то по ней можно разложить
не все функции, а только функции, удовлетворяющие определенным
соотношениям; оказывается, что любую ортогональную неполную сис
тему функций можно «расширить» до ортогональной полной системы,
присоединив к исходной системе некоторое (быть может, бесконеч
ное!) количество функций.
В конечномерном векторном пространстве полнота или неполнота
системы ортогональных векторов выясняется очень просто: если число
векторов в системе равно размерности пространства, то система полная,
а если это число меньше размерности пространства, то система непол
ная. В отличие от этого в бесконечномерном пространстве и неполная
система может содержать бесконечное количество векторов, так что
только по этому количеству установить полноту системы нельзя. Обыч
но установить полноту системы (48) бывает далеко не просто.
Если все же полнота системы функций (48) так или иначе установ
лена, то найти коэффициенты разложения заданной функции f (x)
в ряд (49) очень легко. Для этого надо обе части равенства
f ( t ) = a1 g1 ( t ) + a 2 g 2 ( t ) + a 3 g 3 ( t ) + ...

(50)

скалярно помножить на одну из функций g k (t). При этом в правой
части равенства (50) в силу соотношения ортогональности все члены
обратятся в нуль, кроме одного, в котором функция множится сама на
себя. Мы получим равенство ( f , g k ) = a k ( g k , g k ), т.е.
b

( f , gk )
ak =
=
( gk , gk )

∫ f ( t ) g k ( t ) dt
a

b



(51)

g k2 ( t ) dt

§ 7]

ПРОСТРАНСТВО ГИЛЬБЕРТА

системе (52) — это не что иное, как разложение (42), а мы видели, что оно
возможно для любой функции f (t) (ведь периодическая с перио
дом T функция может при 0 < t < T принимать совершенно произволь
ные значения). Если же вычислить коэффициенты разложения по систе
ме (52) с помощью общей формулы (51) и легко проверяемых равенств
T

T

2
∫ 1 dt = T ,

2
∫ cos

0







t, sin
t, cos
t, sin
t, cos
t, sin
t, ...
T
T
T
T
T
T

∫ sin
0

2 kπ
T
t dt =
T
2

( f , f ) = a12 ( g1 , g1 ) + a 22 ( g 2 , g 2 ) + ...,

т.е.
f

2

2

= a12 g1

2

+ a 22 g 2

2

+ a 32 g 3

+ ...

(53)

Здесь слева стоит квадрат модуля вектора f , а справа — сумма квадра
тов его проекций на базисные векторы g 1 , g 2 , . . .
Если рассматривается комплексное гильбертово пространство, т.е.
рассматриваемые функции от вещественного аргумента могут прини
мать комплексные значения, то формула для скалярного произведе
ния, взамен (44), будет иметь вид
b

( f , ϕ ) = ∫ f ( t ) [ϕ ( t )]* dt,
a

где звездочкой обозначена комплексно сопряженная величина (см.
§ V.2 и IX.6). Поэтому и формула для нормы изменится:
2

b

b

2

= ( f , f ) = ∫ f ( t ) [ f ( t )]* dt = ∫ f ( t ) dt.
a

a

Аналогичные изменения получат и дальнейшие формулы. Важным
примером полной ортогональной системы функций в комплексном
гильбертовом пространстве на интервале 0 t T служит совокуп
ность функций

(52)

Ортогональность этой системы можно получить с помощью непосред
ственного вычисления интегралов вида (47) (см. упражнение 1). Пол
нота этой системы, по существу, показана в § 5, так как разложение по

2

то мы получим как раз формулы (43).
Интересное обобщение теоремы Пифагора на пространство Гильбер
та получится, если левую, а также правую части равенства (50) скалярно
помножить саму на себя. При этом в правой части все попарные скаляр
ные произведения равны нулю в силу соотношения ортогональности,
а останутся только скалярные квадраты всех слагаемых и мы получим

a

1, cos

0

T

2 kπ
T
t dt = ,
T
2
( k = 1, 2, ... ),

f

(ср. формулу (IX.28)).
Важный пример ортогональной полной системы функций на конеч
ном интервале 0 t T дает система

573

..., e



4 πi
t
T ,

e



2 πi
t
T ,

1, e

2 πi
t
T ,

e

4 πi
t
T ,

... , e



2 kπi
t
T ,

...

(54)

Разложение по этой системе функций — это как раз разложение (40)
из § 6.

574

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Такой геометрический подход к совокупности функций дает воз
можность получить многие важные и интересные следствия, лежащие,
однако, за пределами данной книги.
В заключение остановимся немного на развитии понятия функции.
В XVIII веке, когда это понятие возникло, функция мыслилась задан
ной обязательно с помощью формулы. Поэтому пример разложения
в ряд Фурье функции, заданной различными формулами на различных
участках изменения аргумента (см. § 6), на некоторое время поставил
математиков в затруднение: одна это функция (ведь ряд один, он обра
зован по вполне определенному закону) или несколько? Анализ подо
бных примеров привел в XIX веке к принятому сейчас в математике
определению функции как произвольного закона соответствия между
зависимыми и независимыми переменными. Такой подход оказался
полезным для логического обоснования математики. Однако с точки
зрения приложений такое определение является слишком аморфным,
расплывчатым; право на существование получили такие функции, как
например, функция Дирихле, равная 0 для иррациональных и 1 для ра
циональных значений независимого переменного (попробуйте пред
ставить себе ее график!), и другие подобные функции, которым трудно
придать другой смысл, кроме формально логического. В приложениях
функция должна образовывать не дезорганизованную толпу значений,
а рабочий организм. Сейчас стала особенно ясной роль функций, за
данных формулами, более точно — аналитических функций (гл. V).
Но логический анализ понятия функции, проведенный в XIX веке,
не прошел и для приложений бесследно. Так, функции, заданные не
сколькими формулами (кусочно аналитические функции), часто
встречаются в приложениях и более не вызывают замешательства
(простейший пример — единичная функция e(x) из § VI.3). Их место
стало еще более ясным после открытия в XX веке обобщенных функ
ций — δ функции Дирака и связанных с ней функций (математическая
строгая теория обобщенных функций была развита в 1936 г. С.Л. Собо
левым). Например, функцию f (x), равную f1 (x) при x < a и f2 (x)
при x > a, можно записать единой формулой:
f ( x ) = f1 ( x ) e ( a − x ) + f2 ( x ) e ( x − a ).

Повидимому, сейчас в приложениях индивидуальное («персональ
ное») значение имеют только аналитические, кусочно аналитические
и простые обобщенные функции. (В теории случайных процессов типа
броуновского движения важную роль играют непрерывные, нигде не
дифференцируемые — и потому не аналитические — функции, описыва
ющие траектории частиц; однако эти функции невоспроизводимы, а по
тому имеют только вероятностное, а не индивидуальное значение.) Роль
особенностей функции — в частности, возникающих при «сшивании» ее

§ 8]

МОДУЛЬ И ФАЗА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ

575

из различных формул — проявляется при переходе к комплексным зна
чениям независимого переменного. Рассмотрим, например, функцию
0
f ( x ) = x 2 e( x ) =  2
x

( −∞ < x < 0 ),
(0 < x < ∞ ),

показанную на рис. 200. Две час
ти f (x) «сшиты» при x = 0 с соблюде
нием непрерывности производной. Эту
функцию можно приближенно предста
вить в виде
f(x) =

x2
,
1 + e − αx

Рис. 200.

где α весьма велико. Однако если допустить, чтобы независимое пере
менное принимало комплексные значения, то правая часть будет иметь
полюсы при 1 + e − αx = 0, т.е.
x=

π
(2 k + 1)i


( k = 0, ± 1, ± 2, ... ).

Эти полюсы при α → ∞ заполняют мнимую ось, которая и разграни
чивает области действия обеих формул для функции.
Как мы видели в § 4, «сшивание» проявляется и при спектральном
анализе исследуемой функции в асимптотическом поведении ее
Фурьеобраза.
Для XX века характерен еще один подход к понятию функции,
именно как к элементу функционального пространства — например
пространства Гильберта, т.е. как к члену функционального коллектива.
Такой подход имеет во многих задачах разнообразные теоретические
и прикладные преимущества, на которых здесь мы не имеем возмож
ности остановиться.
Упражнения
1. Докажите, что система функций (52) является ортогональной на интер
T
неортогональная; та же сис
2
тема на интервале 0  t 2T ортогональная, но неполная.
2. Докажите, что система функций (54) ортогональна на интервале 0  t T.

вале 0  t T; та же система на интервале 0  t 

§ 8. Модуль и фаза спектральной плотности
Выше, в § 2, было отмечено, что простейшие приемники колебаний
(в том числе ухо, глаз, фотопластинка) регистрируют только абсолют
ную величину амплитуды; показания этих приемников не зависят от
фазы колебаний. Такой подход к колебаниям характерен для XIX века
с его интересом к энергетике, так как энергия колебаний определяется

574

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

Такой геометрический подход к совокупности функций дает воз
можность получить многие важные и интересные следствия, лежащие,
однако, за пределами данной книги.
В заключение остановимся немного на развитии понятия функции.
В XVIII веке, когда это понятие возникло, функция мыслилась задан
ной обязательно с помощью формулы. Поэтому пример разложения
в ряд Фурье функции, заданной различными формулами на различных
участках изменения аргумента (см. § 6), на некоторое время поставил
математиков в затруднение: одна это функция (ведь ряд один, он обра
зован по вполне определенному закону) или несколько? Анализ подо
бных примеров привел в XIX веке к принятому сейчас в математике
определению функции как произвольного закона соответствия между
зависимыми и независимыми переменными. Такой подход оказался
полезным для логического обоснования математики. Однако с точки
зрения приложений такое определение является слишком аморфным,
расплывчатым; право на существование получили такие функции, как
например, функция Дирихле, равная 0 для иррациональных и 1 для ра
циональных значений независимого переменного (попробуйте пред
ставить себе ее график!), и другие подобные функции, которым трудно
придать другой смысл, кроме формально логического. В приложениях
функция должна образовывать не дезорганизованную толпу значений,
а рабочий организм. Сейчас стала особенно ясной роль функций, за
данных формулами, более точно — аналитических функций (гл. V).
Но логический анализ понятия функции, проведенный в XIX веке,
не прошел и для приложений бесследно. Так, функции, заданные не
сколькими формулами (кусочно аналитические функции), часто
встречаются в приложениях и более не вызывают замешательства
(простейший пример — единичная функция e(x) из § VI.3). Их место
стало еще более ясным после открытия в XX веке обобщенных функ
ций — δ функции Дирака и связанных с ней функций (математическая
строгая теория обобщенных функций была развита в 1936 г. С.Л. Собо
левым). Например, функцию f (x), равную f1 (x) при x < a и f2 (x)
при x > a, можно записать единой формулой:
f ( x ) = f1 ( x ) e ( a − x ) + f2 ( x ) e ( x − a ).

Повидимому, сейчас в приложениях индивидуальное («персональ
ное») значение имеют только аналитические, кусочно аналитические
и простые обобщенные функции. (В теории случайных процессов типа
броуновского движения важную роль играют непрерывные, нигде не
дифференцируемые — и потому не аналитические — функции, описыва
ющие траектории частиц; однако эти функции невоспроизводимы, а по
тому имеют только вероятностное, а не индивидуальное значение.) Роль
особенностей функции — в частности, возникающих при «сшивании» ее

§ 8]

МОДУЛЬ И ФАЗА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ

575

из различных формул — проявляется при переходе к комплексным зна
чениям независимого переменного. Рассмотрим, например, функцию
0
f ( x ) = x 2 e( x ) =  2
x

( −∞ < x < 0 ),
(0 < x < ∞ ),

показанную на рис. 200. Две час
ти f (x) «сшиты» при x = 0 с соблюде
нием непрерывности производной. Эту
функцию можно приближенно предста
вить в виде
f(x) =

x2
,
1 + e − αx

Рис. 200.

где α весьма велико. Однако если допустить, чтобы независимое пере
менное принимало комплексные значения, то правая часть будет иметь
полюсы при 1 + e − αx = 0, т.е.
x=

π
(2 k + 1)i


( k = 0, ± 1, ± 2, ... ).

Эти полюсы при α → ∞ заполняют мнимую ось, которая и разграни
чивает области действия обеих формул для функции.
Как мы видели в § 4, «сшивание» проявляется и при спектральном
анализе исследуемой функции в асимптотическом поведении ее
Фурьеобраза.
Для XX века характерен еще один подход к понятию функции,
именно как к элементу функционального пространства — например
пространства Гильберта, т.е. как к члену функционального коллектива.
Такой подход имеет во многих задачах разнообразные теоретические
и прикладные преимущества, на которых здесь мы не имеем возмож
ности остановиться.
Упражнения
1. Докажите, что система функций (52) является ортогональной на интер
T
неортогональная; та же сис
2
тема на интервале 0  t 2T ортогональная, но неполная.
2. Докажите, что система функций (54) ортогональна на интервале 0  t T.

вале 0  t T; та же система на интервале 0  t 

§ 8. Модуль и фаза спектральной плотности
Выше, в § 2, было отмечено, что простейшие приемники колебаний
(в том числе ухо, глаз, фотопластинка) регистрируют только абсолют
ную величину амплитуды; показания этих приемников не зависят от
фазы колебаний. Такой подход к колебаниям характерен для XIX века
с его интересом к энергетике, так как энергия колебаний определяется

576

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

только модулем амплитуды, точнее, модулем спектральной плотности.
Если колебание описывается вещественной функцией f (t), то поток
энергии для различных типов колебаний пропорционален [ f (t)]2 или
[ f ′(t)]2 , так что полная энергия колебаний, протекшая за все время
−∞ < t < ∞, выражается через интегралы I 0 или I 1 :


I 0 = ∫ [ f ( t )]2 dt,
−∞



I1 = ∫ [ f ′( t )]2 dt.
−∞

Однако эти интегралы легко выражаются через квадрат модуля
спектральной плотности. Чтобы получить это выражение для I 0 , воз
ведем обе части равенства (4) в квадрат, после чего объединим в правой
части два интеграла в один:
[ f ( t )]2 = ∫ F (ω ) e iωt dω ∫ F (ω ) e iωt dω = ∫∫ F (ω1 )F (ω 2 )e i ( ω 1 + ω 2 )t dω1 dω 2 .

Теперь проинтегрируем обе части по t и воспользуемся формулами
(9), (VI.4) и (5):
I 0 = ∫ [ f ( t )]2 dt = ∫∫∫ F (ω1 )F (ω 2 )e i ( ω 1 + ω 2 ) t dt dω1 dω 2 =
= 2 π ∫∫ F (ω1 )F (ω 2 )δ (ω1 + ω 2 ) dω1 dω 2 =
= 2 π ∫ F ( −ω 2 )F (ω 2 ) dω 2 = 2 π ∫ F (ω)

2

МОДУЛЬ И ФАЗА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ

ми фазами отвечают разные f (t), то при неизвестной фазе нельзя вос
2
произвести f (t), зная лишь F . Записывая F и фазу, мы получили
бы, грубо говоря, вдвое больше сведений, вдвое больше информации от
заданной волны. Более того, оказывается возможным передавать ин
формацию именно за счет изменения фазы колебаний, при постоянной
их амплитуде.
В радиотехнике известны два способа передачи информации: с по
мощью амплитудной модуляции
f ( t ) = a ( t )cos ω 0 t

(рис. 201) или с помощью частотной модуляции
t


f ( t ) = a 0 cos ω 0 t + c ∫ b( t ) dt





2

I1 = ∫ [ f ′( t )]2 dt =2 π ∫ iωF (ω ) dω = 2 π ∫ ω 2 F (ω ) dω.

Соответствующие формулы для периодических функций с перио
дом T были, по существу, выведены в § 7 (см. (53)):
T

I 0 = ∫ [ f ( t )]2 dt = T
0





2

ak ,

k =−∞

где a k — коэффициенты разложения функции f (t) в ряд Фурье (40).
Здесь достаточно найти энергию за время одного периода, а вместо ин
теграла по частоте входит сумма. Выражение для I 1 имеет аналогич
ный вид.
Два выражения для I — через интеграл по времени или интеграл
(сумму) по частотам — можно представить себе как выражение квадра
та модуля вектора по теореме Пифагора в виде суммы квадратов его
компонент (ср. истолкование формулы (53) в § 7). При этом разные вы
ражения получаются потому, что мы пользуемся различными система
ми координат: в одной координатами являются значения функции

577

в различных точках, т.е. f (t1 ), f (t1 + ∆t), . . . , в другой — коэффициен
ты Фурье. Равенство двух выражений для I показывает, что каждое
из них является полным, ни одна из компонент вектора не забыта.
Таким образом, выражение энергии не зависит от фазы колебаний:
заменяя F(ω) на F (ω)e ia ( ω ) , где a(ω) — вещественная функция, мы
не меняем интеграл I. Остается неизменной не только полная энергия,
но и энергия, полученная осциллятором, настроенным на ту или иную
частоту. При энергетическом подходе фаза колебаний несущественна.
В XX веке и особенно в его второй половине огромное значение
приобрела передача информации, начиная от радиовещания и телеви
дения и кончая кибернетическими системами управления и исследова
тельскими задачами. Ясно, что, отказываясь от регистрации фазы, мы
2
теряем часть информации: если одинаковому по F спектру с разны

dω.

Аналогично, так как Фурьеобразом функции f ′(t) служит iωF (ω), то
2

§ 8]

(рис. 202). Информация, которую необходимо передать, в первом слу
чае заключена в функции a(t), а во втором — в функции b(t). С точки
зрения гармонического анализа, т.е. разложения f (t) в интеграл
Фурье, в обоих случаях мы имеем дело со спектром, в котором F(ω)
отлично от нуля в окрестности ω 0 — величины, называемой несущей
частотой.

Рис. 201.

Рис. 202.

576

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

только модулем амплитуды, точнее, модулем спектральной плотности.
Если колебание описывается вещественной функцией f (t), то поток
энергии для различных типов колебаний пропорционален [ f (t)]2 или
[ f ′(t)]2 , так что полная энергия колебаний, протекшая за все время
−∞ < t < ∞, выражается через интегралы I 0 или I 1 :


I 0 = ∫ [ f ( t )]2 dt,
−∞



I1 = ∫ [ f ′( t )]2 dt.
−∞

Однако эти интегралы легко выражаются через квадрат модуля
спектральной плотности. Чтобы получить это выражение для I 0 , воз
ведем обе части равенства (4) в квадрат, после чего объединим в правой
части два интеграла в один:
[ f ( t )]2 = ∫ F (ω ) e iωt dω ∫ F (ω ) e iωt dω = ∫∫ F (ω1 )F (ω 2 )e i ( ω 1 + ω 2 )t dω1 dω 2 .

Теперь проинтегрируем обе части по t и воспользуемся формулами
(9), (VI.4) и (5):
I 0 = ∫ [ f ( t )]2 dt = ∫∫∫ F (ω1 )F (ω 2 )e i ( ω 1 + ω 2 ) t dt dω1 dω 2 =
= 2 π ∫∫ F (ω1 )F (ω 2 )δ (ω1 + ω 2 ) dω1 dω 2 =
= 2 π ∫ F ( −ω 2 )F (ω 2 ) dω 2 = 2 π ∫ F (ω)

2

МОДУЛЬ И ФАЗА СПЕКТРАЛЬНОЙ ПЛОТНОСТИ

ми фазами отвечают разные f (t), то при неизвестной фазе нельзя вос
2
произвести f (t), зная лишь F . Записывая F и фазу, мы получили
бы, грубо говоря, вдвое больше сведений, вдвое больше информации от
заданной волны. Более того, оказывается возможным передавать ин
формацию именно за счет изменения фазы колебаний, при постоянной
их амплитуде.
В радиотехнике известны два способа передачи информации: с по
мощью амплитудной модуляции
f ( t ) = a ( t )cos ω 0 t

(рис. 201) или с помощью частотной модуляции
t


f ( t ) = a 0 cos ω 0 t + c ∫ b( t ) dt





2

I1 = ∫ [ f ′( t )]2 dt =2 π ∫ iωF (ω ) dω = 2 π ∫ ω 2 F (ω ) dω.

Соответствующие формулы для периодических функций с перио
дом T были, по существу, выведены в § 7 (см. (53)):
T

I 0 = ∫ [ f ( t )]2 dt = T
0





2

ak ,

k =−∞

где a k — коэффициенты разложения функции f (t) в ряд Фурье (40).
Здесь достаточно найти энергию за время одного периода, а вместо ин
теграла по частоте входит сумма. Выражение для I 1 имеет аналогич
ный вид.
Два выражения для I — через интеграл по времени или интеграл
(сумму) по частотам — можно представить себе как выражение квадра
та модуля вектора по теореме Пифагора в виде суммы квадратов его
компонент (ср. истолкование формулы (53) в § 7). При этом разные вы
ражения получаются потому, что мы пользуемся различными система
ми координат: в одной координатами являются значения функции

577

в различных точках, т.е. f (t1 ), f (t1 + ∆t), . . . , в другой — коэффициен
ты Фурье. Равенство двух выражений для I показывает, что каждое
из них является полным, ни одна из компонент вектора не забыта.
Таким образом, выражение энергии не зависит от фазы колебаний:
заменяя F(ω) на F (ω)e ia ( ω ) , где a(ω) — вещественная функция, мы
не меняем интеграл I. Остается неизменной не только полная энергия,
но и энергия, полученная осциллятором, настроенным на ту или иную
частоту. При энергетическом подходе фаза колебаний несущественна.
В XX веке и особенно в его второй половине огромное значение
приобрела передача информации, начиная от радиовещания и телеви
дения и кончая кибернетическими системами управления и исследова
тельскими задачами. Ясно, что, отказываясь от регистрации фазы, мы
2
теряем часть информации: если одинаковому по F спектру с разны

dω.

Аналогично, так как Фурьеобразом функции f ′(t) служит iωF (ω), то
2

§ 8]

(рис. 202). Информация, которую необходимо передать, в первом слу
чае заключена в функции a(t), а во втором — в функции b(t). С точки
зрения гармонического анализа, т.е. разложения f (t) в интеграл
Фурье, в обоих случаях мы имеем дело со спектром, в котором F(ω)
отлично от нуля в окрестности ω 0 — величины, называемой несущей
частотой.

Рис. 201.

Рис. 202.

578

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

ОТВЕТЫ И РЕШЕНИЯ

[Гл. XIV

В случае амплитудной модуляции, чтобы определить спектр, разло
жим a(t):
a ( t ) = ∫ A(ω )e iωt dω.

Очевидно, что если A(t) отлично от нуля лишь в полосе −∆ < ω < ∆, то
разложение f (t) будет сосредоточено в полосе частот той же ширины,
т.е. F(ω) ≠ 0 при ω 0 − ∆ < ω < ω 0 + ∆ (конечно, и при −ω 0 − ∆ < ω <
< −ω 0 + ∆, что в силу соотношения (5) не дает для частот ничего ново
го). Эта ширина не зависит от абсолютного значения амплитуды.
В случае частотной модуляции мгновенное значение частоты равно
производной от фазы:
ω( t ) =

t

d 
w0 t + c ∫ b( t ) dt  = w0 + cb( t ) .
dt 



(

)

τ > cb (τ)



1. F (ω ) =

1
− α t − iωt
∫ e e dt =
2 π −∞

0

 1  1
α
1  αt − iωt
1  1
− αt − iωt
∫e
.
dt
+
dt =


=
∫e
2


π
α
ω

α

i
ω
π
i
2 π  −∞
2

α + ω2

0
1
Если обозначить α = , мы получим как раз один из примеров, из которых
m
в § VI.1 при m→ ∞ (т.е. α → +0) была получена дельтафункция; значит, для
f ( t ) ≡ 1 будет F (ω ) = δ(ω ). Формула (4) дает

=



α
1
−α t
,
e itω dω = e
2
2
π
α
ω
+
−∞



т.е.


Однако, согласно принципу неопределенности (§ 5), мы должны иметь
достаточный интервал времени τ, для того чтобы частота изменилась
существенно и это изменение можно было бы зарегистрировать:
−1

§ 2

α cos tω
−α t
.
dω = πe
α 2 + ω2
−∞



При α = 1 получаем формулу (I.1) в других обозначениях.
2. Из (17) получаем

,



где b надо понимать как (b2 )1 2 . Соответствующее время изменения
самой функции b(t) зависит от частоты передаваемого сигнала;это
время равно τ = 1 ∆. Таким образом, если cb (t) ∆ > 1, то ширина поло
сы, используемой для передачи, т.е. ширина спектра F(ω) функции
f (t), равна cb (t) и больше ширины частоты сигнала ∆.
В определенных условиях большая ширина передаваемого радио
сигнала оказывается выгодной и позволяет уменьшить помехи.
Рисунки 201 и 202 показывают, в частности, что две функций f (t)
2
с похожим спектром, с похожей зависимостью F(ω) могут выгля
деть совершенно поразному. Это различие проистекает изза различия
фаз, т.е. функции ϕ (ω) в выражении F (ω) =

579

2

F (ω) e iϕ( ω ) .

ОТВЕТЫ И РЕШЕНИЯ
§ 1
1. F (ω ) = ∑ a kδ(ω − ω k ).
k

2. Так будет, если все ω k соизмеримы, т.е. ω k = nkα , где α > 0 не зависит
от k, а все nk — целые. Тогда все слагаемые, а потому и сумма имеют период

T= .
α

x(t ) =

F (ω )e iωt dω
,
m(ω 20 − ω 2 ) + iωh
−∞



где


F (ω ) =

1
− iωt
∫ f ( t ) e dt.
2 π −∞

Заменяя в последнем интеграле обозначение переменной интегрирова
ния t на τ, подставляя этот интеграл в первый и меняя порядок интегрирова
ния, получаем после преобразований


x( t ) =



e iω ( t − τ )
1
f ( τ ) dτ ∫
dω .
2

2 π −∞
m(ω 0 − ω 2 ) + iωh
−∞

Внутренний интеграл можно вычислить по методам § V.9. Подынтегральная
функция имеет простые полюсы при
ω = ω1, 2 =

ih
h2
± − 2 + ω 20 = iγ ± ω 0 ;
2m
4m

оба эти значения находятся в верхней полуплоскости. При t > τ, пользуясь вер
хней полуокружностью ω = R → ∞, получаем, что внутренний интеграл равен
 e iω 1 ( t − τ )
e iω 2 ( t − τ )  2 π − γ ( t − τ )
+
e
2 πi 
sin ω 0 ( t − τ ).
=
0

+

+
2
m
ω
ih
2
m
ω
ih
m
ω
1
2



578

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

ОТВЕТЫ И РЕШЕНИЯ

[Гл. XIV

В случае амплитудной модуляции, чтобы определить спектр, разло
жим a(t):
a ( t ) = ∫ A(ω )e iωt dω.

Очевидно, что если A(t) отлично от нуля лишь в полосе −∆ < ω < ∆, то
разложение f (t) будет сосредоточено в полосе частот той же ширины,
т.е. F(ω) ≠ 0 при ω 0 − ∆ < ω < ω 0 + ∆ (конечно, и при −ω 0 − ∆ < ω <
< −ω 0 + ∆, что в силу соотношения (5) не дает для частот ничего ново
го). Эта ширина не зависит от абсолютного значения амплитуды.
В случае частотной модуляции мгновенное значение частоты равно
производной от фазы:
ω( t ) =

t

d 
w0 t + c ∫ b( t ) dt  = w0 + cb( t ) .
dt 



(

)

τ > cb (τ)



1. F (ω ) =

1
− α t − iωt
∫ e e dt =
2 π −∞

0

 1  1
α
1  αt − iωt
1  1
− αt − iωt
∫e
.
dt
+
dt =


=
∫e
2


π
α
ω

α

i
ω
π
i
2 π  −∞
2

α + ω2

0
1
Если обозначить α = , мы получим как раз один из примеров, из которых
m
в § VI.1 при m→ ∞ (т.е. α → +0) была получена дельтафункция; значит, для
f ( t ) ≡ 1 будет F (ω ) = δ(ω ). Формула (4) дает

=



α
1
−α t
,
e itω dω = e
2
2
π
α
ω
+
−∞



т.е.


Однако, согласно принципу неопределенности (§ 5), мы должны иметь
достаточный интервал времени τ, для того чтобы частота изменилась
существенно и это изменение можно было бы зарегистрировать:
−1

§ 2

α cos tω
−α t
.
dω = πe
α 2 + ω2
−∞



При α = 1 получаем формулу (I.1) в других обозначениях.
2. Из (17) получаем

,



где b надо понимать как (b2 )1 2 . Соответствующее время изменения
самой функции b(t) зависит от частоты передаваемого сигнала; это
время равно τ = 1 ∆. Таким образом, если cb (t) ∆ > 1, то ширина поло
сы, используемой для передачи, т.е. ширина спектра F(ω) функции
f (t), равна cb (t) и больше ширины частоты сигнала ∆.
В определенных условиях большая ширина передаваемого радио
сигнала оказывается выгодной и позволяет уменьшить помехи.
Рисунки 201 и 202 показывают, в частности, что две функций f (t)
2
с похожим спектром, с похожей зависимостью F(ω) могут выгля
деть совершенно поразному. Это различие проистекает изза различия
фаз, т.е. функции ϕ (ω) в выражении F (ω) =

579

2

F (ω) e iϕ( ω ) .

ОТВЕТЫ И РЕШЕНИЯ
§ 1
1. F (ω ) = ∑ a kδ(ω − ω k ).
k

2. Так будет, если все ω k соизмеримы, т.е. ω k = nkα , где α > 0 не зависит
от k, а все nk — целые. Тогда все слагаемые, а потому и сумма имеют период

T= .
α

x(t ) =

F (ω )e iωt dω
,
m(ω 20 − ω 2 ) + iωh
−∞



где


F (ω ) =

1
− iωt
∫ f ( t ) e dt.
2 π −∞

Заменяя в последнем интеграле обозначение переменной интегрирова
ния t на τ, подставляя этот интеграл в первый и меняя порядок интегрирова
ния, получаем после преобразований


x( t ) =



e iω ( t − τ )
1
f ( τ ) dτ ∫
dω .
2

2 π −∞
m(ω 0 − ω 2 ) + iωh
−∞

Внутренний интеграл можно вычислить по методам § V.9. Подынтегральная
функция имеет простые полюсы при
ω = ω1, 2 =

ih
h2
± − 2 + ω 20 = iγ ± ω 0 ;
2m
4m

оба эти значения находятся в верхней полуплоскости. При t > τ, пользуясь вер
хней полуокружностью ω = R → ∞, получаем, что внутренний интеграл равен
 e iω 1 ( t − τ )
e iω 2 ( t − τ )  2 π − γ ( t − τ )
+
e
2 πi 
sin ω 0 ( t − τ ).
=
0

+

+
2
m
ω
ih
2
m
ω
ih
m
ω
1
2



580

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

При t < τ надо пользоваться нижней полуокружностью, что приводит к ра
венству интеграла нулю. Таким образом,
x( t ) =

1
mω 0

t

−γ(t − τ )
sin ω 0 ( t − τ ) f ( τ ) dτ.
∫e

−∞

ОТВЕТЫ И РЕШЕНИЯ

581

§ 7
1. При m ≠ n будет
T

T

∫ cos
0

2 mπ
2 nπ
1 
2( m + n )π
2( m − n )π 
t ⋅ cos
t dt = ∫ cos
t + cos
t  dt =
20
T
T
T
T

T

1
T
2( m + n )π
T
2( m − n )π 
= 
sin
t+
sin
t  = 0.
2 2( m + n )π
T
2( m − n )π
T
t = 0

§ 4
1. Образом функции f ( at ) служит


a∞

−i
1
1
− iωt
∫ f ( at )e dt = a ∫ f ( t1 ) e
2 π −∞
− a∞

ω
t1
a

1  ω
dt1 = F  
a α

(сделана подстановка at = t1 ) при a > 0; при a < 0 надо переставить пределы
интегрирования, что даст

2. e − it 0 ( ω − β )

1  ω
1
 ω
F  =
F  .
α
a α a

α
1
;
π α 2 + (ω − β )2

α

1
.
iω 2
=
α
α + ω2 α 2 + ω2

§ 5
1. Так как на соотношение неопределенности сдвиг по оси t не влияет, то
положим f ( t ) = C ( x < h ), f ( t ) = 0 ( x > h ), так что ∆t = 2 h. Тогда по формуле
sin ωh
. Примем за ширину полученной функции ширину средне
(10) F (ω ) = C
ωh
π
го «горба», т.е. расстояние между ее соседними нулями. Тогда ∆ω = , откуда
h
π
∆t ∆ω = 2 h = 2 π = const.
h
2. Если както определена ширина ∆t функции f ( t ) и ширина ∆ω ее
∆t
плотности F (ω ), то ширина функции f ( at ) равна
, а ширина ее плотности
a
1
∆t
 ω
F   равна a ∆ω. При этом
⋅ a ∆ω = ∆t ∆ω, т.е. не зависит от а.


a
a
a
§ 6
2 A ∞ 4 A cos2 kαt
а)
;

π ∑
4k 2 − 1
k =1 π


( −1)k
2 kπt
;
sin
k
T
k =1

б)

hT hT

2
π

в)

2T
A A ∞
kπt
. Период kй гармоники равен
.
+
cos
T
2T T ∑
k
k =1



2 mπ
t ≡ 1. Аналогично проверяется
T
ортогональность друг другу синусов, а также синуса — косинусу. Если интег
T
рал берется от 0 до , то синусы косинусам уже не ортогональны (интеграл
2
оказывается отличным от нуля). Для интервала 0  t 2T интегралы тоже рав
ны нулю, но так так все функции (52) периодичны с периодом T, то и разлагать
по ним можно только функцию, значения которой на части T  t 2T в точнос
ти повторяют ее значения на части 0  t T.
2. При m ≠ n будет
При этом может быть и m = 0, тогда cos

T

∫e
0

2 mπ i
t
T

*

T

2 ( m − n ) πi
T 2 ( m − n ) πi
 2 nπi t 
t
t
T
 e T  dt = e T
e T
dt =
| = 0.



2
(

n
)
π
i
m
t =0


0

580

ПРЕОБРАЗОВАНИЕ ФУРЬЕ

[Гл. XIV

При t < τ надо пользоваться нижней полуокружностью, что приводит к ра
венству интеграла нулю. Таким образом,
x( t ) =

1
mω 0

t

−γ(t − τ )
sin ω 0 ( t − τ ) f ( τ ) dτ.
∫e

−∞

ОТВЕТЫ И РЕШЕНИЯ

581

§ 7
1. При m ≠ n будет
T

T

∫ cos
0

2 mπ
2 nπ
1 
2( m + n )π
2( m − n )π 
t ⋅ cos
t dt = ∫ cos
t + cos
t  dt =
20
T
T
T
T

T

1
T
2( m + n )π
T
2( m − n )π 
= 
sin
t+
sin
t  = 0.
2 2( m + n )π
T
2( m − n )π
T
t = 0

§ 4
1. Образом функции f ( at ) служит


a∞

−i
1
1
− iωt
∫ f ( at )e dt = a ∫ f ( t1 ) e
2 π −∞
− a∞

ω
t1
a

1  ω
dt1 = F  
a α

(сделана подстановка at = t1 ) при a > 0; при a < 0 надо переставить пределы
интегрирования, что даст

2. e − it 0 ( ω − β )

1  ω
1
 ω
F  =
F  .
α
a α a

α
1
;
π α 2 + (ω − β )2

α

1
.
iω 2
=
α
α + ω2 α 2 + ω2

§ 5
1. Так как на соотношение неопределенности сдвиг по оси t не влияет, то
положим f ( t ) = C ( x < h ), f ( t ) = 0 ( x > h ), так что ∆t = 2 h. Тогда по формуле
sin ωh
. Примем за ширину полученной функции ширину средне
(10) F (ω ) = C
ωh
π
го «горба», т.е. расстояние между ее соседними нулями. Тогда ∆ω = , откуда
h
π
∆t ∆ω = 2 h = 2 π = const.
h
2. Если както определена ширина ∆t функции f ( t ) и ширина ∆ω ее
∆t
плотности F (ω ), то ширина функции f ( at ) равна
, а ширина ее плотности
a
1
∆t
 ω
F   равна a ∆ω. При этом
⋅ a ∆ω = ∆t ∆ω, т.е. не зависит от а.


a
a
a
§ 6
2 A ∞ 4 A cos2 kαt
а)
;

π ∑
4k 2 − 1
k =1 π


( −1)k
2 kπt
;
sin
k
T
k =1

б)

hT hT

2
π

в)

2T
A A ∞
kπt
. Период kй гармоники равен
.
+
cos
T
2T T ∑
k
k =1



2 mπ
t ≡ 1. Аналогично проверяется
T
ортогональность друг другу синусов, а также синуса — косинусу. Если интег
T
рал берется от 0 до , то синусы косинусам уже не ортогональны (интеграл
2
оказывается отличным от нуля). Для интервала 0  t 2T интегралы тоже рав
ны нулю, но так так все функции (52) периодичны с периодом T, то и разлагать
по ним можно только функцию, значения которой на части T  t 2T в точнос
ти повторяют ее значения на части 0  t T.
2. При m ≠ n будет
При этом может быть и m = 0, тогда cos

T

∫e
0

2 mπ i
t
T

*

T

2 ( m − n ) πi
T 2 ( m − n ) πi
 2 nπi t 
t
t
T
 e T  dt = e T
e T
dt =
| = 0.



2
(

n
)
π
i
m
t =0


0

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Абсолютно сходящийся ряд 86
Автономная система дифференциаль
ных уравнений 253
Автономный процесс 253
Адамса метод 270
Адиабатический инвариант 265
Адиабатическое изменение 264
Аксиальный вектор 389
Амплитудная модуляция 577
Аналитическая функция 167
Антикоммутативность 367
Антисимметрический тензор 387
Античастица 189, 390
Аргумент комплексного числа 147
Архимеда закон 360
Асимптотическая формула 62
Асимптотически устойчивое по Ля
пунову решение 236, 254
Базис 299, 310
Безвихревое поле 401
Безусловный экстремум 445
Бернулли интеграл 361
Бесконечномерное пространство 316
Бесселя формула 40
Бесциркуляционное поле 401
Бетатрон 413
Биения 234
БиоСавара закон 410
Больцмана постоянная 54, 503
Быстроколеблющиеся функции, ин
тегрирование 79–82, 559
Быстроменяющиеся функции, интег
рирование 69–77
Вариационное исчисление 421
Вариационный принцип 458

Вариация функции 430
— функционала 430
Вектор 296
— аксиальный 389
— вихревой 394
— единичный 299
— истинный 389
—, компоненты 299
—, модуль 296
—, момент 371
— обобщенный 316
— площадки 358
— полярный 389
—, производная 304
— скользящий 370
— угловой скорости 370
Векторная линия 331, 348
Векторновекторное произведение 369
Векторное поле 321, 348
— — центральное 373
— произведение 366, 367
— пространство 316
Векторноскалярное произведение
369
Векторный потенциал 407
Векторы линейно зависимые 298
Вероятностей интеграл 532
— теория 479—533
Вероятность 479
Вес 48
Ветвления точка 174
Вещественная часть 146
Вещественное линейное простран
ство 317
Вихревая линия 399, 405
Вихревой вектор 394
Вихрь 394

Влияния функция 193
Внешний интеграл 135
Внутренний интеграл 135
Возмущений метод 30
Возмущенное решение 32, 236
Волновой пакет 564
Волчек 382
Вторая разделенная разность 425
— разность 37
Вынужденные колебания 222–235
Вычет 179
Гамильтона оператор 397
Гармоническая функция 169, 357, 402
Гармонические колебания 159, 220
Гармонический анализ 542
— ряд 85
Гаусса теорема 339
Геометрическая прогрессия 83
Гиббса явление 568
Гильбертово пространство 571
Гиперболическая точка 128
Гиперплоскость 315
Гироскоп 382
Главная нормаль 308
Главное значение интеграла 552
Главные оси тензора 386
Градиент 323
Графический способ подбора формул
51–58
Грина функция 193
Группа преобразований 290, 555
Групповая скорость 463
Давление 358
Даламбера признак 84
Движение финитное (инфинитное)
375
Двойной интеграл 134
Действие 466
Декартова система координат 299
Декартовы координаты вектора 299
Дельтафункция 189
Детерминант 248
Диагональный вид тензора 386
Дивергенция 349
Дидо задача 440
Диполь 201, 346
—, момент 201, 346

583

Дирака дельтафункция 189
Дирихле функция 574
Дискретный спектр 539
Дисперсионные соотношения 553
Дисперсия 515
Дифференциал массы 131
— полный 102
Дифференциальное уравнение 205
— —, асимптотически устойчивое по
Ляпунову решение 236, 254
Дифференциальное уравнение, воз
мущенное решение 236
— — второго порядка 216, 272
— — линейное 209–235
— —, невозмущенное решение 236
— — обыкновенное 205
— —, особая точка 242
— — первого порядка 205
— —, приближенное решение 255
— — Риккати 271
— — с разделяющимися переменны
ми 208
— — с частными производными 205
— —, частное решение 207
— —, численное решение 266–275
Дифференциальных уравнений сис
тема 244, 251
— — — замкнутая 247
Дифференцирование функций, за
данных таблично 41–45
Евклидово пространство 316
Единица мнимая 146
Единичная функция 197
Единичный вектор 299
— тензор 384
Зависимость корреляционная 522
Задача Дидо 440
— Коши 277
Закон Архимеда 360
— БиоСавара 410
— Кулона 335, 376
— линейности 195
— причинности 551
— сохранения четности 390
Законы Кеплера 374, 377, 378
— Кирхгофа 162
— Ньютона 330, 371, 372, 376

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Абсолютно сходящийся ряд 86
Автономная система дифференциаль
ных уравнений 253
Автономный процесс 253
Адамса метод 270
Адиабатический инвариант 265
Адиабатическое изменение 264
Аксиальный вектор 389
Амплитудная модуляция 577
Аналитическая функция 167
Антикоммутативность 367
Антисимметрический тензор 387
Античастица 189, 390
Аргумент комплексного числа 147
Архимеда закон 360
Асимптотическая формула 62
Асимптотически устойчивое по Ля
пунову решение 236, 254
Базис 299, 310
Безвихревое поле 401
Безусловный экстремум 445
Бернулли интеграл 361
Бесконечномерное пространство 316
Бесселя формула 40
Бесциркуляционное поле 401
Бетатрон 413
Биения 234
БиоСавара закон 410
Больцмана постоянная 54, 503
Быстроколеблющиеся функции, ин
тегрирование 79–82, 559
Быстроменяющиеся функции, интег
рирование 69–77
Вариационное исчисление 421
Вариационный принцип 458

Вариация функции 430
— функционала 430
Вектор 296
— аксиальный 389
— вихревой 394
— единичный 299
— истинный 389
—, компоненты 299
—, модуль 296
—, момент 371
— обобщенный 316
— площадки 358
— полярный 389
—, производная 304
— скользящий 370
— угловой скорости 370
Векторная линия 331, 348
Векторновекторное произведение 369
Векторное поле 321, 348
— — центральное 373
— произведение 366, 367
— пространство 316
Векторноскалярное произведение
369
Векторный потенциал 407
Векторы линейно зависимые 298
Вероятностей интеграл 532
— теория 479—533
Вероятность 479
Вес 48
Ветвления точка 174
Вещественная часть 146
Вещественное линейное простран
ство 317
Вихревая линия 399, 405
Вихревой вектор 394
Вихрь 394

Влияния функция 193
Внешний интеграл 135
Внутренний интеграл 135
Возмущений метод 30
Возмущенное решение 32, 236
Волновой пакет 564
Волчек 382
Вторая разделенная разность 425
— разность 37
Вынужденные колебания 222–235
Вычет 179
Гамильтона оператор 397
Гармоническая функция 169, 357, 402
Гармонические колебания 159, 220
Гармонический анализ 542
— ряд 85
Гаусса теорема 339
Геометрическая прогрессия 83
Гиббса явление 568
Гильбертово пространство 571
Гиперболическая точка 128
Гиперплоскость 315
Гироскоп 382
Главная нормаль 308
Главное значение интеграла 552
Главные оси тензора 386
Градиент 323
Графический способ подбора формул
51–58
Грина функция 193
Группа преобразований 290, 555
Групповая скорость 463
Давление 358
Даламбера признак 84
Движение финитное (инфинитное)
375
Двойной интеграл 134
Действие 466
Декартова система координат 299
Декартовы координаты вектора 299
Дельтафункция 189
Детерминант 248
Диагональный вид тензора 386
Дивергенция 349
Дидо задача 440
Диполь 201, 346
—, момент 201, 346

583

Дирака дельтафункция 189
Дирихле функция 574
Дискретный спектр 539
Дисперсионные соотношения 553
Дисперсия 515
Дифференциал массы 131
— полный 102
Дифференциальное уравнение 205
— —, асимптотически устойчивое по
Ляпунову решение 236, 254
Дифференциальное уравнение, воз
мущенное решение 236
— — второго порядка 216, 272
— — линейное 209–235
— —, невозмущенное решение 236
— — обыкновенное 205
— —, особая точка 242
— — первого порядка 205
— —, приближенное решение 255
— — Риккати 271
— — с разделяющимися переменны
ми 208
— — с частными производными 205
— —, частное решение 207
— —, численное решение 266–275
Дифференциальных уравнений сис
тема 244, 251
— — — замкнутая 247
Дифференцирование функций, за
данных таблично 41–45
Евклидово пространство 316
Единица мнимая 146
Единичная функция 197
Единичный вектор 299
— тензор 384
Зависимость корреляционная 522
Задача Дидо 440
— Коши 277
Закон Архимеда 360
— БиоСавара 410
— Кулона 335, 376
— линейности 195
— причинности 551
— сохранения четности 390
Законы Кеплера 374, 377, 378
— Кирхгофа 162
— Ньютона 330, 371, 372, 376

584

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Замкнутая система дифференциаль
ных уравнений 247
Знакочередующаяся сумма 21
Знакочередующийся ряд 85
Изоклина 208
— бесконечностей 208
— нулей 208
Изолированная точка 129
Изопериметрическая задача 449
Изотропия 317
Импеданс 163
Инвариант адиабатический 265
Интеграл Бернулли 361
Интеграл вероятностей 495, 532
— двойной 134
— кратный 133
— криволинейный 134
— линейный 326, 391
— несобственный 61–69
— — главное значение 552
— — правильно сходящийся 94
— — равномерно сходящийся 94
— —, численное интегрирование 67
— объемный 131
— от функции комплексного пере
менного 170–175
— ошибок 12
— первый 246
— по мере 202
— расходящийся 62, 64, 66, 95
— Римана 200
— собственный 61
— Стилтьеса 202
— сходящийся 62, 66
— тройной 134
— Фурье 232, 548
Интегралы, зависящие от параметра
93–97
Интегральная линия 206
— сумма 131
Интегральное уравнение 256
Интегральный признак Коши 84
— синус 12
Интегрирование функций, заданных
таблично 41–45
— численное 12–17
Интерполяционная задача 14

Интерполяционная формула Бессе
ля 40
Интерполяция 36, 54
— квадратичная 39
— линейная 38
Инфинитное движение 375
Истинный вектор 389
Источник векторных линий 348, 352
Исчисление вариационное 421
Итераций метод 27, 255
Кавитация 363
Кажущееся сопротивление 163
Кардано формула 27
Квадратичная интерполяция 39
— форма 126
Квадратичный функционал 430
Кеплера законы 374, 377, 378
Кеплерово движение 378
Кинетическая энергия 308, 379
Кинетический момент 373
Кирхгофа законы 162
Колебаний уравнение 217, 239
Колебания вынужденные 222, 224
— гармонические 159, 220
— свободные (собственные) 165,
217–221
Количество векторных линий 334,
348, 350
Коммутативность 367
Комплексное линейное простра
нство 317
— число 146
— —, аргумент 147
— —, извлечение корня 156
— —, модуль 147
— —, показательная форма 154
— —, сопряженное 149
— —, тригонометрическая форма
147
Компонента вектора 299
Конвективная скорость 105
Конденсатор 345
Конечное уравнение 25
Концевой экстремум 456
Координаты обобщенные 140
Корень из комплексного числа 156
— кратный 158

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Корреляции коэффициент 523
Корреляционная зависимость 522
Коши задача 277
— интегральный признак 84
— теорема 172
КошиРимана условия 168
Коэффициент корреляции 523
Краевая задача 276
Краевое условие 276
Кратный интеграл 133
— корень 158
Кривизна 308
Криволинейный интеграл 134
Критерии подобия 284
Кронекера символ 384
Круговая перестановка 390, 394
Кулона закон 335, 376
Лагранжа множитель 447
— функция 466
Лапласа оператор 356
— уравнение 168, 356, 402
Лейбница признак 85
Ленца правило 412
Линейная зависимость (независи
мость) векторов 298
— интерполяция 38
— комбинация 217, 298
Линейное дифференциальное урав
нение 209–235
Линейное отображение 312
— пространство 316
— — вещественное 317
— — комплексное 317
Линейности закон 195
Линейные действия 297
Линейный интеграл 326, 391
— функционал 430
Линия векторная 331, 348
— вихревая 399, 405
—, изолированная точка 129
— интегральная 206
—, обыкновенная точка 129
— ориентированная 326
—, особая точка 129
— силовая 170, 331
Линия тока 332
—, точка самопересечения 129

585

— уровня 108, 325
— цепная 440
Логарифм комплексного числа 156
Локальная скорость изменения
поля 105
— флуктуация 501
Лорана ряд 178
Магнитное поле 406
Мажорируемость 94
Максвелла уравнения 410–413
Малого параметра метод 30, 259
Массовая скорость 333, 353
Матрица 312
Медленно меняющаяся величина 264
Мембрана 444, 467
Метод Адамса 270
— возмущений 30
— итераций 27, 255
— касательных 26
— малого параметра 30, 259
— МонтеКарло 291
— наименьших квадратов 47
— неопределенных коэффициентов
259
— Ньютона 26
— последовательных приближений
27
— Ритца (РитцаГалеркина) 470
— трапеций 13
— Эйлера .267
— Эйткена 29
Минимакс 125
Мнимая единица 146
— степень 153
— часть 146
Мнимое число 150
Многозначная функция 174
Многомерное векторное простра
нство 314–318
Многомерное многообразие 140
— пространство 140
Многообразие kмерное 140
Множитель Лагранжа 447
Моделирование 286
Модуль вектора 296
— комплексного числа 147
Модуляция 577

584

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Замкнутая система дифференциаль
ных уравнений 247
Знакочередующаяся сумма 21
Знакочередующийся ряд 85
Изоклина 208
— бесконечностей 208
— нулей 208
Изолированная точка 129
Изопериметрическая задача 449
Изотропия 317
Импеданс 163
Инвариант адиабатический 265
Интеграл Бернулли 361
Интеграл вероятностей 495, 532
— двойной 134
— кратный 133
— криволинейный 134
— линейный 326, 391
— несобственный 61–69
— — главное значение 552
— — правильно сходящийся 94
— — равномерно сходящийся 94
— —, численное интегрирование 67
— объемный 131
— от функции комплексного пере
менного 170–175
— ошибок 12
— первый 246
— по мере 202
— расходящийся 62, 64, 66, 95
— Римана 200
— собственный 61
— Стилтьеса 202
— сходящийся 62, 66
— тройной 134
— Фурье 232, 548
Интегралы, зависящие от параметра
93–97
Интегральная линия 206
— сумма 131
Интегральное уравнение 256
Интегральный признак Коши 84
— синус 12
Интегрирование функций, заданных
таблично 41–45
— численное 12–17
Интерполяционная задача 14

Интерполяционная формула Бессе
ля 40
Интерполяция 36, 54
— квадратичная 39
— линейная 38
Инфинитное движение 375
Истинный вектор 389
Источник векторных линий 348, 352
Исчисление вариационное 421
Итераций метод 27, 255
Кавитация 363
Кажущееся сопротивление 163
Кардано формула 27
Квадратичная интерполяция 39
— форма 126
Квадратичный функционал 430
Кеплера законы 374, 377, 378
Кеплерово движение 378
Кинетическая энергия 308, 379
Кинетический момент 373
Кирхгофа законы 162
Колебаний уравнение 217, 239
Колебания вынужденные 222, 224
— гармонические 159, 220
— свободные (собственные) 165,
217–221
Количество векторных линий 334,
348, 350
Коммутативность 367
Комплексное линейное простра
нство 317
— число 146
— —, аргумент 147
— —, извлечение корня 156
— —, модуль 147
— —, показательная форма 154
— —, сопряженное 149
— —, тригонометрическая форма
147
Компонента вектора 299
Конвективная скорость 105
Конденсатор 345
Конечное уравнение 25
Концевой экстремум 456
Координаты обобщенные 140
Корень из комплексного числа 156
— кратный 158

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Корреляции коэффициент 523
Корреляционная зависимость 522
Коши задача 277
— интегральный признак 84
— теорема 172
КошиРимана условия 168
Коэффициент корреляции 523
Краевая задача 276
Краевое условие 276
Кратный интеграл 133
— корень 158
Кривизна 308
Криволинейный интеграл 134
Критерии подобия 284
Кронекера символ 384
Круговая перестановка 390, 394
Кулона закон 335, 376
Лагранжа множитель 447
— функция 466
Лапласа оператор 356
— уравнение 168, 356, 402
Лейбница признак 85
Ленца правило 412
Линейная зависимость (независи
мость) векторов 298
— интерполяция 38
— комбинация 217, 298
Линейное дифференциальное урав
нение 209–235
Линейное отображение 312
— пространство 316
— — вещественное 317
— — комплексное 317
Линейности закон 195
Линейные действия 297
Линейный интеграл 326, 391
— функционал 430
Линия векторная 331, 348
— вихревая 399, 405
—, изолированная точка 129
— интегральная 206
—, обыкновенная точка 129
— ориентированная 326
—, особая точка 129
— силовая 170, 331
Линия тока 332
—, точка самопересечения 129

585

— уровня 108, 325
— цепная 440
Логарифм комплексного числа 156
Локальная скорость изменения
поля 105
— флуктуация 501
Лорана ряд 178
Магнитное поле 406
Мажорируемость 94
Максвелла уравнения 410–413
Малого параметра метод 30, 259
Массовая скорость 333, 353
Матрица 312
Медленно меняющаяся величина 264
Мембрана 444, 467
Метод Адамса 270
— возмущений 30
— итераций 27, 255
— касательных 26
— малого параметра 30, 259
— МонтеКарло 291
— наименьших квадратов 47
— неопределенных коэффициентов
259
— Ньютона 26
— последовательных приближений
27
— Ритца (РитцаГалеркина) 470
— трапеций 13
— Эйлера .267
— Эйткена 29
Минимакс 125
Мнимая единица 146
— степень 153
— часть 146
Мнимое число 150
Многозначная функция 174
Многомерное векторное простра
нство 314–318
Многомерное многообразие 140
— пространство 140
Многообразие kмерное 140
Множитель Лагранжа 447
Моделирование 286
Модуль вектора 296
— комплексного числа 147
Модуляция 577

586

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Момент вектора 371
— вращения 373
— диполя 201, 346
— инерции 381
— кинетический 373
МонтеКарло метод 291
Муавра формула 154
Наблаоператор 397
Наименьшего действия принцип 466
Наименьших квадратов метод 47
Напряженность магнитного поля 406
Начальная задача 275
Начальное условие 207, 220, 275
Неабсолютно сходящийся ряд 86
Неасимптотически устойчивое реше
ние 236
Невозмущенное решение 32, 236
Независимые события 482
Нелинейный функционал 430
Немой индекс 311
Необратимый процесс 502
Неоднородное линейное дифферен
циальное уравнение 210, 222, 228,
276
Неодносвязная область 416
Неопределенности принцип 563
Неопределенных коэффициентов ме
тод 259
Непрерывный спектр 539
Неразрывности уравнение 353
Несобственный интеграл 61–69
— — правильно сходящийся 94
— — равномерно сходящийся 94
— —, численное интегрирование 67
Неустановившееся поле 321
Неустойчивость вычислений 292
Неявная функция 109
— —, производная 114
Норма функции 571
Нормаль главная 308
Нормальная составляющая 309
Нормальный закон 521
Нормировка 330
Носитель функции 539
Нулевое приближение 25
Нуль машинный 288
Нульвектор 298

Ньютона законы 330, 371, 372, 376
— метод 26
— формула 39
Обильность источника 348
Область 130
—, мера 133
— неодносвязная 416
— односвязная 415
Обобщенные координаты 140
— функции 574
Обобщенный вектор 316
Образ 195, 554
Объемный интеграл 131
Обыкновенное дифференциальное
уравнение 205
Огибающая 121
Однородное линейное дифференци
альное уравнение 209, 217
Односвязная область 415
Оператор 195
— Гамильтона 397
— Лапласа 356
— Фурье 554
Определитель 248
— системы 248
Оптическая плотность 459
Ориентированная линия 326
— поверхность 332
Ортогональная система функций 571
— — — полная 572
Особая точка дифференциального
уравнения 242
— — линии 129
Особенности интеграла 61
Остроградского формула 349
Отображение линейное 312
Параболическая точка 128
Параметр 93, 113
Параметра малого метод 30
Параметрический резонанс 266
Параметрическое задание функции
113
Первая разность 37
Первого приближения система 254
Первое приближение 26
Первый интеграл 246
Передаточная функция 550

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Перестановка круговая (цикличес
кая) 390, 394
Пересчет 268
Переходный период 234
Планка постоянная 265, 468, 503
Плоское поле 322
Плоскопараллельное поле 322
Плоскость соприкасающаяся 309
Плотность распределения вероятнос
тей 481, 510
— совместного распределения 524
— спектральная 539, 547
Поверхность ориентированная 332
— уровня 324
Пограничный слой 282
Подобие явлений 282
Поле 321
— безвихревое 401
— бесциркуляционное 401
— векторное 321, 348
— магнитное 406
— нестационарное (неустановившее
ся) 321
— плоское 322
— плоскопараллельное 322
— потенциальное 400
— силовое 326
— скалярное 321
— скорости 332, 352, 404
— соленоидальное 409
— стационарное (установившееся)
105, 321
— электрическое 335, 355
— электромагнитное 410
— электростатическое 335
Полная ортогональная система функ
ций 572
— производная 104
— энергия 330, 374
Полный дифференциал 102
«Полуцелые» значения аргумента 37
Полюс 178
Полярный вектор 389
Последовательных приближений ме
тод 27
Постоянная Больцмана 54, 503
— Планка 265, 468, 503
— Эйлера 90

587

Поступательный перенос 296
Потенциал 330, 336, 400, 414
— векторный 407
Потенциал центробежный 376
— эффективный 376
Потенциальная энергия 328
Потенциальное поле 400
Поток вектора 333, 348
Правило Ленца 412
— параллелограмма 297
— правого винта 366
Правильно сходящийся несобствен
ный интеграл 94
Правый винт 366
Преобразование Фурье 545
Прецессионное движение 383
Приближение нулевое 25
— первое 26
Приближенные методы решения
дифференциальных уравнений
255
Признак Даламбера 84
— Лейбница 85
Признаки сходимости рядов 83–85
Принцип вариационный 458
— наименьшего действия 466
— неопределенности 563
— сохранения четности 390
— суперпозиции 193
— Ферма 459
Причинности закон 551
Прогрессия геометрическая 83
Проекция вектора 300
Произведение векторновекторное
369
— векторное 366, 367
— векторноскалярное 369
— скалярное 301, 570
— смешанное 369
— тензорное 313
Производная вектора 304
— неявной функции 114
— полная 104
— функции, заданной параметричес
ки 113
— частная 101
— — второго порядка 105
— — смешанная 105

586

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Момент вектора 371
— вращения 373
— диполя 201, 346
— инерции 381
— кинетический 373
МонтеКарло метод 291
Муавра формула 154
Наблаоператор 397
Наименьшего действия принцип 466
Наименьших квадратов метод 47
Напряженность магнитного поля 406
Начальная задача 275
Начальное условие 207, 220, 275
Неабсолютно сходящийся ряд 86
Неасимптотически устойчивое реше
ние 236
Невозмущенное решение 32, 236
Независимые события 482
Нелинейный функционал 430
Немой индекс 311
Необратимый процесс 502
Неоднородное линейное дифферен
циальное уравнение 210, 222, 228,
276
Неодносвязная область 416
Неопределенности принцип 563
Неопределенных коэффициентов ме
тод 259
Непрерывный спектр 539
Неразрывности уравнение 353
Несобственный интеграл 61–69
— — правильно сходящийся 94
— — равномерно сходящийся 94
— —, численное интегрирование 67
Неустановившееся поле 321
Неустойчивость вычислений 292
Неявная функция 109
— —, производная 114
Норма функции 571
Нормаль главная 308
Нормальная составляющая 309
Нормальный закон 521
Нормировка 330
Носитель функции 539
Нулевое приближение 25
Нуль машинный 288
Нульвектор 298

Ньютона законы 330, 371, 372, 376
— метод 26
— формула 39
Обильность источника 348
Область 130
—, мера 133
— неодносвязная 416
— односвязная 415
Обобщенные координаты 140
— функции 574
Обобщенный вектор 316
Образ 195, 554
Объемный интеграл 131
Обыкновенное дифференциальное
уравнение 205
Огибающая 121
Однородное линейное дифференци
альное уравнение 209, 217
Односвязная область 415
Оператор 195
— Гамильтона 397
— Лапласа 356
— Фурье 554
Определитель 248
— системы 248
Оптическая плотность 459
Ориентированная линия 326
— поверхность 332
Ортогональная система функций 571
— — — полная 572
Особая точка дифференциального
уравнения 242
— — линии 129
Особенности интеграла 61
Остроградского формула 349
Отображение линейное 312
Параболическая точка 128
Параметр 93, 113
Параметра малого метод 30
Параметрический резонанс 266
Параметрическое задание функции
113
Первая разность 37
Первого приближения система 254
Первое приближение 26
Первый интеграл 246
Передаточная функция 550

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Перестановка круговая (цикличес
кая) 390, 394
Пересчет 268
Переходный период 234
Планка постоянная 265, 468, 503
Плоское поле 322
Плоскопараллельное поле 322
Плоскость соприкасающаяся 309
Плотность распределения вероятнос
тей 481, 510
— совместного распределения 524
— спектральная 539, 547
Поверхность ориентированная 332
— уровня 324
Пограничный слой 282
Подобие явлений 282
Поле 321
— безвихревое 401
— бесциркуляционное 401
— векторное 321, 348
— магнитное 406
— нестационарное (неустановившее
ся) 321
— плоское 322
— плоскопараллельное 322
— потенциальное 400
— силовое 326
— скалярное 321
— скорости 332, 352, 404
— соленоидальное 409
— стационарное (установившееся)
105, 321
— электрическое 335, 355
— электромагнитное 410
— электростатическое 335
Полная ортогональная система функ
ций 572
— производная 104
— энергия 330, 374
Полный дифференциал 102
«Полуцелые» значения аргумента 37
Полюс 178
Полярный вектор 389
Последовательных приближений ме
тод 27
Постоянная Больцмана 54, 503
— Планка 265, 468, 503
— Эйлера 90

587

Поступательный перенос 296
Потенциал 330, 336, 400, 414
— векторный 407
Потенциал центробежный 376
— эффективный 376
Потенциальная энергия 328
Потенциальное поле 400
Поток вектора 333, 348
Правило Ленца 412
— параллелограмма 297
— правого винта 366
Правильно сходящийся несобствен
ный интеграл 94
Правый винт 366
Преобразование Фурье 545
Прецессионное движение 383
Приближение нулевое 25
— первое 26
Приближенные методы решения
дифференциальных уравнений
255
Признак Даламбера 84
— Лейбница 85
Признаки сходимости рядов 83–85
Принцип вариационный 458
— наименьшего действия 466
— неопределенности 563
— сохранения четности 390
— суперпозиции 193
— Ферма 459
Причинности закон 551
Прогрессия геометрическая 83
Проекция вектора 300
Произведение векторновекторное
369
— векторное 366, 367
— векторноскалярное 369
— скалярное 301, 570
— смешанное 369
— тензорное 313
Производная вектора 304
— неявной функции 114
— полная 104
— функции, заданной параметричес
ки 113
— частная 101
— — второго порядка 105
— — смешанная 105

588

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Прообраз 195, 554
Пространство бесконечномерное 316
Пространство векторное 314–318
— вещественное 317
— Гильберта 571
— евклидово 316
— kмерное 140
— комплексное 317
— линейное 316
— —, размерность 316
— псевдоевклидово 317
Процесс автономный 253
— сходящийся 28
Прямые методы вариационного исчи
сления 469
Псевдовектор 389
Псевдоевклидово пространство 317
Псевдоскаляр 390
Пуассона распределение 506, 508
— уравнение 356
Равномерно сходящийся несобствен
ный интеграл 94
Радиоактивный распад 504
Радиолампа 117–120
—, внутреннее сопротивление 118
—, коэффициент усиления 118
—, крутизна характеристики 118
Разложение вектора 299
Размерность пространства 316
Разность вторая 37
— — разделенная 425
— первая 37
— первого порядка 37
— центральная 37
Разрез 175
Разрыв 1го рода 558
Ранг тензора 313
Распределение вероятностей нор
мальное 521
— простых чисел 527
— Пуассона 506, 508
Расходимость (дивергенция) 349
Расходящийся интеграл 62, 64, 66, 95
— процесс 28
— ряд 83
Резонанс 235
— параметрический 266

Решение асимптотически устойчи
вое 236, 253
Решение неасимптотически устой
чивое 236
— невозмущенное 32, 236
Риккати уравнение 271
Римана интеграл 204
Ритца (РитцаГалеркина) метод 470
Ротор 394, 405
Ряд абсолютно сходящийся 86
— гармонический 85
— знакочередующийся 85
— Лорана 178
— неабсолютно сходящийся 86
— расходящийся 83
— сходящийся 83
— Тейлора 122
— Фурье 566
— числовой 82
Свободные колебания 165, 217
Связи уравнение 446
Сдвиговое течение 405
Седло (особая точка) 243
Седловина 126
Сила тока комплексная 160
Силовая линия 170, 331
Силовое поле 326
Символ Кронекера 384
Симметрический тензор 386
Симпсона формула 15
Синус интегральный 12
Система автономная 253
— дифференциальных уравнений 244
— — — замкнутая 247
— укороченная (первого приближе
ния) 254
Скаляр 296
Скалярное поле 321
— —, градиент 323
— —, линии уровня 325
— —, поверхности уровня 324
— произведение 301, 570
Скользящий вектор 370
Скорость изменения поля 105
— — — конвективная (переносная) 105
— — — местная (локальная) 105
След тензора 388

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Сложение векторов 297
Слой пограничный 282
Случайная величина 499, 514
Случайные числа 291
Смешанное произведение 369
Собственные колебания 165
Собственный интеграл 61
События независимые 482
Соленоидальное поле 409
Соприкасающаяся плоскость 309
Сопротивление кажущееся 163
Сопряженные гармонические функ
ции 169
— комплексные числа 149
Составляющая вектора 299
Спектр дискретный 539, 547
— задачи 278
— непрерывный 539
— функции 539
Спектральная плотность 539
Спектральный анализ 542, 566–570
Среднее значение функции 132
— квадратичное уклонение 517
Статистический массив 499
Стационарное значение 422
— поле 105, 321
Степени свободы 140
Степень мнимая 153
Стилтьеса интеграл 202
Стирлинга формула 78
Сток 349
Стокса формула 395
Струна 425
Сумма знакочередующаяся 21
Сумма интегральная 131
— частичная 82
Суперпозиции принцип 193
Схема с пересчетом 269
Сходящийся интеграл 62
— процесс 28
— ряд 83
Тангенциальная составляющая 309
Тейлора ряд 122
Температура 503
Тензор 313
— антисимметрический 387
—, диагональный вид 386

589

Тензор единичный 384
— инерции 384
— симметрический 386
— упругих напряжений 387
Тензорное произведение 313
Теорема Гаусса 339
— Коши 172
Теория вероятностей 479–533
Теплосодержание 40
Ток смещения 411
Тока линия 332
— трубка 362
Точка ветвления 174
— воздействия 193
— линии изолированная 129
— — обыкновенная 129
— — особая 129
— наблюдения 193
— особая дифференциального, урав
нения 242
— поверхности гиперболическая 128
— — параболическая 128
— — эллиптическая 128
— самопересечения линии 129
Трапеций способ 13
Тригонометрическая форма ком
плексного числа 147
Тройной интеграл 134
Трубка тока 362
Узел (особая точка) 243
Умножение вектора на скаляр 298
Умножения вероятностей правило 482
Уравнение дифференциальное 205
— интегральное 256
— колебаний 217, 239
— конечное 25
— Лапласа 168, 356, 402
Уравнение неразрывности 353
— Пуассона 356
— Риккати 271
— с частными производными 205
— связи 446
— характеристическое 217, 251
— Эйлера 435
Уравнения Максвелла 410–414
Уровня линия 108, 325
— поверхность 324

588

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Прообраз 195, 554
Пространство бесконечномерное 316
Пространство векторное 314–318
— вещественное 317
— Гильберта 571
— евклидово 316
— kмерное 140
— комплексное 317
— линейное 316
— —, размерность 316
— псевдоевклидово 317
Процесс автономный 253
— сходящийся 28
Прямые методы вариационного исчи
сления 469
Псевдовектор 389
Псевдоевклидово пространство 317
Псевдоскаляр 390
Пуассона распределение 506, 508
— уравнение 356
Равномерно сходящийся несобствен
ный интеграл 94
Радиоактивный распад 504
Радиолампа 117–120
—, внутреннее сопротивление 118
—, коэффициент усиления 118
—, крутизна характеристики 118
Разложение вектора 299
Размерность пространства 316
Разность вторая 37
— — разделенная 425
— первая 37
— первого порядка 37
— центральная 37
Разрез 175
Разрыв 1го рода 558
Ранг тензора 313
Распределение вероятностей нор
мальное 521
— простых чисел 527
— Пуассона 506, 508
Расходимость (дивергенция) 349
Расходящийся интеграл 62, 64, 66, 95
— процесс 28
— ряд 83
Резонанс 235
— параметрический 266

Решение асимптотически устойчи
вое 236, 253
Решение неасимптотически устой
чивое 236
— невозмущенное 32, 236
Риккати уравнение 271
Римана интеграл 204
Ритца (РитцаГалеркина) метод 470
Ротор 394, 405
Ряд абсолютно сходящийся 86
— гармонический 85
— знакочередующийся 85
— Лорана 178
— неабсолютно сходящийся 86
— расходящийся 83
— сходящийся 83
— Тейлора 122
— Фурье 566
— числовой 82
Свободные колебания 165, 217
Связи уравнение 446
Сдвиговое течение 405
Седло (особая точка) 243
Седловина 126
Сила тока комплексная 160
Силовая линия 170, 331
Силовое поле 326
Символ Кронекера 384
Симметрический тензор 386
Симпсона формула 15
Синус интегральный 12
Система автономная 253
— дифференциальных уравнений 244
— — — замкнутая 247
— укороченная (первого приближе
ния) 254
Скаляр 296
Скалярное поле 321
— —, градиент 323
— —, линии уровня 325
— —, поверхности уровня 324
— произведение 301, 570
Скользящий вектор 370
Скорость изменения поля 105
— — — конвективная (переносная) 105
— — — местная (локальная) 105
След тензора 388

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Сложение векторов 297
Слой пограничный 282
Случайная величина 499, 514
Случайные числа 291
Смешанное произведение 369
Собственные колебания 165
Собственный интеграл 61
События независимые 482
Соленоидальное поле 409
Соприкасающаяся плоскость 309
Сопротивление кажущееся 163
Сопряженные гармонические функ
ции 169
— комплексные числа 149
Составляющая вектора 299
Спектр дискретный 539, 547
— задачи 278
— непрерывный 539
— функции 539
Спектральная плотность 539
Спектральный анализ 542, 566–570
Среднее значение функции 132
— квадратичное уклонение 517
Статистический массив 499
Стационарное значение 422
— поле 105, 321
Степени свободы 140
Степень мнимая 153
Стилтьеса интеграл 202
Стирлинга формула 78
Сток 349
Стокса формула 395
Струна 425
Сумма знакочередующаяся 21
Сумма интегральная 131
— частичная 82
Суперпозиции принцип 193
Схема с пересчетом 269
Сходящийся интеграл 62
— процесс 28
— ряд 83
Тангенциальная составляющая 309
Тейлора ряд122
Температура 503
Тензор 313
— антисимметрический 387
—, диагональный вид 386

589

Тензор единичный 384
— инерции 384
— симметрический 386
— упругих напряжений 387
Тензорное произведение 313
Теорема Гаусса 339
— Коши 172
Теория вероятностей 479–533
Теплосодержание 40
Ток смещения 411
Тока линия 332
— трубка 362
Точка ветвления 174
— воздействия 193
— линии изолированная 129
— — обыкновенная 129
— — особая 129
— наблюдения 193
— особая дифференциального, урав
нения 242
— поверхности гиперболическая 128
— — параболическая 128
— — эллиптическая 128
— самопересечения линии 129
Трапеций способ 13
Тригонометрическая форма ком
плексного числа 147
Тройной интеграл 134
Трубка тока 362
Узел (особая точка) 243
Умножение вектора на скаляр 298
Умножения вероятностей правило 482
Уравнение дифференциальное 205
— интегральное 256
— колебаний 217, 239
— конечное 25
— Лапласа 168, 356, 402
Уравнение неразрывности 353
— Пуассона 356
— Риккати 271
— с частными производными 205
— связи 446
— характеристическое 217, 251
— Эйлера 435
Уравнения Максвелла 410–414
Уровня линия 108, 325
— поверхность 324

590

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Условие краевое 276
— начальное 207, 220, 275
Условия КошиРимана 168
Условный экстремум 445
Установившееся поле 321
Устойчивое асимптотически решение
236, 253
— неасимптотически решение 236
Устойчивость 252, 279
— по Ляпунову 253
— — — асимптотическая 236, 253
Фазовая диаграмма 162
— скорость 463
Ферма принцип 458
Финитное движение 375
Флуктуация локальная 501
Фокус 244
Форма квадратичная 126
Формула Бесселя 40
— Кардано 27
— Муавра 154
— Ньютона 39
— Остроградского 349
— Симпсона 15
— Стирлинга 78
— Стокса 395
— Эйлера 153
Функции ортогональные 571
Функционал 429
—, вариация 430
— линейный 430
— нелинейный (квадратичный) 430
—, экстремум 431
Функция аналитическая 167
— влияния (Грина) 193
— гармоническая 169, 357, 402
— Грина 193
— Дирихле 574
— единичная 197
— Лагранжа 466
— многозначная 174
— неявная 109
— —, производная 114
—, параметрическое задание 113
— Хевисайда 197
Функцияобраз 195
Функцияпрообраз 195

Фурье интеграл 232, 548
— оператор 554
Фурье преобразование 545
— ряд 566
Характеристическое уравнение 217, 251
Характерное время 282
Хевисайда функция 197
«Целые» значения аргумента 36
Центр масс 372
— (особая точка) 243
Центральная разность 37
Центральное векторное поле 373
Центральносимметричное поле
325, 334, 349, 350, 356
Центробежный потенциал 376
Цепная линия 440
Циклическая перестановка 394
Циклоида 437
Циркуляция 328, 392
Частичная сумма 82
Частная производная 101
— — второго порядка 105
— — третьего порядка 105
— — смешанная 105
Частное решение 207
Частотная модуляция 577
Численное интегрирование 12–17
— — быстроменяющихся функций
69–77
— — несобственных интегралов 67
— решение дифференциальных
уравнений 266–275
— — конечных уравнений 25–33
Число комплексное 146
— степеней свободы 140
Числовой ряд 82
Чисто мнимое число 150
Шаг таблицы 37
Эйлера метод 267
— постоянная 90
— уравнение 435
— формула 153
Эйткена метод 29

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Экстраполяция 36, 54
Экстремум концевой 456
— с ограничениями 456–458
Экстремум условный 445
— функции 124
— функционала 431
Электрическое поле 335, 355
Электромагнитное поле 410
Электростатическое поле 335
Элемент массы 131
— объема 131

Эллиптическая точка 128
Эмпирическая формула 45
Энергия кинетическая 308, 379
— полная 330, 374
— потенциальная 328
Энтальпия 40
Энтропия 501
Эффективный потенциал 376
Явление Гиббса 568

591

590

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Условие краевое 276
— начальное 207, 220, 275
Условия КошиРимана 168
Условный экстремум 445
Установившееся поле 321
Устойчивое асимптотически решение
236, 253
— неасимптотически решение 236
Устойчивость 252, 279
— по Ляпунову 253
— — — асимптотическая 236, 253
Фазовая диаграмма 162
— скорость 463
Ферма принцип 458
Финитное движение 375
Флуктуация локальная 501
Фокус 244
Форма квадратичная 126
Формула Бесселя 40
— Кардано 27
— Муавра 154
— Ньютона 39
— Остроградского 349
— Симпсона 15
— Стирлинга 78
— Стокса 395
— Эйлера 153
Функции ортогональные 571
Функционал 429
—, вариация 430
— линейный 430
— нелинейный (квадратичный) 430
—, экстремум 431
Функция аналитическая 167
— влияния (Грина) 193
— гармоническая 169, 357, 402
— Грина 193
— Дирихле 574
— единичная 197
— Лагранжа 466
— многозначная 174
— неявная 109
— —, производная 114
—, параметрическое задание 113
— Хевисайда 197
Функцияобраз 195
Функцияпрообраз 195

Фурье интеграл 232, 548
— оператор 554
Фурье преобразование 545
— ряд 566
Характеристическое уравнение 217, 251
Характерное время 282
Хевисайда функция 197
«Целые» значения аргумента 36
Центр масс 372
— (особая точка) 243
Центральная разность 37
Центральное векторное поле 373
Центральносимметричное поле
325, 334, 349, 350, 356
Центробежный потенциал 376
Цепная линия 440
Циклическая перестановка 394
Циклоида 437
Циркуляция 328, 392
Частичная сумма 82
Частная производная 101
— — второго порядка 105
— — третьего порядка 105
— — смешанная 105
Частное решение 207
Частотная модуляция 577
Численное интегрирование 12–17
— — быстроменяющихся функций
69–77
— — несобственных интегралов 67
— решение дифференциальных
уравнений 266–275
— — конечных уравнений 25–33
Число комплексное 146
— степеней свободы 140
Числовой ряд 82
Чисто мнимое число 150
Шаг таблицы 37
Эйлера метод 267
— постоянная 90
— уравнение 435
— формула 153
Эйткена метод 29

ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ

Экстраполяция 36, 54
Экстремум концевой 456
— с ограничениями 456–458
Экстремум условный 445
— функции 124
— функционала 431
Электрическое поле 335, 355
Электромагнитное поле 410
Электростатическое поле 335
Элемент массы 131
— объема 131

Эллиптическая точка 128
Эмпирическая формула 45
Энергия кинетическая 308, 379
— полная 330, 374
— потенциальная 328
Энтальпия 40
Энтропия 501
Эффективный потенциал 376
Явление Гиббса 568

591

Учебное издание

ЗЕЛЬДОВИЧ Яков Борисович
МЫШКИС Анатолий Дмитриевич
ЭЛЕМЕНТЫ ПРИКЛАДНОЙ МАТЕМАТИКИ

Редактор С.А. Тюрина
Оригинал-макет: С.М. Данилюк
Оформление переплета: Н.В. Гришина

Подписано в печать 7.11.07. Формат 60 90/16. Бумага офсетная.
Печать офсетная. Усл. печ. л. 37. Уч.-изд. л. 40,7. Тираж 2000 экз.
Заказ №

Издательская фирма «Физико-математическая литература»
МАИК «Наука/Интерпериодика»
117997, Москва, ул. Профсоюзная, 90
E-mail: fizmat@maik.ru, fmlsale@maik.ru;
http://www.fml.ru

Отпечатано с готовых диапозитивов в ПФ «Полиграфист»
160001, г. Вологда, ул. Челюскинцев, 3
Тел.: (8172) 72-55-31, 72-61-75, факс: (8172) 72-60-72
E-mail: form.pfp@votel.ru http://www.vologda/ pfpv



ISBN 978-5-9221-0775-4