‹-- Назад

Связь дифференциала с частными производными

        Теорема 7.9   Пусть функция $ f$ дифференцируема в точке $ x^0$ . Докажем, что тогда в точке $ x^0$ существуют частные производные по всем переменным $ x_i$ , причём если

$\displaystyle df(x^0;{\Delta}x)=D_1(x^0){\Delta}x_1+\ldots+D_n(x^0){\Delta}x_n,$

то


        Доказательство.     Рассмотрим приращения вида $ {\Delta}x=({\Delta}x_1;0;\dots;0)$ , где $ {\Delta}x_1\ne0$ . Тогда $ \vert{\Delta}x\vert=\vert{\Delta}x_1\vert$ и $ \vert{\Delta}x\vert\to0$ при $ {\Delta}x_1\to0$ . Поскольку $ {\Delta}x_2=0,\ \dots,\ {\Delta}x_n=0$ , приращение функции имеет вид

$\displaystyle {\Delta}f=D_1(x^0){\Delta}x_1+{\alpha}(x^0;{\Delta}x).$

Разделив обе части на $ {\Delta}x_1$ и переходя к пределу при $ {\Delta}x_1\to0$ , получаем:

$\displaystyle \lim_{{\Delta}x_1\to0}\frac{{\Delta}f}{{\Delta}x_1}=D_1(x^0)+
\lim_{{\Delta}x_1\to0}\frac{{\alpha}(x^0;{\Delta}x)}{{\Delta}x_1}.$

Второе слагаемое даёт 0, поскольку

$\displaystyle \lim_{{\Delta}x_1\to0}\bigl\vert\frac{{\alpha}(x^0;{\Delta}x)}{{\...
...lta}x\vert\to0}\frac{\vert{\alpha}(x^0;{\Delta}x)\vert}{\vert{\Delta}x\vert}=0,$

по предположению о дифференцируемости.

Левая часть же даёт частную производную по $ x_1$ , поскольку точка $ x^0+{\Delta}x$ при приращении указанного вида находится на прямой, проходящей через точку $ x^0$ параллельно оси $ Ox_1$ . Значит,

$\displaystyle \lim_{{\Delta}x_1\to0}\frac{{\Delta}f}{{\Delta}x_1}=\frac{\partial f}{\partial x_1}(x^0).$

Итак, доказали, что частная производная по $ x_1$ существует, и

$\displaystyle \frac{\partial f}{\partial x_1}(x^0)=D_1(x^0).$

Совершенно аналогично доказывается существование частных производных по $ x_2,\dots, x_n$ и равенства (7.3) при $ i=2,\dots,n$ , если рассматривать ненулевые приращения лишь по какой-либо из остальных переменных.     

Итак, доказанная теорема позволяет записать дифференциал функции в виде


Эта формула выражает дифференциал через частные производные первого порядка.

Заметим, что если взять функцию $ f$ равной какой-нибудь координате,

$\displaystyle f(x)=x_i,$

то, очевидно,

$\displaystyle \frac{\partial f}{\partial x_i}=1;\ \frac{\partial f}{\partial x_j}=0$ при $\displaystyle j\ne i,$

так что по формуле (7.4) получаем:

$\displaystyle df=dx_i=1\cdot{\Delta}x_i={\Delta}x_i:$

приращение $ {\Delta}x_i$ координаты $ x_i$ и её дифференциал $ dx_i$ совпадают. Поэтому формулу (7.4) можно записать в виде


где $ dx=(dx_1;\dots;dx_n).$

        Пример 7.15   Найдём дифференциал функции трёх переменных

$\displaystyle f(x_1;x_2;x_3)=x_1^3x_2^2x_3.$

Поскольку

$\displaystyle \frac{\partial f}{\partial x_1}=3x_1^2x_2^2x_3;\ %
\frac{\partial f}{\partial x_2}=2x_1^3x_2x_3;\ %
\frac{\partial f}{\partial x_3}=x_1^3x_2^2,
$

то по формуле (7.5) получаем:

$\displaystyle df(x;dx)=(3x_1^2x_2^2x_3)dx_1+(2x_1^3x_2x_3)dx_2+(x_1^3x_2^2)dx_3.$

    

Выше мы видели, что, во-первых, наличие частных производных функции в какой-либо точке не гарантирует непрерывности функции в этой точке, а во-вторых, что из дифференцируемости функции следует её непрерывность. Отсюда следует, что из возможности записать правую часть последней формулы ещё не следует существование левой части: функция может оказаться не дифференцируемой, даже если все частные производные существуют.

Однако имеет место следующая теорема, дающая достаточное условие дифференцируемости функции.

        Теорема 7.10   Пусть функция $ f(x)$ имеет в некоторой окрестности точки $ x^0$ частные производные $ \displaystyle{\frac{\partial f}{\partial x_i}}(x)$ , $ i=1,\dots,n$ , и все они непрерывны в точке $ x^0$ . Тогда функция $ f(x)$ дифференцируема в точке $ x^0$ .

        Доказательство.     Пусть приращение аргумента $ {\Delta}x$ таково, что точка $ x^0+{\Delta}x$ принадлежит той окрестности точки $ x^0$ , в которой существуют все частные производные. Преобразуем приращение функции $ {\Delta}f$ при таком приращении аргумента:

$\displaystyle {\Delta}f=f(x^0+{\Delta}x)-f(x^0)=$ (7.6)
$\displaystyle =f(x^0_1+{\Delta}x_1;x^0_2+{\Delta}x_2;\dots;x^0_{n-1}+{\Delta}x_{n-1};x^0_n+{\Delta}x_n)-$    
$\displaystyle -f(x^0_1;x^0_2{+}{\Delta}x_2;\dots;x^0_{n{-}1}{+}{\Delta}x_{n{-}1...
...x^0_2{+}{\Delta}x_2;\dots;x^0_{n{-}1}+{\Delta}x_{n{-}1};x^0_n{+}{\Delta}x_n){-}$    
$\displaystyle -f(x^0_1;x^0_2;\dots;x^0_{n-1}+{\Delta}x_{n-1};x^0_n+{\Delta}x_n)+
 f(x^0_1;x^0_2;\dots;x^0_{n-1}+{\Delta}x_{n-1};x^0_n+{\Delta}x_n)-\ldots-$    
$\displaystyle -f(x^0_1;x^0_2;\dots;x^0_{n-1};x^0_n+{\Delta}x_n)+
 f(x^0_1;x^0_2;\dots;x^0_{n-1};x^0_n+{\Delta}x_n)-$    
$\displaystyle -f(x_1^0;x_2^0;\dots;x_{n-1}^0;x^0_n).$    

Заметим, что все слагаемые в правой части (7.6), кроме первого и последнего, добавлены дважды с противоположными знаками, так что правая часть получена из левой тождественным преобразованием.

Пусть $ g_i(x_i)$  -- ограничение функции $ f$ на прямую $ l_i$ , параллельную оси $ Ox_i$ (через какую точку проходит прямая, будем каждый раз уточнять). Так как функция $ g_n(x_n)=f(x_1^0;x_2^0;\dots;x^0_{n-1},x_n)$ по предположению имеет производную по $ x_i$ , то к ней можно применить теорему Лагранжа на отрезке между точками $ x^0_n$ и $ x^0_n+{\Delta}x_n$ (для определённости будем считать, что $ {\Delta}x_n>0$ ):

$\displaystyle g_n(x^0_n+{\Delta}x_n)-g_n(x^0_n)=g_n'(x_n^*){\Delta}x_n,$

где $ x^*_n\in[x_n^0;x_n^0+{\Delta}x_n]$ , то есть

$\displaystyle f(x^0_1;x^0_2;\dots;x^0_{n-1};x^0_n+{\Delta}x_n)-
 f(x^0_1;x^0_2;\dots;x^0_{n-1};x^0_n)=$    
$\displaystyle \frac{\partial f}{\partial x_n}(x_1^0;x_2^0;\dots;x_{n-1}^0;x_n^*){\Delta}x_n.$    

По аналогичной причине, применение теоремы Лагранжа к функции $ {g_{n-1}(x_{n-1})=f(x_1^0;x^0_2;\dots;x_{n-1},x^0_n+{\Delta}x_n)}$ на отрезке между $ x^0_{n-1}$ и $ x^0_{n-1}+{\Delta}x_{n-1}$ приводит к равенству

$\displaystyle f(x^0_1;x^0_2;\dots;x^0_{n-1}+{\Delta}x_{n-1};x^0_n+{\Delta}x_n)
 -f(x^0_1;x^0_2;\dots;x^0_{n-1};x^0_n+{\Delta}x_n)=$    
$\displaystyle =\frac{\partial f}{\partial x_{n-1}}(x_1^0;x_2^0;\dots;x_{n-1}^*;x_n^0+{\Delta}x_n){\Delta}x_{n-1},$    

где $ x_{n-1}^*\in[x^0_{n-1};x^0_{n-1}+{\Delta}x_{n-1}]$ (снова для определённости считаем, что $ {\Delta}x_{n-1}>0$ ).

Применяя тот же приём по переменным $ x_{n-2},\ x_{n-3}$ и т. д.  и дойдя до переменной $ x_1$ , получим в итоге:

$\displaystyle {\Delta}f=
 \frac{\partial f}{\partial x_1}(x_1^*;x_2^0+{\Delta}x_2;\dots;x_{n-1}^0+{\Delta}x_{n-1};x_n^0+{\Delta}x_n)
 {\Delta}x_1+$    
$\displaystyle +\frac{\partial f}{\partial x_2}(x_1^0;x_2^*;\dots;x_{n-1}^0+{\Delta}x_{n-1};x_n^0+{\Delta}x_n){\Delta}x_2+
 \ldots+$    
$\displaystyle +\frac{\partial f}{\partial x_{n-1}}(x_1^0;x_2^0;\dots;x_{n-1}^*;x_n^0+{\Delta}x_n){\Delta}x_{n-1}+$    
$\displaystyle \frac{\partial f}{\partial x_n}(x_1^0;x_2^0;\dots;x_{n-1}^0;x_n^*){\Delta}x_n.$    

Так как по предположению частная производная $ \displaystyle{\frac{\partial f}{\partial x_n}}(x)$ непрерывна в точке $ x^0$ , то при $ {\Delta}x_n\to0$ будет $ x_n^*\to x_n^0$ (и, следовательно, $ (x_1^0;x_2^0;\dots;x_{n-1}^0;x_n^*)\to x^0)$ ), то

$\displaystyle \frac{\partial f}{\partial x_n}(x_1^0;x_2^0;\dots;x_{n-1}^0;x_n^*)=\frac{\partial f}{\partial x_n}(x^0)+{\Delta}f_n',$

где $ {\Delta}f_n'\to0$ при $ {\Delta}x_n\to0$ (и, следовательно, при $ {\Delta}x\to0$ ).

Аналогично,

$\displaystyle \frac{\partial f}{\partial x_{n-1}}(x_1^0;x_2^0;\dots;x_{n-1}^*;x_n^0+{\Delta}x_n)=
\frac{\partial f}{\partial x_{n-1}}(x^0)+{\Delta}f_{n-1}',$

где $ {\Delta}f_{n-1}'\to0$ при $ {\Delta}x_n\to0$ и $ {\Delta}x_{n-1}\to0$ (и, следовательно, при $ {\Delta}x\to0$ ); ...; наконец,

$\displaystyle \frac{\partial f}{\partial x_2}(x_1^0;x_2^*;\dots;x_{n-1}^0+{\Delta}x_{n-1};x_n^0+{\Delta}x_n)=
\frac{\partial f}{\partial x_2}(x^0)+{\Delta}f_2',$

где $ {\Delta}f_2'\to0$ при $ {\Delta}x_n\to0$ , $ {\Delta}x_{n-1}\to0$ , ..., $ {\Delta}x_2\to0$ (и, следовательно, при $ {\Delta}x\to0$ ) и

$\displaystyle \frac{\partial f}{\partial x_1}(x_1^*;x_2^0+{\Delta}x_2;\dots;x_{...
...x_{n-1};x_n^0+{\Delta}x_n)=
\frac{\partial f}{\partial x_1}(x^0)+{\Delta}f_1',$

где $ {\Delta}f_1'\to0$ при $ {\Delta}x_n\to0$ , $ {\Delta}x_{n-1}\to0$ , ..., $ {\Delta}x_2\to0$ , $ {\Delta}x_1\to0$ (то есть при $ {\Delta}x\to0$ ).

Используя полученные равенства, находим, что

$\displaystyle {\Delta}f=\frac{\partial f}{\partial x_1}(x^0){\Delta}x_1+\ldots+\frac{\partial f}{\partial x_n}(x^0){\Delta}x_n+$    
$\displaystyle +{\Delta}f_1'{\Delta}x_1+{\Delta}f_2'{\Delta}x_2+\ldots+{\Delta}f_{n-1}'{\Delta}x_{n-1}+{\Delta}f_n'{\Delta}x_n.$    

Здесь первая группа слагаемых есть в точности $ df(x^0;{\Delta}x)$ . Осталось показать, что остаток

$\displaystyle {\alpha}(x^0;{\Delta}x)=
{\Delta}f_1'{\Delta}x_1+{\Delta}f_2'{\Delta}x_2+\ldots+{\Delta}f_{n-1}'{\Delta}x_{n-1}+{\Delta}f_n'{\Delta}x_n$

имеет больший порядок малости, чем $ \vert{\Delta}x\vert$ , то есть проверить выполнение равенства

$\displaystyle \lim_{\vert{\Delta}x\vert\to0}\frac{{\alpha}(x^0;{\Delta}x)}{\ver...
...elta}f_{n-1}'{\Delta}x_{n-1}+{\Delta}f_n'{\Delta}x_n}
{\vert{\Delta}x\vert}=0.$

Образуем из величин $ {\Delta}f'_1,\dots,{\Delta}f'_n$ вектор $ {\Delta}f'=({\Delta}f'_1,\dots,{\Delta}f'_n)\in\mathbb{R}^n.$ Так как $ {\Delta}f'_i\to0$ при $ {\Delta}x\to0$ для всех $ i=1,\dots,n$ , то и

$\displaystyle \vert De f'\vert\to0$ при $\displaystyle {\Delta}x\to0.$

Представим $ {\alpha}$ в виде скалярного произведения: $ {\alpha}={\Delta}f'\cdot{\Delta}x$ . Поскольку $ \vert a\cdot b\vert\leqslant \vert a\vert\vert b\vert$ , то

$\displaystyle \vert{\alpha}\vert\leqslant \vert{\Delta}f'\vert\vert{\Delta}x\vert$

и

$\displaystyle 0\leqslant \frac{\vert{\alpha}\vert}{\vert{\Delta}x\vert}\leqslant \vert{\Delta}f'\vert.$

Отсюда следует, что

$\displaystyle \frac{\vert{\alpha}\vert}{\vert{\Delta}x\vert}\to0$ при $\displaystyle {\Delta}x\to0,$

и доказательство теоремы завершено.     

        Замечание 7.3   В действительности при доказательстве теоремы мы использовали только часть условий, касающихся непрерывности частных производных $ \displaystyle{\frac{\partial f}{\partial x_i}}(x)$ . Так, у производной $ \displaystyle{\frac{\partial f}{\partial x_n}}(x)$ мы использовали лишь непрерывность по одной переменной $ x_n$ при фиксированных значениях $ x^0_1,x^0_2,\dots,x^0_{n-1}$ остальных переменных; у производной $ \displaystyle{\frac{\partial f}{\partial x_{n-1}}}(x)$  -- лишь непрерывность по переменным $ x_{n-1}$ и $ x_n$ при фиксированных значениях $ x^0_1,x^0_2,\dots,x^0_{n-2}$ и т. д.

Кроме того, порядок нумерации переменных (или добавление и вычитание слагаемых в формуле (7.6)) может быть произвольным, что также приводит к возможности ослабить условие теоремы.     

Напомним, что уpавнение касательной плоскости к гpафику $ y=f(x_1;x_2)$ в точке $ x^0=(x_1^0;x_2^0)$ имеет вид

$\displaystyle y=f(x^0)+\frac{\partial f}{\partial x_1}(x^0)(x_1-x_1^0)+\frac{\partial f}{\partial x_2}(x^0)(x_2-x_2^0).$

С учётом вида диффеpенциала $ df(x^0;{\Delta}x)$ , получаем такое уpавнение касательной плоскости:

$\displaystyle y=f(x^0)+df(x^0;x-x^0).$

Таким обpазом, касательная плоскость -- это гpафик линейной функции $ l(x)$ , заданной фоpмулой

$\displaystyle l(x)=f(x^0)+df(x^0;x-x^0).$

Разность между функцией $ f(x)$ и этой линейной функцией $ l(x)$ pавна

$\displaystyle f(x)-l(x)=f(x)-f(x^0)-df(x^0;{\Delta}x)={\alpha}(x^0;{\Delta}x),$

то есть имеет больший поpядок малости по сpавнению с $ \vert{\Delta}x\vert$ . Поскольку, очевидно, pасстояние от точки гpафика $ (x_1;x_2;f(x_1;x_2))$ до касательной плоскости не больше $ \vert f(x)-l(x)\vert=\vert{\alpha}(x^0;x-x^0)\vert$ ,

Рис.7.14.



то pасстояние от точки гpафика $ y=f(x)$ до касательной плоскости есть бесконечно малая величина большего поpядка малости по сpавнению с pасстоянием от точки гpафика до точки касания.