‹-- Назад

Равенство смешанных частных производных

Ранее мы отмечали, что при некоторых дополнительных предположениях частные производные высших порядков, отличающиеся лишь порядком дифференцирований, совпадают. Теперь мы уточним эти предположения и сформулируем утверждение о равенстве смешанных производных. Оказывается, достаточно предположить непрерывность этих смешанных производных.

        Теорема 7.12   Пусть функция $ f(x)$ задана в области $ {\Omega}\sbs\mathbb{R}^n$ , причём в некоторой окрестности $ B^{x^0}_{{\delta}}$ ( $ {\delta}>0$ ) точки $ x^0\in{\Omega}$ существуют смешанные частные производные

$\displaystyle \frac{\pat^2f}{\pat x_i\pat x_j}(x)$ и $\displaystyle \frac{\pat^2f}{\pat x_j\pat x_i}(x), \ i\ne j,$

и обе эти производные непрерывны в точке $ x^0$ . Тогда эти смешанные производные совпадают в точке $ x^0$ :

$\displaystyle \frac{\pat^2f}{\pat x_i\pat x_j}(x^0)=
\frac{\pat^2f}{\pat x_j\pat x_i}(x^0).$

        Доказательство.     Пусть $ e_i$ и $ e_j$  -- единичные базисные векторы в $ \mathbb{R}^n$ вида $ (0;\dots;0;1;0;\dots;0)$ , где 1 стоит, соответственно, на $ i$ -м и $ j$ -м местах. Пусть $ {\Delta}x_i\ne0$ и $ {\Delta}x_j\ne0$ (для определённости будем далее считать, что $ {\Delta}x_i>0$ и $ {\Delta}x_j>0$ ). Рассмотрим приращения

$\displaystyle {\Delta}x^{(i)}={\Delta}x_ie_i=(0;\dots;0;{\Delta}x_i;0;\dots;0)$ и $\displaystyle {\Delta}x^{(j)}={\Delta}x_je_j=(0;\dots;0;{\Delta}x_j;0;\dots;0)$

и будем считать, что числа $ {\Delta}x_i$ и $ {\Delta}x_j$ достаточно малы, так что точка $ x^0+{\Delta}x^{(i)}+{\Delta}x^{(j)}$ лежит в окрестности $ B^{x^0}_{{\delta}}$ .

Положим

$\displaystyle D=f(x^0+{\Delta}x^{(i)}+{\Delta}x^{(j)})-
f(x^0+{\Delta}x^{(i)})-
f(x^0+{\Delta}x^{(j)})+f(x^0)$

и введём две функции:

$\displaystyle g^{(i)}(x)=f(x+{\Delta}x^{(i)})-f(x)$ и $\displaystyle g^{(j)}(x)=f(x+{\Delta}x^{(j)})-f(x).$

Тогда

$\displaystyle D=[f(x^0+{\Delta}x^{(i)}+{\Delta}x^{(j)})-
 f(x^0+{\Delta}x^{(j)})]-
 [f(x^0+{\Delta}x^{(i)})-f(x^0)]=$    
$\displaystyle =g^{(i)}(x^0+{\Delta}x^{(j)})-g^{(i)}(x^0)=
 {\Delta}g^{(i)}$    

и

$\displaystyle D=[f(x^0+{\Delta}x^{(i)}+{\Delta}x^{(j)})-
 f(x^0+{\Delta}x^{(i)})]-
 [f(x^0+{\Delta}x^{(j)})-f(x^0)]=$    
$\displaystyle =g^{(j)}(x^0+{\Delta}x^{(i)})-g^{(j)}(x^0)={\Delta}g^{(j)}.$    

Полученные разности $ {\Delta}g^{(i)}$ и $ {\Delta}g^{(j)}$ тождественно равны друг другу. Применим к первой из них теорему Лагранжа на отрезке $ [x^0_j;x_j^0+{\Delta}x_j]$ по переменной $ x_j$ :

$\displaystyle D={\Delta}g^{(i)}=g^{(i)}(x^0+{\Delta}x^{(j)})-g^{(i)}(x^0)=
 \frac{\partial g^{(i)}}{\partial x_j}(x^0+te_j){\Delta}x_j=$    
$\displaystyle =\Bigl(\frac{\partial f}{\partial x_j}(x^0+te_j+{\Delta}x^{(i)})-
 \frac{\partial f}{\partial x_j}(x^0+te_j)\Bigr){\Delta}x_j,$    

где $ t\in[0;{\Delta}x_j]$  -- некоторая промежуточная точка. Аналогично, применяя ко второй из разностей, $ {\Delta}g^{(j)}$ , теорему Лагранжа на отрезке $ [x^0_i;x_i^0+{\Delta}x_i]$ по переменной $ x_i$ , получаем

$\displaystyle D={\Delta}g^{(j)}=g^{(j)}(x^0+{\Delta}x^{(i)})-g^{(j)}(x^0)=
 \frac{\partial g^{(j)}}{\partial x_i}(x^0+te_i){\Delta}x_i=$    
$\displaystyle =\Bigl(\frac{\partial f}{\partial x_i}(x^0+se_i+{\Delta}x^{(j)})-
 \frac{\partial f}{\partial x_i}(x^0+se_i)\Bigr){\Delta}x_i,$    

где $ s\in[0;{\Delta}x_i]$  -- некоторая промежуточная точка. (Попутный вопрос к читателю: почему к функциям $ g^{(i)}$ и $ g^{(j)}$ можно было применять теорему Лагранжа, и почему получились именно такие выражения, как написано выше?)

К получившимся в правых частях разностям частных производных

$\displaystyle \frac{\partial f}{\partial x_j}(x^0+te_j+{\Delta}x^{(i)})-
\frac{\partial f}{\partial x_j}(x^0+te_j)$

и

$\displaystyle \frac{\partial f}{\partial x_i}(x^0+te_i+{\Delta}x^{(j)})-
\frac{\partial f}{\partial x_i}(x^0+se_i)$

снова применим теорему Лагранжа и получим

$\displaystyle D=\frac{\partial}{\partial x_i}\Bigl(\frac{\partial f}{\partial x_j}(x^0+s_1e_i+te_j)\Bigr){\Delta}x_i{\Delta}x_j,$

где $ s_1\in[0;{\Delta}x_i]$ , и

$\displaystyle D=\frac{\partial}{\partial x_j}\Bigl(\frac{\partial f}{\partial x_i}(x^0+se_i+t_1e_j)\Bigr){\Delta}x_i{\Delta}x_j,$

где $ t_1\in[0;{\Delta}x_j]$ , и, следовательно,

$\displaystyle \frac{\pat^2f}{\pat x_i\pat x_j}(x^0+s_1e_i+te_j){\Delta}x_i{\Delta}x_j=
\frac{\pat^2f}{\pat x_j\pat x_i}(x^0+se_i+t_1e_j){\Delta}x_i{\Delta}x_j.$

(Снова продумайте вопрос о том, почему можно было применять теорему Лагранжа.) Так как по предположению $ {\Delta}x_i\ne0$ и $ {\Delta}x_j\ne0$ , то на $ {\Delta}x_i{\Delta}x_j$ можно левую и правую части поделить и получить

$\displaystyle \frac{\pat^2f}{\pat x_i\pat x_j}(x^0+s_1e_i+te_j)=
\frac{\pat^2f}{\pat x_j\pat x_i}(x^0+se_i+t_1e_j).$

При $ {\Delta}x_i\to0$ и $ {\Delta}x_j\to0$ величины $ s,s_1$ и $ t,t_1$ стремятся к 0. Поэтому, переходя к пределу при $ {\Delta}x_i\to0$ и $ {\Delta}x_j\to0$ в обеих частях последнего равенства, получаем

$\displaystyle \frac{\pat^2f}{\pat x_i\pat x_j}(x^0)=
\frac{\pat^2f}{\pat x_j\pat x_i}(x^0)$

в силу того, что, по предположению теоремы, обе смешанные частные производные непрерывны в точке $ x^0$ . Итак, теорема доказана.     

Из доказанной теоремы вытекает такое следствие:

        Следствие 7.1   Пусть даны две частные производные порядка $ m$ :

$\displaystyle g(x)=\frac{\pat^mf}{\pat x_{i_1}\pat x_{i_2}\ldots\pat x_{i_m}}(x)$

и

$\displaystyle h(x)=\frac{\pat^mf}{\pat x_{j_1}\pat x_{j_2}\ldots\pat x_{j_m}}(x),$

которые существуют в некоторой окрестности точки $ x^0$ , непрерывны в точке $ x^0$ и отличаются только порядком дифференцирований, то есть если списки номеров переменных $ \{i_1;i_2;\dots;i_m\}$ и $ \{j_1;j_2;\dots;j_m\}$ состоят из равных количеств каждого из чисел $ 1,2,\dots,n$ . Предположим также, что все частные производные меньшего порядка $ m_1<m$

$\displaystyle \frac{\pat^{m_1}f}{\pat x_{k_1}\pat x_{k_2}\ldots\pat x_{k_{m_1}}}(x),$

у которых список номеров переменных $ \{k_1;k_2;\dots;k_{m_1}\}$ есть часть списка $ \{i_1;i_2;\dots;i_m\}$ , также определены в окрестности точки $ x^0$ и непрерывны в этой точке. Тогда смешанные производные $ g(x)$ и $ h(x)$ принимают равные значения в точке $ x^0$ :

$\displaystyle \frac{\pat^mf}{\pat x_{i_1}\pat x_{i_2}\ldots\pat x_{i_m}}(x^0)=
\frac{\pat^mf}{\pat x_{j_1}\pat x_{j_2}\ldots\pat x_{j_m}}(x^0).$

        Доказательство.     Для доказательства этого следствия воспользуемся методом "пузырьковой сортировки": будем переставлять, пользуясь доказанной теоремой и проверяя списки номеров переменных слева направо, те соседние дифференцирования в производных $ g(x)$ и $ h(x)$ , в которых $ i_k>i_{k+1}$ или $ j_l>j_{l+1}$ .

В результате конечного числа таких перестановок, оба значения $ f(x^0)$ и $ g(x^0)$ окажутся равными значению одной и той же смешанной частной производной

$\displaystyle \frac{\pat^mf}{\pat x_{p_1}\pat x_{p_2}\ldots\pat x_{p_m}}(x^0),$

в которой номера переменных идут в порядке неубывания, то есть $ {1\leqslant p_1\leqslant p_2\leqslant \ldots\leqslant p_m\leqslant n}$ . Следовательно, совпадают числа $ f(x^0)$ и $ g(x^0)$ , что и требовалось доказать.     

        Замечание 7.4   Приводя смешанную частную производную к виду

$\displaystyle \frac{\pat^mf}{\pat x_{p_1}\pat x_{p_2}\ldots\pat x_{p_m}},$

где $ 1\leqslant p_1\leqslant p_2\leqslant \ldots\leqslant p_m\leqslant n$ , мы можем записать её в виде

$\displaystyle \frac{\pat^mf}{\pat x_1^{{\alpha}_1}\pat x_2^{{\alpha}_2}\ldots\pat x_n^{{\alpha}_n}},$

где $ {\alpha}_j\geqslant 0$ и $ {\alpha}_1+{\alpha}_2+\ldots+{\alpha}_n=m$ . (Если $ {\alpha}_j=0$ , то соответствующий "множитель" в "знаменателек мы не пишем, а вместо $ \pat x_k^1$ пишем просто $ \pat x_k$ .)     

        Пример 7.17   Если две производных

$\displaystyle \frac{\pat^5f}{\pat x_5\pat x_2\pat x_5\pat x_1\pat x_2}$

и

$\displaystyle \frac{\pat^5f}{\pat x_1\pat x_2^2\pat x_5^2}$

непрерывны, то они совпадают, так как соответствующие списки номеров переменных равны, соответственно, $ \{5;2;5;1;2\}$ и $ \{1;2;2;5;5\}$ и отличаются лишь порядком перечисления номеров. Значит, частные производные отличаются лишь порядком дифференцирований, и поэтому

$\displaystyle \frac{\pat^5f}{\pat x_5\pat x_2\pat x_5\pat x_1\pat x_2}=
\frac{\pat^5f}{\pat x_1\pat x_2^2\pat x_5^2}.$

В этом примере перестановки дифференцирований можно выполнить в следующем порядке:

$\displaystyle \frac{\pat^5f}{\pat x_5\pat x_2\pat x_5\pat x_1\pat x_2}=
 \frac{...
..._5\pat x_1\pat x_2}=
 \frac{\pat^5f}{\pat x_2\pat x_5\pat x_1\pat x_5\pat x_2}=$    
$\displaystyle =\frac{\pat^5f}{\pat x_2\pat x_1\pat x_5\pat x_5\pat x_2}=
 \frac...
..._5\pat x_5\pat x_2}=
 \frac{\pat^5f}{\pat x_1\pat x_2\pat x_5\pat x_2\pat x_5}=$    
$\displaystyle =\frac{\pat^5f}{\pat x_1\pat x_2\pat x_2\pat x_5\pat x_5}=
 \frac{\pat^5f}{\pat x_1\pat x_2^2\pat x_5^2}.$    

При первой и четвёртой перестановках переставляемые диффиеренцирования -- внешние и выполняются непосредственным применением теоремы к функциям $ \frac{\textstyle{\pat^3f}}{\textstyle{\pat x_5\pat x_1\pat x_2}}(x)$ и $ \frac{\textstyle{\pat^3f}}{\textstyle{\pat x_5\pat x_5\pat x_2}}(x)$ соответственно; эти производные третьего порядка предполагаются непрерывными. При остальных перестановках переставляются внутренние дифференцирования. При этом, например, при второй перестановке, рассуждаем так: имеем равенство

$\displaystyle \frac{\pat^5f}{\pat x_2\pat x_5\pat x_5\pat x_1\pat x_2}=
\frac{...
...c{\pat^2}{\pat x_5\pat x_1}\bigl(\frac{\partial f}{\partial x_2}\bigr)\Bigr).
$

Функции $ \frac{\textstyle{\pat^2}}{\textstyle{\pat x_5\pat x_1}}\bigl(\displaystyle{\frac{\partial f}{\partial x_2}}\bigr)$ и $ \frac{\textstyle{\pat^2}}{\textstyle{\pat x_1\pat x_5}}\bigl(\displaystyle{\frac{\partial f}{\partial x_2}}\bigr)$ непрерывны по предположению, так как содержат меньше дифференцирований по $ x_2$ и $ x_5$ , чем исходные производные пятого порядка, и столько же дифференцирований по остальным переменным. Поэтому

$\displaystyle \frac{\textstyle{\pat^2}}{\textstyle{\pat x_5\pat x_1}}\bigl(\dis...
...e{\pat x_1\pat x_5}}\bigl(\displaystyle{\frac{\partial f}{\partial x_2}}\bigr),$

и мы можем продолжить равенство:

$\displaystyle \frac{\pat^2}{\pat x_2\pat x_5}\Bigl(
\frac{\pat^2}{\pat x_5\pat...
... x_2}\bigr)\Bigr)=
\frac{\pat^5f}{\pat x_2\pat x_5\pat x_1\pat x_5\pat x_2},
$

и вторая перестановка обоснована.