‹-- Назад

Матрица Гессе

Двойная сумма в формуле (9.8) содержит в качестве коэффициентов значения всех частных производных второго порядка, вычисленные в точке $ x^0$ . Эти $ n^2$ значений $ h_{ij}=\frac{\textstyle{\pat^2f}}{\textstyle{\pat x_i\pat x_j}}(x^0)$ можно объединить в квадратную матрицу $ H(x^0)=(h_{ij})$ размера $ n\times n$ . Эта матрица $ H(x^0)$ называется матрицей Гессе функции $ f(x)$ в точке $ x^0$ .

Если все смешанные частные производные второго порядка непрерывны, то

$\displaystyle h_{ij}=\frac{\textstyle{\pat^2f}}{\textstyle{\pat x_i\pat x_j}}(x^0)=
\frac{\textstyle{\pat^2f}}{\textstyle{\pat x_j\pat x_i}}(x^0)=h_{ji},$

так что матрица Гессе в этом случае симметрична: $ {}^tH(x^0)=H(x^0)$ (знак $ {}^t$ означает транспонирование матрицы).

Заметим, что линейную часть правой части формулы (9.8) можно представить в виде

$\displaystyle \sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^0)(x_i-x_i^0)=
(\mathop{\rm grad}\nolimits f)(x^0)\cdot(x-x^0)$

(точка означает скалярное произведение), а квадратичную часть, заданную двойной суммой в формуле (9.8), -- в виде

$\displaystyle \frac{1}{2}\sum_{i=1}^n
\sum_{j=1}^n\frac{\pat^2f}{\pat x_i\pat x_j}(x^0)(x_i-x^0_i)(x_j-x^0_j)=
\frac{1}{2}\;{}^t(x-x^0)H(x^0)(x-x^0);$

при этом мы считаем вектор $ x-x^0$ записанным в виде матрицы-столбца, а транспонированный вектор $ {}^t(x-x^0)$  -- в виде матрицы-строки. Тем самым, получаем формулу квадратичного приближения в виде

$\displaystyle f(x)\approx f(x^0)+(\mathop{\rm grad}\nolimits f)(x^0)\cdot(x-x^0)+
\frac{1}{2}\;{}^t(x-x^0)H(x^0)(x-x^0),$

где $ H(x^0)$  -- матрица Гессе.

В случае, когда $ x^0$  -- стационарная точка функции $ f(x)$ , градиент обращается в 0 в точке $ x^0$ , так что получаем

$\displaystyle {\Delta}f=f(x)-f(x^0)\approx
\frac{1}{2}\;{}^t{\Delta}xH(x^0){\Delta}x,$

где $ {\Delta}x$  -- приращение аргумента $ x$ в точке $ x^0$ . Таким образом, в окрестности стационарной точки приращение функции ведёт себя как квадратичная функция приращения аргумента:

$\displaystyle {\Delta}f(x^0;{\Delta}x)\approx
\frac{1}{2}\sum_{i=1}^n
\sum_{j=1}^n\frac{\pat^2f}{\pat x_i\pat x_j}(x^0){\Delta}x_i{\Delta}x_j.$

        Пример 9.1   Рассмотрим функцию

$\displaystyle f(x_1;x_2)=x_1^2e^{x_1+x_2}+x^2_2e^{x_1-x_2}.$

Покажем, что начало координат $ O(0;0)$  -- это стационарная точка функции $ f$ , и найдём квадратичное приближение функции $ f$ в окрестности начала координат.

Частные производные первого порядка равны

$\displaystyle \frac{\partial f}{\partial x_1}=(2x_1+x_1^2)e^{x_1+x_2}+x_2^2e^{x...
...;\ %
\frac{\partial f}{\partial x_2}=x_1^2e^{x_1+x_2}+(2x_2-x_2^2)e^{x_1-x_2}.$

При $ x_1=0$ и $ x_2=0$ обе частные производные, действительно, обращаются в 0, так что точка $ O$  -- стационарная. Вычислим элементы матрицы Гессе $ H(0;0)$ функции $ f$ в точке $ O$ :

$\displaystyle \frac{\pat^2f}{\pat x_1^2}=(2+4x_1+x_1^2)e^{x_1+x_2}+x^2_2e^{x_1-x_2};$

$\displaystyle \frac{\pat^2f}{\pat x_1\pat x_2}=
\frac{\pat^2f}{\pat x_2\pat x_1}=
(2x_1+x_1^2)e^{x_1+x_2}+(2x_2-x^2_2)e^{x_1-x_2};$

$\displaystyle \frac{\pat^2f}{\pat x_2^2}=x_1^2e^{x_1+x_2}+(2-4x_2+x^2_2)e^{x_1-x_2}.$

При $ x_1=0$ и $ x_2=0$ получаем:

$\displaystyle \frac{\pat^2f}{\pat x_1^2}(0;0)=2;
\frac{\pat^2f}{\pat x_1\pat x_2}=
\frac{\pat^2f}{\pat x_2\pat x_1}=0;
\frac{\pat^2f}{\pat x_2^2}=2.
$

Значит,

$\displaystyle H(0;0)=
\begin{pmatrix}
2&0\\
0&2
\end{pmatrix}.$

Так как значение $ f(0;0)$ равно 0, то квадратичное приближение функции $ f(x)$ в окрестности начала координат выглядит так:

$\displaystyle f(x_1;x_2)\approx\frac{1}{2}\;(x_1;x_2)
\begin{pmatrix}
2&0\\ 
...
...{pmatrix}
x_1\\
x_2
\end{pmatrix}
=\frac{1}{2}(2x_1^2+2x_2^2)=x_1^2+x_2^2.$

Таким образом, при небольших $ \vert x\vert$ функция приближённо равна $ \vert x\vert^2$ .