‹-- Назад

Вывод формулы Тейлора

Предположим, что в рассматриваемой области $ {\Omega}\sbs\mathbb{R}^n$ функция $ f(x)$ имеет все частные производные до порядка $ m+1$ включительно. Рассмотрим прямую $ \ell$ , соединяющую фиксированную внутреннюю точку $ x^0\in{\Omega}$ с произвольной точкой $ x\in{\Omega}$ и будем предполагать, что все точки отрезка, соединяющего $ x^0$ с $ x$ , также принадлежат $ {\Omega}$ :

$\displaystyle x^t=x^0+t(x-x^0)\in{\Omega}$ при $\displaystyle t\in[0;1].$

Рассмотрим ограничение функции $ f$ на прямую $ \ell$ (точнее, на её часть, лежащую в пределах области $ {\Omega}$ ) и параметризуем это ограничение параметром $ t$ . Полоучим функцию одного переменного $ t$ :

$\displaystyle \wt f(t)=f(x^0+t(x-x^0)).$

К функции $ \wt f$ можно применить обычную (приведённую выше) формулу Тейлора в точке $ t_0=0$ :

$\displaystyle \wt f(t)=\wt f(0)+\wt f'(0)t+\frac{1}{2!}\wt f''(0)t^2+\ldots+
 \frac{1}{m!}\wt f^{(m)}(0)t^m+
 \frac{1}{(m+1)!}\wt f^{(m+1)}(r)t^m,$    

где $ r$  -- некоторая точка отрезка между 0 и $ t$ . Если $ t\in[0;1]$ , то $ r$ также принадлежит отрезку $ [0;1]$ . Отсюда при $ t=1$ получаем


где $ r\in[0;1]$ .

Очевидно, что $ \wt f(0)=f(x^0)$ . Посмотрим, как производные

$\displaystyle \wt f'(0),\ \wt f''(0),\ \dots,\ \wt f^{(m)}(0),\ \wt f^{(m+1)}(r)$

выражаются через частные производные функции $ f$ .

Для нахождения $ \wt f'(t)$ воспользуемся формулой производной сложной функции:

$\displaystyle \wt f'(t)=\frac{d}{dt}f(x^0+t(x-x^0))=$    
$\displaystyle =\frac{\partial f}{\partial x_1}(x^t)\cdot\frac{d}{dt}(x_1^0+t(x_...
...ts+
 \frac{\partial f}{\partial x_n}(x^t)\cdot\frac{d}{dt}(x_n^0+t(x_n-x_n^0))=$    
$\displaystyle =\frac{\partial f}{\partial x_1}(x^t)(x_1-x_1^0)+\ldots+
 \frac{\...
...(x^t)(x_n-x_n^0)=
 \sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^t)(x_i-x_i^0)=$    
$\displaystyle =(\mathop{\rm grad}\nolimits f)(x^t)\cdot(x-x^0).$    

При $ t=0$ получаем

$\displaystyle \wt f'(0)=\sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^0)(x_i-x_i^0)=$ (9.2)
$\displaystyle =(\mathop{\rm grad}\nolimits f)(x^0)\cdot(x-x^0).$ (9.3)

Вычислим теперь $ \wt f''(0)$ , для чего найдём $ \wt f''(t)$ :

$\displaystyle \wt f''(t)=\frac{d}{dt}\wt f'(t)=\frac{d}{dt}\Bigl(
 \sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^t)(x_i-x_i^0)\Bigr)=$    
$\displaystyle =\sum_{i_1=1}^n\Bigl[\frac{d}{dt}\Bigl(\frac{\partial f}{\partial x_{i_1}}(x^t)\Bigr)\Bigr]
 (x_{i_1}-x^0_{i_1})=$    
$\displaystyle =\sum_{i_1=1}^n\Bigl[
 \sum_{i_1=1}^n\frac{\pat^2f}{\pat x_{i_1}\pat x_{i_2}}(x^t)(x_{i_2}-x^0_{i_2})
 \Bigr](x_{i_1}-x^0_{i_1})=$    
$\displaystyle =\sum_{i_1=1}^n
 \sum_{i_1=2}^n\frac{\pat^2f}{\pat x_{i_1}\pat x_{i_2}}(x^t)(x_{i_1}-x^0_{i_1})
 (x_{i_2}-x^0_{i_2}).$    

Положив в этой формуле $ t=0$ , получаем:


Каждое последующее дифференцирование, как нетрудно понять, будет увеличивать на единицу количество суммирований от 1 до $ n$ , порядок частных производных функции $ f$ , вычисленных в точке $ x^0$ , а также количество сомножителей-биномов вида $ (x_{i_j}-x^0_{i_j})$ . Для третьей производной получаем

$\displaystyle <tex2html_comment_mark>109 \wt f^{(3)}(0)=
 \sum_{i_1=1}^n
 \sum_...
...t x_{i_3}}(x^0)
 (x_{i_1}-x^0_{i_1})
 (x_{i_2}-x^0_{i_2})
 (x_{i_3}-x^0_{i_3}),$    

а для производной порядка $ m$  --


Правая часть формулы (9.5) содержит $ n^m$ слагаемых, в каждом из которых $ m+1$ множитель. Точно так же выписывается и выражение, задающее $ \wt f^{(m+1)}(r)$ :


где $ x^r=x^0+r(x-x^0)$ .

Подставляя выражения (9.2), (9.4),..., (9.5), (9.6) в правую часть формулы (9.1), получаем в результате следующее утверждение:

        Теорема 9.1 (Формула Тейлора для функции нескольких переменных)   Пусть функция $ f(x)$ задана в области $ {\Omega}\sbs\mathbb{R}^n$ и имеет в $ {\Omega}$ все частные производные до порядка $ m+1$ включительно. Пусть $ x^0$ и $ x$  -- две точки области $ {\Omega}$ , такие что весь отрезок между ними целиком лежит в $ {\Omega}$ . Тогда для некоторой точки $ x^r$ этого отрезка имеет место равенство

$\displaystyle f(x)=f(x^0)+
 \sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^0)(x_i-x_i^0)+$ (9.6*)
$\displaystyle +\frac{1}{2!}\sum_{i_1=1}^n
 \sum_{i_2=1}^n\frac{\pat^2f}{\pat x_{i_1}\pat x_{i_2}}(x^0)(x_{i_1}-x^0_{i_1})
 (x_{i_2}-x^0_{i_2})+\ldots+$    
$\displaystyle +\frac{1}{m!}\sum_{i_1=1}^n
 \sum_{i_2=1}^n\ldots
 \sum_{i_m=1}^n...
..._m}}(x^0)
 (x_{i_1}-x^0_{i_1})
 (x_{i_2}-x^0_{i_2})\ldots
 (x_{i_m}-x^0_{i_m})+$    
$\displaystyle +\frac{1}{(m+1)!}\sum_{i_1=1}^n
 \sum_{i_2=1}^n\ldots
 \sum_{i_{m...
...(x^r)
 (x_{i_1}-x^0_{i_1})
 (x_{i_2}-x^0_{i_2})\ldots
 (x_{i_m}-x^0_{i_{m+1}}).$ (9.7)

    

Сумма всех слагаемых в правой части формулы (9.6*), кроме записанных в последней строке, называется многочленом Тейлора функции $ f$ в точке $ x^0$ , а эта последняя строка содержит остаточный член формулы Тейлора. Считая его малым при небольших расстояниях между $ x$ и $ x^0$ (он имеет порядок $ \vert x-x^0\vert^{m+1}$ , в то время как все остальные слагаемые -- порядок не выше $ \vert x-x^0\vert^m$ , если не обращаются в 0), мы можем не учитывать остаточный член и, тем самым, получаем приближённую формулу

$\displaystyle f(x)\approx f(x^0)+
 \sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^0)(x_i-x_i^0)+\notag$    
$\displaystyle +\frac{1}{2!}\sum_{i_1=1}^n
 \sum_{i_2=1}^n\frac{\pat^2f}{\pat x_{i_1}\pat x_{i_2}}(x^0)(x_{i_1}-x^0_{i_1})
 (x_{i_2}-x^0_{i_2})+\ldots+\notag$    
$\displaystyle +\frac{1}{m!}\sum_{i_1=1}^n
 \sum_{i_2=1}^n\ldots
 \sum_{i_m=1}^n...
..._m}}(x^0)
 (x_{i_1}-x^0_{i_1})
 (x_{i_2}-x^0_{i_2})\ldots
 (x_{i_m}-x^0_{i_m}),$    

содержащую лишь значения функции $ f$ и её частных производных, вычисленные в точке $ x^0$ (но не в других точках $ x^r$ ). Эту формулу можно использовать для приближённого вычисления значений функции $ f(x)$ в точках $ x$ , близких к $ x^0$ . На практике её применяют, ввиду большого числа слагаемых в правой части, лишь при небольших значениях $ m$ , как правило, $ m=1$ и $ m=2$ .

При $ m=1$ получается линейное приближение функции $ f$ (нетрудно видеть, что правая часть совпадает с линейной функцией $ y=l(x)$ , графиком которой служит касательная плоскость, проведённая при $ x=x^0$ к графику функции $ y=f(x)$ ):

$\displaystyle f(x)\approx f(x^0)+\sum_{i=1}^n\frac{\partial f}{\partial x_i}(x^0)(x_i-x_i^0).$    

При $ m=2$ получается квадратичное приближение функции $ f$ :


Многочлен Тейлора в этом случае оказывается многочленом второй степени относительно переменных $ x_1,\ \dots,\ x_n$ .