函数的插值

4 minute read

Published: October 10, 2021

多项式插值的基本内容，包括经典的Lagrange,Neville,Newton插值方法，以及多项式重构问题以及Chebyshev插值，Hermite插值于矩阵函数的关系，样条插值以及其性质。

Polynomial Interpolation

本节研究多项式插值问题，给定$n$个数据结点$(x_1,y_1),(x_2,y_2),…,(x_n,y_n)$，求一个$n-1$阶以内多项式，满足：

\[p(x_i) = y_i\]

Uniqueness

上述问题解的唯一性可以简单证明。

一种证明方法是利用线性方程组的思想，将多项式插值问题看作：

\[\begin{pmatrix} 1 & x_1 & ... & x_1^{n-1} \\ 1 & x_2 & ... & x_2^{n-1} \\ ...&...&...&...\\ 1& x_n &... & x_n^{n-1} \end{pmatrix} \begin{pmatrix} a_0 \\ a_1 \\ ... \\ a_{n-1} \end{pmatrix} = \begin{pmatrix} y_1 \\ y_2 \\ ... \\ y_{n} \end{pmatrix}\]

其系数矩阵为Vandemonde行列式，记作$A$,则有：

\[det(A) = \prod_{i <j} (x_j - x_i)\]

由于$x_i \ne x_j$，因此$det(A) \ne 0$，因此上述线性方程有唯一解。

另一种证明思路是首先构造出一个满足条件的多项式$p_1(x)$，然后证明任意满足条件的多项式$p_2(x)$都与$p_1(x)$相等。

此时，$n-1$阶多项式$p_1(x) - p_2(x)$有$n$个相异的根$x_1,x_2,…,x_n$，该$n-1$阶多项式只能为0多项式，也即$p_1(x) = p_2(x)$.

Lagrange‘s Method

Lagrange插值多项式是一种常见的构造方法。

其基于的思想也很简单，构造出一组多项式基$L_i(x)$，满足：

\[\begin{align} L_i(x_j) = 1 ,i=j \\ L_i(x_j) = 0,i \ne j \end{align}\]

$L_i$的构造基于零点即可，

\[L_i(x) = \frac{\prod _{j \ne i} (x - x_j)}{\prod_{j \ne i}(x_i -x_j)}\]

基于上述这组基可以得到满足条件的插值多项式，

\[p(x) = \sum_i y_i L_i(x)\]

在计算中，为了减少重复计算量，可以如下定义$w(x),\lambda_i$并且提前计算，

\[\begin{align} &p(x) = w(x) \sum_i \frac{y_i}{\lambda_i(x-x_i)} \\ \text{With }& w(x) = \prod_j(x-x_j) \\ & \lambda_i = \prod_{j \ne i} (x_j - x_i) \end{align}\]

Neville’s Method

Neville插值方法的思想是用两个$n-1$个插值点构成的插值多项式，合成用$n$个插值点构成的插值多项式。

记$p_{1,2,…,n}(x)$为$x_1,x_2,…,x_n$些插值点构成的插值多项式，对于插值多项式$p_{2,…,n}(x)$和$p_{1,…,n-1}(x)$，想要用上述两个多项式的仿射组合得到插值多项式$p_{1,…,n}(x)$：

\[p_{1,...,n}(x) = \alpha p_{2,...n}(x) + (1-\alpha) p_{1,...,n-1}(x)\]

显然，对于$x_2,…x_{n-1}$，根据仿射组合的定义，其一定满足插值条件，只需考虑端点处的$x_1,x_n$，此时只要取

\[\alpha = \frac{x-x_1}{x_n -x_1},1-\alpha = \frac{x_n -x}{ x_n -x_1}\]

则可以保证组合后的多项式在所有点处都满足插值条件。

据此，我们得到Neville的插值方法，可以用行列式的形式表示为，

\[p_{1,2,...,n}(x) = \frac{ det \begin{pmatrix} x -x_1 & p_{1,2,...,n-1}(x)\\ x - x_n & p_{2,3,...,n}(x) \end{pmatrix} }{x_n - x_1}\]

在插值的过程中，通常考虑内插值，也即$ x_1 \le x \le x_n$, 此时有$0 \le \alpha \le 1$,也即相当于做了一个凸组合。

而对于凸组合的计算是数值稳定的，假设$d = \alpha b+(1-\alpha) c$,而$b,c$的误差分别为$\delta(b),\delta(c)$,则计算出来凸组合$d$的数值误差满足：

\[\delta(d) \le \alpha \delta(b) + (1-\alpha) \delta(c) \le \max(\delta(b),\delta(c))\]

因此，进行凸组合过后的数值误差不会变大，此时Nevill插值方法是数值稳定的。

Newton’s Method

Newton插值巧妙地利用前$n-1$个插值点的插值多项式，递推得到$n$个结点的插值多项式。

此时只要，加上一个由前$n-1$个根组成的多项式$\prod_{j=1}^{n-1}(x -x_j)$,乘上一个组合系数$\alpha_{n-1}$

\[p_{1,2,...,n} = p_{1,2,...n-1} + \alpha_{n-1} \prod_{j=1}^{n-1}(x -x_j) = \sum_i \alpha_i \prod_j^i (x-x_j)\]

根据插值多项式的唯一性，且系数$\alpha_{n}$为该插值多项式的最高次系数，可以根据对照Lagrange多项式的最高次系数得到，

\[\alpha_n = \sum_{k=1}^n \frac{y_n}{\prod_{j \ne k} (x_k -x_j)}\]

实际上，展开可以发现上述的$\alpha_n$其实还是$n$阶差分$f[x_1,x_2,…,x_n]$的表达式，$n$阶差分是Newton方法的精髓，其中$n$阶差分可以被$n-1$阶差分递归定义，且满足：

\[\begin{align} f[x_1] &= y_1 \\ f[x_1,x_2] &= \frac{y_2-y_1}{x_2 -x_1 }\\ f[x_1,x_2,x_3] &= \frac{\frac{y_3-y_2}{x_3 -x_2 }- \frac{y_2-y_1}{x_2 -x_1 }}{x_3 -x_1 } \\ &... \\ f[x_1,x_2,...,x_n] &= \frac{f[x_2,...,x_n]-f[x_1,...x_{n-1}]}{x_n-x_1} \end{align}\]

由于$n$阶差分非常重要，下面给出其性质，

$n$阶差分具有轮换对称性，对于任意排列$\sigma$,证明可以根据Lagrange插值多项式首项的轮换对称性得到：

\[f[x_1,x_2,...,x_n] = f[\sigma(x_1),\sigma(x_2),...,\sigma(x_n)]\]

$n$阶差分和微分也存在关系，当取极限的情况下:

\[\lim_{(x_1,...,x_{n+1}) \rightarrow (x_0,...,x_0)} f[x_1,...x_{n+1}] = \frac{f^{(n)}(x_0)}{n !}\]

Polynomial Reconstruction

如果插值点来自于某个函数$f(x)$，此时多项式插值问题转换为多项式重构问题，也即我们希望寻找一个多项式尽可能重构出原函数$f(x)$.

Error Bound

根据Newton插值方法，可以给出利用插值进行多项式重构的误差。

取$n$个插值点进行插值得到插值多项式$p_n(x)$之后，在其基础上去，对于任意函数值$f(x)$可以看作根据$n$个插值点构成的多项式，使用Newton方法新增一个插值结点形成的。

\[f(x) - p_n(x) = f[x_1,x_2,...x_n,x] \prod_j^n (x-x_j)\]

而由于差分和微分的关系，根据推广的中值定理，存在$\xi$满足：

\[f(x) - p_n(x) = \frac{f^{(n)}(\xi)}{n!} \prod_j^n (x-x_j)\]

因此，我们可以得到多项式重建问题的误差上界，

\[\Vert f(x) - p_n(x) \Vert_{\infty} = \frac{\Vert f^{(n)}(x) \Vert_{\infty}}{n!} \Vert \prod_j^n (x-x_j) \Vert_{\infty}\]

Runge Phenomenon

Runge现象说明了某些情况下，采取等距插值结点可能导致插值结果很差，甚至插值结点越多，插值误差越差的现象，或者

\[\lim_{n \rightarrow \infty} \sup \Vert f(x) - p_n(x) \Vert_{\infty} > 0, \exists f(x)\]

Chebyshev Interpolation

为了避免Runge现象，在可以自由选择插值结点的情况下，通常采用Chebyshev结点插值，此时可以证明这种插值方法是最优的。

\[\Vert f(x) - p_n(x) \Vert_{\infty} = \frac{\Vert f^{(n)}(x) \Vert_{\infty}}{n!} \Vert \prod_j^n (x-x_j) \Vert_{\infty}\]

根据重构误差上界，$\Vert f^{(n)}(x) \Vert_{\infty}$和函数$f(x)$本身的性质相关，和插值结点相关的项为$\Vert \prod_j^n (x-x_j) \Vert_{\infty}$，考虑最小化该项，

首先考虑$x \in [-1,1]$的情况，考虑取插值结点满足，$x_j = \cos \frac{2j-1}{2n} \pi$，此时称为Chebychev结点，对比函数的根和首项系数并且根据插值多项式的唯一性可以知道，

\[T_n(x) = 2^{n-1} \prod_j^n (x-x_j) = \cos (n \arccos x )\]

上式定义的$T_n(x)$即为Chebyshev多项式，此时显然满足

\[\Vert \prod_j^n (x-x_j) \Vert_{\infty} = \frac{\Vert T_n(x) \Vert_{\infty}}{2^{n-1}} =\frac{1}{2^{n-1}}\]

下面我们证明由Chebshev多项式给出的上述$\Vert \prod_j^n (x-x_j) \Vert_{\infty} $的界是最小的界，

假设存在其他某些插值结点插值而成的$n$阶首一多项式$p(x) = \prod_j^n (x-x_j)$ 有更小的界,也即

\[\Vert \prod_j^n (x-x_j) \Vert_{\infty} < \frac{1}{2^{n-1}}\]

构造函数$g(x) = p(x) - \frac{T_n(x)}{2^{n-1}}$ ,且已知Chebyshev多项式在$x_j = \cos \frac{j}{n} \pi$ 这些结点上取到极值，在这些极值点上，有

\[g(x_j) = p(x_j) - \frac{(-1)^j}{2^{n-1}}\]

根据假设，$\Vert p(x_j) \Vert_{\infty} < \frac{1}{2^{n-1}}$ ,因此$g(x)$在这$n+1$个结点上正负交错，因此其具有$n$个根。

又因为$g(x)$为两个首一$n$阶多项式之差，$g(x)$为$n-1$阶多项式，具有$n$个根只能为0多项式，矛盾。

因此，处理Chebyshev结点，不可能存在其他插值结点构成的插值多项式具有更小的界。

将Chebyshev多项式推广到任意闭区间$[a,b]$上，可以得到Chebyshev插值的误差上界，

\[\Vert f(x) - p(x) \Vert_{\infty} \le \frac{ \Vert f^{(n)}(x) \Vert_{\infty}}{2^{n-1} n!}(\frac{b-a}{2})^n\]

Hermite Interpolation

上述问题中考虑的多项式插值都仅在函数值上提要求，Hermite插值对导数值提要求，也即要求插值得到的函数具有一定的光滑性。

Transform to Newton‘s Method

Hermite插值实际上可以转化为一般的插值问题。

例如，基于Lagrange插值的思想，只需要找到一组高阶导数满足给定条件的基，就可以组成新的插值函数。

基于Newton插值方法，可以给出更简洁的Hermite插值的计算，也即将Hermite插值问题看作允许重结点的Newton插值即可。

例如，对于重结点$x_1,x_1$，相当于在$f[x_1,x_1] = \frac{f’(x_1)}{2}$上进行插值。

Matrix Function

Hermite插值本质上和矩阵函数息息相关。

根据Hamilton-Cayley定理，任意矩阵$A$适合于其特征多项式$p(A)=O$

对于不熟悉Hamilton-Cayley定理的读者，以下通过归纳法简证，熟悉的读者可以跳过该部分：

归纳假设是对于$n-1$阶矩阵Hamilton-Cayley定理成立，

首先对矩阵$A$进行Schur分解，

\[PAP^{-1} = \begin{pmatrix} \lambda_1 & \star \\ 0 & B \\ \end{pmatrix}\]

根据归纳假设,$B$适合于其特征多项式$q(B)=O$,

因此，

\[p(A) = (A- \lambda_1I) q(A) = P \begin{pmatrix} 0 & \star \\ 0 & B \end{pmatrix} \begin{pmatrix} q(\lambda_1) & \star \\ 0 & O \end{pmatrix} P^{-1} = O\\\]

Hamilton-Cayley定理得证。

根据Hamilton-Cayley定理，$A^n$可以被$I,A,…,A^{n-1}$线性表示

因此将任意矩阵函数$f(A)$进行Taylor展开后，其都可以被一个$n-1$阶多项式表示，也即$f(A) = p(A)$

根据Jordan标准型理论，求$p(A)$等价于求解$p(J)$，其中$J$为$A$的Jordan标准型。

而对矩阵$J$进行Taylor展开可以得到，

\[f(J) = f(\lambda I+J-\lambda I) =f(\lambda I) + f'(\lambda I) (J -\lambda I) + \frac{f''(\lambda I)}{2} (J - \lambda I)^2 +...\]

代入可以得到，

\[f(J) = \begin{pmatrix} \lambda & f'(\lambda) & f''(\lambda) & ...\\ 0 & \lambda & f'(\lambda) & f''(\lambda) \\ 0 & 0 & \lambda & f'(\lambda) \\ ...& ...&...&... \end{pmatrix}\]

此时求解$f(J)$不仅要求函数值相等，也要求各阶导数值满足条件，也即相当于在$\lambda_1,\lambda_2,…\lambda_n$这些点上做Hermite插值。

Spline Interpolation

样条插值也即使用分段函数进行插值，使用分段函数通常可以获得更小的插值误差上界。

Linear Spline

线性样条是一种简单的想法，在$x_0,x_1,…,x_n$个结点的端点处进行插值，也即使得$s(x_i) = f(x_i)$,且在中间使用线性函数分段拟合，得到样条函数$s(x)$,其插值误差上界，根据上面的理论，在每一段处$n=2$, 并且令区间长度为$h$,

\[\Vert f(x) - s(x) \Vert_{\infty} = \frac{\Vert f^{(n)}(x) \Vert_{\infty}}{n!} \Vert \prod_j^n (x-x_j) \Vert_{\infty}\]

而对于

\[\Vert \prod_j^n (x-x_j) \Vert_{\infty} = \Vert (x-x_1) (x- x_2) \Vert_{\infty} = \frac{h^2}{4}\]

因此，可以得到线性样条插值的重构误差上界为，

\[\Vert f(x) - s(x) \Vert_{\infty} = \frac{h^2}{8} \Vert f^{(2)}(x) \Vert_{\infty}\]

Cubic Spline

一种更常用的方法是三次样条插值，其具有很好的性质。

定义多段在$[x_i,x_{i+1}]$上的分段三次函数$s_i(x) = a_i x^3 + b_i x^2 + c_i x +d_i$,使其函数值满足插值条件且一阶和二阶导数均连续:

\[\begin{align} s_i(x_i) &= f(x_i) \\ s_i(x_{i+1}) &= f(x_{i+1}) \\ s_i'(x_{i+1}) &= s_{i+1}'(x_{i+1})\\ s_i''(x_{i+1}) &= s_{i+1}''(x_{i+1}) \end{align}\]

由于参数总的自由度为$4n$，但上述只提了$4n-2$个条件（端点处没有导数的联系性要求），通常对于端点处增加要求，根据要求的不同可以分为不同的样条：

Complete，完全样条：指定了端点处的一阶导数值，$s_0’(x_0) = k_0, s_{n-1}’(x_{n})=k_n$
Natural，自然样条：令端点处的二阶导数值为0，$s_0’‘(x_0) = 0, s_{n-1}’‘(x_{n})=0$
Periodic，周期样条：令端点处的一阶和二阶导数满足周期性，$s_0’(x_0) = s_{n-1}’(x_{n}),s_0’‘(x_0) = s_{n-1}’‘(x_{n})$

构造相应的线性方程组，即可解得对应的参数取值，得到三次样条插值函数。

可以证明，三次样条通常可以最小化如下定义的势能，其中$t(x)$为满足插值条件的函数。

\[E = \int_a^b [t''(x)]^2 dx\]

对于任意$t(x)$, 定义$\eta(x) = t(x) - s(x)$,

\[\begin{align} \int_a^b [t''(x)]^2 dx &= \int_a^b [s''(x) + \eta''(x)]^2 dx\\ &= \int_a^b [s''(x)]^2 dx + \int_a^b [\eta''(x)]^2 dx + \int_a^b s''(x) \eta''(x) dx \end{align}\]

对于交叉项，对于每个分段使用分部积分公式，考虑到三次函数，$s’’‘(x)=0$,则有，

\[\begin{align} \int_a^b s''(x) \eta''(x) dx &= \int_a^b s''(x) d \eta'(x) \\ &= s''(x) \eta'(x) \Big{\vert}_{x_0}^{x_n} - \int_a^b s'''(x) \eta'(x) d x \\ &= s''(x) \eta'(x) \Big{\vert}_{x_0}^{x_n} - \int_a^b s'''(x)d\eta(x) \\ &= s''(x) \eta'(x) \Big{\vert}_{x_0}^{x_n} - s'''(x) \eta(x) \Big{\vert}_{x_0}^{x_n} +\int_a^b \eta(x)ds'''(x) \\ &= s''(x) \eta'(x) \Big{\vert}_{x_0}^{x_n} - s'''(x) \eta(x) \Big{\vert}_{x_0}^{x_n} \end{align}\]

由于样条的插值条件，$\eta(x_0) = \eta(x_n)=0$ ，因此：$ s’’‘(x) \eta(x) \Big{\vert}_{x_0}^{x_n}=0$.

而对于自然样条，$s(x_0)’’ = s’‘(x_n)=0$，因此： $s’‘(x) \eta’(x) \Big{\vert}_{x_0}^{x_n}=0$

而对于完全样条，如果限制函数$t(x)$也满足，$t’(x_0) = k_0, t’(x_n) = k_n$，则$\eta’(x_0) = \eta’(x_n) = 0$，

因此在限定的函数空间内，此时也有： $s’‘(x) \eta’(x) \Big{\vert}_{x_0}^{x_n}=0$

综上，可以得到，

\[\begin{align} \int_a^b [t''(x)]^2 dx = \int_a^b [s''(x)]^2 dx + \int_a^b [\eta''(x)]^2 \ge \int_a^b [s''(x)]^2 dx dx \end{align}\]

也即，三次样条函数是所有$t(x)$的函数空间内最小化势能的函数。

Share on

Twitter Facebook LinkedIn

Lesi Chen (陈乐偲)