线性代数、数列和微分方程特征值的含义,连续与离散的关系,零空间与稳定性

柏舟   新冠4年 11-30

数列、线性代数、常微分方程都出现过特征值,虽然它们的数学形式大相径庭,但其实是等价的。首先简单介绍一下数学形式:

名字 形式 特征方程
数列 \(x_{n+2}=ax_{n+1}+bx_n\) \(\lambda^2-a\lambda-b=0\)
线性代数 \(Ax=\lambda x\) \(\det{(A-\lambda I)}=0\)
常微分方程 \(y''+ay'+by=0\) \(\lambda^2+a\lambda+b=0\)

化成线性代数形式

显然满足线性性质的数列和常微分方程可以写成线性代数的形式。比如数列:

\[ \begin{bmatrix} x_{n+1} \\ x_{n+2} \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ a & b \end{bmatrix} \begin{bmatrix} x_{n} \\ x_{n+1} \end{bmatrix} \]

对于任意类似的结构都可以写成

\[ \boldsymbol{x_{k+1}=Ax_k} \]

对于常微分方程,令$y_0=y, y_1=y', y_2=y''\cdots$

\[ \begin{bmatrix} y_1 \\ y_2 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ -a & -b \end{bmatrix} \begin{bmatrix} y_0 \\ y_1 \end{bmatrix} \]

对于任意类似的结构都可以写成

\[ \boldsymbol{\dot{x}(t)=Ax(t)} \]

然后你就会发现特征方程就是矩阵A的特征方程。

但还有很多非线性的方程不能写成这种形式,比如:

\[ \sin y' + y' + y=0 \]

连续与离散

数列和常微分方程有什么关系吗?我们知道导数的定义是:

\[ f'(x)=\lim_{T\to 0}\frac{f(x)-f(x-T)}{T} \]

我们对时间离散化

\[ x'(t)\mapsto \frac{1}{T}(x_{k+1}-x_k),x(t)\mapsto x_k \]

连续方程就变成了离散形式的方程

\[ \frac{1}{T}\boldsymbol{(x_{k+1}-x_k)=Ax_k} \]

整理得

\[ \boldsymbol{x_{k+1}}=(T\boldsymbol{A+I})\boldsymbol{x_k} \]

这就是z变换。

稳定性

为什么连续方程稳定要求特征根小于0,而离散方程要求特征根在0到1之间?我是这样理解的:

连续

微分方程的根都是构造出来的,因为只有指数函数有这么好的性质:

\[ y=ce^{\lambda t}, y'=\lambda y \]

需要注意的是,通解中往往有三角函数存在,虽然三角函数可以用特征根为复数的指数函数存在,但是为什么通解却是实数?这是因为当解出复数的特征根时,它一定是共轭的,此时$e^{(a+bi)t},e^{(a-bi)t}$就可以通过基变换变成$e^\sin bt, e^\cos bt$。

显然,通解想要收敛需要所有特征根实部小于0。因为这是微分方程的性质决定的。

注:微分方程的根还有其它构造方法,可以搜索关键词椭圆函数,超几何函数。我在天体力学和空气动力学里面都看到过。

离散

离散方程非常简单。假如可以对A进行特征根分解,就有

\[ \boldsymbol{\Lambda=P^{-1}AP} \]

离散方程就可以写成

\[ \boldsymbol{x_k=A^{k}x_0=(P\Lambda P^{-1})^kx_0=P\Lambda^k P^{-1}x_0} \]

显然,当A的谱半径小于1时收敛。因为A的特征根的绝对值都小于1,所以当k趋近无穷时Λ等于0。严格的证明需要用Jordan标准形,但是我忘了。

零空间和不动点

零空间和不动点的关系就像连续于离散一样。

对于连续系统,稳定即

\[ x'(t)=Ax(t)=0 \]

不动点,或者迭代方程:

\[ x=f(x) \]

表面上看没有关系,其实只需要对矩阵函数f(x)泰勒展开,取邻域:

\[ f(x)=I+f'(0)x+\frac{1}{2} f''(0)x^2+\cdots \]

矩阵函数导数求法矩阵分析里有。舍去高阶项:

\[ (I-f'(0))x=0 \]

不动点本质上就是零空间。至于什么是零空间,我比较深入地理解这个概念是当我学习抽象代数之后,Kernel的定义:

\[ \phi:A\to B,ker\phi=\{a\in A| \phi(a)=e_B\} \]

这里的$e_B$是单位元,对于加法来说单位元就是0。那零空间有什么用呢?我也没有想得很清楚,大致就是可以将标量的性质推广到矩阵上。因为标量上处于0时系统稳定(比如速度等于0,位置不变),所以对于矩阵来说,处于零空间时系统稳定。很容易发现,Kernel不一定等于0,比如当A不满秩时,Kernel的根就无穷(比如物体不受力做匀速直线运动,位置一直变),就很容易根据矩阵解的性质推导出李雅普诺夫稳定和渐近稳定的性质。

随便举几个例子

物理的固有频率的关系

写出系统的受力方程,包含加速度于阻尼和外力的关系:

\[ x''+\mu x'=F \]

解出来就是$e^ \sin bt, e^ \cos bt$的形式,三角函数刚好对应频率b。换句话说就是你给一个力F的激励,它就会产生频率的响应。假如输入的F是正弦曲线,你只需要画一下伯德图就可以知道响应的频率变化和相位变化。反过来,你可以输入扫频信号,绘制系统伯德图,倒推系统的微分方程,事实上这就是一种常用的系统辨识方法。

通信协同的一致性

对于一个通信网络可以写成邻接矩阵的形式,通过计算入度可以获得拉普拉斯矩阵L。L具有以下性质:

\[ Lx=0,x=[1,1,\cdots]^T \]

即0是L的一个特征根,$1_N$是L的特征向量。

对于一个积分系统:

\[ \dot{x_i}(t)=u_i(t)=-\sum a_{ij}(x_i(t)-x_j(t)) \]

可以写成

\[ \dot{x}(t)=-Lx(t) \]

可以发现系统具有零空间$1_N$,即当系统稳定时系统状态一致。(假设通信网络有directed spanning tree)。希望通过这个例子感受一下0特征根和特征向量、kernel、和矩阵方程组的解的关系。