Please enable Javascript to view the contents

现代控制理论学习要点

 ·  ☕ 115 分钟

1. 数学基础

1.1. 线性空间与线性变换

1.1.1. 代数结构简介

定义为具有相同属性事物的全体

设$\pmb F$为一非空集,如果在$\pmb F$中存在某种运算$\ast $,使得$\forall a,b\in \pmb F,\exists c=a\ast b\in \pmb F$,且满足下列条件则称为群:

  1. 结合律:$\forall a_1,a_2,a_3\in \pmb F$,总有$(a_1\ast a_2)\ast a_3=a_1\ast (a_2\ast a_3)$
  2. $\pmb F$中存在单位元素$e$,即$\forall a\in \pmb F$,总有$e\ast a=a\ast e=a$
  3. $\pmb F$中有逆元素,即$\forall a\neq 0\in \pmb F$,总有元素$\overline{a}$,使得$\overline{a}\ast a=a\ast \overline{a}=e$

半群:集$\pmb F$与运算$\ast $只满足结合律

可交换群:群$\pmb F$及其运算$\ast $满足交换律,即$\forall a,b\in\pmb F$,总有$a\ast b=b\ast a$

加法群:运算$\ast $为加法

乘法群:运算$\ast $为乘法

设非空集$\pmb F$中规定了加法运算“+”和乘法运算"$\times$",即$\forall a,b\in \pmb F,\exists \alpha=a+b\in\pmb F$和$\exists \beta=a\times b\in \pmb F$,且满足下列条件则称为环

  1. 对加法运算而言,$\pmb F$为可交换群
  2. 对乘法运算而言,$\pmb F$为半群
  3. 加法和乘法联合运算时,乘法对于加法满足分配律,即

$$
a_1\times(a_2+a_3)=a_1\times a_2+a_1\times a_3,\forall a_1,a_2,a_3\in\pmb F
$$

若环$\pmb F$满足乘法交换律,则称为可交换环

若$\pmb F$不仅是可交换环,而且对乘法而言又是可交换群,则$\pmb F$称为域。

显然,域$\pmb F$具有单位元素$e=1$和逆元素$\overline{a}=a^{-1}$

1.1.2. 线性空间的基本概念

当向量集$\pmb X$和数域$\pmb F$中元素进行的向量加和标量乘满足下面条件时,称$\pmb X$为域$\pmb F$上的线性空间,记为$(\pmb X,\pmb F)$

  1. 向量加和标量乘具有封闭性和唯一性

  2. 向量加满足交换律和结合律

  3. $\pmb X$中存在零向量$\pmb 0$

  4. 对于$\pmb X$中任何一个向量$\pmb x$,总存在一个向量$\overline{\pmb x}$,使得$\pmb x+\overline{\pmb x}=\pmb 0$

  5. 标量乘满足结合律

  6. 向量加和标量乘联合运算时满足分配律

  7. $\pmb F$中有标量1,使得

$$
1\cdot \pmb x=\pmb x\cdot 1=\pmb x,\ \ \forall \pmb x\in \pmb X
$$

1.1.3. 线性变换

基底变换

$\pmb n$维向量空间$\pmb X$中两组基$\pmb E=(\pmb e_1,\pmb e_2,\pmb e_3,\cdots,\pmb e_n)$ 和 $$\overline{\pmb E}=(\overline{\pmb e}_ 1,\overline{\pmb e}_ 2,\overline{\pmb e}_ 3,\cdots,\overline{\pmb e}_ n)$$ ,$\pmb X$中某个向量$\pmb x$在两组基下表示为:

$$
\begin{align}
\pmb x&=(\pmb e_1,\pmb e_2,\pmb e_3,\cdots,\pmb e_n)\pmb \alpha\\\\
\overline{\pmb x}&=(\overline{\pmb e}_ 1,\overline{\pmb e}_ 2,\overline{\pmb e}_ 3,\cdots,\overline{\pmb e}_ n)\overline{\pmb \alpha}
\end{align}
$$

设$\pmb e_j$在基$\overline{\pmb E}$下的坐标为$\pmb p_j=(p_ {1j},p_ {2j},\dots,p_ {nj})^T$,有:

$$
\begin{align}
\pmb e_ j=(\overline{\pmb e}_ 1,\overline{\pmb e}_ 2,\overline{\pmb e}_ 3,\cdots,\overline{\pmb e}_ n)\begin{bmatrix}p_ {1j}\\\\p_ {2j}\\\\\vdots\\\\ p_ {nj} \end{bmatrix}=\overline{\pmb E}\pmb p_ j,j=1,2,\cdots,n
\end{align}
$$

$$
\begin{align}
\begin{bmatrix}\pmb e_1&\pmb e_2&\cdots&\pmb e_n\end{bmatrix}&=\begin{bmatrix}
\overline{\pmb E}\pmb p_1&\overline{\pmb E}\pmb p_2&\cdots&\overline{\pmb E}\pmb p_n \end{bmatrix}\\\\
&=\overline{\pmb E}\begin{bmatrix}\pmb p_1&\pmb p_2&\cdots&\pmb p_n\end{bmatrix}\\\\
&=\overline{\pmb E}\pmb P
\end{align}
$$

代入前式有

$$
\begin{align}
\pmb x=\overline{\pmb E}\pmb P\pmb \alpha=\overline{\pmb E}\overline{\pmb \alpha}
\end{align}
$$

解得:

$$
\begin{align}
\overline{\pmb \alpha}=\pmb{P\alpha}
\end{align}
$$
同理有
$$
\begin{align}
\pmb \alpha=\pmb Q\overline{\pmb \alpha}\\\\
\pmb Q\pmb P=\pmb I
\end{align}
$$
线性变换

设$(\pmb X,\pmb F)$和$(\pmb Y,\pmb F)$为同一个域$\pmb F$的$n$维和$m$维向量空间,$\pmb X$的基为$(\pmb x_1,\pmb x_2,\cdots,\pmb x_n)$,$\pmb Y$的基为$(\pmb u_1,\pmb u_2,\cdots,\pmb u_m)$

线性变换$\pmb L:(\pmb X,\pmb F)\rightarrow(\pmb Y,\pmb F)$ 将$\pmb x$映射为:
$$
\begin{align}
\pmb L(\pmb x)&=\alpha_1\pmb L(\pmb x_1)+\alpha_2\pmb L(\pmb x_2)+\cdots+\alpha_n\pmb L(\pmb x_n)\\\\
&=\alpha_1\pmb y_1+\alpha_2\pmb y_2+\cdots+\alpha_n\pmb y_n
\end{align}
$$
假定$\pmb y_i$相对于$\pmb Y$的基$(\pmb u_1,\pmb u_2,\cdots,\pmb u_m)$的坐标为$(a_ {1j},a_ {2j},\cdots,a_ {mj})^T=\pmb a_j$,即
$$
\begin{align}
\pmb y_j=(\pmb u_1,\pmb u_2,\cdots,\pmb u_m)\pmb a_j,j=1,2,\cdots,n
\end{align}
$$
其中系数$a_ {ij},i=1,2,\cdots,m,j=1,2,\cdots,n$


$$
\begin{align}
\pmb L(\pmb x_1,\pmb x_2,\cdots,\pmb x_n)&=(\pmb y_1,\pmb y_2,\cdots,\pmb y_n)\\\\
&=(\pmb u_1,\pmb u_2,\cdots,\pmb u_m)(\pmb a_1,\pmb a_2,\cdots,\pmb a_n)\\\\
&=(\pmb u_1,\pmb u_2,\cdots,\pmb u_m)\pmb A
\end{align}
$$
其中,$\pmb A=(a_ {ij})_ {m\times n}$,$\pmb A$的第$j$列$\pmb a_j$表示$\pmb y_j=\pmb L(\pmb x_j)$相对于$\pmb Y$的基德坐标

若向量$\pmb x$和$\pmb y=\pmb L(\pmb x)$在各自的基下坐标为$\pmb \alpha=(\alpha_1,\alpha_2,\cdots,\alpha_n)^T$和$\pmb \beta=(\beta_1,\beta_2,\cdots,\beta_m)^T$

对于线性变换$\pmb y=\pmb L(\pmb x)$,可表示为
$$
\begin{align}
(\pmb u_1,\pmb u_2,\cdots,\pmb u_m)\pmb \beta&=\pmb L[(\pmb x_1,\pmb x_2,\cdots,\pmb x_n)\pmb \alpha]\\\\
&=L[\pmb x_1,\pmb x_2,\cdots,\pmb x_n]\pmb \alpha\\\\
&=(\pmb u_1,\pmb u_2,\cdots,\pmb u_m)\pmb A\pmb \alpha
\end{align}
$$
由向量的唯一性得到:
$$
\begin{align}\pmb \beta=\pmb A\pmb\alpha\end{align}
$$
线性变换的矩阵形式

设$n$维空间$(\pmb X,\pmb F)$有两组不同的基$\pmb E=(\pmb e_1,\pmb e_2,\pmb e_3,\cdots,\pmb e_n)$ 和 $$\overline{\pmb E}=(\overline{\pmb e}_ 1,\overline{\pmb e}_ 2,\overline{\pmb e}_ 3,\cdots,\overline{\pmb e}_ n)$$ ,$m$维空间$(\pmb Y,\pmb F)$有两组不同的基$$\pmb \varepsilon=(\pmb \varepsilon_1,\pmb \varepsilon_2,\pmb \varepsilon_3,\cdots,\pmb \varepsilon_n)$$和$$\overline{\pmb \varepsilon}=(\overline{\pmb \varepsilon}_ 1,\overline{\pmb \varepsilon}_ 2,\overline{\pmb \varepsilon}_ 3,\cdots,\overline{\pmb \varepsilon}_ n)$$ ,$\forall \pmb x\in\pmb X$和$\pmb y=\pmb L(\pmb x)\in \pmb Y$ 在各自基下的表达式为:
$$
\begin{align}
\pmb x=\pmb{E\alpha}=\overline{\pmb E}\overline{\pmb \alpha}\\\\
\pmb y=\pmb{\varepsilon\beta}=\overline{\pmb \varepsilon}\overline{\pmb \beta}
\end{align}
$$
由前式可知
$$
\begin{align}
\begin{matrix}
\overline{\pmb \alpha}=\pmb{P\alpha}&
\pmb \alpha=\pmb P^{-1}\overline{\pmb \alpha}\\\\
\overline{\pmb \beta}=\pmb {Q\beta}&
\pmb\beta=\pmb Q^{-1}\overline{\pmb\beta}
\end{matrix}
\end{align}
$$
用基$\pmb E$和$\pmb \varepsilon$表示线性变换的表达式为:
$$
\begin{align}
\pmb\beta=\pmb{A\alpha}
\end{align}
$$
用基$\overline{\pmb E}$和$\overline{\pmb \varepsilon}$表示线性变换的表达式为:
$$
\begin{align}
\overline{\pmb \beta}=\overline{\pmb A}\overline{\pmb \alpha}
\end{align}
$$
其中,
$$
\begin{align}
\overline{\pmb A}=\pmb {QAP}^{-1}\\\\
\pmb A=\pmb Q^{-1}\overline{\pmb A}\pmb{P}
\end{align}
$$

特别地,对于映射到自身的线性变换$\pmb L:(\pmb X,\pmb F)\rightarrow(\pmb X,\pmb F)$,两组基下表达同一个线性变换的矩阵$\pmb A$和$\overline{\pmb A}$有
$$
\begin{align}
\overline{\pmb A}=\pmb {PAP}^{-1}\\\\
\pmb A=\pmb{P}^{-1}\overline{\pmb{A}}\pmb{P}
\end{align}
$$

1.2. 特征值、特征向量和约尔当标准型

1.2.1. 特征值与特征向量

设矩阵$\pmb A$表示一个将$(\pmb C^n,\pmb C)$映射到自身的线性变换,$\lambda\in \pmb C$,若$\exists x\in\pmb C^m$,使得
$$
\pmb {Ax}=\lambda\pmb x
$$
则称$\lambda$为$\pmb A$的特征值,$\pmb x$为伴随特征值$\lambda$的特征向量,$\det(\lambda\pmb I-\pmb {A})=0$称为$\pmb A$的特征方程

1.2.2. 若尔当标准型求法

n个特征值、n个特征向量

特征方程
$$
|s\boldsymbol I-\boldsymbol A|=(s-\lambda_1)(s-\lambda_2)\cdots(s-\lambda_n)
$$
具有$n$个相异特征值:$\lambda_i\neq \lambda_j$

特征向量
$$
\lambda_i\rightarrow \boldsymbol A \boldsymbol q_i=\lambda_i\boldsymbol q_i
$$
$n$个线性无关的特征向量:${\boldsymbol q_1,\boldsymbol q_2,\cdots,\boldsymbol q_n}$

变换矩阵:
$$
\boldsymbol Q= \begin{bmatrix}\boldsymbol q_1& \boldsymbol q_2& \cdots&\boldsymbol q_n\end{bmatrix}
$$
标准型:
$$
\pmb Q^{-1}\pmb {AQ}=\pmb \Lambda=\mathrm {diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)
$$
注意:$n$个特征值可相异

p(p<n)个特征值

特征方程
$$
|s\boldsymbol I-\boldsymbol A|=(s-\lambda_1)^{m_1}(s-\lambda_2)^{m_2}\cdots(s-\lambda_l)^{m_l}
$$
$\mu_i$:$\lambda_i$的代数重数,$\sum\limits_ {i=1}^p\mu_i=n$

特征向量
$$
\lambda_i\rightarrow \boldsymbol A \boldsymbol q_ {i,1/2/\cdots/n_i}=\lambda_i\boldsymbol q_ {i,1/2/\cdots/n_i}
$$
从每个特征向量出发,求取$m_i-1$个增广特征向量

增广特征向量
$$
\begin{align}
\pmb A\pmb q_ {j}^{(1)}&=\lambda_j\pmb q_ {j}^{(1)}\\\\
\pmb {Aq}_ {j}^{(2)}&=\lambda_j\pmb q_ {j}^{(2)}+\pmb q_ {j}^{(1)}\\\\
\cdots\\\\
\pmb{Aq}_ {j}^{(i)}&=\lambda_j\pmb q_ {j}^{(i)}+\pmb q_ {j}^{(i-1)}
\end{align}
$$
由此得到$n_i$组增广特征向量串

$$
\begin{align}
\boldsymbol q_ {i,1}^{(m_ {i,1})}\rightarrow\boldsymbol q_ {i,1}^{(m_ {i,1}-1)}\rightarrow&\cdots\rightarrow\boldsymbol q_ {i,1}^{(1)}\Rightarrow m_ {i,1}阶约当块\boldsymbol J_ {i,1}\\\\
\boldsymbol q_ {i,2}^{(m_ {i,2})}\rightarrow\boldsymbol q_ {i,2}^{(m_ {i,2}-1)}\rightarrow&\cdots\rightarrow\boldsymbol q_ {i,2}^{(1)}\Rightarrow m_ {i,2}阶约当块\boldsymbol J_ {i,2}\\\\
&\vdots\\\\
\boldsymbol q_ {i,n_i}^{(m_ {i,n_i})}\rightarrow\boldsymbol q_ {i,n_i}^{(m_ {i,n_i}-1)}\rightarrow&\cdots\rightarrow\boldsymbol q_ {i,n_i}^{(1)}\Rightarrow m_ {i,n_i}阶约当块\boldsymbol J_ {i,n_i}\\\\
\end{align}
$$

变换矩阵

$$
\boldsymbol Q=\begin{bmatrix}\boldsymbol Q_!&\boldsymbol Q_2 &\cdots&\boldsymbol Q_l\end{bmatrix}
$$

其中,

$$
\boldsymbol Q_i=\begin{bmatrix}\boldsymbol q_ {i,1}^{(1)}&\cdots&\boldsymbol q_ {i,1}^{(m_ {i,1})}&\cdots&\boldsymbol q_ {i,n_i}^{(1)}&\cdots& \boldsymbol q_ {1,n_i}^{(m_ {i,n_i})} \end{bmatrix}
$$

标准型

$$
\boldsymbol Q^{-1}\boldsymbol A\boldsymbol Q=\boldsymbol J=\begin{bmatrix}\boldsymbol J_1\\\\&\ddots\\\\&&\boldsymbol J_l\end{bmatrix}
$$

其中,

$$
\boldsymbol J_i=\begin{bmatrix}\boldsymbol J_ {i,1}\\\\&\ddots\\\\&&\boldsymbol J_ {i,n_i} \end{bmatrix}
$$

$$
\boldsymbol J_i=\begin{bmatrix}\lambda_i&1\\\\ &\lambda_i&1\\\\&&\lambda_i&\ddots\\\\&&&\ddots&\ddots\\\\&&&&\lambda_i\end{bmatrix}_ {m_i\times m_i}
$$

其实就是把每个特征值对应的线性无关特征向量先算出来,对有重数的特征值对应的特征向量算约尔当链,将每一个特征值对应的若尔当链先凑起来成为$\pmb Q_i$,再把所有的$\pmb Q_i$凑成变换矩阵$\pmb Q$

模式规范化

针对于具有复特征值的情况,实方阵的非实复特征值以共轭形式成对出现,相应的特征向量也是共轭的

设$n$阶方阵$\pmb A$有特征值$\sigma\pm j\omega$,对应的特征向量为$\pmb u\pm j\pmb v$

将对角化变换矩阵$\boldsymbol Q$中的共轭非实复特征值$\lambda=\sigma+j\omega$和$\overline{\lambda}=\sigma-j\omega$对应的共轭非实复特征向量$\boldsymbol q=\boldsymbol u+j \boldsymbol v$和$\overline{\boldsymbol q}=\boldsymbol u-j\boldsymbol v$分别用实向量$\boldsymbol u$和$\boldsymbol v$取代

变换后结果为:
$$
\begin{bmatrix}
\sigma+j\omega &0\\\\
0&\sigma-j\omega
\end{bmatrix}
\Rightarrow
\begin{bmatrix}
\sigma&\omega\\\\
-\omega&\sigma
\end{bmatrix}
$$
其他情况

基本可以通过模式规范化和若尔当标准型一般形式进行转换

1.3. 线性变换结构和线性代数方程组

1.3.1. 线性变换结构

值域空间(象空间)

$m\times n$矩阵$\pmb A$表示线性变换$\mathbb R^n\rightarrow\mathbb R^m$
$$
R(\pmb A)\mathop=\limits^{def}{\pmb y\in \mathbb R^m:\pmb y=\pmb{Ax},\forall \pmb x\in \mathbb R^n}
$$
性质:

  1. $R(\pmb A)=\mathrm{span}(\pmb A)$
  2. $R(\pmb A)$为$\mathbb R^n$的子空间,由$\pmb A$的各个列向量张成,故$R(\pmb A)$又称$\pmb A$的列空间
  3. $\dim R(\pmb A)=\mathrm{rank}(\pmb A)\mathop{=}\limits^{def}\rho(\pmb A)\leq \min(n,m)$
    • 当$\rho(\pmb A)=\min(n,m)$时,$\pmb A$为满秩矩阵
    • 若$m=n$,满秩矩阵即为可逆矩阵或非奇异矩阵
  4. $R(\pmb A)=R(\pmb {AA}^T)$
  5. $\rho(\pmb A)=\rho(\pmb {AA}^T)$

化零空间
$$
N(\pmb A)\mathop=\limits^{def}{\pmb x\in \mathbb R^n:\pmb {Ax}=\pmb 0}
$$
性质

  1. $N(\pmb A)$为$\mathbb R^n$的子空间,由与$\pmb A$的各个行向量正交的向量$\pmb x$张成,又称零空间
  2. $N(\pmb A)=[\mathrm {span}(\pmb A)^T]^{\perp}=R(\pmb A^T)^\perp$
  3. $\mathbb R^n=R(\pmb A^T)\oplus N(\pmb A)$ ;$\mathbb R^m=R(\pmb A)\oplus N(\pmb A^T)$
  4. 零度$\nu(\pmb A)=\dim N(\pmb A)$
  5. $\rho(\pmb A^T)+\nu(\pmb A)=\rho(\pmb A)+\nu(\pmb A)=n$
  6. $N(\pmb A)=N(\pmb A^T\pmb A)$
  7. $\nu(\pmb A)=\nu(\pmb A^T\pmb A)$

1.3.2. 线性代数方程组

$$
\pmb{Ax}=\pmb b,\pmb x\in\mathbb R^n,\pmb b\in \mathbb R^m
$$

  1. 方程组有解的充要条件
    $$
    \pmb b\in R(\pmb A)=R(\pmb {AA^T})
    $$

    $$
    \pmb b\perp N(\pmb A^T)=N(\pmb {AA}^T)\\\\
    \rho(\pmb A)=\rho(\pmb A|\pmb b)
    $$

  2. 方程组具有最多一个解的充要条件是
    $$
    N(\pmb A)=N(\pmb A^T\pmb A)={\pmb 0}
    $$

    $$
    \rho(\pmb A)=n
    $$
    否则,若$\pmb x$为一个解,则对任何$\hat{\pmb x}\in N(\pmb A)$,$\pmb x+\hat{\pmb x}$也为其解

  3. 方程组对每一个$\pmb b\in \mathbb R^m$有解的充要条件为
    $$
    R(\pmb A)=R(\pmb{AA}^T)=\mathbb R^m
    $$

    $$
    \rho(\pmb A)=m
    $$

  4. 方程组对每一个$\pmb b\in \mathbb R^m$有唯一解的充要条件为
    $$
    \pmb x=\pmb A^{-1}\pmb b
    $$

1.4. 矩阵指数

1.4.1. 矩阵指数的定义

对方阵$\pmb A$,矩阵指数定义为:
$$
e^{\pmb A t}=\sum\limits_ {k=0}^{\infty} \dfrac{1}{k!}\pmb A^kt^k=\pmb I+\pmb A t+\frac{1}{2!}\pmb A^2t^2+\frac{1}{3!}\pmb A^3t^3+\cdots
$$

1.4.2. 计算方法

直接计算法

  1. 若矩阵$\boldsymbol A$呈对角线形,即:$\boldsymbol A=\mathrm{diag}(a_1,a_2,\cdots,a_m)$则
    $$
    e^{\boldsymbol A t}=\mathrm{diag}(e^{a_1t},e^{a_2t},\cdots,e^{a_mt})
    $$

  2. 若矩阵$\boldsymbol A$呈对角块形,即:$\boldsymbol A=\mathrm{Diag}(\boldsymbol A_1,\boldsymbol A_2,\cdots,\boldsymbol A_m)$则
    $$
    e^{\boldsymbol At}=\mathrm{Diag}(e^{\boldsymbol A_1t},e^{\boldsymbol A_2t},\cdots,e^{\boldsymbol A_mt})
    $$

拉氏变换法
$$
e^{\pmb At}=\mathcal L^{-1}[(s\pmb I-\pmb A)^{-1}]
$$
标准型法
$$
e^{\pmb At}=\pmb Qe^{\pmb Q^{-1}\pmb{AQ}t}\pmb Q^{-1}=\pmb Qe^{\pmb \Lambda t}\pmb Q^{-1}
$$
当矩阵$\pmb A $有$n $个互不相关的特征向量时,可以通过相似变换将$\pmb A $变换为对角线形

待定系数法

凯利-哈密顿定理:方阵满足自身的特征方程

对$n\times n$的方阵$\pmb A$,设其特征多项式为:
$$
f(\lambda)=|\lambda\pmb I-\pmb A|=\lambda^n+a_ {n-1}\lambda^{n-1}+\cdots+a_1\lambda+a_0
$$
则凯利-哈密顿定理保证如下矩阵方程成立:
$$
f(\pmb A)=a_0\pmb I+a_1\pmb A+a_2\pmb A^2+\cdots+a_ {n-1}\pmb A^{n-1}+\pmb A^n=\pmb 0
$$
为求解矩阵指数$e^{\pmb At}$,先求解特征方程$f(\lambda)=0$得到特征值$\lambda_1,\lambda_2,\cdots,\lambda_n$

设$g(\lambda)=\alpha_0+\alpha_1\lambda+\alpha_2\lambda^2+\cdots+\alpha_ {n-1}\lambda^{n-1}$ ,$h(\lambda)=e^{\lambda t}$,其中$\alpha_i=\alpha_i(t),i=1,2,\cdots,n$

解方程组
$$
g(\lambda_i)=h(\lambda_i),i=1,2,\cdots,n
$$
求得参变量$\alpha_i=\alpha_i(t),i=1,2,\cdots,n$ ,可求得矩阵指数:
$$
e^{\pmb At}=\sum\limits_ {k=1}^{k=n}\alpha_ {k-1}\pmb A^{k-1}
$$

1.4.3. 常用标准型对应的矩阵指数

系统矩阵为对角线矩阵

系统矩阵:
$$
\boldsymbol A=\mathrm{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)
$$
矩阵指数:
$$
e^{\boldsymbol At}=\mathrm{diag}(e^{\lambda_1t},e^{\lambda_2t},\cdots,e^{\lambda_nt})
$$
系统矩阵为对角分块矩阵

系统矩阵:
$$
\boldsymbol A=\mathrm{diag}(\boldsymbol A_1,\boldsymbol A_2,\cdots,\boldsymbol A_l)
$$
矩阵指数:
$$
e^{\boldsymbol At}=\mathrm{diag}(e^{\boldsymbol A_1t},e^{\boldsymbol A_2t},\cdots,e^{\boldsymbol A_lt})
$$
特殊类型系统矩阵(1)

系统矩阵:
$$
\boldsymbol A=\begin{bmatrix}
0&1\\\\
&0&1&&\boldsymbol 0\\\\
&&0&1\\\\
&&&0&\ddots\\\\&\boldsymbol 0&&&\ddots&1\\\\&&&&&0\end{bmatrix}
$$
$\boldsymbol A$仅右上方次对角线上的元素为1,其余元素为零

矩阵指数:
$$
e^{\boldsymbol At}=\begin{bmatrix}
1&t&\frac{t^2}{2!}&\frac{t^3}{3!}&\cdots&\frac{t^{n-1}}{(n-1)!}\\\\
&1&t&\frac{t^2}{2!}&\cdots&\frac{t^{n-1}}{(n-1)!}\\\\
&&1&t&&\vdots\\\\
&&&1&\ddots&\frac{t^2}{2!}\\\\
\boldsymbol 0&&&&\ddots&t\\\\
&&&&&1
\end{bmatrix}
$$
特殊类型系统矩阵(2)

系统矩阵:
$$
\boldsymbol A=\begin{bmatrix}\lambda&1\\\\&\lambda&1&&\boldsymbol 0\\\\&&\lambda&1\\\\&&&\lambda&\ddots\\\\&\boldsymbol 0&&&\ddots&1\\\\&&&&&\lambda\end{bmatrix}
$$
可以分解为以下形式:
$$
\boldsymbol A=\begin{bmatrix}0&1\\\\&0&1&&\boldsymbol 0\\\\&&0&1\\\\&&&0&\ddots\\\\&\boldsymbol 0&&&\ddots&1\\\\&&&&&0\end{bmatrix}+\begin{bmatrix}\lambda&\\\\&\lambda&&&\boldsymbol 0\\\\&&\lambda&\\\\&&&\lambda&\ddots\\\\&\boldsymbol 0&&&\ddots&\\\\&&&&&\lambda\end{bmatrix}
$$
矩阵指数:
$$
e^{\boldsymbol At}=\begin{bmatrix}
e^{\lambda t}&te^{\lambda t}&\frac{t^2}{2!}e^{\lambda t}&\frac{t^3}{3!}e^{\lambda t}&\cdots&\frac{t^{n-1}}{(n-1)!}e^{\lambda t}\\\\
&e^{\lambda t}&te^{\lambda t}&\frac{t^2}{2!}e^{\lambda t}&\cdots&\frac{t^{n-1}}{(n-1)!}e^{\lambda t}\\\\
&&e^{\lambda t}&te^{\lambda t}&&\vdots\\\\
&&&e^{\lambda t}&\ddots&\frac{t^2}{2!}e^{\lambda t}\\\\
\boldsymbol 0&&&&\ddots&te^{\lambda t}\\\\
&&&&&e^{\lambda t}
\end{bmatrix}
$$
特殊类型系统矩阵(3)

系统矩阵:
$$
\boldsymbol A=\begin{bmatrix}0&\omega\\\\-\omega&0\end{bmatrix}
$$
矩阵指数:
$$
e^{\boldsymbol At}=\begin{bmatrix}\cos\omega t&\sin\omega t\\\\-\sin\omega t&\cos\omega t\end{bmatrix}
$$
特殊类型系统矩阵(4)

系统矩阵:
$$
\boldsymbol A=\begin{bmatrix}\sigma&\omega\\\\-\omega&\sigma\end{bmatrix}
$$
矩阵指数:
$$
e^{\boldsymbol At}=\begin{bmatrix}e^{\sigma t}\cos\omega t&e^{\sigma t}\sin\omega t\\\\-e^{\sigma t}\sin\omega t&e^{\sigma t}\cos\omega t\end{bmatrix}
$$

1.5. 时间函数的线性关系

1.5.1. 一组时间函数的线性相关与无关

假设$f_1(t),f_2(t),\cdots,f_n(t)$是一组复值函数,倘若在复数域$\pmb C$中存在一组不全为零的复数$\alpha_1,\alpha_2,\cdots,\alpha_n$使得
$$
\sum\limits_ {i=1}^n\alpha_if_i(t)=0,\ \ \ \ \forall t\in[t_1,t_2]
$$
则称这组复值函数在区间$[t_1,t_2]$内线性相关,否则它们在$[t_1,t_2]$内线性无关。同理可推广到复值函数向量,令$\pmb f_i(t)$,$i=1,2,\cdots,n$是一组$p$维复值行向量,如果在复数域$\pmb C$中存在一组不全为零的复数$\alpha_1,\alpha_2,\cdots,\alpha_n$使得
$$
\sum\limits_ {i=1}^n\alpha_i\pmb f_i(t)=\pmb {\alpha F}(t)=\pmb0,\ \ \ \ \forall t\in[t_1,t_2]
$$
其中,$\pmb \alpha=\begin{bmatrix}\alpha_1&\alpha_2&\cdots&\alpha_n\end{bmatrix}$为$n$维向量,$\pmb F(t)=\begin{bmatrix}\pmb f_1^T(t)&f_2^T(t)&\cdots&f_n^T(t)\end{bmatrix}^T$为$n\times p$矩阵

就称这组时间函数复值向量在区间$[t_1,t_2]$内线性相关,否则线性无关

1.5.2. 时间函数线性无关的判定方法

格拉姆矩阵判定法

令$\pmb f_i(t)$,$i=1,2,\cdots,n$是定义在$[t_1,t_2]$内的$p$维连续复值函数行向量,$\pmb F(t)$是以它们为行构成的$n\times p$矩阵,规定$\pmb F(t)$的格拉姆矩阵如下:
$$
\pmb W(t_1,t_2)\mathop=\limits^{def}\int_ {t_1}^{t_2}\pmb F(t)\pmb F^\ast(t)\mathrm dt
$$
则这组复值函数行向量线性无关的充要条件是常值矩阵$\pmb W(t_1,t_2)$非奇异

证明:

必要性

假设这组函数行向量在$[t_1,t_2]$内线性无关,但$\pmb W(t_1,t_2)$奇异,因此存在一个非零$n$维行向量$\pmb \alpha$使得$\pmb \alpha\pmb W(t_1,t_2)=\pmb 0$,也就有
$$
\begin{align}
\pmb {\alpha W}(t_1,t_2)\pmb \alpha^\ast&=\int_ {t_1}^{t_2}\pmb {\alpha F}(t)[\pmb {\alpha F}(t)]^\ast\mathrm dt\\\\
&=\int_ {t_1}^{t_2}|\pmb {\alpha F}(t)|^2\mathrm dt=0
\end{align}
$$
函数向量的连续性保证了$\pmb F(t)$的连续性,$|\pmb {\alpha F}(t)|^2$是非负的数,上式意味着
$$
\pmb {\alpha F}(t)=\pmb 0,\ \ \ \ \forall t\in[t_1,t_2]
$$
这与$n$个函数行向量在区间$[t_1,t_2]$内线性无关矛盾,所以必要性成立

充分性

假设$\pmb W(t_1,t_2)$非奇异但$n$个函数行向量线性相关,那么存在一个非零$n$维行向量$\pmb \alpha$使得$\pmb {\alpha F}(t)=\pmb 0$,$\forall t\in[t_1,t_2]$,于是
$$
\pmb {\alpha W}(t_1,t_2)=\int_ {t_1}^{t_2}\pmb {\alpha F}(t)\pmb F^\ast(t)\mathrm dt=\pmb 0
$$
即$\pmb W(t_1,t_2)$奇异,与假设矛盾,所以充分性成立

导数矩阵判定法(充分条件)

假设$n$个$p$维复值函数行向量$\pmb f_1(t)$,$\pmb f_2(t)$,$\cdots$,$\pmb f_n(t)$在区间$[t_1,t_2]$内具有直到$n-1$阶的连续导数,$\pmb F(t)$是以它们为行构成的$n\times p$矩阵,以$\pmb F^{(k)}(t)$表示$\pmb F(t)$的$k$阶导数。倘若在区间$[t_1,t_2]$内存在某一个时刻$t'$,使得矩阵
$$
\begin{bmatrix}
\pmb F(t')&\pmb F^{(1)}(t')&\pmb F^{(2)}(t')&\cdots&\pmb F^{(n-1)}(t')
\end{bmatrix}
$$
的秩为$n$,则$\pmb f_1(t)$,$\pmb f_2(t)$,$\cdots$,$\pmb f_n(t)$在区间$[t_1,t_2]$内线性无关

证明:

反证法证明,假设确有$t'\in [t_1,t_2]$使得
$$
\rho \begin{bmatrix}
\pmb F(t')&\pmb F^{(1)}(t')&\pmb F^{(2)}(t')&\cdots&\pmb F^{(n-1)}(t')
\end{bmatrix}=n
$$
但函数向量$\pmb f_1,\pmb f_2,\cdots,\pmb f_n$在$[t_1,t_2]$内线性相关,这表明存在一个非零行向量$\pmb \alpha$使得
$$
\pmb {\alpha F}(t)=\pmb 0,\ \ \ \ \forall t\in[t_1,t_2]
$$
因而
$$
\pmb {\alpha F}^{(k)}(t)=\pmb 0,\ \ \ \ k=1,2,\cdots,n-1,\ \ \ \ \forall t\in [t_1,t_2]\\\\
\pmb \alpha \begin{bmatrix}
\pmb F(t')&\pmb F^{(1)}(t)&\pmb F^{(2)}(t)&\cdots&\pmb F^{(n-1)}(t)
\end{bmatrix}=\pmb 0,\ \ \ \ \forall t\in[t_1,t_2]
$$
当然对于$t'\in[t_1,t_2]$有
$$
\pmb \alpha \begin{bmatrix}
\pmb F(t')&\pmb F^{(1)}(t')&\pmb F^{(2)}(t')&\cdots&\pmb F^{(n-1)}(t')
\end{bmatrix}=n
$$
这与$\rho \begin{bmatrix}
\pmb F(t')&\pmb F^{(1)}(t')&\pmb F^{(2)}(t')&\cdots&\pmb F^{(n-1)}(t')
\end{bmatrix}=n$ 相矛盾,所以这组函数向量组线性无关

解析函数的线性无关(充要条件)

假设$n$个$p$维复值函数行向量$\pmb f_1(t)$,$\pmb f_2(t)$,$\cdots$,$\pmb f_n(t)$在区间$[t_1,t_2]$内解析,$\pmb F(t)$是以它们为行构成的$n\times p$矩阵,以$\pmb F^{(k)}(t)$表示$\pmb F(t)$的$k$阶导数。则这组解析函数向量线性无关的充要条件是
$$
\rho\begin{bmatrix}
\pmb F(t')&\pmb F^{(1)}(t')&\pmb F^{(2)}(t')&\cdots&\pmb F^{(n-1)}(t')
\end{bmatrix}=n,\ \ \ \ \forall t'\in[t_1,t_2]
$$

2. 系统的状态空间模型

2.1. 状态与状态空间的概念

2.1.1. 基本概念

输入

作用于系统的所有(外界)激励统称为系统的输入

输出

可以量测的、能表征系统行为的响应统称为系统的输出

状态

动态系统的状态可定义为一组信息的集合。在已知未来外部输入的情况下,这些信息对于确定系统未来的行为是充分的。可以理解为状态空间的一组基,减少其中的一个变量就会破坏它们对系统行为表征的完全性,而增加一个变量将不增加行为表征的信息量

状态变量

用于确定动态系统状态的一组变量称作状态变量

状态向量

$n$个状态变量依次用$ x_1(t),x_2(t), \cdots , x_n(t) $表 示,再把这些状态变量看作是向量$ x(t) $的分量,则x(t) 就称为状态向量,记作
$$
\boldsymbol{x}(t)=\begin{bmatrix}x_1(t)\\\\x_2(t)\\\\ \vdots \\\\x_n(t) \end{bmatrix}
$$
状态空间

以状态变量用$x_1(t),x_2(t), \cdots , x_n(t)$为坐标轴所为基张成的$n$维空间,称为状态空间。在特定的时刻$t$,状态向量$x(t)$在状态空间中是一点

状态轨线

随着时间的推移,$x(t)$在状态空间中描绘出一条轨迹,称为状态轨线

2.1.2. 状态空间描述

状态方程
$$
\begin{matrix}
\dot{\boldsymbol x}=\boldsymbol f(\boldsymbol x,\boldsymbol u,t)&\dot{\boldsymbol x}=\boldsymbol A\boldsymbol x+\boldsymbol B\boldsymbol u
\end{matrix}
$$
输出方程
$$
\begin{matrix}
\boldsymbol y=\boldsymbol g(\boldsymbol x,\boldsymbol u,t)&\boldsymbol y=\boldsymbol C\boldsymbol x+\boldsymbol D\boldsymbol u
\end{matrix}
$$
状态空间方程

  1. 一般形式
    $$
    \begin{cases}
    \dot{\boldsymbol x}=\boldsymbol f(\boldsymbol x,\boldsymbol u,t)\\\\
    \boldsymbol y=\boldsymbol g(\boldsymbol x,\boldsymbol u,t)
    \end{cases}
    $$

  2. 线性定常系统
    $$
    \begin{cases}
    \dot{\boldsymbol x}=\boldsymbol A\boldsymbol x+\boldsymbol B\boldsymbol u\\\\
    \boldsymbol y=\boldsymbol C\boldsymbol x+\boldsymbol D\boldsymbol u
    \end{cases}
    $$

2.1.3. 连续时间线性系统

连续时间线性系统状态空间方程的系数矩阵
$$
\begin{matrix}
\begin{matrix}
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol A(t)\boldsymbol x+\boldsymbol B(t) \boldsymbol u\\\\
\boldsymbol y=\boldsymbol C(t) \boldsymbol x+\boldsymbol D(t) \boldsymbol u
\end{cases}\\\\
\dim \boldsymbol x=n\\\\
\dim \boldsymbol u=p\\\\
\dim \boldsymbol y=q
\end{matrix}&&&&
\begin{align}
\boldsymbol A&=(a_ {ij})_ {n\times n}——系统矩阵(状态矩阵)\\\\
\boldsymbol B&=(b_ {ij})_ {n\times p}——控制矩阵(输入矩阵)\\\\
\boldsymbol C&=(c_ {ij})_ {q\times n}——观测矩阵(输出矩阵)\\\\
\boldsymbol D&=(d_ {ij})_ {q\times p}——输入-输出矩阵
\end{align}
\end{matrix}
$$
**叠加原理**

系统被称作为线性系统是指对每一个及任意两个状态-输入-输出组:

$$
\left.\begin{align}
&\boldsymbol x_i(t_0)\\\\
&\boldsymbol u_i(t),\ t\geq t_0
\end{align}\right\}
\rightarrow
y_i(t),\ t\geq t_0\ \ \ \ i=1,2
$$

一定有($\alpha$为任意实常数):

  1. 可加性

    $$
    \left.\begin{align}
    &\boldsymbol x_1(t_0)+\boldsymbol x_2(t_0)\\\\
    &\boldsymbol u_1(t)+\boldsymbol u_2(t),\ t\geq t_0
    \end{align}\right\}
    \rightarrow
    y_1(t)+y_2(t),\ t\geq t_0
    $$

  2. 均匀性

    $$
    \left.\begin{align}
    &\alpha \boldsymbol x_i(t_0)\\\\
    &\alpha\boldsymbol u_i(t),\ t\geq t_0
    \end{align}\right\}
    \rightarrow
    \alpha y_i(t),\ t\geq t_0,\ \ \ \ i=1,2
    $$

  3. 叠加性=可加性+均匀性

    $$
    \left.\begin{align}
    \alpha_1&\boldsymbol x_1(t_0)+\alpha_2\boldsymbol x_2(t_0)\\\\
    &\alpha_1\boldsymbol u_1(t)+\alpha_2\boldsymbol u_2(t),\ t\geq t_0
    \end{align}\right\}
    \rightarrow
    \alpha_1y_1(t)+\alpha_2y_2(t),\ t\geq t_0
    $$

根据可加性,线性系统响应=零输入响应+零状态响应

$$
\begin{cases}
\pmb x(t_0)\\\\
\pmb u(t),t\geq t_0
\end{cases}
的输出=
\begin{cases}
\pmb x(t_0)\\\\
\pmb u(t)\equiv 0,t\geq t_0
\end{cases}
的输出+
\begin{cases}
\pmb x(t_0)=0\\\\
\pmb u(t),t\geq t_0
\end{cases}
的输出
$$

系统结构图

传递函数矩阵为:
$$
\pmb G(s)=\pmb C(s\pmb I-\pmb A)^{-1}\pmb B+\pmb D
$$
连续时间线性系统的输入—输出描述

  1. 脉冲输入响应

  2. 齐次性

  3. 可加性

  4. 极限

  5. 脉冲响应
    $$
    y(t)=\int_ {-\infty}^{+\infty}g(t,\tau)u(\tau)\mathrm d\tau
    $$

    • 因果
      $$
      因果的\Leftrightarrow g(t,\tau)=0\ \ \ \ \forall t<\tau
      $$

    • 系统在$t_0$时刻松弛
      $$
      \begin{matrix}
      y(t)=\int_ {t_0}^tg(t,\tau)u(\tau)d\tau&
      \boldsymbol y(t)=\int^t_ {t_0}\boldsymbol G(t,\tau)\boldsymbol u(\tau)d\tau
      \end{matrix}
      $$

2.1.4. 离散时间系统

状态空间描述
$$
\begin{align}
\boldsymbol x[k+1]&=\boldsymbol F\boldsymbol x[k]+\boldsymbol H \boldsymbol u[k]\\\\
\boldsymbol y[k]&=\boldsymbol C\boldsymbol x[k]+\boldsymbol D \boldsymbol u[k]
\end{align}
$$
传递函数矩阵
$$
\pmb G(z)=\pmb C(z\pmb I-\pmb F)^{-1}\pmb H+\pmb D
$$
连续系统离散化
$$
\pmb u[k]:=\pmb u(kT)\\\\
\pmb y[k]:=\pmb y(kT)
$$

2.1.5. 分布系统与非线性系统

集总系统

集总系统的状态是有限维向量

分布系统

分布系统具有无限多个状态变量

非线性系统

不满足叠加原理的系统即为非线性系统

集总的非线性系统的状态空间方程一般只能写作:
$$
\dot{\boldsymbol x}=\boldsymbol f(\boldsymbol x,\boldsymbol u,t)\\\\
\boldsymbol y=\boldsymbol g(\boldsymbol x, \boldsymbol u,t)
$$
状态方程及输出方程不显含时间$t$又称为自治系统,如:
$$
\dot{\boldsymbol x}=\boldsymbol f(\boldsymbol x,\boldsymbol u)\\\\
\boldsymbol y=\boldsymbol g(\boldsymbol x, \boldsymbol u)
$$

2.2. 状态空间方程的建立方法

2.2.1. 从系统的机理出发

步骤:

  1. 寻找合适的最大线性无关组,作为系统的状态变量
  2. 列写微分方程/差分方程
  3. 转为矩阵表达形式

2.2.2. 从传递函数求状态空间方程

传递函数的状态空间实现一节

2.2.3. 由动态结构图求状态空间方程

步骤:

  1. 选择各个积分器输出为状态变量
  2. 求解各个状态变量之间、状态变量与输入输出变量之间的关系式
  3. 整理为矩阵形式

2.2.4. 系统互连状态方程

设有两个互连线性子系统
$$
S_1:\begin{cases}
\dot{\pmb x}_ 1=\pmb A_1\pmb x_1+\pmb B_1\pmb u_1\\\\
\pmb y_1=\pmb C_1\pmb x_1+\pmb D_1\pmb u_1
\end{cases}\\\\
S_2:\begin{cases}
\dot{\pmb x}_ 2=\pmb A_2\pmb x_2+\pmb B_2\pmb u_2\\\\
\pmb y_2=\pmb C_2\pmb x_2+\pmb D_2\pmb u_2
\end{cases}
$$
总系统状态表示为:
$$
\pmb x=\begin{bmatrix}\pmb x_1\\\\ \pmb x_2\end{bmatrix}
$$
**串联**

连接关系:
$$
\begin{cases}
\pmb u_1=\pmb u\\\\
\pmb u_2=\pmb y_1=\pmb C_1\pmb x_1+\pmb D_1\pmb u\\\\
\pmb y=\pmb y_2
\end{cases}
$$
状态空间方程:
$$
\begin{align}
\dot{\pmb x}&=\begin{bmatrix}
\pmb A_1&\pmb 0\\\\ \pmb B_2\pmb C_1&\pmb A_2
\end{bmatrix}\pmb x+\begin{bmatrix}\pmb B_1\\\\ \pmb B_2\pmb D_1\end{bmatrix}\pmb u\\\\
\pmb y&=\begin{bmatrix}\pmb D_2\pmb C_1& \pmb C_2\end{bmatrix}\pmb x+\pmb D_2\pmb D_1 \pmb u
\end{align}
$$
分流

连接关系:
$$
\begin{cases}
\pmb u_1=\pmb u\\\\
\pmb u_2=\pmb u\\\\
\pmb y=\begin{bmatrix}\pmb y_1\\\\ \pmb y_2\end{bmatrix}
\end{cases}
$$
状态空间方程:
$$
\begin{align}
\dot{\pmb x}&=\begin{bmatrix}
\pmb A_1&\pmb 0\\\\ \pmb 0&\pmb A_2
\end{bmatrix}\pmb x+\begin{bmatrix}\pmb B_1\\\\ \pmb B_2\end{bmatrix}\pmb u\\\\
\pmb y&=\begin{bmatrix}\pmb C_1&\pmb 0\\\\ \pmb 0&\pmb C_2\end{bmatrix}\pmb x+\begin{bmatrix}\pmb D_1\\\\ \pmb D_2\end{bmatrix} \pmb u
\end{align}
$$
并联

连接关系:
$$
\begin{cases}
\pmb u_1=\pmb u\\\\
\pmb u_2=\pmb u\\\\
\pmb y=\pmb y_1+\pmb y_2
\end{cases}
$$
状态空间方程:
$$
\begin{align}
\dot{\pmb x}&=\begin{bmatrix}
\pmb A_1&\pmb 0\\\\ \pmb 0&\pmb A_2
\end{bmatrix}\pmb x+\begin{bmatrix}\pmb B_1\\\\ \pmb B_2\end{bmatrix}\pmb u\\\\
\pmb y&=\begin{bmatrix}\pmb C_1&\pmb C_2\end{bmatrix}\pmb x+(\pmb D_1+\pmb D_2) \pmb u
\end{align}
$$
反馈

连接关系:
$$
\begin{cases}
\pmb u_1=\pmb u-\pmb y_2=\pmb u-\pmb C_2\pmb x_2-\pmb D_2\pmb u_2\\\\
\pmb u_2=\pmb y_1=\pmb C_1\pmb x_1+\pmb D_1\pmb u_1\\\\
\pmb y=\pmb y_1
\end{cases}
$$
状态空间方程:
$$
\begin{cases}
\dot{\pmb x}=\begin{bmatrix}\pmb A_1-\pmb B_1\pmb \Delta \pmb D_2\pmb C_1&-\pmb B_1\pmb \Delta \pmb C_2\\\\
\pmb B_2(\pmb C_1-\pmb D_1\pmb \Delta \pmb D_2\pmb C_1)&\pmb A_2-\pmb B_2\pmb D_1\pmb \Delta \pmb C_2
\end{bmatrix}\pmb x+\begin{bmatrix}\pmb B_1\pmb \Delta\\\\ \pmb B_2\pmb D_1\pmb \Delta\end{bmatrix}\pmb u\\\\
\pmb y=\begin{bmatrix}\pmb C_1-\pmb D_1\pmb \Delta \pmb D_2\pmb C_1&\pmb D_1\pmb \Delta \pmb C_2\end{bmatrix}\pmb x+(\pmb D_1\pmb \Delta )\pmb u
\end{cases}
$$
其中,$\pmb \Delta=(\pmb I+\pmb D_2\pmb D_1)^{-1}$

2.3. 状态空间的线性变换

2.3.1. 坐标变换对状态空间方程的影响

$$
\begin{align}
\begin{matrix}
\dot{\boldsymbol x}=\boldsymbol A \boldsymbol x+\boldsymbol B \boldsymbol u\\\\
\boldsymbol y=\boldsymbol C \boldsymbol x + \boldsymbol D \boldsymbol u
\end{matrix}
\xrightarrow[\overline{\boldsymbol x}=\boldsymbol P \boldsymbol x=\boldsymbol Q^{-1} \boldsymbol x]{\boldsymbol x= \boldsymbol Q \overline{\boldsymbol x}}
\begin{matrix}
\dot{\overline{\boldsymbol x}}=\overline{\boldsymbol A} \overline{\boldsymbol x}+\overline{\boldsymbol B} \overline{\boldsymbol u}\\\\
\boldsymbol y=\overline{\boldsymbol C} \overline{\boldsymbol x} + \overline{\boldsymbol D} \overline{\boldsymbol u}
\end{matrix}

\end{align}
$$

$$
\boldsymbol Q \dot{\overline{\boldsymbol x}}=\boldsymbol A \boldsymbol Q \overline{\boldsymbol x}+\boldsymbol B \boldsymbol u\\\\
\dot{\overline{\boldsymbol x}}=\boldsymbol Q^{-1} \boldsymbol A \boldsymbol Q \overline{\boldsymbol x}+\boldsymbol Q^{-1}\boldsymbol B \boldsymbol u
$$

$$
\begin{matrix}
\overline{\boldsymbol A}=\boldsymbol Q^{-1}\boldsymbol A \boldsymbol Q & \overline{\boldsymbol B}=\boldsymbol Q^{-1}\boldsymbol B\\\\
\overline{\boldsymbol C}=\boldsymbol C \boldsymbol Q & \overline{\boldsymbol D}=\boldsymbol D

\end{matrix}
$$

令$\pmb P=\pmb Q^{-1}$得
$$
\begin{matrix}
\overline{\boldsymbol A}=\boldsymbol P\boldsymbol A \boldsymbol P^{-1} & \overline{\boldsymbol B}=\boldsymbol P\boldsymbol B\\\\
\overline{\boldsymbol C}=\boldsymbol C \boldsymbol P^{-1} & \overline{\boldsymbol D}=\boldsymbol D

\end{matrix}
$$

2.3.2. 矩阵的规范化

对角规范化

模式规范化

2.4. 作业复习

2.4.1. 建模问题

缓冲器模型: $F=f\dot{x}$

弹簧模型: $F=kx$

水槽排水模型:

设断面积为$S$,水位高度为$x$,管道单位时间流出量为$y$,输入量$u$,管道阻力为$R$
$$
S\dot{x}=u-y=u-\frac{x}{R}
$$

2.4.2. 由系统微分方程导出状态空间描述式

法一: 直接选取状态变量

例:
$$
\ddot{y}(t)+5\dot{y}(t)+6y(t)=u(t)
$$
直接取$x_1=y$和$x_2=\dot{y}$即可求解

法二: 拉普拉斯变换(输入函数存在导数)

例:
$$
\ddot{y}(t)+2\dot{y}(t)+y(t)=\dot{u}(t)+3u(t)
$$
做拉普拉斯变换:
$$
(s^2+2s+1)\hat{y}=(s+3)\hat u
$$
令$\hat v=\frac{1}{s^2+2s+1}\hat u$ ,取$v=\mathcal L^{-1}\hat v$,定义状态变量$x_1=v$和$x_2=\dot{v}$即可解决问题

法三: 利用动态结构图求状态空间方程

将微分方程转为动态结构图,选取积分器后为状态变量构造状态空间方程

3. 状态空间方程的解

3.1. 状态转移矩阵

3.1.1. 状态转移矩阵的概念

对于时变线性系统的齐次状态方程
$$
\dot{\boldsymbol x}(t)=\boldsymbol A(t)\boldsymbol x(t),\ \ \boldsymbol x(t_0)=\boldsymbol x_0
$$
的解可写作
$$
\boldsymbol x(t,t_0)=\Phi(t,t_0)\boldsymbol x_0
$$
则称矩阵$\pmb \Phi(t,t_0)$为该系统的状态转移矩阵。对于线性定常系统,$t_0$总可移至零,即$\pmb \Phi(t,t_0)=\Phi(t-t_0,0)$,故又可记为$\pmb \Phi(t)$

3.1.2. 状态转移矩阵的表达式

仅考虑线性定常系统

对方程
$$
\dot{\boldsymbol x}(t)=\boldsymbol A\boldsymbol x(t)
$$
做拉普拉斯变换,得到:
$$
s\hat{\boldsymbol x}(s)-\pmb x(0)=\boldsymbol A\hat{\boldsymbol x}(s)
$$
即:
$$
\hat{\pmb x}(s)=(s\pmb I-\pmb A)^{-1}\pmb x_0
$$
逆变换得到:
$$
\pmb x(t)=\mathcal L^{-1}[(s\pmb I-\pmb A)^{-1}]\pmb x_0=\Phi(t)\pmb x_0
$$
得到状态转移矩阵的表达式:
$$
\phi(t)=\mathcal L^{-1}[(s\pmb I-\pmb A)^{-1}]
$$
进一步,对于$\mathcal L^{-1}[(s\pmb I-\pmb A)^{-1}]$ ,我们注意到标量系统:
$$
\mathcal L^{-1}[\frac{1}{s-a}]=e^{at}=\sum\limits_ {k=0}^\infty \frac{1}{k!}(at)^k
$$
定义矩阵指数$e^{\pmb At}$ ,有$\pmb \Phi(t)=e^{\pmb At}$

3.1.3. 状态转移矩阵的性质

  1. $\pmb \Phi(t)=e^{\pmb At}=\mathcal L^{-1}[(s\pmb I-\pmb A)^{-1}]$

  2. $\pmb \Phi(0)=e^{\pmb A0}=\pmb I$

  3. $\pmb \Phi(t)=\pmb A\Phi(t)=\Phi(t)\pmb A$ ,解释:$\frac{\mathrm d}{\mathrm dt}(e^{\pmb At})=\pmb Ae^{\pmb At}=e^{\pmb At}\pmb A$

  4. $\pmb \Phi(t)\pmb \Phi(\tau)=\Phi(t+\tau)$ ,解释:$e^{\pmb At}e^{\pmb A\tau}=e^{\pmb A(t+\tau)}$

    推论:

    1. 状态转移矩阵是可逆阵,且总有

      ​ $[\Phi(t)]^{-1}=\Phi(-t)$,解释:$[e^{\pmb At}]^{-1}=e^{-\pmb At}$

    2. 对一切整数$k$,总有

      ​ $[\Phi(t)]^k=\Phi(kt)$,解释:$[e^{\pmb At}]^k=e^{\pmb Akt}$

  5. $\pmb {AB}=\pmb {BA}\Leftrightarrow e^{\pmb At}e^{\pmb Bt}=e^{(\pmb A+\pmb B)t}$

    ​ 推论:对标量$\sigma$和方阵$\pmb B$,有$\pmb A=\sigma \pmb I+\pmb B$,则:$e^{\pmb At}=e^{\sigma t}e^{\pmb Bt}$

  6. 对任一非奇异矩阵$\pmb P$有:
    $$
    e^{\pmb P^{-1}\pmb A\pmb P}=\pmb P^{-1}e^{\pmb At}\pmb P
    $$

3.1.4. 状态转移矩阵的求取

详见矩阵指数的计算方法

3.2. 模态与模态分解

考察齐次状态空间方程的解,以互不相同的特征值为例:
$$
\begin{align}
\boldsymbol x(t)&=e^{\boldsymbol At}\boldsymbol x_0=e^{(\boldsymbol Q \boldsymbol \Lambda \boldsymbol Q^{-1})t}\boldsymbol x_0=\boldsymbol Q e^{\boldsymbol \Lambda t}\boldsymbol Q^{-1}\boldsymbol x_0\\\\
&=\begin{bmatrix}\boldsymbol q_1&\boldsymbol q_2&\cdots&\boldsymbol q_n\end{bmatrix}
\begin{bmatrix}e^{\lambda_1 t}\\\\&e^{\lambda_2 t}\\\\&&\ddots\\\\&&& e^{\lambda_n t} \end{bmatrix}\begin{bmatrix}\boldsymbol p_1\\\\ \boldsymbol p_2\\\\ \vdots\\\\ \boldsymbol p_n\end{bmatrix}\boldsymbol x_0\\\\
&=\begin{bmatrix}e^{\lambda_1 t}\boldsymbol q_1&e^{\lambda_2 t}\boldsymbol q_2\cdots e^{\lambda_nt}\boldsymbol q_n \end{bmatrix}\begin{bmatrix}\boldsymbol p_1\boldsymbol x_0\\\\ \boldsymbol p_2\boldsymbol x_0\\\\ \vdots\\\\ \boldsymbol p_n \boldsymbol x_0 \end{bmatrix}\\\\
&=(\boldsymbol p_1 \boldsymbol x_0)e^{\lambda_1 t}\boldsymbol q_1+(\boldsymbol p_2 \boldsymbol x_0)e^{\lambda_2 t}\boldsymbol q_2+\cdots+(\boldsymbol p_n \boldsymbol x_0)e^{\lambda_n t}\boldsymbol q_n
\end{align}
$$
其中,$\boldsymbol p$为行向量,$\boldsymbol q$、$\boldsymbol x$为列向量,$\boldsymbol p\boldsymbol x$为标量

对于一个给定的线性定常系统,不论进行怎样的状态变换,系统矩阵$\pmb A$的特征值及其相应的特征向量是不会改变的。

由于$e^{\lambda_i t}$体现了系统的固有属性,一般将$e^{\lambda_i t},(i=1,2,\cdots,n)$称作系统的模态,或者称作振荡振型,简称振型。 也称将系统矩阵约当化的状态变换阵$Q$为该系统的模态矩阵,称该状态变换过程及结果为模态分解。

3.3. 状态空间方程的解

3.3.1. 线性定常非齐次状态方程的解

状态方程:
$$
\begin{matrix}\dot{\boldsymbol x}=\boldsymbol A\boldsymbol x+\boldsymbol B \boldsymbol u&\boldsymbol x(0)=\boldsymbol x_0 \end{matrix}
$$
同时左乘$e^{-\boldsymbol A t}$并移项
$$
e^{-\boldsymbol A t}\dot{\boldsymbol x}-e^{-\boldsymbol A t}\boldsymbol A \boldsymbol x(t)=e^{-\boldsymbol A t}\boldsymbol B \boldsymbol u(t)
$$
此即
$$
\frac{\mathrm{d}}{\mathrm{d}t}(e^{-\boldsymbol A t}\boldsymbol x(t))=e^{-\boldsymbol A t}\boldsymbol B \boldsymbol u(t)
$$
对此式从0至$t$积分
$$
e^{-\boldsymbol At}\boldsymbol x(t)-e^0 \boldsymbol x(0)=\int^t_0 e^{-\boldsymbol A \tau}\boldsymbol B \boldsymbol u(\tau)d\tau
$$
移项,等式两边同左乘$e^{\boldsymbol A t}$
$$
\boldsymbol x(t)=e^{\boldsymbol A t}\boldsymbol x_0+\int^t_0 e^{\boldsymbol A(t-\tau)}\boldsymbol B \boldsymbol u(\tau)d\tau
$$
变量代换得
$$
\boldsymbol x(t)=e^{\boldsymbol A t}\boldsymbol x_0+\int^t_0 e^{\boldsymbol A\tau}\boldsymbol B \boldsymbol u(t-\tau)d\tau
$$
当初始时刻非零时,从$t_0$积分到$t$,得
$$
\boldsymbol x(t)=e^{\boldsymbol A (t-t_0)}\boldsymbol x(t_0) +\int^t_ {t_0} e^{\boldsymbol A\tau}\boldsymbol B \boldsymbol u(t-\tau)d\tau
$$

第二项可以看成是卷积$l(t-t_0)e^{\pmb At}\ast\pmb B\pmb u(t)$

3.3.2. 状态空间的解

状态方程:
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol A \boldsymbol x+ \boldsymbol B \boldsymbol u\\\\
\boldsymbol y=\boldsymbol C \boldsymbol x+\boldsymbol D \boldsymbol u
\end{cases}
$$
初始条件:
$$
\boldsymbol x(0)=\boldsymbol x_0
$$
解得:
$$
\begin{align}
\boldsymbol x(t)&=e^{\boldsymbol A t}\boldsymbol x_0+\int^t_0 e^{\boldsymbol A(t-\tau)}\boldsymbol B\boldsymbol u(\tau)d\tau\\\\
&=e^{\boldsymbol A t}\boldsymbol x_0+\int^t_0 e^{\boldsymbol A\tau}\boldsymbol B \boldsymbol u(t-\tau)d\tau\\\\
\boldsymbol y(t)&=\boldsymbol C e^{\boldsymbol At}\boldsymbol x_0+\boldsymbol C\int^t_0 e^{\boldsymbol A(t-\tau)}\boldsymbol B\boldsymbol u(\tau)d\tau+\boldsymbol D \boldsymbol u\\\\
&=\boldsymbol C e^{\boldsymbol A t}\boldsymbol x_0+\boldsymbol C\int ^t_0 e^{\boldsymbol A\tau}\boldsymbol B\boldsymbol u(t-\tau)d\tau+\boldsymbol D\boldsymbol u
\end{align}
$$

3.3.3. 状态空间方程的离散化

$$
\begin{matrix}
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol A \boldsymbol x+ \boldsymbol B \boldsymbol u\\\\
\boldsymbol y=\boldsymbol C \boldsymbol x+\boldsymbol D \boldsymbol u
\end{cases}
&
\Rightarrow
&
\begin{cases}
\pmb x[k+1]=\pmb {Fx}[k]+\pmb {Hu}[k]\\\\
\pmb y[k]=\pmb C_d \pmb x[k]+\pmb D_d\pmb u[k]
\end{cases}
\end{matrix}
$$

设$\pmb u(t)$分段定常,且对所有的$k=0,1,2,\cdots$有
$$
\begin{matrix}
\pmb u(t)=\pmb u(kT):=\pmb u[k]&\forall kT\leq t\leq (k+1)T
\end{matrix}
$$
以$kT$为时间起点应用状态方程解公式,有:
$$
\pmb x((k+1)T)=e^{\pmb At}\pmb x(kT)+\int_ {kT}^{(k+1)T}e^{\pmb A((k+1)T-t)}\pmb {Bu}(\tau)\mathrm d\tau
$$
定义:
$$
\pmb x[k]:=\pmb x(kT)
$$

$$
\int_ {kT}^{(k+1)T}e^{\pmb A((k+1)T-\tau)}\mathrm d\tau\cdot \pmb B=-\int_ {T}^{0}e^{\pmb A\alpha}\mathrm d\alpha\cdot \pmb B=\int_0^Te^{\pmb A\tau}\mathrm d\tau\cdot \pmb B
$$
其中,$\alpha=(k+1)T-\tau$


$$
\begin{matrix}
\pmb F=e^{\pmb AT}&\pmb H=(\int_0^Te^{\pmb A\tau}\mathrm d\tau)\pmb B&\pmb C_d=\pmb C&\pmb D_d=\pmb D
\end{matrix}
$$
可以得到
$$
\begin{matrix}
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol A \boldsymbol x+ \boldsymbol B \boldsymbol u\\\\
\boldsymbol y=\boldsymbol C \boldsymbol x+\boldsymbol D \boldsymbol u
\end{cases}
&
\Rightarrow
&
\begin{cases}
\pmb x[k+1]=\pmb {Fx}[k]+\pmb {Hu}[k]\\\\
\pmb y[k]=\pmb C_d \pmb x[k]+\pmb D_d\pmb u[k]
\end{cases}
\end{matrix}
$$
特别的,当$\pmb A$非奇异时,$\pmb H=\pmb A^{-1}(e^{\pmb AT-\pmb I})\pmb B$,下面是简单证明:

令方阵函数$\pmb M(t)=\pmb A^{-1}(e^{\pmb At}-\pmb I)$,则$\pmb M(0)=\pmb 0$,且
$$
\frac{\mathrm d}{\mathrm dt}\pmb M(t)=\frac{\mathrm d}{\mathrm dt}(\pmb A^{-1}(e^{\pmb At}-\pmb I))=e^{\pmb At}
$$
于是,
$$
\begin{align}
\pmb H&=(\int_0^Te^{\pmb A\tau}\mathrm d\tau)\pmb B=\int_0^T\Big(\frac{\mathrm d}{\mathrm d\tau}\pmb M(\tau)\Big)\mathrm d\tau\cdot \pmb B\\\\
&=[\pmb M(T)-\pmb M(0)]\pmb B=\pmb M(T)\pmb B=\pmb A^{-1}(e^{\pmb AT}-\pmb I)\pmb B
\end{align}
$$

3.4. 预解矩阵与频域求解

3.4.1. Souriau-Frame-Faddeev算法

$$
\begin{align}
(s\boldsymbol I-\boldsymbol A)^{-1}&=\frac{\mathrm{adj}(s\boldsymbol I-\boldsymbol A)}{\mathrm{det}(s\boldsymbol I-\boldsymbol A)}\\\\
&=\frac{\sum\limits^{n-1}_ {k=0}\boldsymbol Q_k\boldsymbol S^k}{s^n+a_ {n-1}s^{n-1}+\cdots+a_1s+a_ 0}
\end{align}
$$

其中,各步$\pmb Q_k$和$a_k$由下列迭代公式给出:

$$
\begin{matrix}
\pmb Q_ {n-1}=\pmb I&a_ {n-1}=-\mathrm {tr}(\pmb Q_ {n-1}\pmb A)\\\\
\pmb Q_ {k-1}=\pmb Q_k\pmb A+a_k\pmb I&a_ {k-1}=-\frac{1}{n-k}\mathrm{tr}(\pmb Q_k\pmb A)&k=n-1,n-2,\cdots,2,1
\end{matrix}
$$

此算法用于比较方便地求出$(s\pmb I-\pmb A)^{-1}$ ,以便进一步求出传递函数矩阵$\pmb G(s)=\pmb C(s\pmb I-\pmb A)^{-1}\pmb B+\pmb D=\sum\limits_ {k=0}^{n-1}\frac{\pmb C\pmb Q_k\pmb Bs^k}{\Delta(s)}+\pmb D$

3.4.2. S-F-F算法的推论

$$
(s\boldsymbol I-\boldsymbol A)^{-1}=\sum\limits^{n-1}_ {k=0}a_k(s)\boldsymbol A^k
$$

其中,

$$
a_k(s)=\frac{1}{\Delta (s)}(s^{n-k-1}+a_ {n-1}s^{n-k-2}+\cdots+a_ {k+2}s+a_ {k+1}),k=0,1,2,\cdots,n-1
$$

其中,$\Delta (s)=\det(s \boldsymbol I-\boldsymbol A)$

对两边取拉普拉斯逆变换得凯莱-哈密顿定理表示下的$e^{\pmb At}$的幂级数表达式
$$
\begin{align}
e^{\pmb At}&=\mathcal L^{-1}\Big[\sum\limits_ {k=0}^{n-1}\alpha_k(s)\pmb A^k \Big]=\sum\limits_ {k=0}^{n-1}\alpha_k(t)\pmb A^k\\\\
\alpha_k(t)&=\mathcal L^{-1}[\alpha_k(s)],k=0,1,2,\cdots,n-1
\end{align}
$$
进一步代入传递函数矩阵得:
$$
\pmb G(s)=\sum\limits_ {k=0}^{n-1}\alpha_k(s)\pmb {CA}^k\pmb B+\pmb D
$$

3.5. 作业复习

3.5.1. 已知状态转移矩阵,求系统矩阵$\pmb A$

系统状态方程为$\dot{\pmb x}=\pmb {Ax}(t)$

状态转移矩阵为:$\pmb \Phi(t)$

求系统矩阵$\pmb A$,只需:
$$
A=\frac{\mathrm d}{\mathrm dt}\pmb \Phi(t)\Big|_ {t=0}=\pmb Ae^{\pmb A0}
$$

3.5.2. 已知两对系统状态,求系统矩阵$\pmb A$

系统状态方程为$\dot{\pmb x}=\pmb {Ax}(t)$

现已知$\pmb x_1(0)$,$\pmb x_1(t)$,$\pmb x_2(0)$,$\pmb x_2(t)$

由$\pmb x(t)=\Phi(t)\pmb x(0)$可得:
$$
\begin{bmatrix}\pmb x_1(t)&\pmb x_2(t) \end{bmatrix}=\Phi(t)\begin{bmatrix}\pmb x_1(0)&\pmb x_2(0) \end{bmatrix}
$$
求得系统状态转移方程:
$$
\pmb \Phi(t)=\begin{bmatrix}\pmb x_1(t)&\pmb x_2(t) \end{bmatrix}\begin{bmatrix}\pmb x_1(0)&\pmb x_2(0) \end{bmatrix}^{-1}
$$
求系统矩阵$\pmb A$,只需:
$$
A=\frac{\mathrm d}{\mathrm dt}\pmb \Phi(t)\Big|_ {t=0}=\begin{bmatrix}\dot{\pmb x}_ 1(0)&\dot{\pmb x}_ 2(0) \end{bmatrix}\begin{bmatrix}\pmb x_1(0)&\pmb x_2(0) \end{bmatrix}^{-1}
$$

3.5.3. 已知状态方程和系统输入求状态响应

已知:
$$
\begin{matrix}\dot{\boldsymbol x}=\boldsymbol A\boldsymbol x+\boldsymbol B \boldsymbol u&\boldsymbol x(0)=\boldsymbol x_0 \end{matrix}
$$
求输入$\pmb u(t)$下的状态响应

先求状态转移矩阵$\pmb \Phi(t)=e^{\pmb At}$(待定系数法、拉普拉斯变换法、标准型法)

代公式:
$$
\boldsymbol x(t)=e^{\boldsymbol A t}\boldsymbol x_0+\int^t_0 e^{\boldsymbol A\tau}\boldsymbol B \boldsymbol u(t-\tau)d\tau
$$
若输入$\pmb u(t)=\delta(t)$,则
$$
\pmb x(t)=e^{\pmb At}(\pmb x(0)+\pmb B)
$$

3.5.4. 模态分解

已知:
$$
\dot{\boldsymbol x}=\boldsymbol A\boldsymbol x+\boldsymbol B \boldsymbol u
$$
先计算$\pmb A$的特征值和特征向量得到变换矩阵$\pmb Q$,进一步得到$e^{\pmb At}=\pmb Qe^{\pmb \Lambda t}\pmb Q^{-1}$

3.5.5. 预解矩阵的应用

利用预解矩阵可以很方便的求解$(s\pmb I-\pmb A)^{-1}$,$\pmb A^{-1}$和$\det \pmb A$
$$
(s\pmb I-\pmb A)^{-1}=\sum\limits_ {k=0}^{n-1}\frac{s^{n-k-1}+a_ {n-1}s^{n-k-2}+\cdots+a_ {k+2}s+a_ {k+1}}{\Delta (s)}\pmb A^k
$$
其中,
$$
\Delta (s)=\det(s \boldsymbol I-\boldsymbol A)
$$
令$s=0$即可求得$\pmb A^{-1}$和$\det \pmb A$

3.5.6. 状态空间离散化

套公式:
$$
\begin{matrix}
\pmb F=e^{\pmb AT}&\pmb H=(\int_0^Te^{\pmb A\tau}\mathrm d\tau)\pmb B&\pmb C_d=\pmb C&\pmb D_d=\pmb D
\end{matrix}
$$

3.5.7. 凯勒-哈密顿定理证明题

若$\pmb A\in \mathbb R^{m\times n}$,则对所有$k\in \mathbb N$,有$\pmb A^k=\sum\limits_ {m=0}^{n-1}\alpha_m\pmb A^m$

证明:

  1. 当$k<n$时,显然有$\pmb A^k=\sum\limits_ {m=0}^{n-1}\alpha_m\pmb A^m$

  2. 当$k=n$时,由凯勒-哈密顿定理,方阵满足自身特征多项式
    $$
    f(\lambda)=\det(\lambda\pmb I-\pmb A)=\lambda^n+a_1\lambda^{n-1}+\cdots+a_ {n-1}\lambda+a_n=0
    $$
    则一定有:
    $$
    \pmb A^n+a_1\pmb A^{n-1}+\cdots+a_ {n-1}\pmb A+a_n=0\Rightarrow \pmb A^n=-(a_1\pmb A^{n-1}+\cdots+a_ {n-1}\pmb A+a_n)
    $$

  3. 当$k>n$时,可用数学归纳法证明,这里证明$k=n+1$存在
    $$
    \begin{align}
    \pmb A^{n+1}&=\pmb A\cdot \pmb A^n=-\pmb A(a_1\pmb A^{n-1}+\cdots+a_ {n-1}\pmb A+a_n)\\\\
    &=-a_1\pmb A^n-a_2\pmb A^{n-1}-\cdots-a_ {n-1}\pmb A^2-a_n\pmb A\\\\
    &=-a_1(-a_1\pmb A^{n-1}-\cdots-a_ {n-1}\pmb A-a_n)-a_2\pmb A^{n-1}-\cdots-a_ {n-1}\pmb A^2-a_n\pmb A\\\\
    &=\sum\limits_ {m=0}^{n-1}\alpha_m\pmb A^m
    \end{align}
    $$

4. 系统的稳定性

4.1. 外部稳定性(BIBO)

4.1.1. BIBO稳定的概念

定义

BIBO稳定(有界输入有界输出稳定):系统在每一个有界的输入信号激励下所引起的输出响应都有界

特点

  • 系统在每一个有界的输入信号激励下所引起的输出响应都有界

  • BIBO稳定性是定义在零状态响应之上,即仅当系统初始松弛时才能使用

  • 系统的稳定性是一个与输入信号无关的概念

4.1.2. 系统的外部稳定性

单输入单输出(SISO)系统的外部稳定性

一个$t_0$时刻松弛的单变量系统为BIBO稳定系统的充要条件是其脉冲响应函数绝对可积,即存在有限正数$\pmb K_g\in \mathbb R_+$使得
$$
\int_ {-\infty}^t|g(t,\tau)|\mathrm d\tau\leq K_g,0\leq \pmb K_g<\infty,t\in (-\infty,\infty)
$$
证明:

充分性:设系统的脉冲响应函数为$\overline g(t,\tau)=g(t-\tau)$则其绝对可积是指$\int^\infty_0|g(t)|dt\leq M<\infty$,当系统输入有界,即$|u(t)|\leq u_m<\infty,\forall t\geq 0$,时
$$
\begin{align}
|y(t)|&=|\int^t_0g(t-\tau)u(\tau)d\tau |=|\int^t_0g(\tau)u(t-\tau)d\tau |\\\\
&\leq \int^t_0|g(t)|\cdot |u(t-\tau)|d\tau\leq u_m\int^\infty_0|g(\tau)|d\tau\leq u_mM
\end{align}
$$
用反证法很容易证明此定理的必要性。只要取
$$
u(t_1-\tau)=\begin{cases}1&g(\tau)\geq 0\\\\-1&g(\tau)<0\end{cases}
$$
多变量系统的外部稳定性

一个初始时刻$t_0$松弛的用$r\times m$冲激响应矩阵$\pmb G(t,\tau)=[g_ {ij}(t,\tau)]$描述的多变量系统为BIBO稳定系统的充要条件是:存在有限正数$K_g$使得对于$\pmb G(t,\tau)$中每一个元素$g_ {ij}(t,\tau)$满足
$$
\int_ {-\infty}^t|g_ {ij}(t,\tau)|\mathrm d\tau\leq K_g,0\leq K_g<\infty,t\in(-\infty,\infty)
$$
推广:

一个初始时刻$t_0$松弛的用$r\times m$冲激响应矩阵$\pmb G(t,\tau)$描述的多变量系统为BIBO稳定系统的充要条件是:
$$
\int_ {-\infty}^t|\pmb G(t,\tau)|\mathrm d\tau\leq K_g,0\leq K_g<\infty,t\in(-\infty,\infty)
$$
特别地,对于定常系统,有
$$
\int_ {-\infty}^t|\pmb G(\tau)|\mathrm d\tau\leq K_g,0\leq K_g<\infty
$$
**由真有理传递函数描述的系统的外部稳定性**

一个由真有理传递函数$g(s)$描述的松弛的线性非时变系统为BIBO稳定系统的充要条件是$g(s)$的所有极点位于$s$开平面左半部分内,或等价地说$g(s)$的所有极点具有负实部。

由真有理传递函数矩阵描述的系统的外部稳定性

一个由真有理传递函数矩阵$\pmb G(s)$描述的松弛的线性非时变多变量系统为BIBO稳定系统的充要条件是$\pmb G(s)$的每个元素的全部极点具有负实部。

4.2. 内部稳定性(李雅普诺夫稳定性)

4.2.1. 系统的平衡状态及其特征

相关概念

自治系统:一个没有输入信号的系统

平衡状态:自治系统的静止状态

受扰运动:由于外界扰动$\delta(t)$及其导数导致自治系统偏离平衡状态后的运动

平衡状态

对于零输入条件下的自由运动,若系统达到某状态时,系统将维持在此状态而不再发生变化,则称状态为该系统的一个平衡状态
$$
\begin{matrix}
\dot{\pmb x}=\pmb f(t,\pmb x,\pmb u)&\dot{\pmb x}_ e=f(t,\pmb x_e,\pmb 0)=0\\\\
\dot{\pmb x}=\pmb A\pmb x&\pmb A\pmb x_e=0
\end{matrix}
$$
$\pmb x_e=\pmb 0$一定是线性系统的一个平衡状态

连续时间线性系统有且仅有一个平衡状态的充要条件是:系统矩阵$A$非奇异,或者说$A$没有零特征值。

4.2.2. 李雅普诺夫意义下的稳定性

李雅普诺夫意义下稳定的平衡状态(限界稳定)

平衡状态$\pmb x_e$称为在$t_0$时刻是李雅普诺夫意义下稳定的,是指:对于每个$\varepsilon>0$,存在着一依赖于$\varepsilon $的正数$\delta$,使得若$|\pmb x_0-\pmb x_e|\leq \delta $,则总有
$$
|\pmb x(t)-\pmb x_e |\leq \varepsilon,\forall t\geq t_0
$$
其中,$\pmb x(t)=\pmb x(t,t_0,\pmb x_0)$是系统始于初态$\pmb x(t_0)=\pmb x_0$的零输入响应

对于线性系统,李雅普诺夫意义下稳定或限界稳定的定义可表述得更为简单:若任一有限的初态所引起的零输入响应有界, 则称该线性系统是李雅普诺夫意义下稳定的或称是限界稳定的

另一种定义(课本定义的说法)

对于任意给定的一个正数$\varepsilon>0$,存在另外一个正数$\delta(\varepsilon,t_0)>0$使得所有$|\pmb x(t_0)|<\delta$的初态$\pmb x(t_0)$引起的受扰运动$|\pmb x(t)|=|\Phi(t,t_0,\pmb x_0,\pmb 0)|$满足
$$
|\pmb x(t)|<\varepsilon,t>t_0,t_0\in(-\infty,\infty)
$$
则状态空间的原点$\pmb 0_x$称为李雅普诺夫意义下$t_0$时刻的平衡状态。若$\delta$与$t_0$无关,则称为一致稳定的平衡状态。老师课件中默认一致稳定=限界稳定。

不稳定的平衡状态

平衡状态不稳定指它不满足李雅普诺夫稳定的定义。即:

平衡状态$x_e$是不稳定的指:若有某个$\varepsilon>0$,无论$\delta>0$如何小,尽管$|\pmb x_0-\pmb x_e|\leq \delta$,也总有某时刻$t_1>t_0$,使得$|\pmb x(t_1,\pmb x_0,t_0)-\pmb x_e|>\varepsilon $

另一种定义(课本定义的说法)

对于任意给定的一个正数$\varepsilon>0$,不论选取另外一个正数$\delta>0$如何小,在所有$|\pmb x(t_0)|<\delta$的初态$\pmb x(t_0)$中,至少有一个$\pmb x(t_0)$引起的运动使得
$$
|\pmb x(t)|>\varepsilon,t\geq t_0+T\\\\
T\in \mathbb R_+,t_0\in(-\infty,\infty)
$$
**渐近稳定平衡状态**

稳定,且该在$\pmb x_e $附近任一由有限初态所引起的零输入响应,当$t\rightarrow \infty $时趋于零。即
$$
\lim\limits_ {t\rightarrow\infty}|\pmb x(t)-\pmb x_e|=0
$$

另一种定义(课本定义的说法)

若状态空间原点不仅是李雅普诺夫稳定平衡状态,且存在某个正数$\delta'(t_0)>0$,只要$|\pmb x(t_0)|<\delta'(t_0)$,由$\pmb x(t_0)$引起的受扰运动$|\pmb x(t)|=|\pmb \Phi(t,t_0,\pmb x_0,\pmb 0_u)|$满足
$$
\lim\limits_ {t\rightarrow \infty}|\pmb \Phi(t,t_0,\pmb x_0,\pmb 0_u)|=\pmb 0_x,t>t_0,t_0\in(-\infty,\infty)
$$
则称状态空间原点为$t_0$时刻渐近稳定的平衡状态

若$\delta'$与$t_0$无关,称为一致渐近稳定的平衡状态

在所有的$\delta'(t_0)$或$\delta'$中,将$\max \delta'(t_0)$或$\max \delta'$所确定的超球体称为平衡状态的吸引域或渐近稳定区域

大范围渐近稳定

平衡状态$\pmb x_e$是大范围渐近稳定的是指:对于从状态空间中的所有点出发的轨迹都能收敛到$\pmb x_e$。此时也称系统是大范围渐近稳定的或全局渐近稳定的

若线性系统是渐近稳定的,则一定是大范围渐近稳定的

全局渐近稳定的必要条件是系统在状态空间中只有一个平衡状态

注:古典控制理论下的稳定 vs 李雅普诺夫意义下的稳定

李雅普诺夫意义下的稳定(通常也简称为稳定)与在古典控制理论中所提的稳定,在概念上有所不同:

  • 古典控制理论中的临界稳定属于不稳定的一种,而在李雅普诺夫意义下它却是稳定的
  • 古典理论中所指的稳定性就是这里所述的渐近稳定性

4.3. 线性系统平衡状态稳定性判据

4.3.1. 线性时变系统的稳定性判据

线性时变系统李雅普诺夫稳定性判据

线性时变系统每一个平衡状态为$t_0$时刻李雅普诺夫稳定平衡状态的充要条件是,存在一个正数$K(t_0)$,使得
$$
|\pmb \Phi(t,t_0)|\leq K(t_0)<\infty,t\geq t_0,t_0\in(-\infty,\infty)
$$

若$K$与$t_0$无关,则为一致稳定平衡状态

线性时变系统渐近稳定与一致渐近稳定判据

线性时变系统为渐近稳定的充要条件是
$$
|\pmb \Phi(t,t_0)|\leq K(t_0)
$$
且$\lim\limits_ {t\rightarrow \infty}|\pmb \Phi(t,t_0)|=0$

其中,$0\leq K(t_0)<\infty,t\geq t_0,t_0\in(-\infty,\infty)$

线性时变系统为一致渐近稳定的充要条件是
$$
|\pmb \Phi(t,t_0)|\leq K_1e^{-k_2(t-t_0)}\\\\
0\leq K_1<\infty,0\leq K_2<\infty,t\geq t_0,t_0\in(-\infty,\infty)
$$

4.3.2. 线性非时变系统的稳定性判据(间接法)

线性非时变系统李雅普诺夫稳定性判据

线性非时变系统$\dot{\pmb x}(t)=\pmb {Ax}(t)$的每一个平衡状态是李雅普诺夫稳定平衡状态的充要条件是,$\pmb A$的所有特征值实部$\alpha_i\leq 0$,实部$\alpha_i=0$的特征值是$\pmb A$的最小多项式的简单零点

说明:

  • 最小多项式

    • 特征方程无重根时最小多项式与特征多项式完全一致

    • 特征根重数与相应的互不相关特征向量数相同时,该特征值仍是最小多项式的单根

    • 示例:
      $$
      \begin{matrix}
      \dot{\pmb x}=\begin{bmatrix}0&0&0\\\\0&0&0\\\\0&0&-1\end{bmatrix}\pmb x
      &
      \begin{matrix}
      特征多项式\Delta(\lambda)=\lambda^2(\lambda+1)\\\\
      最小多项式\Psi(\lambda)=\lambda(\lambda+1)\ \
      \end{matrix}
      &
      \begin{matrix}
      0是最小多项式的单根\\\\
      系统限界稳定
      \end{matrix}
      \end{matrix}
      $$

      $$
      \begin{matrix}
      \dot{\pmb x}=\begin{bmatrix}0&1&0\\\\0&0&0\\\\0&0&-1\end{bmatrix}\pmb x
      &
      \begin{matrix}
      特征多项式\Delta(\lambda)=\lambda^2(\lambda+1)\\\\
      最小多项式\Psi(\lambda)=\lambda^2(\lambda+1)
      \end{matrix}
      &
      \begin{matrix}
      0是最小多项式的重根\\\\
      系统非限界稳定
      \end{matrix}
      \end{matrix}
      $$

  • 等价变换的影响

    • 等价变换不改变系统矩阵的特征值
    • 等价变换不改变系统矩阵的最小多项式
    • 等价变换不改变系统的稳定性

线性非时变系统的大范围渐近稳定判据

线性非时变系统$\dot{\pmb x}(t)=\pmb {Ax}(t)$为大范围渐近稳定系统的充要条件是$\pmb A$的所有特征值的实部$\alpha_i<0$

4.3.3. 线性化模型的稳定性判据

设非线性自治系统的状态方程为:

$$
\dot{\pmb x}(t)=\pmb f[\pmb x(t)]
$$

$\pmb x_e$表示某一平衡状态,经线性化得:

$$
\dot{\pmb x}_ \sim(t)=\pmb J_x\pmb x_ {\sim}(t)
$$

上式是在$\pmb x_e$作为状态空间原点的前提下,状态方程的线性化模型,其中$\pmb J_x$为$\pmb f[\pmb x(t),t]$关于状态向量$\pmb x(t)$的雅可比矩阵,即

$$
\pmb J_x=\frac{\mathrm d\pmb f}{\mathrm d\pmb x}\Bigg|_ {\pmb x_e}
$$

亦可记作:
$$
\dot{\pmb x}(t)=\pmb {Ax}(t)
$$

李雅普诺夫指出:

  1. 若线性化模型中$\pmb A$的所有特征值具有负实部,则平衡状态$\pmb x_e$为稳定的
  2. 若$\pmb A$至少含有一个实部为正的特征值,平衡状态$\pmb x_e$不稳定
  3. 若$\pmb A$的特征值中有的实部为零,其余的实部均为负值,则平衡状态$\pmb x_e$的稳定性取决于$\dot{\pmb x}(t)=\pmb f[\pmb x(t)]$的广义泰勒级数展开式中更高阶项

4.3.4. 平衡状态稳定性 vs BIBO稳定性

线性时变系统的BIBO稳定性

线性时变系统${\pmb A(t),\pmb B(t),\pmb C(t) }$为BIBO稳定系统的充要条件为
$$
\int_ {-\infty}^t|\pmb C(t)\pmb \Phi(t,\tau)\pmb B(\tau)|\mathrm d\tau\leq K_g,0\leq K_g<\infty
$$
这里假定系统在$t_0$时刻松弛,$t_0\in (-\infty,\infty)$,$t\geq t_0$

一致稳定性 vs BIBO稳定

当线性系统${\pmb A(t),\pmb B(t),\pmb C(t) }$中$\pmb B(t)$和$\pmb C(t)$在$(-\infty,\infty)$内有界,则系统的一致渐近稳定意味着系统BIBO稳定

当线性系统${\pmb A(t),\pmb B(t),\pmb C(t) }$中$\pmb A(t)$,$\pmb B(t)$和$\pmb C(t)$在$(-\infty,\infty)$内有界,且系统是一致能控和一致能观的,则线性系统为BIBO稳定的充要条件是系统为一致渐近稳定系统

完全稳定性

定义:当且仅当对于任何初始状态和任何有界输入,线性系统的输出和每个状态分量均有界,称系统为完全稳定系统

线性系统${\pmb A(t),\pmb B(t),\pmb C(t) }$完全稳定的充要条件是$\pmb C(t)$和$\pmb \Phi(t,t_0)$有界,且
$$
\int_ {t_0}^t|\pmb\Phi(t,\tau)\pmb B(\tau)|\mathrm d\tau\leq K,0\leq K<\infty,t\geq t_0,t_0\in(-\infty,\infty)
$$
**能控能观线性非时变系统的性质**

如果线性非时变系统是既能控又能观的系统,则下述论断是等价的:

  1. 系统是完全稳定的
  2. 系统是BIBO稳定的
  3. 系统是渐近稳定的
  4. 系统传递函数矩阵的极点都具有负实部
  5. 系统矩阵的特征值都具有负实部

4.4. 李雅普诺夫直接法

4.4.1. 李雅普诺夫函数简介

李雅普诺夫函数$V(\pmb x)$表征某种虚拟的能量函数,李雅普诺夫函数必须是正定

正定和半正定

设$V(\boldsymbol x) $是定义在向量空间原点某领域$\Re$内的标量函数,称$V(\boldsymbol x)$是正定泛函是指:
$$
V(\boldsymbol x)\geq 0\ \ \ \ \forall x\in \Re,且V(\boldsymbol x)=0\Leftrightarrow \boldsymbol x=0
$$
而称$V(\boldsymbol x)$是半正定泛函指:
$$
V(\boldsymbol x)\geq 0\ \ \ \ \forall x\in \Re,且\boldsymbol x=0\Rightarrow V(\boldsymbol x)=0
$$

负定和负半定

若$-V(\boldsymbol x)$是正定泛函,则称$V(\boldsymbol x)$是负定泛函;同样,若$-V(\boldsymbol x)$是半正定的,则称$V(\boldsymbol x)$是半负定的

不定

设$V(\boldsymbol x)$是定义在向量空间原点某邻域$\Re$内的标量函数,若$\Re$内同时存在非零元素$x_1\neq 0$和$x_2\neq 0$,使得$V(\boldsymbol x_1)>0$而$V(\boldsymbol x_2)<0$,则称泛函$V(\boldsymbol x)$是$\Re$中不定的

4.4.2. 李雅普诺夫稳定性定理

如果在状态空间原点邻域$\Re$内存在一个标量函数$V(\pmb x,t)$,$t\in(-\infty,\infty)$,它对于每个状态变量$x_i$,$i=1,2,\cdots,n$和$t$有连续一阶偏微商

  1. $V(\pmb x,t)$正定,$\dot{V}(\pmb x,t)$半负定,原点是李雅普诺夫一致稳定平衡状态(限界稳定)
  2. $V(\pmb x,t)$正定,$\dot{V}(\pmb x,t)$负定,原点为(一致)渐近稳定平衡状态
  3. 邻域$\Re$扩张到整个状态空间,$V(\pmb x,t)$正定,$\dot{V}(\pmb x,t)$负定,而且随着$|\dot{\pmb x}|\rightarrow\infty$,$V(\pmb x,t)\rightarrow \infty$ ,原点是大范围一致渐近稳定平衡状态
  4. 邻域$\Re$扩张到整个状态空间,$V(\pmb x,t)$正定,$\dot{V}(\pmb x,t)$半负定,而且对于任意$t_0\in(-\infty,\infty)$和任意$\pmb x_0\neq \pmb 0_x$,当$t\geq t_0$时除原点外,$\dot V[\Phi(t,t_0,\pmb x_0,\pmb 0_u),t]\not\equiv0$,原点是大范围一致渐近稳定平衡状态
  5. $V(\pmb x,t)$正(负)定,$\dot{V}(\pmb x,t)$正(负)定,原点是不稳定平衡状态

4.5. 李雅普诺夫函数的构造方法

4.5.1. 构造方法

线性非时变系统$\dot{\pmb x}=\pmb {Ax}$的$\pmb x_e=\pmb 0_x$是大范围渐近稳定平衡状态的充要条件是对于任意给定的正定实对称矩阵$\pmb Q$,存在另一个正定实对称矩阵$\pmb P$,满足下式表达的李雅普诺夫方程:
$$
\pmb A^T\pmb P+\pmb {PA}=-\pmb Q
$$
倘若$\dot{V}[\Phi(t,t_0,\pmb x_0,\pmb 0_u)]\not\equiv 0$,$\pmb Q$可放宽为半正定,李雅普诺夫函数构造为$V(\pmb x)=\pmb x^T\pmb {Px}$

证明:

充分性:

由于已经假设$\pmb Q$和$\pmb P$均为正定实对称矩阵且满足李雅普诺夫方程,不妨取$V(\pmb x)=\pmb x^T\pmb {Px}$,$\pmb P$保证了$V(\pmb x)$是正定函数
$$
\begin{align}
\dot{V}(\pmb x)&=\dot{\pmb x}^T\pmb {Px}+\pmb x^T\pmb {Px}\\\\
&=\pmb x^T\pmb A^T\pmb {Px}+\pmb x^T\pmb {PAx}\\\\
&=\pmb x^T(\pmb A^T\pmb P+\pmb {PA})\pmb x\\\\
&=-\pmb x^T\pmb {Qx}
\end{align}
$$
$\pmb Q$保证了$\dot V(\pmb x)$的负定性所以$\pmb x_e=\pmb 0_x$是大范围渐近稳定平衡状态

必要性:

设系统为大范围渐近稳定的,则$Re[\lambda_i(\pmb A)]<0$,$i=1,2,\cdots,n$,任意选取一正定对称矩阵$\pmb Q$,则$\pmb M(t)\mathop=\limits^{def}e^{\pmb A^Tt}\pmb Q e^{\pmb At}$是满足如下矩阵微分方程的唯一解,且$\pmb M(t)$是对称矩阵
$$
\begin{align}
\dot{\pmb M}(t)&=\pmb A^T\pmb M(t)+\pmb M(t)\pmb A\\\\
\pmb M(0)&=\pmb Q
\end{align}
$$
因为$Re[\lambda_i(\pmb A)]<0$,$i=1,2,\cdots,n$,
$$
\lim\limits_ {t\rightarrow \infty}\pmb M(t)=\pmb 0
$$

$$
\int_0^\infty \dot{\pmb M}(t)\mathrm dt=\pmb M(\infty)-\pmb M(0)=-\pmb Q
$$
或者写成
$$
\pmb A^T\int_0^\infty {\pmb M}(t)\mathrm dt+\Big(\int_0^\infty \pmb M(t)\mathrm dt\Big)\pmb A=-\pmb Q
$$
令$\pmb P\mathop=\limits^{def}\int_0^\infty\pmb M(t)\mathrm dt$
$$
\pmb P^T=\Big(\int_0^\infty \pmb M(t)\mathrm dt\Big)^T=\int_0^\infty \pmb M^T(t)\mathrm dt=\pmb P
$$
最后考察$\pmb P$的正定性
$$
\begin{align}
<\pmb x,\pmb {px}>&=<\pmb x,\Big(\int_0^\infty e^{\pmb A^Tt}\pmb Qe^{\pmb At}\mathrm dt \Big)\pmb x>\\\\
&=\begin{cases}
0&\pmb x=\pmb 0_x\\\\
\int_0^\infty (e^{\pmb At}\pmb x)^T\pmb Q(e^{\pmb At}\pmb x)\mathrm dt>0&\pmb x\neq \pmb 0_x
\end{cases}
\end{align}
$$
所以$\pmb P$是满足李雅普诺夫方程的正定实对称矩阵,定理得证

4.5.2. 克拉索夫斯基定理

设非线性系统$\dot{\pmb x}=\pmb f(\pmb x)$的雅可比矩阵为$\pmb J(\pmb x)$,定义李雅普诺夫函数$V(\pmb x)=<\pmb f(\pmb x),\pmb f(\pmb x)>$,和
$$
\hat{\pmb J}(\pmb x)=\mathop{\pmb J}^\ast+\pmb J(\pmb x)
$$
如果埃尔米特矩阵$\hat{\pmb J}(\pmb x)$负定,则状态空间原点$\pmb x_e=\pmb 0_x$是渐进稳定的平衡状态。如果$|\pmb x|\rightarrow \infty$,$V(\pmb x)\rightarrow\infty$,则$\pmb x_e=\pmb 0_x$是大范围渐进稳定平衡状态

证明:

$V(\pmb x)=f^\ast(\pmb x)f(\pmb x)=|\dot{\pmb x}(t)|^2\geq 0$,且仅在$\dot{\pmb x}(t)=\pmb 0$即$\pmb x_e=\pmb 0_x$处为零,故$V(\pmb x)$正定

$$
\dot V(\pmb x)=\dfrac{\mathrm d\pmb f^\ast}{\mathrm dt}\pmb f+\pmb f^\ast\dfrac{\mathrm d\pmb f}{\mathrm dt}=[\pmb {Jf}]^\ast\pmb f+\pmb f^\ast[\pmb {Jf}]=\pmb f^\ast\hat{\pmb J}\pmb f
$$

由于$\hat{\pmb J}(\pmb x)$负定,$\dot V(\pmb x)$负定,于是系统$\dot{\pmb x}=\pmb f[\pmb x]$的平衡状态$\pmb x_e=\pmb 0_x$为渐近稳定平衡状态。

倘若当$|\pmb x|\rightarrow\infty$,$V(\pmb x)\rightarrow\infty$,$\pmb x_e=\pmb 0_x$为大范围渐进稳定平衡点

4.5.3. 变量梯度法

假设$V(\boldsymbol x)$是非线性系统$\dot{\boldsymbol x}=\boldsymbol f(\boldsymbol x)$的李雅普诺夫函数,则
$$
\dot{V}(\boldsymbol x)=[\nabla_xV(\boldsymbol x)]^T\dot{\boldsymbol x}\\\\
\int^{V(\boldsymbol x)}_ {V(\boldsymbol 0)=0}dV(\boldsymbol x)=\int^x_0[\nabla_xV(\boldsymbol x)]^Td\boldsymbol x
$$

4.6. 线性非时变离散系统的稳定性

4.6.1. BIBO稳定性

设线性非时变离散系统在时域和频域中分别由下式描述:
$$
\pmb y(k)=\sum\limits_ {p=0}^k\pmb G(k-p)\pmb u(p),k=0,1,2,\cdots
$$

$$
\pmb y(z)=\pmb G(z)\pmb u(z)
$$

系统为BIBO稳定系统的充要条件为在时域中为:
$$
\sum\limits_ {k=0}^\infty|\pmb G(k)|\leq K_g,K_g<\infty\in \mathbb R_+
$$

$$
\sum\limits_ {k=0}^\infty |g_ {ij}(k)|\leq K_g,\ i=1,2,\cdots,r,\ j=1,2,\cdots,m
$$
其中$r$,$m$分别表示输出向量$\pmb y(k)$和输入向量$\pmb u(k)$的维数,$g_ {ij}(k)$是$\pmb G(k)$的元素。在频域中$\pmb G(z)$的每一个元素$g_ {ij}(z)$的全部极点$z_i$都位于$Z$平面的单位圆内,即$|z_i|<1$

4.6.2. 平衡状态及其稳定性

大范围渐近稳定

线性非时变离散系统$\pmb x(k+1)=\pmb {Ax}(k)$为大范围渐近稳定系统的充要条件是$\pmb A$的所有特征值的模均小于1

限界稳定

线性定常离散时间系统$\boldsymbol x[k+1]=\boldsymbol A \boldsymbol x[k]$限界稳定的充要条件:$\boldsymbol A$的所有特征值,其模都小于或等于1.且模为1的特征值是$\boldsymbol A$之最小多项式的单根

Routh-Shur判据

线性非时变离散系统$\pmb x(k+1)=\pmb {Ax}(k)$的特征多项式:
$$
\det(\pmb A-z\pmb I)=a_0z^n+a_1z^{n-1}+\cdots+a_ {n-1}z+a_n,\ \ \ \ a_0>0
$$
只含有模小于1的特征值的充要条件是Routh-Shur阵列:
$$
\begin{matrix}
a_0^{(0)}&a_1^{(0)}&a_2^{(0)}&\cdots&a_ {n-2}^{(0)}&a_ {n-1}^{(0)}&a_n^{(0)}\\\\
a_0^{(1)}&a_1^{(1)}&a_2^{(1)}&\cdots&a_ {n-2}^{(1)}&a_ {n-1}^{(1)}\\\\
a_0^{(2)}&a_1^{(2)}&a_2^{(2)}&\cdots&a_ {n-2}^{(2)}\\\\
&\cdots&\cdots&\cdots\\\\
a_0^{(n-2)}&a_1^{(n-2)}&a_2^{(n-2)}\\\\
a_0^{(n-1)}&a_1^{(n-1)}\\\\
a_0^{(n)}
\end{matrix}
$$
中第一列所有元素$a_0^{(i)}>0$,$i=0,1,2,\cdots,n$

Routh-Shur阵列的构造:

$k_i=a^{(i)}_ {n-i}-a^{(i)}_ 0$,$a_i^{(k)}=a_i^{(k-1)}-k_ia_ {n-i-k}^{(k-1)}$

4.6.3. 线性非时变离散系统的李雅普诺夫函数构造

线性非时变离散系统$\pmb x(k+1)=\pmb {Ax}(k)$的平衡状态$\pmb x_e=\pmb 0_x$是大范围渐近稳定平衡状态的充分必要条件是,对于任意给定的正定对称实矩阵$\pmb Q$,存在另外一个正定对称实矩阵$\pmb P$满足李雅普诺夫方程
$$
\pmb A^T\pmb {PA}-\pmb P=-\pmb Q
$$

4.7. 作业复习

4.7.1. 已知系统方程,确定不同稳定类型下的参数取值

设系统动态方程为:
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol A \boldsymbol x+ \boldsymbol B \boldsymbol u\\\\
\boldsymbol y=\boldsymbol C \boldsymbol x+\boldsymbol D \boldsymbol u
\end{cases}
$$
计算传递函数矩阵$\pmb G(s)=\pmb C(s\pmb I-\pmb A)^{-1}\pmb B$

  • BIBO稳定要求矩阵每个元素具有负实部
  • 李雅普诺夫稳定要求$\pmb A$的所有特征值实部$\alpha_i\leq 0$,实部$\alpha_i=0$的特征值是$\pmb A$的最小多项式的简单零点
  • 渐近稳定要求$\pmb A$的所有特征值实部小于0

4.7.2. 李雅普诺夫直接法

可先用间接法判断属于哪种稳定(界限稳定、渐近稳定、大范围渐近稳定)作为检验,再构造李雅普诺夫函数

构造方法:

  1. 经验法

    通常选用二次型如
    $$
    V(\pmb x)=\sum\limits_ {i=1}^n \alpha_i x_i^2+\sum\limits_ {j=1}^m(\sum\limits_ {i=1}^n \beta_ix_i)^2+\sum\limits_ {i=1,j=1,i\neq j}^{n}\gamma_ {ij}x_ix_j
    $$

  2. 公式构造法

    对任意给定的正定对称实矩阵$\pmb Q$,经常取$\pmb Q=\pmb I$ ,寻找另外一个正定对称实矩阵$\pmb P$满足

    连续:$\pmb A^T\pmb P+\pmb {PA}=-\pmb Q$

    离散:$\pmb A^T\pmb {PA}-\pmb P=-\pmb Q$

    李雅普诺夫函数即为$V(\pmb x)=\pmb x^T\pmb {Px}$

4.7.3. 小结

BIBO稳定

  1. 脉冲响应函数绝对可积(较少见)
  2. 传递函数矩阵所有极点具有负实部

李雅普诺夫稳定

间接法 直接法
限界稳定 $\pmb A$的所有特征值实部小于零
实部为0的特征值是$\pmb A$的最小多项式的简单零点
$\dot{V}(\pmb x,t)$半负定
渐近稳定 $\pmb A$的所有特征值实部小于0 $\dot{V}(\pmb x,t)$负定
大范围一致渐近稳定 $\pmb A$的所有特征值实部小于0 $\dot{V}(\pmb x,t)$负定且$\lim\limits_ {|\dot{\pmb x}|\rightarrow \infty}V(\pmb x,t)=\infty$
另一种情况见李雅普诺夫稳定性定理

5. 能观性与能控性

5.1. 能控性与能达性

5.1.1. 能达与能控的概念

状态能控

对某系统的一个特定状态$\overline{\boldsymbol x}$,若存在一个有限的时间段$[t_0,t_f)$,以及定义在该时间段上的控制函数$\boldsymbol u(t)=\overline{\boldsymbol u}(t)$,$t\in[t_0,t_f)$,能够把系统从初始状态$\boldsymbol x(t_0)=\overline{\boldsymbol x}$推向状态$\boldsymbol x(t_f)=\boldsymbol 0$,则称该系统的这一特定状态$\overline{\boldsymbol x}$是$t_0$时刻能控的。($\boldsymbol x(t_0)=\overline{\boldsymbol x}\Rightarrow \boldsymbol x(t_f)=\boldsymbol 0$)

状态能达

若存在将系统从$\boldsymbol x(t_0)=\boldsymbol 0$推向$\boldsymbol x(t_f)=\overline{\boldsymbol x}$的控制作用,则称状态$\overline{\boldsymbol x}$是$t_0$时刻能达的。($\boldsymbol x(t_0)=\boldsymbol 0\Rightarrow \boldsymbol x(t_f)=\overline{\boldsymbol x}$)

系统的能控与能达

如果系统状态空间中的每一个状态都是能控的,则称系统是状态完全能控的或简称系统是能控的;同样,若系统的每一个状态都是能控的则称系统是状态完全能达的,或简称系统是能达的。

特别地,对于连续时间系统,系统能控与系统能达完全等价

5.1.2. 线性时变连续系统的能控性

设线性时变连续系统的动态方程为
$$
\begin{cases}
\dot{\pmb x}(t)=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t),&\pmb x(t)=\pmb x_0\\\\
\pmb y(t)=\pmb C(t)\pmb x(t)
\end{cases}
$$
状态响应为:
$$
\pmb x(t)=\pmb \Phi(t,t_0)\pmb x_0+\int_ {t_0}^t\pmb \Phi(t,\tau) \pmb B(\tau)\pmb u(\tau)\mathrm d\tau
$$
令时间区间$J=[t_0,t_1]$,对于能控系统即找到容许的控制函数$\pmb u_ {[t_0,t_1]}$,使得下式成立
$$
\pmb x(t)=\pmb \Phi(t,t_0)\hat{\pmb x}+\int_ {t_0}^t\pmb \Phi(t,\tau) \pmb B(\tau)\pmb u(\tau)\mathrm d\tau=\pmb 0_x
$$

$$
-\hat{\pmb x}=\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u(\tau)\mathrm d\tau,\ \ \ \ \forall \hat{\pmb x}\in X
$$
对于能达系统即找到容许的控制函数$\pmb u_ {[t_0,t_1]}$,使得下式成立
$$
\pmb x(t_1)=\int_ {t_0}^{t_1}\pmb \Phi(t_1,\tau) \pmb B(\tau)\pmb u(\tau)\mathrm d\tau=\hat{\pmb x}
$$

$$
\pmb\Phi(t_0,t_1)\hat{\pmb x}=\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u(\tau)\mathrm d\tau, \ \ \ \ \forall \hat{\pmb x}\in X
$$
易证得对于线性连续系统,能控性与能达性等价,以下式考察能控性
$$
\overline{\pmb x}=\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u(\tau)\mathrm d\tau, \ \ \ \ \forall \overline{\pmb x}\in X
$$
**格拉姆矩阵判别法**

线性时变系统为$t_0$时刻完全能控系统得充要条件是$n\times m$矩阵$\pmb \Phi(t_0,t)\pmb B(t)$的$n$行在$[t_0,t_1]$内线性无关

证明:

充分性

由时间函数的线性无关判别方法可知,要证$\pmb \Phi(t_0,t)\pmb B(t)$的$n$行在$[t_1,t_2]$内线性无关,其能控格拉姆矩阵
$$
\pmb W_c(t_0,t_1)=\int_ {t_0}^{t_1}[\pmb \Phi(t_0,\tau)\pmb B(\tau)][\pmb \Phi(t_0,\tau)\pmb B(\tau)]^\ast\mathrm d\tau
$$
非奇异,$\pmb W_c^{-1}(t_0,t_1)$存在,设$\forall \overline{\pmb x}=\pmb x(t_0)\in X$,令
$$
\pmb u(t)=[\pmb \Phi(t_0,\tau)\pmb B(\tau)]^\ast\pmb W_c^{-1}(t_0,t_1)\overline{\pmb x}
$$
代入
$$
\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u(\tau)\mathrm d\tau, \ \ \ \ \forall \overline{\pmb x}\in X
$$
得到
$$
\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u(\tau)\mathrm d\tau=\overline{\pmb x}
$$
说明控制函数$\pmb u(t)$可将系统由任意初态$\pmb x(t_0)$转移到$\pmb x(t_1)=\pmb 0$

必要性

假设系统是$t_0$时刻完全能控的,但是$\pmb \Phi(t_0,t)\pmb B(t)$的$n$行在$[t_1,t_2]$内线性相关,即存在非零$n$维向量$\pmb \alpha$使得
$$
\pmb {\alpha\Phi}(t_0,t)\pmb B(t)=\pmb 0,\ \ \ \ \forall t\in[t_0,t_1]
$$
选择$-\pmb x(t_0)=\pmb \alpha^\ast$,系统完全能控表明存在$\pmb u_ {[t_0,t_1]}$使得
$$
\pmb \alpha^\ast=\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u(\tau)\mathrm d\tau
$$
成立,将上面等式两边同时乘以$\pmb \alpha$,有
$$
\pmb {\alpha\alpha}^\ast=\int_ {t_0}^{t_1}\pmb \alpha\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u(\tau)\mathrm d\tau=0
$$
这与$\pmb \alpha$非零矛盾,故$\pmb \Phi(t_0,t)\pmb B(t)$线性无关,得$\pmb \Phi(t_0,t)\pmb B(t)$在$[t_0,t_1]$线性无关$\Leftrightarrow$能控格拉姆矩阵非奇异

证毕

能控性矩阵判别法

假设线性连续系统得$\pmb A(t)$和$\pmb B(t)$均是$n-1$阶连续可导的函数矩阵,规定$\pmb M_0(t)=\pmb B(t)$,再按
$$
\pmb M_ {k+1}(t)=-\pmb A(t)\pmb M_k(t)+\dot{\pmb M}_ k(t),\ \ \ \ k=0,1,2,\cdots,n-1
$$
计算出另外$n-1$个$n\times m$矩阵$\pmb M_1(t)$,$\pmb M_2(t)$,$\cdots$,$\pmb M_ {n-1}(t)$

那么系统是$t_0$时刻完全能控系统的充分条件是

$$
\rho\begin{bmatrix}\pmb M_0(t_1)&\pmb M_1(t_1)&\cdots&\pmb M_ {n-1}(t_1)
\end{bmatrix}=n,
\ \ \ \
t_1>t_0
$$

证明:

考虑到$\partial \pmb \Phi(t_0,t)/\partial t=-\pmb \Phi(t_0,t)\pmb A(t)$,推导出

$$
\frac{\partial ^k}{\partial t^k}\pmb \Phi(t_0,t)\pmb B(t)=\pmb \Phi(t_0,t)\pmb M_k(t),\ \ \ \ k=0,1,2,\cdots,n-1
$$

定义:

$$
\frac{\partial ^k}{\partial t^k}\pmb \Phi(t_0,t)\pmb B(t)\Bigg|_ {t=t_1}\mathop=\limits^{def}\frac{\partial ^k}{\partial t_1^k}\pmb \Phi(t_0,t_1)\pmb B(t_1),\ \ \ \ k=0,1,2,\cdots,n-1
$$

这样

$$
\begin{bmatrix}
\pmb \Phi(t_0,t_1)\pmb B(t_1)&\frac{\partial }{\partial t_1}\pmb \Phi(t_0,t_1)\pmb B(t_1)&\cdots&\frac{\partial^{n-1} }{\partial t_1^{n-1}}\pmb \Phi(t_0,t_1)\pmb B(t_1)
\end{bmatrix}\\\\
=\pmb \Phi(t_0,t_1)\begin{bmatrix}\pmb M_0(t_1)&\pmb M_1(t_1)&\cdots&\pmb M_ {n-1}(t_1)
\end{bmatrix}
$$

因为$\pmb \Phi(t_0,t_1)$非奇异,上式可视为

$$
\rho\begin{bmatrix}
\pmb \Phi(t_0,t_1)\pmb B(t_1)&\frac{\partial }{\partial t_1}\pmb \Phi(t_0,t_1)\pmb B(t_1)&\cdots&\frac{\partial^{n-1} }{\partial t_1^{n-1}}\pmb \Phi(t_0,t_1)\pmb B(t_1)
\end{bmatrix}=n,\ \ \ \ t_1>t_0
$$

$\Rightarrow\Phi(t_0,t)\pmb B(t)$的$n$行在区间$[t_0,t_1]$内线性无关$\Leftrightarrow $系统能控

5.1.3. 线性非时变连续系统的能控性

线性非时变连续系统的能控性判据

线性非时变系统${\pmb A,\pmb B}$为完全能控系统的充要条件是下列等价条件任何一个:

  1. $e^{\pmb At}\pmb B$或$e^{-\pmb At}\pmb B$的$n$行在时间区间$[0,\infty)$内线性无关

  2. $(s\pmb I-\pmb A)^{-1}\pmb B$的$n$行在复数域$\pmb C$上线性无关

  3. 能控性定理

    能控格拉姆矩阵
    $$
    \boldsymbol W_c(t_f)=\int^{t_f}_ 0e^{-\boldsymbol A\tau}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A'\tau}d\tau
    $$
    非奇异,或$\rho[\pmb W_c(t_f)]=n$,对于状态能控,要求状态$\overline{\boldsymbol x}\in R[\boldsymbol W_C(t_f)]$

  4. 能控性判据

    能控性矩阵
    $$
    \boldsymbol M_c=\begin{bmatrix}\boldsymbol B&\boldsymbol A\boldsymbol B&\boldsymbol A^2\boldsymbol B&\cdots&\boldsymbol A^{n-1}\boldsymbol B\end{bmatrix}
    $$
    满秩,即$\rho[\pmb M_c]=n$

  5. 能控性校验(PBH特征向量判别法)

    对于系统矩阵$\pmb A$的每个特征值$\lambda$都有
    $$
    rank\begin{bmatrix}\lambda\boldsymbol I-\boldsymbol A & \boldsymbol B\end{bmatrix}=n
    $$

证明:

  1. 由线性时变连续系统的结论可得:完全能控$\Leftrightarrow e^{\pmb At}\pmb B$的$n$行在$[0,\infty)$线性无关,$e^{\pmb At}\pmb B$解析,符号不影响行的线性无关性

  2. 拉普拉斯变换一对一的性质不改变线性无关性

  3. 线性时变连续系统能控性的格拉姆矩阵判别法可得,或按以下直接证明:

    充分性证明: $\overline{\boldsymbol x}\in R[\boldsymbol W_C(t_f)]\Rightarrow \boldsymbol x(t_f)=\boldsymbol 0$

    因$\overline{\boldsymbol x}\in R[\boldsymbol W_C(t_f)]$,故有向量$\boldsymbol z$满足$\overline{\boldsymbol x}=\boldsymbol W_C(t_f)\boldsymbol z$,于是,对初态$\boldsymbol x(0)=\overline{\boldsymbol x}$,只要选取输入
    $$
    \overline{\boldsymbol u}(t)=-\boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol z,t\in[0,t_f]
    $$
    则在$t_f$时刻,系统的状态响应是
    $$
    \begin{align}
    \boldsymbol x(t_f)&=e^{\boldsymbol At_f}\boldsymbol x(0)+\int^{t_f}_ 0e^{\boldsymbol A(t_f-\tau)}\boldsymbol B\overline{\boldsymbol u}(\tau)d\tau\\\\
    &=e^{\boldsymbol At_f}\boldsymbol x(0)+\int^{t_f}_ 0e^{\boldsymbol A(t_f-\tau)}\boldsymbol B(-\boldsymbol B’e^{-\boldsymbol A'\tau}\boldsymbol z)d\tau\\\\
    &=e^{\boldsymbol At_f}\overline{\boldsymbol x}-e^{\boldsymbol At_f}\left(\int^{t_f}_ 0e^{-\boldsymbol A\tau}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A'\tau}d\tau \right)\boldsymbol z\\\\
    &=e^{\boldsymbol At_f}\overline{\boldsymbol x}-e^{\boldsymbol At_f} \boldsymbol W_C(t_f)\boldsymbol z=e^{\boldsymbol At_f}\overline{\boldsymbol x}-e^{\boldsymbol At_f}\overline{\boldsymbol x}=\boldsymbol 0
    \end{align}
    $$
    此即表明,状态$\overline{\boldsymbol x}$是能控的,充分性得证

    必要性证明: 状态$\overline{\boldsymbol x}$能控$\Rightarrow$$\overline{\boldsymbol x}\in R[\boldsymbol W_C(t_f)]$($\Leftrightarrow\forall\boldsymbol v\in N[\boldsymbol W_C(t_f)],\boldsymbol v'\overline{\boldsymbol x}=0$)

    若状态$\overline{\boldsymbol x}$能控,有$\boldsymbol u(\cdot)$使得
    $$
    \begin{align}
    \boldsymbol x(t_f)&=e^{\boldsymbol At_f}\boldsymbol x(0)+\int^{t_f}_ 0e^{\boldsymbol A(t_f-\tau)}\boldsymbol B\boldsymbol u(\tau)d\tau\\\\
    &=e^{\boldsymbol At_f}\left[\overline{\boldsymbol x}+\int^{t_f}_ 0e^{-\boldsymbol A\tau}\boldsymbol B\boldsymbol u(\tau)d\tau \right]=\boldsymbol 0
    \end{align}
    $$
    因矩阵指数的非奇异性
    $$
    \int^{t_f}_ 0e^{-\boldsymbol A\tau}\boldsymbol B\boldsymbol u(\tau)d\tau=\boldsymbol 0
    $$
    对$\forall \tau\in (0,t_f)$

    有:
    $$
    \begin{align}
    0&=\boldsymbol v'\boldsymbol W_C(t_f)\boldsymbol v=\int^{t_f}_ 0\boldsymbol v’e^{-\boldsymbol A\tau}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A'\tau}\boldsymbol vd\tau\\\\
    &=\int^{t_f}_ 0(\boldsymbol B’e^{-\boldsymbol A'\tau}\boldsymbol v)'(\boldsymbol B’e^{-\boldsymbol A'\tau}\boldsymbol v)d\tau\\\\
    &=\int^{t_f}_ 0|\boldsymbol B’e^{-\boldsymbol A'\tau}\boldsymbol v |^2d\tau
    \end{align}
    $$
    即:
    $$
    \boldsymbol B’e^{-\boldsymbol A'\tau}\boldsymbol v=0
    $$
    因此,
    $$
    \boldsymbol v'\overline{\boldsymbol x}=-\int^{t_f}_ 0\boldsymbol v’e^{-\boldsymbol A\tau}\boldsymbol B\boldsymbol u(\tau)d\tau=-\int^{t_f}_ 0[\boldsymbol B’e^{-\boldsymbol A'\tau}\boldsymbol v]\boldsymbol u(\tau)d\tau=0
    $$
    即若状态$\overline{\boldsymbol x}$能控,则必然有$\overline{\boldsymbol x}\in R[\boldsymbol W_C(t_f)]$

  4. $e^{\pmb At}\pmb B\Leftrightarrow e^{\pmb At}\pmb B$的$n$行在$[0,\infty)$线性无关$\Leftrightarrow $
    $$
    \begin{bmatrix}
    e^{\pmb At'}\pmb B&e^{\pmb At'}\pmb {AB}&e^{\pmb At'}\pmb A^2\pmb B&\cdots&e^{\pmb At'}\pmb A^{n-1}\pmb B
    \end{bmatrix}\\\\
    =e^{\pmb At'}\begin{bmatrix}
    \pmb B&\pmb {AB}&\pmb A^2\pmb B&\cdots&\pmb A^{n-1}\pmb B
    \end{bmatrix}
    $$
    非奇异$\Leftrightarrow$
    $$
    \rho\begin{bmatrix}
    \pmb B&\pmb {AB}&\pmb A^2\pmb B&\cdots&\pmb A^{n-1}\pmb B
    \end{bmatrix}=n
    $$
    或从线性系统状态空间结构角度证明:

    因$\boldsymbol W_C=\boldsymbol W_C' $,且$R(\boldsymbol M_C)^{\perp}=N(\boldsymbol M_C')$,$R(\boldsymbol W_C)^{\perp}=N(\boldsymbol W_C')=N(\boldsymbol W_C)$

    故只要证:$N(\boldsymbol W_C)=N(\boldsymbol M_C')\Leftrightarrow N(\boldsymbol W_C)\subset N(\boldsymbol M_C')$且$N(\boldsymbol W_C)\supset N(\boldsymbol M'_C)$

    先证$N(\boldsymbol W_C)\subset N(\boldsymbol M_C')$:

    设$z\in N(\boldsymbol W_C)$,则$\boldsymbol W_C\boldsymbol z=\boldsymbol 0$

    当然:
    $$
    \begin{align}
    0&=\boldsymbol z'\boldsymbol W_C\boldsymbol z=\int^{t_f}_ 0\boldsymbol z’e^{-\boldsymbol At}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol zdt\\\\
    &=\int^{t_f}_ 0(\boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol z)'(\boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol z)dt\\\\
    &=\int^{t_f}_ 0|\boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol z |^2dt
    \end{align}
    $$
    于是:$\boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol z=\boldsymbol 0,\forall t\in(0,t_f)$,等式两端同时对$t$求$k$阶导数并令$t=0$,可得

    $$
    \boldsymbol B'(\boldsymbol A')^k\boldsymbol z=\boldsymbol 0,k=0,1,2,\cdots,n-1
    $$

    于是

    $$
    \boldsymbol M'_C\boldsymbol z=
    \begin{bmatrix}\boldsymbol B'\\\\\boldsymbol B'\boldsymbol A'\\\\\vdots\\\\\boldsymbol B'(\boldsymbol A')^{n-1}\end{bmatrix}\boldsymbol z=\begin{bmatrix}\boldsymbol B'\boldsymbol z\\\\\boldsymbol B'\boldsymbol A'\boldsymbol z\\\\
    \vdots\\\\\boldsymbol B'(\boldsymbol A')^{n-1}\boldsymbol z\end{bmatrix}=\begin{bmatrix}\boldsymbol 0\\\\\boldsymbol 0\\\\\vdots\\\\\boldsymbol 0\end{bmatrix}=\boldsymbol 0
    $$

    此即$\boldsymbol z\in N(\boldsymbol M_C')$

    所以$N(\boldsymbol W_C)\subset N(\boldsymbol M'_C)$

    再证明$N(\boldsymbol W_C)\supset N(\boldsymbol M_c')$

    若$\boldsymbol z\in N(\boldsymbol M_C')$,即$\boldsymbol M'_C\boldsymbol z=\boldsymbol 0$ ,则

    $$
    \boldsymbol B'(\boldsymbol A')^k\boldsymbol z=\boldsymbol 0\ \ \ \ k=0,1,2,\cdots,n-1
    $$

    于是:

    $$
    \begin{align}
    \boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol z&=\boldsymbol B'\left(\sum\limits_ {k=0}^{n-1}\alpha_k(t)(-\boldsymbol A')^k \right)\boldsymbol z\\\\
    &=\sum\limits_ {k=0}^{n-1}(-1)^k\alpha_k(t)\boldsymbol B'(\boldsymbol A')^k\boldsymbol z=\boldsymbol 0,\forall t\in(0,t_f)
    \end{align}
    $$

    所以

    $$
    \begin{align}
    \boldsymbol W_C\boldsymbol z&=\int^{t_f}_ 0e^{-\boldsymbol At}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A’t}dt\cdot \boldsymbol z\\\\
    &=\int^{t_f}_ 0e^{-\boldsymbol At}\boldsymbol B(\boldsymbol B’e^{-\boldsymbol A’t}\boldsymbol z)dt=\boldsymbol 0
    \end{align}
    $$

    此即$\boldsymbol z\in N(\boldsymbol W_C)$

    所以$N(\boldsymbol W_C)\supset N(\boldsymbol M_C')$

    证毕

  5. 即证

    $$
    rank(\boldsymbol M_C)=rank[\boldsymbol B,\boldsymbol {AB},\boldsymbol A^2\boldsymbol B,\cdots,\boldsymbol A^{n-1}\boldsymbol B]=n
    $$

    充分性证明:

    已知$rank[\boldsymbol B,\boldsymbol {AB},\boldsymbol A^2\boldsymbol B,\cdots,\boldsymbol A^{n-1}\boldsymbol B]=n$

    当$\lambda$不是$\boldsymbol A$的特征值,$|\lambda\boldsymbol I-\boldsymbol A|\neq 0\Rightarrow rank([\lambda\boldsymbol I-\boldsymbol A,\boldsymbol B])=n$

    当$\lambda$是$\boldsymbol A$的特征值,$|\lambda\boldsymbol I-\boldsymbol A|=0\Rightarrow rank(\lambda\boldsymbol I-\boldsymbol A)<n$

    假设$rank([\lambda\boldsymbol I-\boldsymbol A,\boldsymbol B])<0$,则存在非0向量$\boldsymbol v$,使得

    $$
    \begin{align}
    \boldsymbol v^T[\lambda\boldsymbol I-\boldsymbol A,\boldsymbol B]=0\Rightarrow \boldsymbol v^T\boldsymbol B=0,\lambda \boldsymbol v^T=\boldsymbol v^T\boldsymbol A\\\\
    \Rightarrow\boldsymbol v^T\boldsymbol {AB}=\lambda\boldsymbol v^T\boldsymbol B=0\Rightarrow\boldsymbol v^T\boldsymbol A^k\boldsymbol B=0,k=0,1,2,\cdots\\\\
    \Rightarrow\boldsymbol v^T[\boldsymbol B,\boldsymbol {AB},\boldsymbol A^2\boldsymbol B,\cdots,\boldsymbol A^{n-1}\boldsymbol B]=0
    \end{align}
    $$

    得到矛盾

    必要性证明:

    已知$rank([\lambda\boldsymbol I-\boldsymbol A,\boldsymbol B])=n,\forall \lambda$

    假设$rank([\boldsymbol B,\boldsymbol {AB},\boldsymbol A^2\boldsymbol B,\cdots,\boldsymbol A^{n-1}\boldsymbol B])<n$

    存在非0向量$\boldsymbol v$使得:

    $\boldsymbol v^T[\boldsymbol B,\boldsymbol {AB,\boldsymbol A^2\boldsymbol B,\cdots,\boldsymbol A^{n-1}\boldsymbol B}]=0\Rightarrow \boldsymbol v^T\boldsymbol B=0,\cdots,\boldsymbol v^T\boldsymbol A^{n-1}\boldsymbol B=0$

    $\Rightarrow\boldsymbol v^T\boldsymbol A^l\boldsymbol B=0,l\geq n$

    $V={\boldsymbol v|\boldsymbol v^T\boldsymbol A^l\boldsymbol B=0,\forall l\in N}$是一个线性空间,$V$非空

    $V$有一组基${\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s}$,$V=span{\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s}$

    对任意向量$\boldsymbol v\in V$,有如下坐标展开

    $$
    \boldsymbol v=\sum\limits_ {j=1}^sy_j\boldsymbol v_j=\begin{bmatrix}\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s\end{bmatrix}\boldsymbol y,\boldsymbol y=\begin{bmatrix}y_1\\\\\vdots\\\\y_s\end{bmatrix}
    $$

    可以验证:$\boldsymbol v\in V$

    $$
    \boldsymbol A^T\boldsymbol v\in V,(\boldsymbol A^T\boldsymbol v)^T\boldsymbol A^l\boldsymbol B=v^T\boldsymbol A^{l+1}\boldsymbol B=0,\forall l\in N
    $$

    因此

    $$
    \begin{cases}
    \boldsymbol A^T\boldsymbol v_1=\begin{bmatrix}\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s\end{bmatrix}\begin{bmatrix}z_ {11}\\\\z_ {21}\\\\\vdots\\\\z_ {s1} \end{bmatrix}\\\\
    \boldsymbol A^T\boldsymbol v_s=\begin{bmatrix}\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s\end{bmatrix}\begin{bmatrix}z_ {1s}\\\\z_ {2s}\\\\\vdots\\\\z_ {ss} \end{bmatrix}
    \end{cases}
    \Rightarrow
    \begin{matrix}
    \boldsymbol A^T[\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s]=[\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s]\boldsymbol Z\\\\
    Z=\begin{bmatrix}z_ {11}&\cdots&z_ {1s}\\\\\vdots&\ddots&\vdots\\\\z_ {s1}&\cdots&z_ {ss} \end{bmatrix}
    \end{matrix}
    $$

    $Z$至少有一个特征值$\alpha$和一个特征向量$\boldsymbol u$

    $\boldsymbol Z\boldsymbol u=\alpha\boldsymbol u,\boldsymbol u\neq 0$

    定义$\overline{\boldsymbol v}=[\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s]\boldsymbol u,\overline{\boldsymbol v}\neq 0$

    $$
    \begin{align}
    \boldsymbol A^T\overline{\boldsymbol v}&=\boldsymbol A^T[\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s]\boldsymbol u\\\\
    &=[\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s]\boldsymbol {Zu}\\\\
    &=[\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s](\alpha\boldsymbol u)\\\\
    &=\alpha[\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_s]\boldsymbol u\\\\
    &=\alpha\overline{\boldsymbol v}
    \end{align}
    $$

    $$
    \begin{align}
    \begin{cases}\overline{\boldsymbol v}\boldsymbol A=\alpha\overline{\boldsymbol v}\\\\ \overline{\boldsymbol v}\in V\Rightarrow\overline{\boldsymbol v}^T\boldsymbol B=0 \end{cases}
    &\Rightarrow \overline{\boldsymbol v}\begin{bmatrix}\alpha\boldsymbol I-\boldsymbol A&\boldsymbol B\end{bmatrix}=0,\overline{\boldsymbol v}\neq 0\\\\
    &\Rightarrow rank([\lambda \boldsymbol I-\boldsymbol A,\boldsymbol B])<n,\lambda=\alpha
    \end{align}
    $$

    因此

    $$
    rank([\boldsymbol B,\boldsymbol {AB},\boldsymbol A^2\boldsymbol B,\cdots,\boldsymbol A^{n-1}\boldsymbol B])=n\Leftrightarrow rank([\lambda \boldsymbol I-\boldsymbol A,\boldsymbol B])=n,\forall \lambda
    $$

吉尔伯特判别准则

当线性非时变连续系统的系统矩阵$\pmb A$为$n$个互异特征值组成的对角线阵时,系统为完全能控的充要条件是输入矩阵$\pmb B$没有零行;若$\pmb A$为约尔当标准型,充要条件是$\pmb B$中对应每一约尔当子块的最后一行的行向量中没有零行,且对应同一特征值的这些行分别线性无关

等价变换对能控性的影响

线性非时变系统的能控性在代数等价变换下保持不变

证明:

设原系统由${\pmb A,\pmb B}$描述,等价变换后系统由${\overline{A}=\pmb {PAP}^{-1},\overline{\pmb B}=\pmb {PB} }$描述,$\pmb P$非奇异,由于
$$
\begin{align}
\rho[\overline{\pmb M}_ c]&=\rho\begin{bmatrix}\overline{\pmb B}&\overline{\pmb A}\overline{\pmb B}&\overline{\pmb A}^2\overline{\pmb B}&\cdots&\overline{\pmb A}^{n-1}\overline{\pmb B} \end{bmatrix}\\\\
&=\rho\Big(\pmb P\begin{bmatrix}{\pmb B}&{\pmb A}{\pmb B}&{\pmb A}^2{\pmb B}&\cdots&{\pmb A}^{n-1}{\pmb B}\end{bmatrix}\Big)\\\\
&=\rho\begin{bmatrix}{\pmb B}&{\pmb A}{\pmb B}&{\pmb A}^2{\pmb B}&\cdots&{\pmb A}^{n-1}{\pmb B}\end{bmatrix}\\\\
&=\rho[\pmb M_c]
\end{align}
$$

5.1.4. 能控标准型

单输入系统$\dot{\boldsymbol x}=\boldsymbol A_C\boldsymbol x+\boldsymbol b_c\boldsymbol u$,若矩阵对$(\boldsymbol A_C,\boldsymbol b_C)$具有如下标准形式:
$$
\boldsymbol A_c=\begin{bmatrix}0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix};\boldsymbol b_c=\begin{bmatrix}0\\\\0\\\\\vdots\\\\0\\\\1\end{bmatrix}
$$
则系统${\boldsymbol A_C,\boldsymbol b_C}$称作能控标准型系统,矩阵对$(\boldsymbol A_C,\boldsymbol b_C)$称作能控标准型

单输入系统能控的充要条件是:存在一个线性变换,可将系统变换为能控标准型系统

常见形式的能控标准型:
$$
\begin{matrix}
\begin{matrix}
\boldsymbol A_c=\begin{bmatrix}0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix};\boldsymbol b_c=\begin{bmatrix}0\\\\0\\\\\vdots\\\\0\\\\1\end{bmatrix}\\\\
下友型能控标准型
\end{matrix}
&
\begin{matrix}
\boldsymbol A_c=\begin{bmatrix}
0&0&\cdots&0&-\alpha_0\\\\
1&0&\cdots&0&-\alpha_1\\\\
0&1&\cdots&0&-\alpha_2\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&-\alpha_ {n-1}
\end{bmatrix};\boldsymbol b_c=\begin{bmatrix}1\\\\0\\\\\vdots\\\\0\\\\0\end{bmatrix}\\\\
右友型能控标准型
\end{matrix}
\\\\
\begin{matrix}
\boldsymbol A_c=\begin{bmatrix}
-\alpha_ {n-1}&-\alpha_ {n-2}&\cdots&-\alpha_1&-\alpha_0\\\\
1&0&\cdots&0&0\\\\
0&1&\cdots&0&0\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&0
\end{bmatrix};\boldsymbol b_c=\begin{bmatrix}1\\\\0\\\\\vdots\\\\0\\\\0\end{bmatrix}\\\\
上友型能控标准型
\end{matrix}
&
\begin{matrix}
\boldsymbol A_c=\begin{bmatrix}
-\alpha_ {n-1}&1&0&\cdots&0\\\\
-\alpha_ {n-2}&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
-\alpha_1&0&0&\cdots&1\\\\
-\alpha_0&0&0&\cdots&0
\end{bmatrix};\boldsymbol b_c=\begin{bmatrix}0\\\\0\\\\\vdots\\\\0\\\\1\end{bmatrix}\\\\
左友型能控标准型
\end{matrix}
\end{matrix}
$$
**右友型能控标准型的求取方法**


$$
\pmb Q=\begin{bmatrix}\pmb b&\pmb {Ab}&\pmb {A}^2\pmb b&\cdots&\pmb A^{n-1}\pmb b\end{bmatrix}
$$
解:
$$
\pmb v^T=\begin{bmatrix}0&0&0&1\end{bmatrix}\begin{bmatrix}\pmb b&\pmb {Ab}&\pmb A^2\pmb b&\pmb A^3\pmb b\end{bmatrix}^{-1}
$$
构造变换矩阵:
$$
\pmb P=\begin{bmatrix}
\pmb v^T\\\\
\pmb v^T\pmb A\\\\
\pmb v^T\pmb A^2\\\\
\pmb v^T\pmb A^3
\end{bmatrix}
$$
做等价变换$\overline{\pmb A}=\pmb P\pmb {AP}^{-1}$和$\overline{\pmb b}=\pmb P\pmb b$ ,即可得到右友型能控标准型

5.1.5. 输出能控性

定义:系统的输出能控性

对系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$,若存在一个有限时间$t_f>0$,及控制函数
$$
\boldsymbol u(t)=\overline{\boldsymbol u}(t),t\in[0,t_f]
$$
能够把系统的输出从任一初始输出$\boldsymbol y(0)=\boldsymbol y_1$推向$t_f$时刻的任意指定输出$\boldsymbol y(t_f)=\boldsymbol y_2$,则称该系统是输出能控的

定理:系统输出能控的条件

系统输出能控的充要条件为系统的输出能控性矩满秩
$$
\boldsymbol M_ {Cy}=\begin{bmatrix}\boldsymbol D&\boldsymbol {CB}&\boldsymbol {CAB}&\cdots&\boldsymbol C \boldsymbol A^{n-1}\boldsymbol B \end{bmatrix}=\begin{bmatrix}\boldsymbol D&\boldsymbol C\boldsymbol M_C\end{bmatrix}
$$

5.2. 能观性与能构性

5.2.1. 能观性和能构性的概念

假设系统初始状态$\pmb x(t_0)=\hat{\pmb x}$,$\forall \hat{\pmb x}\in X$,若依据有限时间区间$J$内所测得的$\pmb y_J$和外加的$\pmb u_J$能够确定出系统初态$\pmb x(t_0)$

能观系统

若$J$是$t_0$开始以后的区间,称系统在$t_0$时刻完全能观,简称为能观系统,否则为不能观系统

能控系统

若$J$是$t_0$以前到$t_0$的区间,称系统在$t_0$时刻完全能构,简称为能构系统,否则为不能构系统

5.2.2. 线性时变连续系统的能观性

能观性格拉姆矩阵判别法

线性时变连续系统${\pmb A(t),\pmb C(t) }$在$t_0$时刻完全能观的充要条件是$\pmb C(t)\pmb \Phi(t,t_0)$在有限时间区间$[t_0,t]$内列线性无关,即能观格兰姆矩阵非奇异

证明:

充分性

因为
$$
\pmb y_ {zi}(t)=\pmb C(t)\pmb \Phi(t,t_0)\pmb x(t_0)
$$
对等式两边乘以$\pmb \Phi^\ast(t,t_0)\pmb C^\ast(t)$并在$[t_0,t_1]$内积分
$$
\int_ {t_0}^{t_1}\pmb \Phi^\ast(t,t_0)\pmb C^\ast(t)\pmb y_ {zi}(t)\mathrm dt=\int_ {t_0}^{t_1}\pmb \Phi^\ast(t,t_0)\pmb C^\ast(t)\pmb C(t)\pmb \Phi(t,t_0)\pmb x(t_0)\mathrm dt
$$
规定能观性格拉姆矩阵为
$$
\pmb W_o(t_0,t_1)\mathop=\limits^{def}\int_ {t_0}^{t_1}[\pmb C(t)\pmb \Phi(t,t_0)]^\ast[\pmb C(t)\pmb \Phi(t,t_0)]\mathrm dt
$$
由前定理知$\pmb W_o(t_0,t_1)$非奇异$\Leftrightarrow\pmb C(t)\pmb \Phi(t,t_0)$的$n$列在$[t_0,t_1]$内线性无关,可由前式得到
$$
\pmb x(t_0)=\pmb W_o^{-1}(t_0,t_1)\int_ {t_0}^{t_1}\pmb \Phi^\ast(t,t_0)\pmb C^\ast(t)\pmb y_ {zi}(t)\mathrm dt
$$
即只要测量出$\pmb y_ {zi[t_0,t_1]}$ 就可由上式计算$\pmb x(t_0)$

必要性

采用反证法,假设系统能观但不存在有限区间$[t_0,t_1]$使得$\pmb C(t)\pmb \Phi(t,t_0)$的$n$列线性无关。存在一个非零的$n$维列向量$\pmb \alpha$使得
$$
\pmb C(t)\pmb \Phi(t,t_0)\pmb \alpha=\pmb 0_ {r\times 1},\ \ \ \ \forall t>t_0
$$
现在选择$\pmb x(t_0)=\pmb \alpha$,则
$$
\pmb y_ {zi}(t)=\pmb C(t)\pmb \Phi(t,t_0)\pmb x(t_0)=\pmb 0_ {r\times 1}\ \ \ \ \forall t>t_0
$$
与系统能观假设矛盾,必要性得证

能观性矩阵判别法

假设线性连续系统的$\pmb A(t)$和$\pmb C(t)$均是$n-1$阶连续可导的函数矩阵,则系统是$t_0$时刻完全能观系统的充分条件是
$$
\rho\begin{bmatrix}
\pmb N_0(t_1)\\\\
\pmb N_1(t_1)\\\\
\vdots\\\\
\pmb N_ {n-1}(t_1)
\end{bmatrix}
=n,\ \ t_1>t_0
$$
其中
$$
\pmb N_0(t)=\pmb C(t),\ \ \pmb N_ {k+1}(t)=\pmb N_k(t)\pmb A(t)+\frac{\mathrm d}{\mathrm dt}\pmb N_ {k}(t),\ \ \ \ k=0,1,2,\cdots,n-1
$$

5.2.3. 线性非时变连续系统的能观性

线性非时变连续系统的能观性判据

线性非时变连续系统${\pmb A,\pmb C}$为完全能观系统的充要条件是下列等价条件的任何一个成立:

  1. $\pmb Ce^{\pmb At}$的$n$列在时间区间$[0,\infty)$内线性无关

  2. $\pmb C(s\pmb I-\pmb A)^{-1}$的$n$列在复数域$\pmb C$上线性无关

  3. 能观性原理

    能观性格拉姆矩阵
    $$
    \pmb W_o(t_f)=\int_0^{t_f}e^{\pmb A’t}\pmb C'\pmb Ce^{\pmb At}\mathrm dt,\ \ \ \ t_f>0
    $$
    非奇异,或$\rho[\pmb W_o(t_f)]=n$

  4. 能观性判据

    能观性矩阵
    $$
    \pmb M_o=\begin{bmatrix}
    \pmb C\\\\
    \pmb {CA}\\\\
    \pmb C\pmb A^2\\\\
    \vdots\\\\
    \pmb {CA}^{n-1}
    \end{bmatrix}
    $$
    满秩,即$\rho[\pmb M_o]=n$

  5. $n$维系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$能观的充要条件是:对系统矩阵$\boldsymbol A$的每个特征值$\lambda$都有
    $$
    \rho\begin{bmatrix}\lambda\boldsymbol I-\boldsymbol A\\\\\boldsymbol C\end{bmatrix}=n
    $$

吉尔伯特判据

当线性非时变连续系统的系统矩阵$\pmb A$为$n$个互异特征值组成的对角线阵时,系统为完全能观的充要条件是输出矩阵$\pmb C$没有零列;若$\pmb A$为约尔当标准型,充要条件是$\pmb C$中对应每一约尔当子块的最后一行的行向量中没有零列,且对应同一特征值的这些列分别线性无关

等价变换对系统能观性的影响

线性非时变连续系统${\pmb A(t) ,\pmb C(t) }$的能观性在等价变换下保持不变

5.2.4. 能观标准型

能控标准型系统的对偶系统是能观标准型系统,能观标准型系统的系统矩阵和输出矩阵组成的矩阵对称为能观标准型。对$n$维单输出系统${\boldsymbol A_o,\boldsymbol B_o,\boldsymbol c_o,\boldsymbol d_o}$,若其中矩阵$\boldsymbol A_o$和$\boldsymbol c_o$具有如下型式:
$$
\boldsymbol A_o=\begin{bmatrix}0&0&\cdots&0&-\alpha_0\\\\
1&0&\cdots&0&-\alpha_1\\\\0&1&\cdots&0&-\alpha_2\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&-\alpha_ {n-1}
\end{bmatrix},\boldsymbol c_o=\begin{bmatrix}0&0&\cdots&0&1\end{bmatrix}
$$
则系统${\boldsymbol A_o,\boldsymbol B_o,\boldsymbol c_o,\boldsymbol d_o}$称为能观标准型系统,矩阵对$(\boldsymbol A_o,\boldsymbol c_o)$称作能观标准型

单输出系统能观的充要条件是,存在一个线性变换,将之变换成能观标准型系统

能观标准型也可分为右友型、左友型、下友型、上友型四种,它们的型式可由相应的能控标准型的对偶系统得到;

化能观系统为能观标准型系统的变换阵也可由同样方式得到

5.3.线性系统状态空间结构

5.3.1. 不完全能控系统的状态空间结构

能控子空间的概念

若线性系统不完全能控,则状态空间$X=X_c\oplus X_ {\overline{c}}$,且
$$
\begin{matrix}
X_c=R[\pmb W_c(t_0,t_1)]\\\\
X_ {\overline{c}}=N[\pmb W_c(t_0,t_1)]
\end{matrix},\ \ \ \
t_1>t_0
$$
$X_c$称为能控状态子空间,$X_ {\overline{c}}$称为不能控状态子空间。特别地,对于非时变连续系统,当$t_0=0$时,还有
$$
\begin{matrix}
X_c=R[\pmb W_c(0,t_1)]=R[\pmb M_c]\\\\
X_ {\overline{c}}=N[\pmb W_c(0,t_1)]=N[\pmb M_c^T]
\end{matrix},\ \ \ \
t_1>0
$$
*证明:*

简单认为$\pmb W_c(t_0,t_1)$为实函数,有
$$
\pmb W_c(t_0,t_1)=\pmb W^T(t_0,t_1)
$$
将$\pmb W_c(t_0,t_1)$视为将$X$映射为$X$的线性算子,则
$$
\begin{align}
X&=R[\pmb W_c(t_0,t_1)]\oplus R[\pmb W_c^T(t_0,t_1)]\\\\
&=R[\pmb W_c(t_0,t_1)]\oplus R[\pmb W_c(t_0,t_1)]
\end{align}
$$
假设$\pmb x(t_0)=\hat{\pmb x}$,$\forall \hat{\pmb x}\in R[\pmb W_c(t_0,t_1)]$,则$\exists z\in X$满足
$$
\begin{align}
\hat{\pmb x}&=\pmb W_c(t_0,t_1)\pmb z\\\\
&=\int_ {t_0}^{t_1}[\pmb \Phi(t_0,\tau)\pmb B(\tau)][\pmb \Phi(t_0,\tau)\pmb B(\tau)]^Tz\mathrm dz
\end{align}
$$
上式说明存在某个输入函数$[\pmb \Phi(t_0,\tau)\pmb B(\tau)]^Tz$将$\pmb x(t_0)=\hat{\pmb x}$转移到$\pmb 0_x=\pmb x(t_1)$,即凡$\pmb W_c(t_0,t_1)$值域空间中的状态均为能控状态

假设$\overline{\pmb x}=\pmb x(t_0)$为任意一个能控状态,即存在输入函数$\overline{\pmb u}(t)$使得
$$
\overline{\pmb x}=\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\overline{\pmb u}(\tau)\mathrm d\tau
$$
另一方面,$\overline{\pmb x}=\pmb x_R\oplus \pmb x_N$,$\pmb x_R$和$\pmb x_N$分别为$\overline{\pmb x}$分解在$R[\pmb W_c(t_0,t_1)]$和$N[\pmb W_c(t_0,t_1)]$中的分量,对于$\pmb x_N$有
$$
\pmb W_c(t_0,t_1)\pmb x_N=\pmb 0_x
$$

$$
<\pmb x_N,\pmb W_c(t_0,t_1)\pmb x_N>=0
$$

$$
\begin{align}
\pmb x_N^T\pmb W_c(t_0,t_1)\pmb x_N&=\int_ {t_0}^{t_1}\pmb x_N^T[\pmb \Phi(t_0,\tau)\pmb B(\tau)][\pmb \Phi(t_0,\tau)\pmb B(\tau)]^T\pmb x_N\mathrm d\tau\\\\
&=\int_ {t_0}^{t_1} |[[\pmb \Phi(t_0,\tau)\pmb B(\tau)]^T\pmb x_N]|^2\mathrm d\tau=0
\end{align}
$$
所以
$$
[\pmb \Phi(t_0,\tau)\pmb B(\tau)]^T\pmb x_N=\pmb 0_ {m\times 1},\ \ \ \ \forall t\in[t_0,t_1]
$$
对于$\pmb x_R$有
$$
\pmb x_R=\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau)\pmb u_R(\tau)\mathrm d\tau
$$
于是,
$$
\pmb x_N=\overline{\pmb x}-\pmb x_R=\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau) [\overline{\pmb u}(\tau)-\pmb u_R(\tau)]\mathrm d\tau
$$

$$
\begin{align}
|\pmb x_N|^2&=<\pmb x_N,\pmb x_N>=\pmb x_N^T\int_ {t_0}^{t_1}\pmb \Phi(t_0,\tau)\pmb B(\tau) [\overline{\pmb u}(\tau)-\pmb u_R(\tau)]\mathrm d\tau\\\\
&=\int_ {t_0}^{t_1}{[\Phi(t_0,\tau)\pmb B(\tau)]^T\pmb x_N}^T[\overline{\pmb u}(\tau)-\pmb u_R(\tau)]\mathrm d\tau\\\\
&=\int_ {t_0}^{t_1}\pmb 0_ {1\times m}[\overline{\pmb u}(\tau)-\pmb u_R(\tau)]\mathrm d\tau\\\\
&=0
\end{align}
$$

$$
\pmb x_N=\pmb 0
$$
说明任何能控的状态只处于$R[\pmb W_c(t_0,t_1)]$中。由此得到能控子空间的概念

现在分析线性非时变连续系统的情况。

由前证得对于矩阵指数,有
$$
e^{\pmb At}=\sum\limits_ {k=0}^{n-1}\alpha_k(t)\pmb A^k=\mathcal L^{-1}[(s\pmb I-\pmb A)^{-1}]
$$
设$\pmb z\neq \pmb 0_x$,但$\forall \pmb z\in N[\pmb W_c(0,t_1)]$,可以证明
$$
\pmb B^Te^{-\pmb A^Tt}\pmb z=\pmb B^T\sum\limits_ {k=0}^{n-1}(-1)^k\alpha_k(t)(\pmb A^T)^k\pmb z=\pmb 0_ {m\times1},\ \ \ \ \forall t\in[0,\infty)
$$
因为$\alpha_k(t)$,$k=0,1,2,\cdots,n-1$在$[0,\infty)$内彼此线性无关,所以$\pmb B^T\pmb z=\pmb B^T\pmb A^T\pmb z=\cdots=\pmb B^T(\pmb A^{n-1})^T\pmb z=\pmb 0_ {m\times 1}$ ,即
$$
\pmb M_c^T\pmb z=\begin{bmatrix}
\pmb B^T\\\\
(\pmb {AB})^T\\\\
\vdots\\\\
(\pmb A^{n-1}\pmb B)^T
\end{bmatrix}\pmb z=\pmb 0_ {nm\times 1}, \ \ \ \ \pmb z\in N[\pmb M_c^T]
$$
这说明
$$
N[\pmb W_c(0,t_1)]\subseteq N[\pmb M_c^T]
$$
采用相反的思路也可证得
$$
N[\pmb M_c^T]\subseteq N[\pmb W_c(0,t_1)]
$$
所以
$$
X_ {\overline{c}}=N[\pmb W_c(0,t_1)]=N[\pmb M_c^T]
$$
最后因为
$$
\begin{align}
X&=R[\pmb W_c(0,t_1)]\oplus N[\pmb W_c(0,t_1)]\\\\
&=R[\pmb M_c]\oplus N[\pmb M_c^T]
\end{align}
$$
又有
$$
X_c=R[\pmb W_c(0,t_1)]=R[\pmb M_c]
$$
证毕

能控性分解

考虑$n$维线性系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$,当系统不能控,即
$$
\mathrm {rank}(M_C)=\mathrm{rank}(\begin{bmatrix}\boldsymbol B&\boldsymbol {AB}&\cdots&\boldsymbol {A}^{n-1}\boldsymbol B \end{bmatrix})=n_1<n
$$
时,构造$n\times n$的矩阵
$$
\boldsymbol Q:=\begin{bmatrix}\boldsymbol q_1&\boldsymbol q_2&\cdots&\boldsymbol q_ {n_1} &\boldsymbol q_ {n_1+1}&\cdots&\boldsymbol q_n \end{bmatrix}
$$
其中,前$n_1$列是能控性矩阵$\boldsymbol M_C$阵中的任一$n_1$个线性无关列,而剩下的列在保持$\boldsymbol Q$非奇异的前提下可任意选取。这样等价变换$\boldsymbol x=\boldsymbol Q\overline{\boldsymbol x}$可将系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$在形式上变换为
$$
\begin{bmatrix}\dot{\boldsymbol x}_ c\\\\ \dot{\boldsymbol {x}}_ \overline{c} \end{bmatrix}=\begin{bmatrix}\boldsymbol A_c&\boldsymbol A_ {12}\\\\\boldsymbol 0&\boldsymbol A_ {\overline{c}} \end{bmatrix}\begin{bmatrix}\boldsymbol x_c\\\\\boldsymbol x_ {\overline c} \end{bmatrix}+\begin{bmatrix}\boldsymbol B_c\\\\\boldsymbol 0\end{bmatrix}\boldsymbol u
$$
其中$\boldsymbol A_c$是$n_1\times n_1$维的,$\boldsymbol A_c$是$(n-n_1)\times(n-n_1)$的,且变换后的$n_1$维子方程
$$
\begin{align}
\dot{\boldsymbol x}_ c&=\boldsymbol A_c\boldsymbol x_c+\boldsymbol B_c\boldsymbol u\\\\
\boldsymbol y&=\boldsymbol C_c\boldsymbol x_c+\boldsymbol D\boldsymbol u
\end{align}
$$
是能控的,且与原系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$具有相同的传递矩阵

图示:

5.3.2. 不完全能观系统的状态空间结构

能观子空间的概念

若线性连续系统不完全能观,则状态空间$X=X_o\oplus X_ {\overline{o}}$,且
$$
\begin{matrix}
X_ {\overline{o}}=N[W_o(t_0,t_1)],\\\\
X_ {{o}}=R[W_o(t_0,t_1)],
\end{matrix}\ \ \ \
t_1>t_0
$$
特别地,对于线性非时变连续系统,有
$$
\begin{matrix}
X_ {\overline{o}}=N[W_o(t_0,t_1)]=N[\pmb M_o],\\\\
X_ {{o}}=R[W_o(t_0,t_1)]=R[\pmb M^T_o],
\end{matrix}\ \ \ \
t_1>0
$$
$X_\overline{o}$和$X_o$分别表示不能观子空间和能观子空间

证明:

设系统不完全能观,$\pmb x(t_0)= \hat{\pmb x}\neq \pmb 0_x$是任意一个不能观的初态,则有$\hat{\pmb x}$产生$\pmb y_ {zi}(t)=\pmb 0_y$,$\forall t\in[t_0,t_1]$,即
$$
\pmb y_ {zi}(t)=\pmb C(t)\pmb \Phi(t,t_0)\hat{\pmb x}=\pmb 0_y,\ \ \ \ \forall t\in [t_0,t_1]
$$

显然
$$
X_\overline{o}=N[\pmb C(t)\pmb \Phi(t,t_0)],\ \ \ \ \forall t\in[t_0,t_1]
$$
于是
$$
X_ {o}=R[(\pmb C(t)\pmb \Phi(t,t_0))^T],\ \ \ \ \forall t\in[t_0,t_1]
$$
$\pmb W_o(t_0,t_1)$与$[\pmb C(t)\pmb \Phi(t,t_0)]^T$之间秩的一致性和$\pmb W_o(t_0,t_1)$的对称性决定线性连续系统不能观结构的正确性

对于线性非时变连续系统,$\pmb y_ {zi}(t)=\pmb Ce^{\pmb At}\pmb x_0$,若$\forall \pmb x_0\in\hat {\pmb x}\in X_\overline o$则
$$
\sum\limits_ {k=0}^{n-1}\alpha_k(t)\pmb {CA}^k\hat{\pmb x}=\pmb 0_y, \ \ \ \ \forall \hat{\pmb x}\in X_\overline o,t\in [0,\infty)
$$
易证得
$$
\pmb M_o\hat{\pmb x}=\pmb 0_ {nr\times 1},\ \ \ \ \forall \hat{\pmb x}\in X_\overline o
$$

$$
X_\overline o\subseteq N[\pmb M_o]
$$
反过来可证明
$$
N[\pmb M_o]\subseteq X_ {\overline o}
$$
从而有
$$
X_ {\overline o}=N[\pmb M_o]
$$

$$
X_o=R[\pmb M_o^T]
$$
**能观性分解**

考虑$n$维系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$,当系统不能观,即:
$$
\mathrm{rank}(\boldsymbol M_o)=\mathrm{rank}\begin{bmatrix}\boldsymbol C\\\\\boldsymbol {CA}\\\\\vdots\\\\\boldsymbol {CA}^{n-1} \end{bmatrix}=n_2<n
$$
时,通过构造$n\times n$的矩阵$\boldsymbol P$(其中前$n_2$行是$M_o$的任意$n_2$个线性无关行,剩下的各列可在保证$\boldsymbol P$非奇异的条件下任意选取)
$$
\boldsymbol P=\begin{bmatrix}\boldsymbol p_1\\\\\vdots\\\\\boldsymbol p_ {n_2}\\\\\vdots\\\\\boldsymbol p_n \end{bmatrix}
$$
等价变换$\overline{\boldsymbol x}=\boldsymbol {Px}$即可将系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$在形式上变换为
$$
\begin{bmatrix}\dot{\boldsymbol x}_ o\\\\\dot{\boldsymbol x_\overline{o}} \end{bmatrix}=
\begin{bmatrix}\boldsymbol A_o&\boldsymbol O\\\\\boldsymbol A_ {21}&\boldsymbol A_ {\overline{o}} \end{bmatrix}\begin{bmatrix}\boldsymbol x_o\\\\\boldsymbol x_ {\overline{o}}\end{bmatrix}+\begin{bmatrix}\boldsymbol B_o\\\\\boldsymbol B_ {\overline{o}} \end{bmatrix}\boldsymbol u\\\\
\boldsymbol y=\begin{bmatrix}\boldsymbol C_o&\boldsymbol O\end{bmatrix}\begin{bmatrix}\boldsymbol x_o\\\\\boldsymbol x_ {\overline{o}}\end{bmatrix}+\boldsymbol {Du}
$$
其中,$\boldsymbol A_o$是$n_2\times n_2$矩阵,$A_ {\overline{o}}$是$(n-n_2)\times(n-n_2)$的矩阵。变换后的$n_2$维子方程
$$
\begin{align}
\dot{\overline{\boldsymbol x}}_ o&=\overline{\boldsymbol A}_ o\overline{\boldsymbol x}_ o+\overline{\boldsymbol B}_ o\boldsymbol u\\\\
\boldsymbol y&=\overline{\boldsymbol C}_ o\overline{\boldsymbol x}_ o+\boldsymbol {Du}
\end{align}
$$
是能观的,且与原系统${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$具有相同的传递矩阵

图示:

5.3.3. 卡尔曼分解(系统结构分解定理)

每一个状态空间方程都可以通过一等价变换,变换为如下的规范形式:

$$
\begin{bmatrix}\dot{\boldsymbol x}_ {co} \\\\\dot{\boldsymbol x}_ {c\overline{o}}\\\\\dot{\boldsymbol x}_ {\overline{c}o}\\\\\dot{\boldsymbol x}_ {\overline{c}\overline{o}} \end{bmatrix}=\begin{bmatrix}
\overline{\boldsymbol A}_ {co}&\boldsymbol O& \overline{\boldsymbol A}_ {13}&\boldsymbol O\\\\
\overline{\boldsymbol A}_ {21}&\overline{\boldsymbol A}_ {c\overline{o}}&
\overline{\boldsymbol A}_ {23}&\overline{\boldsymbol A}_ {24}\\\\
\boldsymbol O&\boldsymbol O&\overline{\boldsymbol A}_ {\overline{c}{o}}&\boldsymbol O\\\\
\boldsymbol O&\boldsymbol O&\overline{\boldsymbol A}_ {43}&\overline{\boldsymbol A}_ {\overline{c}\overline{o}}
\end{bmatrix}
\begin{bmatrix}{\boldsymbol x}_ {co} \\\\{\boldsymbol x}_ {c\overline{o}}\\\\{\boldsymbol x}_ {\overline{c}o}\\\\{\boldsymbol x}_ {\overline{c}\overline{o}}\end{bmatrix}
+
\begin{bmatrix}\boldsymbol B_ {co}\\\\\boldsymbol B_ {c\overline{o}}\\\\\boldsymbol O\\\\\boldsymbol O \end{bmatrix}\boldsymbol u\\\\
\boldsymbol y=\begin{bmatrix}\boldsymbol C_ {co}&\boldsymbol O&\boldsymbol C_ {\overline{c}o}&\boldsymbol O \end{bmatrix}
$$

其中,

  • $\boldsymbol x_ {co}$:能控,能观
  • $\boldsymbol x_ {c\overline o}$:能控,不能观
  • $\boldsymbol x_ {\overline{c}o}$:不能控,能观
  • $\boldsymbol x_ {\overline{c}\overline{o}}$:不能控,不能观

其状态方程零状态等价于既能控又能观的状态方程:

$$
\dot{\boldsymbol x}_ {co}=\boldsymbol A_ {co}\boldsymbol x_ {co}+\boldsymbol B_ {co}\boldsymbol u\\\\
\boldsymbol y=\boldsymbol C_ {co}\boldsymbol x_ {co}+\boldsymbol {Du}
$$

即传递矩阵为:

$$
\hat G(s)=\boldsymbol C_ {co}(s\boldsymbol I-\boldsymbol A_ {co})^{-1}\boldsymbol B_ {co}+\boldsymbol D
$$

5.4. 能观性与能控性的比较

5.4.1. 对偶性原理

把连续时间系统的能控子空间和不能控子空间以及能观子空间和不能观子空间的表达式写在一起:

$$
\begin{matrix}
X_C=R[\boldsymbol W_C(t_f)]&X_ {\overline{C}}=N[\boldsymbol W_C(t_f)]&\boldsymbol W_C(t_f)=\int^{t_f}_ 0e^{-\boldsymbol At}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A’t}dt\\\\
X_O=R[\boldsymbol W_O(t_f)]&X_ {\overline{O}}=N[\boldsymbol W_O(t_f)]&\boldsymbol W_O(t_f)=\int^{t_f}_ 0e^{\boldsymbol A’t}\boldsymbol C'\boldsymbol Ce^{\boldsymbol At}dt
\end{matrix}
$$

考虑两个系统的能控性和能观性:

$$
\begin{matrix}
S_1:\begin{cases}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\\boldsymbol y=\boldsymbol {Cx} \end{cases}&S_2:\begin{cases}\dot{\boldsymbol x}=-\boldsymbol A'\boldsymbol x+\boldsymbol C'\boldsymbol u\\\\\boldsymbol y=\boldsymbol B'\boldsymbol x \end{cases}
\end{matrix}
$$

对于$S_1$:

$$
W_ {C,1}(t_f)=\int^{t_f}_ 0e^{-\boldsymbol At}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A’t}dt\\\\
X_ {C,1}=R[W_ {C,1}(t_f)]
$$

对于$S_2$:

$$
\begin{align}
W_ {O,1}(t_f)&=\int^{t_f}_ 0e^{(-\boldsymbol A')’t}(\boldsymbol B')'(\boldsymbol B')e^{(-\boldsymbol A')t}dt\\\\
&=\int^{t_f}_ 0e^{-\boldsymbol At}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A’t}dt\\\\
&=W_ {C,1}(t_f)\\\\
X_ {O,2}&=R[W_ {O,2}(t_f)]=R[W_ {C,1}(t_f)]=X_ {C,1}
\end{align}
$$

对于$S_1$:

$$
W_ {O,1}(t_f)=\int^{t_f}_ 0e^{\boldsymbol A’t}\boldsymbol C'\boldsymbol Ce^{\boldsymbol At}dt\\\\
X_ {O,1}=R[\boldsymbol W_ {O,1}(t_f)]
$$

对于$S_2$:

$$
\begin{align}
W_ {C,2}&=\int^{t_f}_ 0e^{-(-\boldsymbol A')t}(\boldsymbol C')(\boldsymbol C')‘e^{-(-\boldsymbol A’)t}dt\\\\
&=\int^{t_f}_ 0e^{\boldsymbol A’t}\boldsymbol C'\boldsymbol Ce^{\boldsymbol At}dt\\\\
&=W_ {O,1}(t_f)\\\\
W_ {C,2}&=R[\boldsymbol W_ {C,2}(t_f)]=R[\boldsymbol W_ {O,1}(t_f)]=X_ {O,1}
\end{align}
$$

5.4.2. 小结

能控 能观
格拉姆矩阵 $\boldsymbol W_C(t_f)=\int^{t_f}_ 0e^{-\boldsymbol A\tau}\boldsymbol B\boldsymbol B’e^{-\boldsymbol A'\tau}d\tau$ $\boldsymbol W_0(t_f)=\int^{t_f}_ 0e^{\boldsymbol A’t}\boldsymbol C'\boldsymbol Ce^{\boldsymbol At}dt$
能控/能观性矩阵 $\boldsymbol M_C=\begin{bmatrix}\boldsymbol B&\boldsymbol A\boldsymbol B&\boldsymbol A^2\boldsymbol B&\cdots&\boldsymbol A^{n-1}\boldsymbol B\end{bmatrix}$ $\boldsymbol M_O=\begin{bmatrix}\boldsymbol C\\\\\boldsymbol {CA}\\\\\vdots\\\\\boldsymbol {CA}^{n-1}\end{bmatrix}$
能控/能观性校验 $\begin{bmatrix}\lambda\pmb I-\pmb A&\pmb B\end{bmatrix}$ $\begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C\end{bmatrix}$
对偶(可互换) $\begin{cases}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\\boldsymbol y=\boldsymbol {Cx} \end{cases}$ $\begin{cases}\dot{\boldsymbol x}=-\boldsymbol A'\boldsymbol x+\boldsymbol C'\boldsymbol u\\\\\boldsymbol y=\boldsymbol B'\boldsymbol x \end{cases}$

5.5. 线性离散系统的能观性和能控性

5.5.1. 基本概念

状态的能控与能达

对某系统的一个特定状态$\overline{\boldsymbol x}$,若存在一个有限的时间段$[t_0,t_f)$,以及定义在该时间段上的控制函数$\boldsymbol u(t)=\overline{\boldsymbol u}(t)$,$t\in [t_0,t_f)$,能够把系统从初始状态$\boldsymbol x(t_0)=\overline{\boldsymbol x}$推向状态$\boldsymbol x(t_f)=\boldsymbol 0$,则称该系统的这一特定状态$\overline{\boldsymbol x}$是$t_0$时刻能控的;反过来,若存在将系统从$\boldsymbol x(t_0)=\boldsymbol 0$推向$\boldsymbol x(t_f)=\overline{\boldsymbol x}$的控制作用,则称状态$\overline{\boldsymbol x}$是$t_0$时刻能达的

系统的能控与能达

如果系统状态空间中的每一个状态都是能控的,则称系统是状态完全能控的或简称系统是能控的;同样,若系统的每一个状态都是能达的,则称系统是状态完全能达的,或简称系统是能达的

能控子空间和不能控子空间

线性系统的所有能控状态集合(及普通的向量加法数乘运算)构成一个子空间,称为系统的能控子空间;能控子空间的正交补空间称为系统的不能控子空间

状态的不能观测与不能重构

零输入条件下,若系统再某有限时间段的输出恒为零,则称该时间段的初始状态是不能观测的;而称该时间段的末端状态是不能重构的

系统的能观与能构

如果系统的状态空间中没有不能观测的非零状态,则称系统是状态完全能观测的,简称系统是能观的;同样,如果状态空间中没有不能重构的非零状态,则称系统是状态完全能重构的,简称系统是能构的

能观子空间和不能观子空间

线性系统的所有不能观状态的集合(及普通的向量加法和数乘运算)构成一个字空间,称之为系统的不能观子空间;不能观子空间的正交补空间称为系统的能观子空间

5.5.2. 离散时间系统能控与能达判据

定义$n$维离散时间系统$\boldsymbol x[k+1]=\boldsymbol F\boldsymbol x[k]+\boldsymbol {Hu}[k]$的$j$步能控性矩阵为
$$
\boldsymbol M_ {cdj}=\begin{bmatrix}\boldsymbol H&\boldsymbol {FH}&\cdots&\boldsymbol F^{j-1}\boldsymbol H \end{bmatrix}
$$
则该系统$j$步能达的充要条件是矩阵$\boldsymbol M_ {cdj}$满秩,而系统$j$步能控的充要条件是
$$
R(\boldsymbol M_ {cdj})\supseteq R(\boldsymbol F^n)
$$
当且仅当系统矩阵$\boldsymbol F $满秩时,离散时间系统的能控性与能达性完全等价

能观与能构的判据可以借助于对偶原理得到,注意:能观与能达对偶,能构与能控对偶

5.5.3. 离散化系统的能控性

连续—离散

若连续时间线性定常状态方程是不能控的,则对任何采样周期,其离散化的状态方程总是不能控的

离散化能控充分条件

若连续时间线性定常系统${\boldsymbol A,\boldsymbol B}$是能控的,且系统的特征值集合为${\lambda_i,i=1,2,\cdots,n}$,则在采样周期为$T$时的离散化方程${\boldsymbol F,\boldsymbol H}$能控的充分条件是:

当$\mathrm{Re}[\lambda_i-\lambda_j]=0$时,$|\mathrm{Im}(\lambda_i-\lambda_j)|\neq\frac{2\pi m}{T}\ \ m=1,2,\cdots$

对单输入情况,此条件也是必要的

5.6. 作业复习

5.6.1. 判断动态方程的能控性和能观性

对于线性非时变连续系统
$$
\begin{cases}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\\boldsymbol y=\boldsymbol {Cx} \end{cases}
$$
能控性判断方法

  1. 能控性定理:能控性格拉姆矩阵$\pmb Wc(t_f)=\int_0^{t_f}[e^{-\pmb At}\pmb B][e^{-\pmb At}\pmb B]^\ast\mathrm dt$ 非奇异
  2. 能控性判据:能控性判别矩阵$\pmb M_c=\begin{bmatrix}\pmb B&\pmb {AB}&\pmb A^2\pmb B&\cdots*\pmb A^{n-1}\pmb B\end{bmatrix}$ 满秩,即$\rho(\pmb M_c)=n$
  3. 能控性校验:对$\pmb A$的每个特征值$\lambda$,都有$\rho\begin{bmatrix}\lambda\pmb I-\pmb A&\pmb B\end{bmatrix}=n$
  4. 能控标准型:存在一个线性变换,将系统变换为能控标准型系统

能观性判断方法

  1. 能观性定理:能观性格拉姆矩阵$\pmb W_o(t_f)=\int_0^{t_f}[\pmb Ce^{\pmb At}]^\ast[\pmb Ce^{\pmb At}]\mathrm dt$ 非奇异
  2. 能观性判据:能观性判别矩阵$\pmb M_o=\begin{bmatrix}\pmb C\\\\\pmb {CA}\\\\\pmb {CA}^2\\\\\vdots\\\\\pmb {CA}^{n-1}\end{bmatrix}$满秩
  3. 能观性校验:对$\pmb A$的每个特征值$\lambda$,都有$\rho\begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C\end{bmatrix}=n$
  4. 能观标准型:存在一个线性变换,将系统变换为能观标准型

5.6.2. 线性变换与能控性的证明

令$\pmb P$是$n$阶非奇异方阵,用$\pmb P$将$n$维状态方程$\dot{\pmb x}=\pmb {Ax}+\pmb {Bu}$等价变换成
$$
\dot{\overline{\pmb x}}=\overline{\pmb A}\overline{\pmb x}+\overline{\pmb B}\overline{\pmb u}=\pmb {PAP}^{-1}\overline{\pmb x}+\pmb {PBu}\\\\
\pmb {PAP}^{-1}=\begin{bmatrix}\overline{\pmb A}_ {11}&\overline{\pmb A}_ {12}\\\\\overline{\pmb A}_ {21}&\overline{\pmb A}_ {22} \end{bmatrix},\ \ \
\pmb {PB}=\begin{bmatrix}\pmb B_1\\\\\pmb 0\end{bmatrix}_ {n\times m}
$$
其中$\pmb B_1$是$n_1\times m$阶矩阵,$\rho \pmb B=\rho \pmb B_1=n_1$,$\overline{\pmb A}_ {21}$和$\overline{\pmb A}_ {22}$分别是$(n-n_1)\times n_1$和$(n-n_1)\times (n-n_1)$的矩阵,证明${\pmb A,\pmb B}$能控的充分条件为${\pmb A_ {22},\pmb A_ {21} }$能控

证明:

若逆否命题成立则结论成立。即要证明:${\pmb A,\pmb B}$不能控$\Rightarrow$ ${\pmb A_ {22},\pmb A_ {21}}$ 不能控

等价变换不改变系统的能控性,若${\pmb A,\pmb B}$不能控,则${\overline{\pmb A},\overline{\pmb B} }$不能控,由能控性校验得

$\exists \lambda\in \pmb C$,使得$\rho\begin{bmatrix}\lambda\pmb I-\overline{\pmb A}&\overline{\pmb B}\end{bmatrix}<n$,即$\exists \pmb\alpha^T\neq \pmb 0$,使得$\pmb \alpha^T\begin{bmatrix}\lambda\pmb I_n- \overline{\pmb A}&\overline{\pmb B} \end{bmatrix}=\pmb 0_ {1\times(n+m)}$,即:
$$
\pmb \alpha^T(\lambda\pmb I_n-\overline{\pmb A})=0_ {1\times n}\\\\
\pmb\alpha^T\overline{\pmb B}=0_ {1\times m}
$$
令$\pmb \alpha^T=\begin{bmatrix}\pmb \alpha_1^T&\pmb \alpha_2^T\end{bmatrix}$,其中$\pmb \alpha_1^T$为$n_1$维行向量,$\pmb \alpha_2^T$为$n-n_1$维行向量

一方面,$\pmb \alpha^T\overline{\pmb B}=\begin{bmatrix}\alpha_1^T&\pmb \alpha_2^T\end{bmatrix}\begin{bmatrix}\pmb B_1\\\\\pmb 0\end{bmatrix}=\pmb \alpha_1^T\pmb B_1=\pmb 0_ {1\times m}$ 因为$\rho(\pmb B_1)=n_1$,则$\pmb \alpha_1^T=\pmb 0$ 但$\pmb \alpha^T\neq \pmb 0$ 故$\pmb \alpha_2^T\neq\pmb 0$

另一方面:

$$
\begin{align}
\pmb \alpha^T(\lambda\pmb I_n-\overline{\pmb A})=\begin{bmatrix}\pmb 0&\pmb \alpha_2^T \end{bmatrix}\begin{bmatrix}\lambda\pmb I_ {n1}-\pmb A_ {11}&-\pmb A_ {12}\\\\-\pmb A_ {21}&\lambda\pmb I_ {n-n_1}-\pmb A_ {22} \end{bmatrix}=\begin{bmatrix}
-\pmb \alpha_2^T\pmb A_ {21}&-\pmb \alpha_2^T(\lambda\pmb I_ {n-n_1}-\pmb A_ {22})
\end{bmatrix}=\pmb 0_ {1\times n}\\\\
\Rightarrow \pmb \alpha_2^T\begin{bmatrix}\lambda\pmb I_ {n-n_1}-\pmb A_ {22}&\pmb A_ {21} \end{bmatrix}=\pmb 0_ {1\times n}
\end{align}
$$

可知$\pmb \alpha_2^T\neq \pmb 0\Rightarrow \rho\begin{bmatrix}\lambda \pmb I_ {n-n_1}-\pmb A_ {22}&\pmb A_ {21}\end{bmatrix}<n-n_1\Rightarrow {\pmb A_ {22},\pmb A_ {21} } $不能控,得证

注:证逆否

5.6.3. 能观性推论的证明

证明${\pmb A,\pmb C }$能观的充要条件是${\pmb A,\pmb C^\ast\pmb C }$ 能观

证明: 反证法

  1. 假设${\pmb A,\pmb C }$不能观,则$\exists \lambda\in \pmb C$,使得$\begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C\end{bmatrix}$不满秩,即:

    $$
    \exists \pmb v\neq \pmb 0,\\\\
    \begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C\end{bmatrix}\pmb v=\pmb 0\Rightarrow \pmb {Cv}=\pmb 0\Rightarrow \pmb C^\ast\pmb C\pmb v=\pmb 0\Rightarrow \begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C^\ast\pmb C\end{bmatrix}\pmb v=\pmb 0\Rightarrow \begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C^\ast\pmb C\end{bmatrix}
    $$

    不满秩

    故$\{\pmb A,\pmb C^\ast\pmb C \}$不能观

  2. 假设$\{\pmb A,\pmb C^\ast\pmb C \}$不能观,则$\exists \lambda\in \pmb C$,使得$\begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C^\ast\pmb C\end{bmatrix}$不满秩,即:

    $$
    \begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C^\ast\pmb C\end{bmatrix}\pmb v=\pmb 0\Rightarrow \pmb C^\ast\pmb {Cv}=\pmb 0\Rightarrow \pmb v^\ast\pmb C^\ast\pmb C\pmb v=\pmb 0\Rightarrow \pmb {Cv}=\pmb 0\Rightarrow \begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C\end{bmatrix}\pmb v=\pmb 0\Rightarrow \begin{bmatrix}\lambda\pmb I-\pmb A\\\\\pmb C\end{bmatrix}
    $$

    不满秩

    故$\{\pmb A,\pmb C \}$不能观

5.6.4. 系统的结构分解

每一个状态空间方程都可以通过一等价变换,变换为如下的规范形式:

$$
\begin{align}
\begin{bmatrix}\dot{\boldsymbol x}_ {co} \\\\
\dot{\boldsymbol x}_ {c\overline{o}}\\\\
\dot{\boldsymbol x}_ {\overline{c}o}\\\\
\dot{\boldsymbol x}_ {\overline{c}\overline{o}}
\end{bmatrix}&=
\begin{bmatrix}
\overline{\boldsymbol A}_ {co}&\boldsymbol O& \overline{\boldsymbol A}_ {13}&\boldsymbol O\\\\
\overline{\boldsymbol A}_ {21}&\overline{\boldsymbol A}_ {c\overline{o}}&
\overline{\boldsymbol A}_ {23}&\overline{\boldsymbol A}_ {24}\\\\
\boldsymbol O&\boldsymbol O&\overline{\boldsymbol A}_ {\overline{c}{o}}&\boldsymbol O\\\\
\boldsymbol O&\boldsymbol O&\overline{\boldsymbol A}_ {43}&\overline{\boldsymbol A}_ {\overline{c}\overline{o}}
\end{bmatrix}
\begin{bmatrix}{\boldsymbol x}_ {co} \\\\
{\boldsymbol x}_ {c\overline{o}}\\\\
{\boldsymbol x}_ {\overline{c}o}\\\\
{\boldsymbol x}_ {\overline{c}\overline{o}}
\end{bmatrix}+
\begin{bmatrix}
\boldsymbol B_ {co}\\\\
\boldsymbol B_ {c\overline{o}}\\\\
\boldsymbol O\\\\\boldsymbol O
\end{bmatrix}\boldsymbol u\\\\
\boldsymbol y&=
\begin{bmatrix}
\boldsymbol C_ {co}&\boldsymbol O&\boldsymbol C_ {\overline{c}o}&\boldsymbol O
\end{bmatrix}
\end{align}
$$

其中,

  • $\boldsymbol x_ {co}$:能控,能观
  • $\boldsymbol x_ {c\overline o}$:能控,不能观
  • $\boldsymbol x_ {\overline{c}o}$:不能控,能观
  • $\boldsymbol x_ {\overline{c}\overline{o}}$:不能控,不能观

5.6.5. 离散系统与离散化系统

离散系统$\neq $离散化系统

$$
{\pmb A,\pmb B,\pmb C,\pmb D}\Rightarrow {\pmb F,\pmb H,\pmb C,\pmb D}
$$

$\pmb F=e^{\pmb AT}$一定是满秩的,而离散系统的$\pmb F$不一定满秩

离散化系统的能控性和能达性等价

6. 传递函数的状态空间实现

6.1. 实现和最小实现

6.1.1. 实现问题的提法

传递矩阵$\hat{\boldsymbol G}(s)$称为是能实现的是指存在一个有限维状态方程
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}+\boldsymbol {Du}
\end{cases}
$$
或简记为${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$

且${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$称为$\hat{\boldsymbol G}(s)$的实现

注意:一个线性定常系统的分布系统可以用传递矩阵来描述,但不能描
述为有限维的状态方程。所以说并非所有的$\hat{\boldsymbol G}(s)$都是能实现的

6.1.2. 最小实现

最小实现

一传递函数(矩阵)的诸多实现中,具有最小维数的实现称为最小维实现或简称为最小实现

最小实现满足的条件

状态空间方程${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$是传递函数矩阵$\hat{\boldsymbol G}(s)$的最小实现的充要条件是${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$既能控又能观

证明:

必要性,用反证法证明

假设${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$既不能控又不能观,可由卡尔曼分解找到既能控又能观的子系统${\boldsymbol A_1,\boldsymbol B_1,\boldsymbol C_1,\boldsymbol D_1}$ ,且
$$
\pmb C(s\pmb I-\pmb A)^{-1}\pmb B=\pmb C_1(s\pmb I-\pmb A_1)^{-1}\pmb B_1=\pmb G(s)\\\\
\dim (\pmb A)>\dim(\pmb A_1)
$$
说明${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$不是$\pmb G(s)$的最小实现

充分性,用反证法证明

假设${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$既能控又能观,但不是最小实现,因此应有最小实现${\overline{\pmb A},\overline{\pmb B},\overline{\pmb C},\overline{\pmb D} }$ ,且有
$$
\dim(\pmb A)\mathop=\limits^{def}n>\overline n=\dim(\overline{\pmb A})
$$

$$
\pmb C(s\pmb I-\pmb A)^{-1}\pmb B=\overline{\pmb C}(s\pmb I-\overline{\pmb A})^{-1}\overline{\pmb B}=\pmb G(s)
$$

取拉普拉斯逆变换得
$$
\pmb G(t)\mathop=\limits^{def}\pmb Ce^{\pmb At}\pmb B=\overline{\pmb C}e^{\overline{\pmb A}t}\overline{\pmb B}\mathop=\limits^{def}\overline{\pmb G}(t),\ \ \ \ t\geq 0
$$
对$\pmb G(t)$和$\overline{\pmb G}(t)$关于$t$求微商到第$2n-2$阶导数
$$
\pmb G_k(t)\mathop=\limits^{def} \frac{\mathrm d^k}{\mathrm dt^k}\pmb G(t)=\pmb {CA}^ke^{\pmb At}\pmb B=\pmb {C}e^{\pmb At}\pmb A^k\pmb B,\ \ \ \ k=0,1,2,\cdots,2n-2
$$

$$
\overline{\pmb G}_ k(t)\mathop=\limits^{def} \frac{\mathrm d^k}{\mathrm dt^k}\overline{\pmb G}(t)=\overline{\pmb C}\overline{\pmb A}^ke^{\overline{\pmb A}t}\overline{\pmb B}=\overline{\pmb {C}}e^{\overline{\pmb A}t}\overline{\pmb A}^k\overline{\pmb B},\ \ \ \ k=0,1,2,\cdots,2n-2
$$

将$\pmb G_k(t)$,$k=0,1,\cdots,2n-2$排成下式:
$$
\begin{align}
\pmb H_n(t)&=
\begin{bmatrix}
\pmb G_0(t)&\pmb G_1(t)&\cdots&\pmb G_ {n-1}(t)\\\\
\pmb G_1(t)&\pmb G_2(t)&\cdots&\pmb G_ {n}(t)\\\\
\vdots&\vdots&&\vdots\\\\
\pmb G_ {n-1}(t)&\pmb G_n(t)&\cdots&\pmb G_ {2n-2}(t)
\end{bmatrix}\\\\
&=\begin{bmatrix}
\pmb Ce^{\pmb At}\pmb B&\pmb Ce^{\pmb At}\pmb A\pmb B&\cdots&\pmb Ce^{\pmb At}\pmb A^{n-1}\pmb B\\\\
\pmb C\pmb Ae^{\pmb At}\pmb B&\pmb C\pmb Ae^{\pmb At}\pmb A\pmb B&\cdots&\pmb C\pmb Ae^{\pmb At}\pmb A^{n-1}\pmb B\\\\
\vdots&\vdots&&\vdots\\\\
\pmb C\pmb A^{n-1}e^{\pmb At}\pmb B&\pmb C\pmb A^{n-1}e^{\pmb At}\pmb A\pmb B&\cdots&\pmb C\pmb A^{n-1}e^{\pmb At}\pmb A^{n-1}\pmb B
\end{bmatrix}\\\\
&=\begin{bmatrix}
\pmb C\\\\\pmb {CA}\\\\\vdots\\\\\pmb {CA}^{n-1}
\end{bmatrix}
e^{\pmb At}
\begin{bmatrix}\pmb B&\pmb {AB}&\cdots&\pmb A^{n-1}\pmb B\end{bmatrix}\\\\
&=\pmb M_oe^{\pmb At}\pmb M_c,\ \ \ \ t\geq 0
\end{align}
$$
类似地,将$\overline{\pmb G}_ k(t)$,$k=0,1,\cdots,2n-2$进行排列,得到:
$$
\overline{\pmb H}_ n(t)=\overline{\pmb M}_ 0e^{\overline{\pmb A}t}\overline{\pmb M}_ c,\ \ \ \ t\geq 0
$$
由$\pmb H_n(t)=\overline{\pmb H}_ o(t)$,取$t=0$,得
$$
\pmb M_o\pmb M_c=\overline{\pmb M}_ o\overline{\pmb M}_ c
$$
已经假设${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$既能控又能观,故有
$$
\rho[\overline{\pmb M}_ o\overline{\pmb M}_ c]=\rho[\pmb M_o\pmb M_c]=n
$$
势必有:
$$
\rho[\overline{\pmb M}_ o]\geq n>\overline{n}
$$

$$
\rho[\overline{\pmb M}_ c]\geq n>\overline n
$$
而${\overline{\pmb A},\overline{\pmb B},\overline{\pmb C},\overline{\pmb D} }$是最小实现,由必要性已知其一定既能控又能观,即
$$
\rho[\overline{\pmb M}_ o]=\rho[\overline{\pmb M}_ c]=\overline{n}<n
$$
推出矛盾,说明${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$既能控又能观但并非最小实现的假设不成立,充分性得证

6.1.3. 最小实现的等价性

传递函数矩阵$\hat{\boldsymbol G}(s)$的所有最小实现,互相同是代数等价的

证明:

设${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$和${\overline{\pmb A},\overline{\pmb B},\overline{\pmb C},\overline{\pmb D} }$均是$\pmb G(s)$的最小实现,则$\dim (\pmb A)=\dim(\overline{\pmb A})=n$

故$\pmb M_c\pmb M_c^T$与$\pmb M_o^T\pmb M_o$皆是$n$阶非奇异方阵,进一步可断定$\overline{\pmb M}_ c\overline{\pmb M}_ c^T$,$\overline{\pmb M}_ o^T\overline{\pmb M}_ o$和$\overline{\pmb M}_ o^T{\pmb M}_ o$,${\pmb M}_ c\overline{\pmb M}_ c^T$ 也是如此,令
$$
\pmb T=(\overline{\pmb M}_ o^T\overline{\pmb M}_ o)^{-1}(\overline{\pmb M}_ o^T{\pmb M}_ o)\\\\
\pmb T'=({\pmb M}_ c\overline{\pmb M}_ c^T)(\overline{\pmb M}_ c\overline{\pmb M}_ c^T)^{-1}
$$
$\pmb T$和$\pmb T'$皆为$n$阶非奇异方阵,考虑到$\pmb M_o\pmb M_c=\overline{\pmb M}_ o\overline{\pmb M}_ c$ ,有
$$
\pmb {TT}'=(\overline{\pmb M}_ o^T\overline{\pmb M}_ o)^{-1}(\overline{\pmb M}_ o^T{\pmb M}_ o)({\pmb M}_ c\overline{\pmb M}_ c^T)(\overline{\pmb M}_ c\overline{\pmb M}_ c^T)^{-1}=\pmb I_n
$$

$$
\pmb T=\pmb T'
$$
因为
$$
\pmb {TM}_ c=(\overline{\pmb M}_ o^T\overline{\pmb M}_ o)^{-1}(\overline{\pmb M}_ o^T{\pmb M}_ o)\pmb M_c=\overline{\pmb M}_ c\\\\
\pmb M_o\pmb T^{-1}=\pmb M_o({\pmb M}_ c\overline{\pmb M}_ c^T)(\overline{\pmb M}_ c\overline{\pmb M}_ c^T)^{-1}=\overline{\pmb M}_ o
$$

$$
\pmb T\begin{bmatrix}\pmb B&\pmb {AB}&\cdots&\pmb A^{n-1}\pmb B \end{bmatrix}=\begin{bmatrix}\overline{\pmb B}&\overline{\pmb A}\overline{\pmb B}&\cdots&\overline{\pmb A}^{n-1}\overline{\pmb B} \end{bmatrix}
$$

$$
\begin{bmatrix}
\pmb {CT}^{-1}\\\\
\pmb {CAT}^{-1}\\\\
\vdots\\\\
\pmb {CA}^{n-1}\pmb T^{-1}
\end{bmatrix}=
\begin{bmatrix}
\overline{\pmb C}\\\\
\overline{\pmb C}\overline{\pmb A}\\\\
\vdots\\\\
\overline{\pmb C}\overline{\pmb A}^{n-1}
\end{bmatrix}
$$

可得
$$
\pmb {TB}=\overline{\pmb B}\\\\
\pmb {CT}^{-1}=\overline{\pmb C}
$$
由前有$\pmb G_k(t=0)=\pmb {CA}^k\pmb B$,$k=0,1,2,\cdots$(也称为线性非时变连续系统的马尔可夫矩阵),这里记作
$$
\pmb G_k=\pmb {CA}^k\pmb B,\ \ \ \ k=0,1,2,\cdots
$$
实现${\boldsymbol A,\boldsymbol B,\boldsymbol C,\boldsymbol D}$和实现${\overline{\pmb A},\overline{\pmb B},\overline{\pmb C},\overline{\pmb D} }$的马尔可夫矩阵彼此相等,$\pmb {CA}^k\pmb B=\overline{\pmb C}\overline{\pmb A}^k\overline{\pmb B}$
$$
\pmb {M}_ o\pmb {AM}_ c=\overline{\pmb M}_ o\overline{\pmb A}\overline{\pmb M}_ c
$$
等式两边同时右乘$\overline{\pmb M}_ c^T$和左乘$\overline{\pmb M}_ o^T$可导出
$$
\overline{\pmb M}_ o^T\pmb M_o\pmb {AM}_ c\overline{\pmb M}_ c^T=\overline{\pmb M}_ o^T\overline{\pmb M}_ o\overline{\pmb A}\overline{\pmb M}_ c\overline{\pmb M}_ c^T\\\\
\pmb {TAT}^{-1}=\overline{\pmb A}
$$
说明两个最小实现之间为代数等价关系,证毕

6.1.4. 最小实现维数的确定

将马尔可夫矩阵$\pmb G_k$排列成$p$阶汉克尔矩阵:
$$
\pmb H_p=\begin{bmatrix}
\pmb G_0&\pmb G_1&\cdots&\pmb G_ {p-1}\\\\
\pmb G_1&\pmb G_2&\cdots&\pmb G_p\\\\
\vdots&\vdots&&\vdots\\\\
\pmb G_ {p-1}&\pmb G_p&\cdots&\pmb G_ {2p-2}
\end{bmatrix},\ \ \ \ p=1,2,\cdots
$$
设给定的传递函数矩阵$\pmb G(s)$是严格的真有理函数矩阵,$\pmb G(s)$的最小实现维数$n_m$等于$k(\geq n_m)$阶汉克尔矩阵的秩

*证明:

假设${\pmb A,\pmb B,\pmb C}$是$\pmb G(s)$的维数为$n_m$的最小实现,则$\rho[\pmb M_c]=\rho[\pmb M_o]=n_m$
$$
\begin{align}
\pmb H_ {n_m}&=\begin{bmatrix}
\pmb G_0&\pmb G_1&\cdots&\pmb G_ {n_m-1}\\\\
\pmb G_1&\pmb G_2&\cdots&\pmb G_ {n_m}\\\\
\vdots&\vdots&&\vdots\\\\
\pmb G_ {n_m-1}&\pmb G_ {n_m}&\cdots&\pmb G_ {2n_m-1}
\end{bmatrix}\\\\
&=\begin{bmatrix}
\pmb {CB}&\pmb {CAB}&\cdots&\pmb{CA}^{n_m-1}\pmb B\\\\
\pmb {CAB}&\pmb {CA}^2\pmb B&\cdots&\pmb {CA}^{n_m}\pmb B\\\\
\vdots&\vdots&&\vdots\\\\
\pmb {CA}^{n_m-1}\pmb B&\pmb {CA}^{n_m}\pmb B&\cdots&\pmb {CA}^{2n_m-2}\pmb B
\end{bmatrix}\\\\
&=\pmb M_o\pmb M_c
\end{align}
$$
所以
$$
\rho[\pmb H_ {n_m}]\leq n_m
$$
由$\pmb M_o^T\pmb M_o$为$n_m$阶非奇异方阵和$\pmb M_o^T\pmb H_ {n_m}=\pmb M_o^T\pmb M_o\pmb M_c$导出
$$
(\pmb M_o^T\pmb M_o)^{-1}\pmb M_o^T\pmb H_ {n_m}=\pmb M_c
$$
故又有
$$
\rho[\pmb M_c]=n_m\leq \min(\rho[(\pmb M_o^T\pmb M_o)^{-1}],\rho[\pmb M_o^T],\rho[\pmb M_ {n_m}])
$$

$$
n_m\leq \min(n_m,n_m,\rho[\pmb H_ {n_m}])\Rightarrow \rho[\pmb H_ {n_m}]\geq n_m
$$
因此
$$
\rho[\pmb H_ {n_m}]=n_m
$$
由凯莱-哈密顿定理可知,若$k>n_m$,则有
$$
\rho[\pmb H_k]=\rho[\pmb H_ {n_m}]=n_m
$$
定理得证

6.2. 传递函数的串联实现

6.2.1. 能控标准型实现

$$
\begin{align}
\hat{g}(s)=\frac{\beta_ {n-1} s^{n-1}+\beta_ {n-2}s^{n-2}+\cdots+\beta_1s+\beta_0}{s^n+\alpha_ {n-1}s^{n-1}+\alpha_ {n-2}s^{n-2}+\cdots+\alpha_1s+\alpha_0}+d
\end{align}
$$

下友型(能控I型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
\beta_0& \beta_1& \beta_2&\cdots& \beta_ {n-1}
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

上友型

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
-\alpha_ {n-1}&-\alpha_ {n-2}&\cdots&-\alpha_ {1}&-\alpha_0\\\\
1&0&\cdots&0&0\\\\
0&1&\cdots&0&0\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&0
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
1 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 0
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
\beta_ {n-1}& \beta_ {n-2}& \beta_ {n-3}&\cdots& \beta_0
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

右友型(能控II型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
0&0&\cdots&0&-\alpha_0\\\\
1&0&\cdots&0&-\alpha_1\\\\
0&1&\cdots&0&-\alpha_2\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
1 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 0
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
\beta_0'& \beta_1'& \beta_2'&\cdots& \beta_ {n-1}'
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

左友型

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
-\alpha_ {n-1}&1&0&\cdots&0\\\\
-\alpha_ {n-2}&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
-\alpha_1&0&0&\cdots&1\\\\
-\alpha_0&0&0&\cdots&0
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
\beta_ {n-1}'& \beta_ {n-2}'& \beta_ {n-3}'&\cdots& \beta_0'
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

其中,

$$
\begin{matrix}
\beta_0'=\pmb {cb}&\beta_1'=\pmb {cAb}&\beta_2'=\pmb {cA}^2\pmb b&\cdots&\beta_ {n-1}'=\pmb {cA}^{n-1}\pmb b
\end{matrix}
$$

这里的$\pmb A$,$\pmb b$和$\pmb c$分别为下友型或上友型的参数(可以选择任意一个,但必须出自同一个)

6.2.2. 能观标准型实现

$$
\begin{align}
\hat{g}(s)=\frac{\beta_ {n-1} s^{n-1}+\beta_ {n-2}s^{n-2}+\cdots+\beta_1s+\beta_0}{s^n+\alpha_ {n-1}s^{n-1}+\alpha_ {n-2}s^{n-2}+\cdots+\alpha_1s+\alpha_0}+d
\end{align}
$$

右友型(能观I型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
0&0&\cdots&0&-\alpha_0\\\\
1&0&\cdots&0&-\alpha_1\\\\
0&1&\cdots&0&-\alpha_2\\\\
\cdots&\cdots&\ddots&\cdots&\cdots\\\\
0&0&\cdots&1&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
\beta_0\\\\ \beta_1\\\\ \beta_2\\\\\vdots\\\\ \beta_ {n-1}
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
0&0&\cdots&0&1
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

左友型

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
-\alpha_ {n-1}&1&0&\cdots&0\\\\
-\alpha_ {n-2}&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
-\alpha_1&0&0&\cdots&1\\\\
-\alpha_0&0&0&\cdots&0
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
\beta_ {n-1} \\\\ \beta_ {n-2}\\\\ \beta_ {n-3}\\\\\vdots\\\\ \beta_0\\\\
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
1&0&\cdots&0&0
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

下友型(能观II型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
\beta_0'\\\\ \beta_1'\\\\\beta_2'\\\\\vdots\\\\ \beta_ {n-1}'
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
1&0&0&\cdots&0
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

上友型

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
-\alpha_ {n-1}&-\alpha_ {n-2}&\cdots&-\alpha_ {1}&-\alpha_0\\\\
1&0&\cdots&0&0\\\\
0&1&\cdots&0&0\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&0
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
\beta_ {n-1}'\\\\ \beta_ {n-2}'\\\\ \beta_ {n-3}'\\\\\vdots\\\\ \beta_0'
\end{bmatrix}
u\\\\
y&=\boldsymbol c \boldsymbol x+ d u=
\begin{bmatrix}
0&0&0&\cdots&1
\end{bmatrix}
\boldsymbol x+d\cdot u
\end{align}
$$

其中,

$$
\begin{matrix}
\beta_0'=\pmb {cb}&\beta_1'=\pmb {cAb}&\beta_2'=\pmb {cA}^2\pmb b&\cdots&\beta_ {n-1}'=\pmb {cA}^{n-1}\pmb b
\end{matrix}
$$

这里的$\pmb A$,$\pmb b$和$\pmb c$分别为下友型或上友型的参数(可以选择任意一个,但必须出自同一个)

6.3. 传递函数的并联实现

6.3.1. 无重极点系统的对角型实现

当传递函数无重极点时,可通过部分分式分解写成如下形式:

$$
\hat g(s)=\frac{\hat y(s)}{\hat u(s)}=\sum\limits_ {k=1}^n\frac{e_k}{s-\lambda_k}
$$

以四阶系统为例

方法一

$$
\begin{align}
\dot{\boldsymbol x}&=\begin{bmatrix}\lambda_1&0&0&0\\\\0&\lambda_2&0&0\\\\0&0&\lambda_3&0\\\\0&0&0&\lambda_4\end{bmatrix}\boldsymbol x+\begin{bmatrix}e_1\\\\e_2\\\\e_3\\\\e_4\end{bmatrix}u\\\\
y&=\begin{bmatrix}1&1&1&1\end{bmatrix}\boldsymbol x
\end{align}
$$

方法二

$$
\begin{align}
\dot{\boldsymbol x}&=\begin{bmatrix}\lambda_1&0&0&0\\\\0&\lambda_2&0&0\\\\0&0&\lambda_3&0\\\\0&0&0&\lambda_4\end{bmatrix}\boldsymbol x+\begin{bmatrix}1\\\\1\\\\1\\\\1\end{bmatrix}u\\\\
y&=\begin{bmatrix}e_1&e_2&e_3&e_4\end{bmatrix}\boldsymbol x
\end{align}
$$

6.3.2. 重极点系统的若尔当标准型实现

当传递函数有重极点时,每个不同的极点对应一个不同的并联支路。以某四重极点支路为例:

$$
\hat g(s)=\frac{\hat y(s)}{\hat u(s)}=\frac{\beta_3s^3+\beta_2s^2+\beta_1s+\beta_0}{(s-\lambda)^4}
$$

$$
\hat y(s)=\frac{f_1}{s-\lambda}\hat{u}(s)+\frac{f_2}{(s-\lambda)^2}\hat{u}(s)+\frac{f_3}{(s-\lambda)^3}\hat{u}(s)+\frac{f_4}{(s-\lambda)^4}\hat{u}(s)
$$

$$
\begin{align}
\hat x_1(s)&=\frac{1}{s-\lambda}\hat x_2(s),\ \
\hat x_2(s)&=\frac{1}{s-\lambda}\hat x_3(s),\ \
\hat x_3(s)&=\frac{1}{s-\lambda}\hat x_4(s),\ \ \\\\
\hat x_4(s)&=\frac{1}{s-\lambda}\hat u(s),\ \
\hat y(s)&=f_4\hat x_1(s)+f_3\hat x_2(s)+f_2\hat x_3(s)+f_1\hat x_4(s)
\end{align}
$$

有:

$$
\begin{align}
\dot x_1(t)&=\lambda x_1(t)+x_2(t)\\\\
\dot x_2(t)&=\lambda x_2(t)+x_3(t)\\\\
\dot x_3(t)&=\lambda x_3(t)+x_4(t)\\\\
\dot x_4(t)&=\lambda x_4(t)+u(t)\\\\
y&=f_4x_1+f_3x_2+f_2x_3+f_1x_4
\end{align}
$$

化为矩阵形式得:

$$
\begin{align}
\dot{\boldsymbol x}&=\begin{bmatrix}\lambda&1&0&0\\\\0&\lambda&1&0\\\\0&0&\lambda&1\\\\0&0&0&\lambda\end{bmatrix}\boldsymbol x+\begin{bmatrix}0\\\\0\\\\0\\\\1\end{bmatrix}u\\\\
y&=\begin{bmatrix}f_4&f_3&f_2&f_1\end{bmatrix}\boldsymbol x
\end{align}
$$

6.4. 传递向量的实现

6.4.1. 列向量形式传递函数矩阵的规范型实现

设单输入—$k$输出传递函数矩阵为:

$$
\pmb G(s)=\frac{1}{s^n+a_ {n-1}s^{n-1}+\cdots+a_1s+a_0}\begin{bmatrix}
b_ {1(n-1)}s^{n-1}+\cdots+b_ {11}s+b_ {10}\\\\
b_ {2(n-1)}s^{n-1}+\cdots+b_ {21}s+b_ {20}\\\\
\vdots\\\\
b_ {k(n-1)}s^{n-1}+\cdots+b_ {k1}s+b_ {k0}\\\\
\end{bmatrix}
$$

方法: 在原来放$\beta$相应的矩阵多放几行

注意: 当$\pmb G(s)$为列向量时只有能控型实现,没有能观型实现

示例

能控下友型(能控I型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1
\end{bmatrix}
u\\\\
y&=\boldsymbol C \boldsymbol x+ \pmb D u=
\begin{bmatrix}
b_ {10}&b_ {11}&\cdots&b_ {1(n-2)}&b_ {1(n-1)}\\\\
b_ {20}&b_ {21}&\cdots&b_ {2(n-2)}&b_ {2(n-1)}\\\\
\vdots&\vdots&&\vdots&\vdots\\\\
b_ {k0}&b_ {k1}&\cdots&b_ {k(n-2)}&b_ {k(n-1)}\\\\
\end{bmatrix}
\boldsymbol x+\pmb D\cdot u
\end{align}
$$

能控右友型(能控II型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
0&0&\cdots&0&-\alpha_0\\\\
1&0&\cdots&0&-\alpha_1\\\\
0&1&\cdots&0&-\alpha_2\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
1 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 0
\end{bmatrix}
u\\\\
y&=\boldsymbol C \boldsymbol x+ \pmb D u=
\begin{bmatrix}
\pmb {CB}&\pmb {CAB}&\cdots&\pmb {CA}^{n-1}\pmb B
\end{bmatrix}
\boldsymbol x+\pmb D\cdot u
\end{align}
$$

6.4.2. 行向量形式传递函数矩阵的规范型实现

设$k$输入—单输出传递函数矩阵为:

$$
\pmb G(s)=\frac{1}{s^n+a_ {n-1}s^{n-1}+\cdots+a_1s+a_0}\begin{bmatrix}
p_1(s)&
p_2(s)&
\cdots&
p_k(s)
\end{bmatrix}
$$

其中,$\pmb p_i(s)=b_ {i(n-1)}s^{n-1}+\cdots+b_ {i1}s+b_ {i0}$

方法: 在原来放$\beta$相应的矩阵多放几列

注意: 当$\pmb G(s)$为行向量时只有能观型实现,没有能控型实现

示例:

能观右友型(能观I型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol B u=
\begin{bmatrix}
0&0&\cdots&0&-\alpha_0\\\\
1&0&\cdots&0&-\alpha_1\\\\
0&1&\cdots&0&-\alpha_2\\\\
\vdots&\vdots&\ddots&\vdots&\vdots\\\\
0&0&\cdots&1&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
b_ {10}&b_ {20}&\cdots&b_ {k0}\\\\
b_ {11}&b_ {21}&\cdots&b_ {k1}\\\\
\vdots&\vdots&&\vdots\\\\
b_ {1n}&b_ {2n}&\cdots&b_ {kn}
\end{bmatrix}
u\\\\
y&=\boldsymbol C \boldsymbol x+ \pmb d u=
\begin{bmatrix}
1&0&0&\cdots&0
\end{bmatrix}
\boldsymbol x+\pmb d\cdot u
\end{align}
$$

能观右友型(能观I型)

$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol A \boldsymbol x+\boldsymbol B u=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
\pmb {CB}\\\\
\pmb {CAB}\\\\
\cdots\\\\
\pmb {CA}^{n-1}\pmb B
\end{bmatrix}
u\\\\
y&=\boldsymbol C \boldsymbol x+ \pmb d u=
\begin{bmatrix}
1&0&0&\cdots&0
\end{bmatrix}
\boldsymbol x+\pmb d\cdot u
\end{align}
$$

6.5. 传递函数矩阵的实现

6.5.1. 传递函数矩阵的约尔当形最小实现

步骤:

  1. 对$\pmb G(s)$的每个元素应用部分分式展开:
    $$
    \pmb G(s)-\sum\limits_ {i=1}^k \frac{\pmb N_i}{s+p_i}
    $$

  2. 确定每个常数阵$\pmb N_i$的秩$\rho_i$,$i=1,2,\cdots,k$

  3. 将每个$\pmb N_i$分解成两个列向量的外积和
    $$
    \pmb N_i=\sum\limits_ {j=1}^{\rho_i}\pmb c_ {ij}><\pmb b_ {ij}
    $$
    其中向量$\pmb \alpha=\begin{bmatrix}\alpha_1&\alpha_2&\cdots&\alpha_r\end{bmatrix}^T$与$\pmb \beta=\begin{bmatrix}\beta_1&\beta_2&\cdots&\beta_m\end{bmatrix}^T$外积定义为:
    $$
    \pmb \alpha><\pmb \beta\mathop=\limits^{def}\begin{bmatrix}
    \alpha_1\\\\\alpha_2\\\\\vdots\\\\\alpha_r
    \end{bmatrix}\begin{bmatrix}\beta_1&\beta_2&\cdots&\beta_m\end{bmatrix}
    $$


  4. $$
    \begin{align}
    \pmb A&=\mathrm {diag}(-p_1\pmb I_ {\rho_1},-p_2\pmb I_ {\rho_2},\cdots,-p_k\pmb I_ {\rho_k})\\\\
    \pmb B^T&=(\begin{matrix}\pmb b_ {11}&\cdots&\pmb b_ {1\rho_1}&|&\pmb b_ {21}&\cdots&\pmb b_ {2\rho_2}&|&\cdots&|&\pmb b_ {k1}&\cdots&\pmb b_ {k\rho_k} \end{matrix})\\\\
    \pmb C&=(\begin{matrix}\pmb c_ {11}&\cdots&\pmb c_ {1\rho_1}&|&\pmb c_ {21}&\cdots&\pmb c_ {2\rho_2}&|&\cdots&|&\pmb c_ {k1}&\cdots&\pmb c_ {k\rho_k} \end{matrix})
    \end{align}
    $$

**例题:**见课本197~199

6.5.2. 传递函数矩阵的能控能观型实现

$$
\pmb G(s)=\frac{\pmb \beta_ {n-1} s^{n-1}+\pmb \beta_ {n-2}s^{n-2}+\cdots+\pmb \beta_1s+\pmb \beta_0}{s^n+\alpha_ {n-1}s^{n-1}+\alpha_ {n-2}s^{n-2}+\cdots+\alpha_1s+\alpha_0}+\pmb D
$$

类比单输入单输出的情况可以化为标准型

6.5.3. 改进的卡尔曼最小实现法

设传递函数矩阵
$$
\pmb G(s)=\frac{\pmb \beta_ {n-1} s^{n-1}+\pmb \beta_ {n-2}s^{n-2}+\cdots+\pmb \beta_1s+\pmb \beta_0}{s^n+\alpha_ {n-1}s^{n-1}+\alpha_ {n-2}s^{n-2}+\cdots+\alpha_1s+\alpha_0}+\pmb D
$$
的能观型实现为${\pmb A_o,\pmb B_o,\pmb C_o}$,能控性实现为${\pmb A_c,\pmb B_c,\pmb C_c}$,设能观型实现的能控性矩阵$\pmb M_c$和能控型实现的能观性矩阵$\pmb M_o$定义如下:
$$
\begin{align}
\pmb M_c&=\begin{bmatrix}
\pmb B_o&\pmb B_o\pmb A_o&\pmb B_o\pmb A_o^2&\cdots&\pmb B_o\pmb A_o^{n-1}
\end{bmatrix}\\\\
\pmb M_o&=\begin{bmatrix}
\pmb B_c\\\\\pmb B_c\pmb A_c\\\\\pmb B_c\pmb A_c^2\\\\\vdots\\\\\pmb B_c\pmb A_c^{n-1}
\end{bmatrix}
\end{align}
$$
在$\pmb M_c$中挑选出所有线性无关的列向量构成$mn\times n_0$矩阵$\pmb V$,或在$\pmb M_o$中挑选出所有线性无关的行向量构成$\overline n_0\times mn$矩阵$\pmb T$ ,继续构造$n_0\times mn$矩阵$\pmb S$和$mn\times \overline n_0$矩阵$\pmb U$,使得
$$
\pmb {VS}=\pmb I_ {n_0}\\\\
\pmb {TU}=\pmb I_ {\overline n_0}
$$
则按下式进行代数等价变换后的实现均为$\pmb G(s)$的最小实现:
$$
\begin{cases}
\pmb A_ {oc}=\pmb {VA}_ o\pmb S\\\\
\pmb B_ {oc}=\pmb {VB}_ o\\\\
\pmb C_ {oc}=\pmb C_o\pmb S
\end{cases}
$$

$$
\begin{cases}
\pmb A_ {co}=\pmb {TA}_ c\pmb U\\\\
\pmb B_ {co}=\pmb {TB}_ c\\\\
\pmb C_ {co}=\pmb C_c\pmb U
\end{cases}
$$

**例题:**见课本204~205

6.6. 作业复习

6.6.1. 能观能控型的实现

难度不大,但各种标准型要记熟
$$
\begin{align}
\hat{g}(s)=\frac{\beta_ {n-1} s^{n-1}+\beta_ {n-2}s^{n-2}+\cdots+\beta_1s+\beta_0}{s^n+\alpha_ {n-1}s^{n-1}+\alpha_ {n-2}s^{n-2}+\cdots+\alpha_1s+\alpha_0}+d
\end{align}
$$

$\pmb A$ $\pmb B$ $\pmb C$ $\pmb {D}$
能控下友型(能控I型) $\begin{bmatrix}0&1&0&\cdots&0\\\\0&0&1&\cdots&0\\\\0&0&1&\cdots&0\\\\\vdots&\vdots&\vdots&\ddots&\vdots\\\\0&0&0&\cdots&1\\\\-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}\end{bmatrix}$ $\begin{bmatrix}0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1\end{bmatrix}$ $\begin{bmatrix}\beta_0& \beta_1& \beta_2&\cdots& \beta_ {n-1}&\beta_0\end{bmatrix}$ $d$
能控上友型 $\begin{bmatrix}-\alpha_ {n-1}&-\alpha_ {n-2}&\cdots&-\alpha_ {1}&-\alpha_0\\\\1&0&\cdots&0&0\\\\0&1&\cdots&0&0\\\\\vdots&\vdots&\ddots&\vdots&\vdots\\\\0&0&\cdots&1&0\end{bmatrix}$ $\begin{bmatrix}1 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 0\end{bmatrix}$ $\begin{bmatrix}\beta_ {n-1}& \beta_ {n-2}& \beta_ {n-3}&\cdots& \beta_0\end{bmatrix}$ $d$
能控右友型(能控II型) $\begin{bmatrix}0&0&\cdots&0&-\alpha_0\\\\1&0&\cdots&0&-\alpha_1\\\\0&1&\cdots&0&-\alpha_2\\\\\vdots&\vdots&\ddots&\vdots&\vdots\\\\0&0&\cdots&1&-\alpha_ {n-1}\end{bmatrix}$ $\begin{bmatrix}1 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 0\end{bmatrix}$ $\begin{bmatrix}\beta_0'& \beta_1'& \beta_2'&\cdots& \beta_ {n-1}'\end{bmatrix}$ $d$
能控左友型 $\begin{bmatrix}-\alpha_ {n-1}&1&0&\cdots&0\\\\-\alpha_ {n-2}&0&1&\cdots&0\\\\\vdots&\vdots&\vdots&\ddots&\vdots\\\\-\alpha_1&0&0&\cdots&1\\\\-\alpha_0&0&0&\cdots&0\end{bmatrix}$ $\begin{bmatrix}0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1\end{bmatrix}$ $\begin{bmatrix}\beta_ {n-1}'& \beta_ {n-2}'& \beta_ {n-3}'&\cdots& \beta_0'\end{bmatrix}$ $d$
能观右友型(能观I型) $\begin{bmatrix}0&0&\cdots&0&-\alpha_0\\\\1&0&\cdots&0&-\alpha_1\\\\0&1&\cdots&0&-\alpha_2\\\\\vdots&\vdots&\ddots&\vdots&\vdots\\\\0&0&\cdots&1&-\alpha_ {n-1}\end{bmatrix}$ $\begin{bmatrix}\beta_0\\\\ \beta_1\\\\ \beta_2\\\\\vdots\\\\ \beta_ {n-1}\end{bmatrix}$ $\begin{bmatrix}0&0&\cdots&0&1\end{bmatrix}$ $d$
能观左友型 $\begin{bmatrix}-\alpha_ {n-1}&1&0&\cdots&0\\\\-\alpha_ {n-2}&0&1&\cdots&0\\\\\vdots&\vdots&\vdots&\ddots&\vdots\\\\-\alpha_1&0&0&\cdots&1\\\\-\alpha_0&0&0&\cdots&0\end{bmatrix}$ $\begin{bmatrix}\beta_ {n-1}\\\\ \beta_ {n-2}\\\\ \beta_ {n-3}\\\\\vdots\\\\ \beta_0\end{bmatrix}$ $\begin{bmatrix}1&0&\cdots&0&0\end{bmatrix}$ $d$
能观下友型(能观II型) $\begin{bmatrix}0&1&0&\cdots&0\\\\0&0&1&\cdots&0\\\\0&0&1&\cdots&0\\\\\vdots&\vdots&\vdots&\ddots&\vdots\\\\0&0&0&\cdots&1\\\\-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}\end{bmatrix}$ $\begin{bmatrix}\beta_0'\\\\ \beta_1'\\\\\beta_2'\\\\\vdots\\\\ \beta_ {n-1}'\end{bmatrix}$ $\begin{bmatrix}1&0&\cdots&0&0\end{bmatrix}$ $d$
能观上友型 $\begin{bmatrix}-\alpha_ {n-1}&-\alpha_ {n-2}&\cdots&-\alpha_ {1}&-\alpha_0\\\\1&0&\cdots&0&0\\\\0&1&\cdots&0&0\\\\\vdots&\vdots&\ddots&\vdots&\vdots\\\\0&0&\cdots&1&0\end{bmatrix}$ $\begin{bmatrix}\beta_ {n-1}'\\\\ \beta_ {n-2}'\\\\ \beta_ {n-3}'\\\\\vdots\\\\ \beta_0'\end{bmatrix}$ $\begin{bmatrix}0&0&\cdots&0&1\end{bmatrix}$ $d$

其中的

$$
\begin{matrix}
\beta'0=\boldsymbol C\boldsymbol B&\beta_1'=\boldsymbol {CAb}&\beta_2'=\boldsymbol C\boldsymbol A^2\boldsymbol B&\cdots&\beta {n-1}'=\boldsymbol C\boldsymbol A^{n-1}\boldsymbol B
\end{matrix}
$$

$\pmb A$,$\pmb B$,$\pmb C$为对应的对偶系统的动态方程矩阵

7. 状态反馈和状态观测器

7.1. 反馈的结构与形式

7.1.1. 输出反馈

动态方程
$$
\begin{cases}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}+\boldsymbol {Du}
\end{cases}\\\\
\boldsymbol u=\boldsymbol v-\boldsymbol {Hy}\\\\
\Downarrow\\\\
\begin{cases}
\dot{\pmb x}=[\pmb A-\pmb {BH}(1+\pmb {DH})^{-1}\pmb C]\pmb x+[\pmb B-\pmb {BH}(1+\pmb {DH})^{-1}\pmb D]\pmb v\\\\
\pmb y=(1+\pmb {DH})^{-1}\pmb {Cx}+(1+\pmb {DH})^{-1}\pmb {Dv}
\end{cases}
$$
传递函数矩阵
$$
\hat{\pmb G}(s)=(1+\pmb {DH})^{-1}\pmb C[s\pmb I-\pmb A+\pmb {BH}(1+\pmb {DH})^{-1}\pmb C]^{-1}[\pmb B-\pmb {BH}(1+\pmb {DH})^{-1}\pmb D]+(1+\pmb {DH})^{-1}\pmb D
$$

7.1.2. 状态反馈

动态方程
$$
\begin{cases}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}+\boldsymbol {Du}
\end{cases}\\\\
\boldsymbol u=\boldsymbol v-\boldsymbol {Kx}
\\\\\Downarrow\\\\
\begin{cases}
\dot{\pmb x}=(\pmb A-\pmb {BK})\pmb x+\pmb B\pmb v\\\\
\pmb y=(\pmb C-\pmb {DK})\pmb x+\pmb {Dv}
\end{cases}
$$
传递函数矩阵
$$
\hat{\pmb G}(s)=(\pmb C-\pmb {DK})(s\pmb I-\pmb A+\pmb {BK})^{-1}\pmb B+\pmb D
$$

7.1.3. 输出内反馈

动态方程
$$
\begin{cases}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}+\boldsymbol {Du}
\end{cases}\\\\
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}+\boldsymbol {Ly}\\\\
\Downarrow\\\\
\begin{cases}
\dot{\pmb x}=(\pmb A+\pmb {LC})\pmb x+(\pmb B+\pmb {LD})\pmb u\\\\
\pmb y=\pmb {Cx}+\pmb {Du}
\end{cases}
$$
传递函数矩阵
$$
\hat{\pmb G}(s)=\pmb C(s\pmb I-\pmb A-\pmb {LC})^{-1}(\pmb B+\pmb{LD})+\pmb D
$$

7.1.4. 反馈结构


$$
\begin{cases}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}+\boldsymbol {Du}
\end{cases}\\\\
\begin{align}
\boldsymbol u&=\boldsymbol v-\boldsymbol {Hy}\\\\
\boldsymbol u&=\boldsymbol v-\boldsymbol {Kx}\\\\
\dot{\boldsymbol x}&=\boldsymbol {Ax}+\boldsymbol {Bu}+\boldsymbol {Ly}
\end{align}
$$

7.2. 状态反馈与极点配置

7.2.1. 状态反馈定理

状态反馈不改变系统的能控性


$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol bu\\\\
y=\boldsymbol {cx}\\\\
u=r-\boldsymbol {kx}
\end{cases}
\Rightarrow
\begin{cases}
\dot{\boldsymbol x}=(\boldsymbol A-\boldsymbol {bk})\boldsymbol x+\boldsymbol br\\\\
y=\boldsymbol {cx}
\end{cases}
$$

7.2.2. 极点配置定理

状态反馈可任意配置系统闭环极点的充要条件是系统能控,即:若${\boldsymbol A,\boldsymbol b}$能控,则通过选择合适的$\boldsymbol k$,就可以任意指定$(\boldsymbol A-\boldsymbol {bk})$的特征值

证明:

记系统的状态方程、状态反馈及状态反馈后的闭环状态方程分别是
$$
\begin{matrix}
\dot{\pmb x}=\pmb {Ax}+\pmb bu&u=r-\pmb{kx}&\dot{\pmb x}=(\pmb A-\pmb {bk})\pmb x+\pmb br
\end{matrix}
$$
则系统状态反馈前后的特征多项式分别为:
$$
\begin{align}
f(\lambda)&=\det(s\pmb I-\pmb A)=\lambda^n+\alpha_ {n-1}\lambda^{n-1}+\cdots+\alpha_1\lambda+\alpha_0\\\\
f_k(\lambda)&=\det(s\pmb I-\pmb A+\pmb {bk})=\lambda^4+\overline{\alpha}_ {n-1}\lambda^{n-1}+\cdots+\overline{\alpha}_ 1\lambda+\overline{\alpha}_ 0
\end{align}
$$
由于系统能控,故有状态变换$\overline{\pmb x}=\pmb {Px}$,将$(\pmb A,\pmb b)$变换为能控标准型

$$
\dot{\overline{\pmb x}}=\pmb {PAP}^{-1}\overline{\pmb x}+\pmb {Pb}u=\overline{\pmb A}\overline{\pmb x}+\overline{\pmb b}u=\boldsymbol A \boldsymbol x+\boldsymbol b u=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix}
\boldsymbol x+
\begin{bmatrix}
0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1
\end{bmatrix}u
$$

此时状态反馈也可写成

$$
u=r-\pmb {kx}=r-\pmb {kP}^{-1}\overline{\pmb x}=:r-\overline{\pmb k}\overline{\pmb x}
$$

其中,$\overline{\pmb k}:=\pmb {kP}^{-1}$

对任意指定的特征值集合,可迅速构造出期望的特征多项式$f_k(\lambda)$

$$
f_k(\lambda)=\det(s\pmb I-\pmb A+\pmb {bk})=\det(s\pmb I-\overline{\pmb A}+\overline{\pmb {b}}\overline{\pmb k})=\lambda^4+\overline{\alpha}_ {n-1}\lambda^{n-1}+\cdots+\overline{\alpha}_ 1\lambda+\overline{\alpha}_ 0
$$

显然,只需选择$\overline{\pmb k}=\begin{bmatrix}\overline{\alpha}_ 0-\alpha_0&\overline{\alpha}_ 1-\alpha_ 1&\cdots&\overline{\alpha}_ {n-1}-\alpha_ {n-1} \end{bmatrix}$ ,就一定有

$$
\begin{align}
\dot{\overline{\pmb x}}&=\overline{\pmb A}\overline{\pmb x}+\overline{\pmb b}u=\overline{\pmb A}\overline{\pmb x}+\overline{\pmb b}(r-\pmb {kx})=\overline{\pmb A}\overline{\pmb x}-\overline{\pmb b}\overline{\pmb k}\overline{\pmb x}+\overline{\pmb b}r=(\overline{\pmb A}-\overline{\pmb b}\overline{\pmb k})\overline{\pmb x}+\overline{\pmb b}r\\\\
&=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\overline \alpha_0&-\overline \alpha_1&-\overline \alpha_2&\cdots&-\overline \alpha_ {n-1}
\end{bmatrix}
\overline{\boldsymbol x}+
\begin{bmatrix}
0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1
\end{bmatrix}u
\end{align}
$$

事实上,$\overline{\pmb A}-\overline{\pmb b}\overline{\pmb k}=\pmb P(\pmb A-\pmb {bk})\pmb P^{-1}$ ,设$\overline{\pmb k}=\begin{bmatrix}k_0&k_1&\cdots&k_ {n-2}&k_ {n-1}\end{bmatrix}$,有

$$
\begin{align}
\overline{\pmb A}-\overline{\pmb b}\overline{\pmb k}&=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0&-\alpha_1&-\alpha_2&\cdots&-\alpha_ {n-1}
\end{bmatrix}
-\begin{bmatrix}
0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1
\end{bmatrix}\begin{bmatrix}k_0&k_1&\cdots&k_ {n-2}&k_ {n-1}\end{bmatrix}\\\\
&=
\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\alpha_0-k_0&-\alpha_1-k_1&-\alpha_2-k_2&\cdots&-\alpha_ {n-1}-k_ {n-1}
\end{bmatrix}\\\\
&=\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\overline \alpha_0&-\overline \alpha_1&-\overline \alpha_2&\cdots&-\overline \alpha_ {n-1}
\end{bmatrix}
\end{align}
$$

得到:$\overline{\pmb k}=\begin{bmatrix}\overline{\alpha}_ 0-\alpha_ 0&\overline{\alpha}_ 1-\alpha_ 1&\cdots&\overline{\alpha}_ {n-1}-\alpha_ {n-1} \end{bmatrix}$ 的结论,且$\pmb k=\overline{\pmb k}\pmb P$

注意:

  • 状态反馈不改变传递函数的零点,这一结论也可以用来解释为什么状态反馈可以改变状态方程的能观性
  • 对于完全不能控系统,状态反馈可以任意配置其能控子空间的特征值,而对不能控子空间的特征值没有影响

7.2.3. 状态反馈增益阵的求取

标准型法
$$
\pmb k=\overline{\pmb k}\pmb P=(\overline{\pmb \alpha}-\pmb \alpha)\pmb M_ {cc}\pmb M_c^{-1}
$$
其中,

  • 行向量$\pmb \alpha$:状态反馈前系统特征多项式系数的升幂排列
  • 行向量$\overline{\pmb \alpha}$:状态反馈后系统特征多项式系数的升幂排列
  • $\pmb M_c$:原系统的能控性矩阵
  • $\pmb M_ {cc}$:相应能控标准型系统的能控性矩阵

依据:极点配置定理的证明,关键是变换阵$\pmb P$的求取:

$$
\begin{align}
\pmb M_ {cc}&=\begin{bmatrix}
\overline{\pmb B}&\overline{\pmb A}\overline{\pmb B}&\overline{\pmb A}^2\overline{\pmb B}&\cdots&\overline{\pmb A}^{n-1}\overline{\pmb B}
\end{bmatrix}\\\\
&=\begin{bmatrix}
\pmb {PB}&\pmb {PAP}^{-1}\pmb {PB}&\pmb {PA}
^2\pmb P^{-1}\pmb {PB} &\cdots&\pmb {PA}^{n-1}\pmb P^{-1}\pmb {PB} \end{bmatrix}\\\\
&=\pmb P\begin{bmatrix}\pmb B&\pmb {AB}&\pmb {A}^2\pmb B&\cdots&\pmb A^{n-1}\pmb B \end{bmatrix}\\\\
&=\pmb {PM}_ c
\end{align}
$$

注意到

$$
\overline{\pmb A}=\begin{bmatrix}
0&1&0&\cdots&0\\\\
0&0&1&\cdots&0\\\\
\vdots&\vdots&\vdots&\ddots&\vdots\\\\
0&0&0&\cdots&1\\\\
-\overline \alpha_0&-\overline \alpha_1&-\overline \alpha_2&\cdots&-\overline \alpha_ {n-1}
\end{bmatrix},
\overline{\pmb B}=\begin{bmatrix}
0 \\\\ 0 \\\\ \vdots \\\\ 0 \\\\ 1
\end{bmatrix}
$$
而$\pmb \alpha$和$\overline{\pmb \alpha}$的值可以通过特征多项式$\Delta(s)=\prod\limits_ {k=1}^n (s-\lambda_k)$和期望特征多项式$\overline\Delta(\lambda)=\prod\limits_ {k=1}^n (s-\overline\lambda_k)$得到

特别地,对于能控I型(下友型)系统,则状态反馈向量直接由$\pmb k=\pmb k_1=\pmb \alpha-\overline{\pmb \alpha}$得到

待定系数法

对于阶数较低的动态方程可以使用待定系数法,设系统的动态方程为:
$$
\dot{\pmb x}=\pmb {Ax}+\pmb Bu
$$
设状态反馈向量为$\pmb k=\begin{bmatrix}k_1&k_2&\cdots&k_n\end{bmatrix}$,引入状态反馈$u=r-\pmb {kx}$

则状态反馈系统描述为:
$$
\dot{\pmb x}=(\pmb A-\pmb {Bk})\pmb x+\pmb Br
$$
列出状态反馈系统的特征多项式$f_ {\pmb k}(\lambda)$ ,通过配置特征多项式的零点,选择合适的$k_i$,$i=1,2,\cdots,n$

求解方程组$\pmb f_ {\pmb k}(\pmb \lambda)=\pmb 0$ 得到$\pmb k$合适的取值

7.2.4. 多输入状态反馈与极点配置

对于多输入的状态反馈,和单变量情况一样有状态反馈定理极点配置定理

对于反馈向量的构造有两种方法:

多输入系统转化为单输入系统进行分析
$$
\begin{matrix}
\begin{matrix}
多输入系统\\\\
\begin{cases}
\dot{\pmb x}=\pmb {Ax}+\pmb {Bu}\\\\
\pmb y=\pmb {Cx}
\end{cases}
\end{matrix}
&
\begin{matrix}
\xrightarrow{\begin{matrix}\pmb u=\pmb v\overline{u}\\\\\pmb b=\pmb {Bv}\end{matrix}}
\end{matrix}
&
\begin{matrix}
单输入系统\\\\
\begin{cases}
\dot{\pmb x}=\pmb {Ax}+\pmb {b}\overline{u}\\\\
\pmb y=\pmb {Cx}
\end{cases}\\\\
\end{matrix}\\\\&&
\begin{matrix}
\begin{matrix}
如果能控\\\\
\overline{u}=r-\pmb {kx}
\end{matrix}&
\Bigg\downarrow&
\begin{matrix}
\pmb u=\pmb vr-(\pmb v\pmb k)\pmb x\\\\
\pmb K=\pmb {vk}
\end{matrix}
\end{matrix}
\\\\&&
\begin{cases}
\dot{\pmb x}=(\pmb A-\pmb {bk})\pmb x+\pmb {b}r=(\pmb A-\pmb {Bvk})\pmb x+\pmb br \\\\
\pmb y=\pmb {Cx}
\end{cases}
\end{matrix}
$$
单输入系统能控的充分条件:对每个特征值,$\pmb A$仅有一个约尔当块

使用多变量标准型

以二维输入,六维状态变量的多输入系统为例,
$$
\begin{cases}
\dot{\pmb x}=\pmb {Ax}+\pmb {Bu}\\\\
\pmb y=\pmb {Cx}
\end{cases}
$$
其中,$\pmb B=\begin{bmatrix}b_1&b_2\end{bmatrix}$

能控性矩阵$\pmb M_c=\begin{bmatrix}\pmb b_1&\pmb b_2&\pmb {Ab_1}&\pmb {Ab}_ 2&\pmb A^2\pmb b_1&\pmb A^2\pmb b_2&\pmb A^3\pmb b_1&\pmb A^3\pmb b_2&\cdots \end{bmatrix}$非奇异

构造非奇异方阵:$\pmb M=\begin{bmatrix}\pmb b_1&\pmb {Ab}_ 1&\pmb A^2\pmb b_1&\pmb A^3\pmb b_3&|&\pmb b_2&\pmb {Ab}_ 2 \end{bmatrix}$

定义方程:
$$
\begin{bmatrix}
\pmb v_1^T\\\\\pmb v_2^T
\end{bmatrix}\begin{bmatrix}\pmb b_1&\pmb {Ab}_ 1&\pmb A^2\pmb b_1&\pmb A^3\pmb b_3&|&\pmb b_2&\pmb {Ab}_ 2 \end{bmatrix}=\begin{bmatrix}0&0&0&1&0&0\\\\0&0&0&0&0&1\end{bmatrix}
$$
解出$\pmb v_1$和$\pmb v_2$

变换矩阵定义为:
$$
\pmb P=\begin{bmatrix}
\pmb v_1^T\pmb A^3\\\\
\pmb v_1^T\pmb A^2\\\\
\pmb v_1^T\pmb A\\\\
\pmb v_1^T\\\\
\pmb v_2^T\pmb A\\\\
\pmb v_2^T\\\\
\end{bmatrix}
$$
类比单变量系统即可求得结果

7.3. 全维状态观测器

7.3.1. 状态观测器的概念

  • 状态反馈功能强大(如:极点配置等)
  • 欲实现状态反馈须有实时准确的状态值
  • 但直接量测所有状态很困难甚至不可能

设法利用来自系统的实时可用的信息,通过构造一个模拟系统来实现对状态变量的实时估计。就是所谓的状态估计或叫状态观测问题
$$
\begin{matrix}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol bu\\\\
y=\boldsymbol {cx}
\end{matrix}\\\\
{\boldsymbol A,\boldsymbol b,\boldsymbol c,\boldsymbol u(\cdot),y(\cdot)}\Rightarrow \boldsymbol x(t)
$$

7.3.2. 全维渐进状态观测器

闭环观测器结构图如下:

动态方程:
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol bu\\\\
y=\boldsymbol {cx}
\end{cases}
$$
观测量的状态方程:
$$
\begin{align}
\dot{\hat{\boldsymbol x}}&=\boldsymbol A\hat{\boldsymbol x}+\boldsymbol bu+\boldsymbol l(y-\boldsymbol c\hat{\boldsymbol x})\\\\
&=(\boldsymbol A-\boldsymbol {lc})\hat{\boldsymbol x}+\boldsymbol bu+\boldsymbol {ly}
\end{align}
$$
观测误差:
$$
\begin{align}
\dot{\boldsymbol e}&=\dot{\boldsymbol x}-\dot{\hat{\boldsymbol x}}\\\\
&=\boldsymbol {Ax}+\boldsymbol bu-(\boldsymbol A-\boldsymbol {lc})\hat{\boldsymbol x}-\boldsymbol bu+\boldsymbol l(\boldsymbol {cx})\\\\
&=(\boldsymbol A-\boldsymbol {lc})\boldsymbol x-(\boldsymbol A-\boldsymbol {lc})\hat{\boldsymbol x}\\\\
&=(\boldsymbol A-\boldsymbol {lc})(\boldsymbol x-\hat{\boldsymbol x})\\\\
&=(\boldsymbol A-\boldsymbol {lc})\boldsymbol e
\end{align}
$$
易解得:
$$
\boldsymbol e(t)=e^{(\boldsymbol A-\boldsymbol {lc})t}\boldsymbol e(0)
$$
状态观测器的期望:
$$
e(t)\rightarrow 0\\\\
\uparrow\\\\
Re(\lambda_ {\boldsymbol A-\boldsymbol {lc}})<0\\\\
\updownarrow\\\\
Re(\lambda_ {(\boldsymbol A-\boldsymbol {lc})^T})<0\\\\
\updownarrow\\\\
(\boldsymbol A^T,\boldsymbol c^T)能正定\\\\
\updownarrow\\\\ (\boldsymbol c,\boldsymbol A)能检测
$$

7.3.3. 存在性定理

渐进状态观测器存在的充要条件是系统能检测
$$
\begin{matrix}\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol bu\\\\y=\boldsymbol {cx}\end{matrix}\ \ \ \ \
\Bigg\{\begin{matrix}\boldsymbol A,\boldsymbol B,\boldsymbol c\\\\ u(\cdot),y(\cdot)\end{matrix}\Bigg\}
$$

$$
\dot{\hat{\boldsymbol x}}=(\boldsymbol A-\boldsymbol {lc})\hat{\boldsymbol x}+\boldsymbol bu+\boldsymbol ly
$$

状态观测器事实上是一个与被观测系统同时运行的一个人工系统(该系统的所有信息都可及时准确得到,激励信号也可以施加在任何需要的地方), 输入是被观测系统的输入和输出,输出是被观测系统状态的估计值

7.4. 分离定理与复合控制

7.4.1. 复合系统的结构

动态方程:
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol bu\\\\
y=\boldsymbol {cx}
\end{cases}
$$
状态观测的动态方程:
$$
\begin{align}
\dot{\hat{\boldsymbol x}}&=\boldsymbol A\hat{\boldsymbol x}+\boldsymbol bu+\boldsymbol l(y-\boldsymbol c\hat{\boldsymbol x})\\\\
&=(\boldsymbol A-\boldsymbol {lc})\hat{\boldsymbol x}+\boldsymbol bu+\boldsymbol {l}y
\end{align}
$$
状态反馈:
$$
u=r-\pmb k\hat{\pmb x}
$$
代入状态反馈有:
$$
\begin{align}
\dot{\boldsymbol x}&=\boldsymbol {Ax}-\boldsymbol {bk}\hat{\boldsymbol x}+\boldsymbol {br}\\\\
\dot{\hat{\boldsymbol x}}&=(\boldsymbol A-\boldsymbol {lc})\hat{\boldsymbol x}+\boldsymbol b(r-\boldsymbol k\hat{\boldsymbol x})+\boldsymbol {lcx}
\end{align}
$$
写成矩阵形式有:
$$
\begin{align}
\begin{bmatrix}\dot{\boldsymbol x}\\\\\dot{\hat{\boldsymbol x}} \end{bmatrix}&=
\begin{bmatrix}
\boldsymbol A&-\boldsymbol {bk}\\\\
\boldsymbol {lc}&\boldsymbol A-\boldsymbol {lc}-\boldsymbol {bk}
\end{bmatrix}
\begin{bmatrix}
\boldsymbol x\\\\ \hat{\boldsymbol x}
\end{bmatrix}+\begin{bmatrix}
\boldsymbol b\\\\\boldsymbol b
\end{bmatrix}r\\\\
y&=\begin{bmatrix}\boldsymbol c&\boldsymbol 0 \end{bmatrix}
\begin{bmatrix}\boldsymbol x\\\\\hat{\boldsymbol x}\end{bmatrix}
\end{align}
$$

7.4.2. 分离特性(卡尔曼分离原理)

含有渐进状态观测器的$2n$维闭环系统通过观测器的状态估值提供反馈信息的动态方程为:
$$
\begin{align}
\begin{bmatrix}\dot{\boldsymbol x}\\\\\dot{\hat{\boldsymbol x}} \end{bmatrix}&=
\begin{bmatrix}
\boldsymbol A&-\boldsymbol {bk}\\\\
\boldsymbol {lc}&\boldsymbol A-\boldsymbol {lc}-\boldsymbol {bk}
\end{bmatrix}
\begin{bmatrix}
\boldsymbol x\\\\ \hat{\boldsymbol x}
\end{bmatrix}+\begin{bmatrix}
\boldsymbol b\\\\\boldsymbol b
\end{bmatrix}r\\\\
y&=\begin{bmatrix}\boldsymbol c&\boldsymbol 0 \end{bmatrix}
\begin{bmatrix}\boldsymbol x\\\\\hat{\boldsymbol x}\end{bmatrix}
\end{align}
$$
代入估计误差$\pmb e=\pmb x-\hat{\pmb x}$ 消去$\hat{\pmb x}$有
$$
\begin{align}
\begin{bmatrix}\dot{\boldsymbol x}\\\\\dot{\boldsymbol e} \end{bmatrix}&=\begin{bmatrix}
\boldsymbol A-\boldsymbol {bk}&\boldsymbol {bk}\\\\
\boldsymbol 0&\boldsymbol {A-\boldsymbol {lc}}
\end{bmatrix}\begin{bmatrix}
\boldsymbol x\\\\\boldsymbol e
\end{bmatrix}+
\begin{bmatrix}\boldsymbol b\\\\\boldsymbol 0\end{bmatrix}r\\\\
y&=\begin{bmatrix}\boldsymbol c&\boldsymbol 0\end{bmatrix}
\begin{bmatrix}\boldsymbol x\\\\\boldsymbol e\end{bmatrix}
\end{align}
$$
估计误差收敛:$\pmb e(t)\rightarrow 0\Leftarrow Re(\lambda_ {\pmb A-\pmb {lc}})<0$

稳定性:$\boldsymbol x(t)\rightarrow 0\Leftarrow Re(\lambda_ {\boldsymbol A-\boldsymbol {bk}})<0$

结论:

  • 代数等价变换后的系统是由状态$\pmb x(t)$反馈形成的闭环子系统和由估值误差子系统组合而成。只要被控系统${\pmb A,\pmb c}$能观,就可用$\pmb l$任意配置$\sigma(\pmb A-\pmb {bk})$。也就是说,只要被控系统是既约的,状态反馈闭环子系统的设计和状态观测器的设计可以分别单独设计,这一特性称为分离特性或分离原理。
  • 估值误差子系统是不受状态反馈闭环子系统任何影响的零输入系统

7.5. 降维状态观测器

7.5.1. 基本概念

状态观测器的一般形式
$$
\begin{cases}
\dot{\boldsymbol z}=\boldsymbol {Fz}+\boldsymbol Gu+\boldsymbol Hy\\\\
\hat{\boldsymbol x}+\boldsymbol {Pz}+\boldsymbol Qu+\boldsymbol Ry
\end{cases}
$$

$$
\dot{\hat{\boldsymbol x}}=(\boldsymbol A-\boldsymbol {lc})\hat{\boldsymbol x}+\boldsymbol bu+\boldsymbol ly
$$

降维观测器

若状态观测器系统S1的维数小于被观测系统S2的维数,则称S1是S2的降维观测器

原理:实际上$\pmb y=\pmb {cx}$表明输出中就含有可利用的状态信息而不必构造全部状态变量估值,倘若$\pmb c$的秩为$r$,则只需对$(n-r)$个状态变量估值使得状态观测器维数从$n$降到$n-r$

最小维状态观测器的维数

对$n$维线性定常系统${\boldsymbol A,\boldsymbol B,\boldsymbol C}$,若${\boldsymbol A,\boldsymbol C}$能观,且
$$
rank(\boldsymbol C)=q
$$
则该系统状态观测器的最小维数是$n-q$

7.5.4.龙伯格观测器

设系统的动态方程为:
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}
\end{cases}
$$
其中,$\pmb x$的维数$\dim \boldsymbol x=n$,输出矩阵的秩$\mathrm{rank} \ \boldsymbol C=q$

定义坐标变换$\overline{\boldsymbol x}=\boldsymbol {Px}$
$$
\begin{matrix}
\overline{\pmb A}=\pmb {PAP}^{-1}&\overline{\pmb B}=\pmb {PB}&\overline{\pmb C}=\pmb {CP}^{-1}
\end{matrix}
$$

$$
\begin{cases}
\dot{\overline{\pmb x}}=\overline{\pmb A}\overline{\pmb x}+\overline{\pmb B}\pmb u\\\\
\pmb y=\overline{\pmb C}\overline{\pmb x}
\end{cases}
$$

从$\pmb C$阵中抽取互不相关的$q$行,称之为$\boldsymbol C_2$(或不妨假设$\boldsymbol C $满秩,这样$\boldsymbol C=\boldsymbol C_2$),再寻$(n-q)× n $维矩阵$\boldsymbol C_1 $使$\boldsymbol P $非奇异,这样

$$
\pmb P=\begin{bmatrix}
\boldsymbol C_1\\\\\boldsymbol C_2
\end{bmatrix}\begin{matrix}n-q\\\\q\end{matrix}
$$

对应分量

$$
\overline{\pmb x}=\begin{bmatrix}
\overline{\pmb x}_ 1\\\\\overline{\pmb x}_ 2
\end{bmatrix}
$$

各个变换后矩阵也可取子块形式:

$$
\begin{align}
\overline{\boldsymbol A}&=\boldsymbol {PAP}^{-1}=\begin{bmatrix}\boldsymbol A_ {11}&\boldsymbol A_ {12}\\\\\boldsymbol A_ {21}&\boldsymbol A_ {22}\end{bmatrix}\\\\
\overline{\boldsymbol B}&=\boldsymbol {PB}=\begin{bmatrix}\boldsymbol B_1\\\\\boldsymbol B_2\end{bmatrix}\\\\
\overline{\boldsymbol C}&=\boldsymbol C_2\boldsymbol P^{-1}=\boldsymbol C_2\begin{bmatrix}\boldsymbol C_1\\\\\boldsymbol C_2\end{bmatrix}^{-1}=\begin{bmatrix}\boldsymbol O&\boldsymbol I\end{bmatrix}
\end{align}
$$

相应的输出表示为:

$$
\boldsymbol y=\overline{\boldsymbol C}\overline{\boldsymbol x}=\begin{bmatrix}\boldsymbol O&\boldsymbol I\end{bmatrix}
\begin{bmatrix}\overline{\boldsymbol x}_ 1\\\\\overline{\boldsymbol x}_ 2 \end{bmatrix}=\overline{\boldsymbol x}_ 2
$$

代入原动态方程有:

$$
\begin{align}
\dot{\overline{\boldsymbol x}}_ 1&=\boldsymbol A_ {11}\overline{\boldsymbol x}_ 1+\boldsymbol A_ {12}\overline{\boldsymbol x}_ 2+\boldsymbol B_1\boldsymbol u\\\\
\dot{\overline{\boldsymbol x}}_ 2&=\boldsymbol A_ {21}\overline{\boldsymbol x}_ 1+\boldsymbol A_ {22}\overline{\boldsymbol x}_ 2+\boldsymbol B_2\boldsymbol u\\\\
\boldsymbol y&=\overline{\boldsymbol C}\overline{\boldsymbol x}=\overline{\boldsymbol x}_ 2
\end{align}
$$

记:$\pmb w=\pmb A_ {21}\overline{\pmb x}_ {1}$,则有

$$
\begin{align}
\dot{\overline{\boldsymbol x}}_ 1&=\boldsymbol A_ {11}\overline{\boldsymbol x}_ 1+(\boldsymbol A_ {12}\boldsymbol y+\boldsymbol B_1\boldsymbol u)=\boldsymbol A_ {11}\overline{\boldsymbol x}_ 1+\boldsymbol v\\\\
\boldsymbol w&=\boldsymbol A_ {21}\overline{\boldsymbol x}_ 1=\dot{\boldsymbol y}-\boldsymbol A_ {22}\boldsymbol y-\boldsymbol B_2\boldsymbol u
\end{align}
$$

至此利用全维观测器的设计方法构造$\overline{\pmb x}_ 1$的观测器

$$
\dot{\hat{\overline{\boldsymbol x}}}_ 1=(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})\hat{\overline{\boldsymbol x}}_ 1+(\boldsymbol A_ {12}\boldsymbol y+\boldsymbol B_1\boldsymbol u)+\boldsymbol L(\dot{\boldsymbol y}-\boldsymbol A_ {22}\boldsymbol y-\boldsymbol B_2\boldsymbol u)
$$

为消除式中的$\dot{\pmb y}$一项,取

$$
\boldsymbol z=\hat{\overline{\boldsymbol x}}_ 1-\boldsymbol {Ly}\Rightarrow\hat{\overline{\boldsymbol x}}_ 1=\boldsymbol z+\boldsymbol {Ly}
$$

这样,有

$$
\dot{\boldsymbol z}=(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})(\boldsymbol z+\boldsymbol {Ly})+(\boldsymbol A_ {12}\boldsymbol y+\boldsymbol B_1\boldsymbol u)-\boldsymbol L(\boldsymbol A_ {22}\boldsymbol y+\boldsymbol B_2\boldsymbol u)
$$

即:

$$
\dot{\boldsymbol z}=(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})\boldsymbol z+(\boldsymbol B_1-\boldsymbol {LB}_ 2)\boldsymbol u+[(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})\boldsymbol L+\boldsymbol A_ {12}-\boldsymbol {LA}_ {22}]\boldsymbol y
$$

$$
\begin{matrix}
\hat{\overline{\boldsymbol x}}=\begin{bmatrix}\hat{\overline{\boldsymbol x}}_ 1\\\\ \hat{\overline{\boldsymbol x}}_ 2 \end{bmatrix}=\begin{bmatrix}\boldsymbol z+\boldsymbol {Ly}\\\\\boldsymbol y\end{bmatrix}=\begin{bmatrix}\boldsymbol I&\boldsymbol L\\\\\boldsymbol O&\boldsymbol I\end{bmatrix}\begin{bmatrix}\boldsymbol z\\\\\boldsymbol y\end{bmatrix}&
\hat{\boldsymbol x}=\boldsymbol P^{-1}\hat{\overline{\boldsymbol x}}=\boldsymbol P^{-1}\begin{bmatrix}\boldsymbol I&\boldsymbol L\\\\\boldsymbol O&\boldsymbol I\end{bmatrix}\begin{bmatrix}\boldsymbol z\\\\\boldsymbol y\end{bmatrix}
\end{matrix}
$$

一般求解步骤:

  1. 检查系统的能控性,确定最小维观测器的阶数$n-\mathrm{rank}(\pmb C)$

  2. 定义坐标变换 $\overline{\boldsymbol x}=\boldsymbol {Px}$
    $$
    \boldsymbol P=\begin{bmatrix}
    \boldsymbol C_1\\\\\boldsymbol C_2
    \end{bmatrix}\begin{matrix}n-q\\\\q\end{matrix}
    $$
    从$\boldsymbol C$阵中抽取互不相关的$ q $行,称之为$\boldsymbol C_2$(或不妨假设$\boldsymbol C $满秩,这样$\boldsymbol C=\boldsymbol C_2$),再寻$(n-q)× n $维矩阵$\boldsymbol C_1 $使$\boldsymbol P $非奇异

  3. 进行状态变换
    $$
    \begin{cases}
    \dot{\overline{\boldsymbol x}}_ 1=\boldsymbol A_ {11}\overline{\boldsymbol x}_ 1+\boldsymbol A_ {12}\overline{\boldsymbol x}_ 2+\boldsymbol B_1\boldsymbol u\\\\
    \dot{\overline{\boldsymbol x}}_ 2=\boldsymbol A_ {21}\overline{\boldsymbol x}_ 1+\boldsymbol A_ {22}\overline{\boldsymbol x}_ 2+\boldsymbol B_2\boldsymbol u
    \end{cases}
    $$

    $$
    \boldsymbol y=\overline{\boldsymbol C}\overline{\boldsymbol x}=\overline{\boldsymbol x}_ 2
    $$

    $$
    \begin{align}
    \dot{\overline{\boldsymbol x}}_ 1&=\boldsymbol A_ {11}\overline{\boldsymbol x}_ 1+\boldsymbol v\\\\
    \boldsymbol v&=\boldsymbol A_ {21}\boldsymbol y+\boldsymbol B_1\boldsymbol u\\\\
    \boldsymbol w&=\boldsymbol A_ {21}\overline{\boldsymbol x}=\dot{\boldsymbol y}-\boldsymbol A_ {22}\boldsymbol y-\boldsymbol B_2\boldsymbol u
    \end{align}
    $$

  4. 构造全维状态观测器
    $$
    \dot{\hat{\overline{\boldsymbol x}}}_ 1=(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})\hat{\overline{\boldsymbol x}}_ 1+(\boldsymbol A_ {12}\boldsymbol y+\boldsymbol B_1\boldsymbol u)+\boldsymbol L(\dot{\boldsymbol y}-\boldsymbol A_ {22}\boldsymbol y-\boldsymbol B_2\boldsymbol u)
    $$

  5. 消除微分项
    $$
    \begin{align}
    \boldsymbol z&=\hat{\overline{\boldsymbol x}}_ 1-\boldsymbol {Ly}\\\\
    \dot{\boldsymbol z}&=(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})(\boldsymbol z+\boldsymbol {Ly})+(\boldsymbol A_ {12}\boldsymbol y+\boldsymbol B_1\boldsymbol u)-\boldsymbol L(\boldsymbol A_ {22}\boldsymbol y+\boldsymbol B_2\boldsymbol u)\\\\
    &=(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})\boldsymbol z+(\boldsymbol B_1-\boldsymbol {LB}_ 2)\boldsymbol u+[(\boldsymbol A_ {11}-\boldsymbol {LA}_ {21})\boldsymbol L+\boldsymbol A_ {21}-\boldsymbol {LA}_ {22}]\boldsymbol y
    \end{align}
    $$

  6. 还原观测目标
    $$
    \begin{matrix}
    \hat{\boldsymbol x}=\boldsymbol P^{-1}\hat{\overline{\boldsymbol x}}=\boldsymbol P^{-1}\begin{bmatrix}\hat{\overline{\boldsymbol x}}_ 1\\\\ \hat{\overline{\boldsymbol x}}_ 2 \end{bmatrix}=\boldsymbol P^{-1}\begin{bmatrix}\boldsymbol z+\boldsymbol {Ly}\\\\\boldsymbol y\end{bmatrix} =\boldsymbol P^{-1}\begin{bmatrix}\boldsymbol I&\boldsymbol L\\\\\boldsymbol O&\boldsymbol I\end{bmatrix}\begin{bmatrix}\boldsymbol z\\\\\boldsymbol y\end{bmatrix}
    \end{matrix}
    $$

例题:

已知系统的动态方程为:
$$
\begin{cases}
\dot{x}_ 1=-2x_1+x_2+u\\\\
\dot x_2=x_1-3x_2+2u\\\\
y=x_1-x_2
\end{cases}
$$
当系统的状态不可直接量测时,设计极点位于$-6$处的最小维状态观测器。

  1. 检查系统的能观性

    能观性矩阵$\pmb M_o=\begin{bmatrix}1&-1\\\\-3&4\end{bmatrix}$满秩,故系统能观,状态观测器存在,又$\mathrm {rank}\pmb c$的秩为1,故最小维观测器维数为1

  2. 取变换矩阵$\pmb P=\begin{bmatrix}1&0\\\\1&-1\end{bmatrix}$,则$\pmb P^{-1}=\begin{bmatrix}1&0\\\\1&-1\end{bmatrix}$

  3. 变换后矩阵如下:
    $$
    \begin{matrix}
    \overline{\pmb A}=\pmb {PAP}^{-1}=\begin{bmatrix}-1&-1\\\\1&-4\end{bmatrix}&
    \overline{\pmb b}=\pmb {Pb}=\begin{bmatrix}1\\\\-1\end{bmatrix}\\\\
    \overline{\pmb c}=\pmb {cP}^{-1}=\begin{bmatrix}0&1\end{bmatrix}
    \end{matrix}
    $$
    即:
    $$
    \begin{align}
    \dot{\overline{x}}_ 1&=-\overline{x}_ 1-\overline{x}_ 2+u\\\\
    \dot{\overline{x}}_ 2&=\overline{x}_ 1-4\overline{x}_ 2-u\\\\
    y&=\overline{x}_ 2
    \end{align}
    $$
    以$\overline{x}_ 1$为状态的状态空间方程可写成:
    $$
    \begin{align}
    \dot{\overline{x}}_ 1&=A_o\overline{x}_ 1+b_ou_o=-\overline{x}_ 1+\overline{u}\\\\
    y_0&=c_o\overline{x}_ 1=\overline x_1
    \end{align}
    $$
    其中,$b_ou_o=u-y$,$y_o=\overline{x}_ 1=\dot y+4y+u$

  4. 构造此一维系统的等维观测器:
    $$
    \dot{\hat{\overline{x}}}_ 1=(A_o-lc_o)\hat{\overline{x}}_ 1+b_ou_o+ly_o
    $$
    根据观测器极点的要求,
    $$
    (A_o-lc_o)=-1-l=-6\Rightarrow l=5
    $$
    因此观测器方程为:
    $$
    \dot{\hat{\overline{x}}}_ 1=-6\hat{\overline{x}}_ 1+(u-y)+5(\dot y+4y+u)=-6\hat{\overline x}_ 1+6u+5\dot y+19y
    $$

  5. 消去微分项

    令$z=\hat{\overline {x}}_ 1-5y$,即$\hat{\overline{x}}_ 1=z+5y$,则得最小维观测器得状态方程:
    $$
    \dot z=-6z+6u-11y
    $$

  6. 还原观测目标

    则状态观测器得输出方程为:
    $$
    \hat x=\pmb P^{-1}\begin{bmatrix}\hat{\overline x}_ 1\\\\\hat{\overline x}_ 2 \end{bmatrix}=\begin{bmatrix}1&0\\\\1&-1\end{bmatrix}\begin{bmatrix}z+5y\\\\y\end{bmatrix}+\begin{bmatrix}5\\\\4\end{bmatrix}y
    $$

7.5.5. 李雅普诺夫方程法

系统的动态方程:
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}
\end{cases}
$$

$$
\begin{matrix}
\dim\pmb x=n&\mathrm{rank} \pmb C=q
\end{matrix}
$$

一般步骤:

  1. 选择任一$(n-q)\times(n-q)$稳定矩阵$\boldsymbol F$,但其特征值与$\boldsymbol A$不同

  2. 选择任一$(n-q)\times q$的矩阵$\boldsymbol L$,使得$(\boldsymbol F,\boldsymbol L)$能控

  3. 求解李雅普诺夫方程$\boldsymbol {TA}-\boldsymbol {FT}=\boldsymbol {LC}$的唯一解($\boldsymbol T$为$(n-q)\times n$的矩阵)

  4. 如果$n$阶方阵$\boldsymbol P=\begin{bmatrix}\boldsymbol T\\\\\boldsymbol C\end{bmatrix}$奇异,退回第2步重新选择

    如果$\boldsymbol P$非奇异,则该系统的$n-q$维状态观测器为
    $$
    \dot{\boldsymbol z}=\boldsymbol {Fz}+\boldsymbol {TBu}+\boldsymbol {Ly}\\\\
    \hat{\boldsymbol x}=\begin{bmatrix}\boldsymbol T\\\\\boldsymbol C\end{bmatrix}^{-1}\begin{bmatrix}\boldsymbol z\\\\\boldsymbol y\end{bmatrix}
    $$

正确性说明:

状态观测器的输出方程:
$$
\begin{bmatrix}\boldsymbol z\\\\\boldsymbol y\end{bmatrix}=\begin{bmatrix}\boldsymbol T\\\\\boldsymbol C\end{bmatrix}\hat{\boldsymbol x}
$$
意味着:$\boldsymbol z=\boldsymbol T\hat{\boldsymbol x}$,$\boldsymbol y=\boldsymbol C\hat{\boldsymbol x}$,显然$\boldsymbol y$是$\boldsymbol {Cx}$的估计,于是只须证明$\boldsymbol z$是$\boldsymbol {Tx}$的一个估计,定义$\boldsymbol e=\boldsymbol z-\boldsymbol {Tx}$,这样
$$
\begin{align}
\dot{\boldsymbol e}&=\dot{\boldsymbol z}-\boldsymbol T\dot{\boldsymbol x}\\\\&=\boldsymbol {Fz}+\boldsymbol {TBu}+\boldsymbol {LCx}-\boldsymbol {TAx}-\boldsymbol {TBu}\\\\
&=\boldsymbol {Fz}+(\boldsymbol {LC-\boldsymbol {TA}})\boldsymbol x\\\\&=\boldsymbol F(\boldsymbol z-\boldsymbol {Tx})\\\\&=\boldsymbol {Fe}
\end{align}
$$
完备性说明:

若$\boldsymbol A$与$\boldsymbol L$没有相同的特征值,且$\boldsymbol T$是方程$\boldsymbol {TA}-\boldsymbol {FT}=\boldsymbol {LC}$的唯一解,则矩阵$\boldsymbol P=\begin{bmatrix}\boldsymbol T\\\\\boldsymbol C\end{bmatrix}$非奇异的必要条件为$(\boldsymbol A,\boldsymbol C)$能观且$(\boldsymbol F,\boldsymbol L)$能控。对单输出系统,上述条件为充要条件

例题:

已知系统的动态方程为:
$$
\begin{cases}
\dot{x}_ 1=-2x_1+x_2+u\\\\
\dot x_2=x_1-3x_2+2u\\\\
y=x_1-x_2
\end{cases}
$$
当系统的状态不可直接量测时,设计极点位于$-6$处的最小维状态观测器。

  1. 取$\pmb F=-6$

  2. 待定矩阵$\pmb L$,满足$(\pmb F,\pmb L)$能控,要求$\pmb L\neq 0$

  3. 令$\pmb T=\begin{bmatrix}t_1&t_2\end{bmatrix}$ ,则待解得李雅普诺夫方程为
    $$
    \pmb {TA}-\pmb {FT}=\pmb {LC}
    $$

    $$
    \begin{bmatrix}
    t_1&t_2
    \end{bmatrix}
    \begin{bmatrix}
    -2&1\\\\1&-3
    \end{bmatrix}
    -(-6)
    \begin{bmatrix}
    t_1&t_2
    \end{bmatrix}=
    \pmb L\cdot
    \begin{bmatrix}
    1&-1
    \end{bmatrix}
    $$

    得:
    $$
    \begin{cases}
    -2t_1+t_2+6t_1=L\\\\
    t_1-3t_2+6t_2=-L
    \end{cases}
    \Rightarrow
    \begin{cases}
    4t_1+t_2=L\\\\
    t_1+3t_2=-L
    \end{cases}
    $$
    取$L=11$,则$T=\begin{bmatrix}4&-5\end{bmatrix}$

    合在一起,即可得到状态观测器:
    $$
    \dot z=-6z-6u+11y\\\\
    \hat{\pmb x}=\begin{bmatrix}-1\\\\-1\end{bmatrix}z+\begin{bmatrix}5\\\\4\end{bmatrix}y
    $$

7.6. 作业复习

7.6.1. 判断能否利用状态反馈向量指定闭环系统的特征值

如动态方程:
$$
\dot {\pmb x}=\begin{bmatrix}2&1&0&0\\\\0&2&0&0\\\\0&0&-1&0\\\\0&0&0&-1\end{bmatrix}\pmb x+\begin{bmatrix}0\\\\1\\\\1\\\\1\end{bmatrix}u
$$
其能控性矩阵为:
$$
\pmb M_c=\begin{bmatrix}
0&1&4&12\\\\1&2&4&8\\\\1&-1&1&-1\\\\1&-1&1&-1
\end{bmatrix}
$$
可以看出$\mathrm {rank}\pmb M_c=3<4$,系统不完全能控,取变换矩阵
$$
\pmb Q=\begin{bmatrix}
0&1&4&0\\\\1&2&4&0\\\\1&-1&1&0\\\\1&-1&1&1
\end{bmatrix}
$$
做线性变换得到:
$$
\dot{\overline {\pmb x}}=\begin{bmatrix}
0&0&-4&0\\\\1&0&0&0\\\\0&1&3&0\\\\0&0&0&-1
\end{bmatrix}\overline{\pmb x}+\begin{bmatrix}1\\\\0\\\\0\\\\0\end{bmatrix}u
$$
其中,不能控部分特征值为$-1$则系统极点中必然含有$-1$

**结论:**系统不能控部分完全属于期望闭环特征值,则必存在状态反馈行向量$\pmb k$实现指定期望极点配置

7.6.2. 求指定特征值的全维观测器

对于系统:
$$
\begin{cases}
\dot{\boldsymbol x}=\boldsymbol {Ax}+\boldsymbol {Bu}\\\\
\boldsymbol y=\boldsymbol {Cx}
\end{cases}
$$
其全维观测器表达式为:
$$
\dot{\hat{\pmb x}}=(\pmb A-\pmb {LC})\pmb x+\pmb {Bu}+\pmb {Ly}
$$
方法一:待定系数法

  1. 判断能观性
  2. 设$\pmb L=\begin{bmatrix}l_1&l_2&\cdots&l_n\end{bmatrix}^T$ ,代入$\pmb A-\pmb {LC}$
  3. 求特征多项式$f(\lambda)=\det (\lambda\pmb I-\pmb A+\pmb {LC})$
  4. 将期望特征值代入求解出$\pmb L$

方法二:构造法

$(\pmb A-\pmb {LC})^T$类比$\pmb A-\pmb {bk}$ ,使用极点配置公式

  1. 判断能观性
  2. 求$\pmb A^T$的特征多项式$f_A(\lambda)$
  3. 目标多项式$f_\lambda$
  4. $\pmb k_1=\overline{\pmb \alpha}-\pmb\alpha$,$\overline{\pmb M}_ c$,$\overline{\pmb M}_ {cc}$为系统${\pmb A^T,\pmb C^T}$的能控性矩阵和能控标准型的能控性矩阵
  5. $\pmb k=\pmb L^T=\pmb k_1\pmb P=\pmb k_1\pmb M_ {cc}\pmb M_c^{-1}$

7.6.3. 求特定特征值的降维观测器

方法一:龙伯格观测器

方法二:李雅普诺夫方法求降维观测器

7.6.4. 求指定状态反馈向量下,传递函数的实现

传递函数因状态反馈的变化如下:
$$
g(s)\Rightarrow \overline g(s)
$$

  1. 由$g(s)$和$\overline g(s)$的特征多项式(分母部分多项式)可得$\pmb \alpha$和$\overline{\pmb \alpha}$,$\pmb k_1=\overline{\pmb \alpha}-\pmb \alpha$
  2. 设$\pmb k$为指定的状态反馈向量,选取一个变换矩阵,满足$\pmb k=\pmb k_1\pmb P$ ,$\pmb P$可能有无穷多组
  3. 找到$g(s)$的一组实现${\pmb A,\pmb B,\pmb C}$,作线性变换$\overline{\pmb A}=\pmb {PAP}^{-1}$,$\overline{\pmb B}=\pmb {PB}$,$\overline{\pmb C}=\pmb {CP}^{-1}$ ,得到的${\overline{\pmb A},\overline{\pmb B},\overline{\pmb C} }$即为所求

7.6.5. 证明降维状态观测器仍具有分离特性

分离特性可以理解为特征值具有分离性:状态观测器的引入,不影响状态反馈配置的系统特征值;状态反馈的引入,不影响状态观测器的特征值

证明:

令$\pmb P=\begin{bmatrix}c\\\\\pmb P_ {n-r}\end{bmatrix}$,$\pmb Q=\pmb P^{-1}=\begin{bmatrix}\pmb Q_r&\pmb Q_ {n-r}\end{bmatrix}$ ,$\overline{ \pmb A}=\pmb {PAQ}$,$\overline{\pmb b}=\pmb {Pb}$,$\overline{\pmb c}=\pmb {cQ}$,$\overline{\pmb x}=\pmb {Px}$,


$$
\dot{\overline{\pmb x}}=\begin{bmatrix}\dot{\overline{\pmb x}}_ a\\\\\dot{\overline{\pmb x}}_ b \end{bmatrix}=\overline{\pmb A}\begin{bmatrix}\overline{\pmb x}_ a\\\\\overline{\pmb x}_ b \end{bmatrix}+\begin{bmatrix}\overline{\pmb B}_ a\\\\\overline{\pmb B}_ b \end{bmatrix}u
$$
状态反馈:
$$
u=r-\pmb {k}\hat{\pmb x}=r-\pmb {kQ}\hat{\overline{\pmb x}}=r-\pmb {kQ}_ r\hat{\overline{\pmb x}}_ a-\pmb {kQ}_ {n-r}\hat{\overline{\pmb x}}_ b=r-\pmb {kQ}_ r\overline{\pmb x}_ a-\pmb {kQ}_ {n-r}\hat{\overline{\pmb x}}_ b
$$

则有:
$$
\begin{align}
\dot{\overline{\pmb x}}_ a&=\overline{\pmb A}_ {aa}\overline{\pmb x}_ a+\overline{\pmb A}_ {ab}\overline{\pmb x}_ b+\overline{\pmb B}_ au=(\overline{\pmb A}_ {aa}-\overline{\pmb B}_ a\pmb {kQ}_ r)\overline{\pmb x}_ a+\overline{\pmb A}_ {ab}\overline{\pmb x}_ b-\overline{\pmb B}_ a\pmb {kQ}_ {n-r}\hat{\overline{\pmb x}}_ b+\overline{\pmb B}_ ar\\\\
\dot{\overline{\pmb x}}_ b&=\overline{\pmb A}_ {ba}\overline{\pmb x}_ a+\overline{\pmb A}_ {bb}\overline{\pmb x}_ b+\overline{\pmb B}_ bu=(\overline{\pmb A}_ {ba}-\overline{\pmb B}_ b\pmb {kQ}_ r)\overline{\pmb x}_ a+\overline{\pmb A}_ {bb}\overline{\pmb x}_ b-\overline{\pmb B}_ b\pmb {kQ}_ {n-r}\hat{\overline{\pmb x}}_ b+\overline{\pmb B}_ br\\\\
\dot{\overline{\pmb x}}&=\overline{\pmb A}\overline{\pmb x}+\overline{\pmb B}u=\overline{\pmb A}\overline{\pmb x}-\overline{\pmb B}\pmb {kQ}\hat{\overline{\pmb x}}+\overline{\pmb B}r=\overline{\pmb A}\overline{\pmb x}-\overline{\pmb B}\pmb {kQ}\hat{\overline{\pmb x}}+\overline{\pmb B}r-\overline{\pmb B}\pmb {kQ}\overline{\pmb x}+\overline{\pmb B}\pmb {kQ}\overline{\pmb x}\\\\
&=(\overline{\pmb A}-\overline{\pmb B}\pmb {kQ})\overline{\pmb x}+\overline{\pmb B}\pmb {kQ}(\overline{\pmb x}-\hat{\overline{\pmb x}})+\overline{\pmb B}r
\end{align}
$$

令$\tilde {\overline{\pmb x}}_ b=\overline{\pmb x}_ b-\hat{\overline{\pmb x}}_ b$,则$\overline{\pmb x}-\hat{\overline{\pmb x}}=\begin{bmatrix}\pmb 0_r\\\\\tilde{\overline{\pmb x}}_ b\end{bmatrix}$ ,

于是

$$
\dot{\overline{\pmb x}}=(\overline{\pmb A}-\overline{\pmb B}\pmb {kQ})\overline{\pmb x}+\overline{\pmb B}\pmb {kQ}_ {n-r}\hat{\overline{\pmb x}}_ b+\overline{\pmb B}r
$$

由于

$$
\begin{align}
\dot{\hat{\overline{\pmb x}}}&=(\overline{\pmb A}_ {bb}-\pmb L\overline{\pmb A}_ {ab})\hat{\overline{\pmb x}}_ b+\pmb {Ly}_ b+\begin{bmatrix}\overline{\pmb A}_ {ba}&\overline{\pmb B}_ b \end{bmatrix}\begin{bmatrix}\overline{\pmb x}_ a\\\\u \end{bmatrix}\\\\
&=(\overline{\pmb A}_ {ba}-\overline{\pmb B}_ {b}\pmb {kQ}_ r)\hat{\overline{\pmb x}}_ a+\pmb {L}\overline{\pmb A}_ {ab}\overline{\pmb x}_ b+(\overline{\pmb A}_ {bb}-\pmb L\overline{\pmb A}_ {ab}-\overline{\pmb B}_ b\pmb {kQ}_ {n-r})\hat{\overline{\pmb x}}_ b+\overline{\pmb B}_ br
\end{align}
$$

故$\dot{\tilde{\overline{\pmb x}}}_ b=\dot{\overline {\pmb x}}_ b-\dot{\hat{\overline{\pmb x}}}_ b=(\overline{\pmb A}_ {bb}-\pmb L\overline{\pmb A}_ {ab})\tilde{\overline{\pmb x}}_ b$

于是

$$
\begin{bmatrix}
\dot{\overline{\pmb x}}\\\\\dot{\tilde{\overline{\pmb x}}}_ b
\end{bmatrix}_ {(2n-r)\times 1}=
\begin{bmatrix}
\overline{\pmb A}-\overline{\pmb B}\pmb {kQ}&\overline{\pmb B}\pmb {kQ}_ {n-r}\\\\
\pmb 0_ {(n-r)\times n}&\overline{\pmb A}_ {bb}-\pmb L\overline{\pmb A}_ {ab}
\end{bmatrix}
\begin{bmatrix}
\overline{\pmb x}\\\\\tilde{\overline{\pmb x}}_ b
\end{bmatrix}+
\begin{bmatrix}
\overline{\pmb B}\\\\\pmb 0_ {(n-r)\times r}
\end{bmatrix}r
$$

故状态反馈参数设计和观测器参数设计可以分别独立完成,具有分离特性

8. 最优性原理与动态规划

8.1. 最优控制问题的描述

8.1.1. 性能指标类型

末值型性能指标——迈耶尔问题
$$
J=\varphi[\pmb x(t_f).t_f]
$$
积分型性能指标——拉格朗日问题
$$
J=\int_ {t_0}^{t_f}L[\pmb x(t),\pmb u(t),t]\mathrm dt
$$
**复合型性能指标——波尔扎问题**
$$
J={\varphi}[\pmb x(t_f),t_f]+\int_ {t_0}^{t_f}L[\pmb x(t_f),\pmb u(t),t]\mathrm dt
$$

8.1.2. 连续最优控制问题的提法

运动方程(系统的数学模型)——微分方程或差分方程
$$
\dot{\pmb x}(t)=\pmb f[\pmb x(t),\pmb u(t),t]
$$
边界条件(初始条件和目标)——目标集多是等式约束
$$
\begin{matrix}
\pmb x(t_0)=\pmb x_0&\psi[\pmb x(t_f),t_f]=\pmb 0
\end{matrix}
$$
控制约束(容许控制)——通常是不等式约束
$$
\pmb g[\pmb x(t),\pmb u(t),t]\geq \pmb 0
$$
性能指标(最优的含义)——一般含有末值项和过程项

8.1.3. 离散最优控制问题

运动方程 (系统的数学模型) ——微分方程或差分方程
$$
\pmb x[k+1]=\pmb f(\pmb x[k],\pmb u[k],k)
$$
边界条件 (初始条件和目标) ——目标集多是等式约束
$$
\pmb x[k_0]=\pmb x_0,\ \psi(\pmb x[k_f],k_f)=\pmb 0
$$
控制约束 (容许控制) ——通常是不等式约束
$$
\pmb g(\pmb x[k],\pmb u[k],k)\geq \pmb 0
$$
性能指标 (最优的含义) ——一般含有末值项和过程项
$$
J=\varphi(\pmb x[k_f],k_f)+\sum\limits_ {k=0}^{k_f-1}L(\pmb x[k],\pmb u[k],k)
$$

8.1.4. 最常见的最优控制

最少时间控制
$$
J=\int_ {t_0}^{t_f}\mathrm dt=t_f-t_0
$$
**最少燃料控制**
$$
J=\int_ {t_0}^{t_f}\sum\limits_ {j=1}^m|u_j(t)|\mathrm dt
$$
**最少能量控制**
$$
J=\int_ {t_0}^{t_f}\pmb u^T(t)\pmb u(t)\mathrm dt
$$

8.2. 多级决策问题

8.2.1. 最优性原理

不论初始状态和初始决策如何,当把其中的任何一级及其状态再作为初始状态时,其余的决策对此必定也是一个最优策略

8.2.2. 动态规划求解过程

阶段4

image-20200602091437682

$$
f_4(D_1)=d(D_1\rightarrow E)+f_5(E)=5+0=5\\\\
f_4(D_2)=d(D_2\rightarrow E)+f_5(E)=2+0=2
$$

状态集合$S_4={D_1,D_2}$,决策集合$X_4={E}$,转移方程$f_4(s)=d(s,x)+f_5^\ast(x)$ ,

$s$ $f_4(s)(x=E)$ $f_4^\ast (s)$ $x^\ast$
$D_1$ $5+0=5$ $5$ $E$
$D_2$ $2+0=2$ $2$ $E$

阶段3

image-20200602102251614

$$
\begin{align}
f_3(C_1)&=
\min\Bigg\}\begin{matrix}d(C_1,D_1)+f_4(D_1)\\\\
d(C_1,D_2)+f_4(D_2) \end{matrix}\Bigg\}\\\\
&=\min\Bigg\{\begin{matrix}3+5
\\\\
9+2
\end{matrix}
\Bigg\}=
\min\Bigg\{
\begin{matrix}8\\\\
11\end{matrix}
\Bigg\}=8
\end{align}
$$

最优决策$C_1\rightarrow D_1$

image-20200602102351969

$$
\begin{align}
f_3(C_2)&=\min\Bigg\{\begin{matrix}d(C_2,D_1)+f_4(D_1)\\\\d(C_2,D_2)+f_4(D_2) \end{matrix}\Bigg\}\\\\
&=\min\Bigg\{\begin{matrix}6+5\\\\5+2\end{matrix} \Bigg\}=\min\Bigg\}\begin{matrix}11\\\\7\end{matrix}
\Bigg\}=7
\end{align}
$$

最优决策$C_2\rightarrow D_2$

$$
\begin{align}
f_3(C_3)&=\min\Bigg\{\begin{matrix}d(C_3,D_1)+f_4(D_1)\\\\d(C_3,D_2)+f_4(D_2) \end{matrix}\Bigg\}\\\\
&=\min\Bigg\{\begin{matrix}8+5\\\\10+2\end{matrix} \Bigg\}=\min\Bigg\{\begin{matrix}13\\\\12\end{matrix} \Bigg\}=12
\end{align}
$$

最优决策:$C_3\rightarrow D_2$

状态集合$S_3={C_1,C_2,C_3}$,决策集合$X_3={D_1,D_2}$,转移方程$f_3(s)=d(x,s)+f^\ast_4(s)$

$s$ $f_3(s)(x=D_1)$ $f_3(s)(x=D_2)$ $f_3^\ast(s)$ $x^\ast$
$C_1$ $3+5=8$ $9+2=11$ $8$ $D_1$
$C_2$ $6+5=11$ $5+2=7$ $7$ $D_2$
$C_3$ $8+5=13$ $10+2=12$ $12$ $D_2$

阶段2

image-20200602104540275

$$
f_2(B_1)=\min \left\{\begin{matrix}d(B_1,C_1)+f_3(C_1)\\\\d(B_1,C_2)+f_3(C_2)\\\\d(B_1,C_3)+f_3(C_3)\end{matrix} \right\}=\min\left\{\begin{matrix}12+8\\\\14+7\\\\10+12\end{matrix}\right\}=\min\left\{\begin{matrix}20\\\\21\\\\22\end{matrix}\right\}=20
$$

最优决策$B_1\rightarrow C_1$

image-20200602105310927

$$
f_2(B_2)=\min \left\{\begin{matrix}d(B_2,C_1)+f_3(C_1)\\\\d(B_2,C_2)+f_3(C_2)\\\\d(B_2,C_3)+f_3(C_3)\end{matrix} \right\}=\min\left\{\begin{matrix}6+8\\\\10+7\\\\4+12\end{matrix}\right\}=\min\left\{\begin{matrix}14\\\\17\\\\16\end{matrix}\right\}=14
$$

最优决策$B_2\rightarrow C_1$

image-20200602105639159

$$
f_2(B_3)=\min \left\{\begin{matrix}d(B_3,C_1)+f_3(C_1)\\\\d(B_3,C_2)+f_3(C_2)\\\\d(B_3,C_3)+f_3(C_3)\end{matrix} \right\}=\min\left\{\begin{matrix}13+8\\\\12+7\\\\11+12\end{matrix}\right\}=\min\left\{\begin{matrix}21\\\\19\\\\23\end{matrix}\right\}=19
$$

最优决策:$B_3\rightarrow C_2$

状态变量$S_2={B_1,B_2,B_3}$,决策变量$X_2={C_1,C_2,C_3}$,转移方程$f_2(s)=d(s,x)+f_3^\ast(s)$

$s$ $f_2(s)(x=C_1)$ $f_2(s)(x=C_2)$ $f_2(s)(x=C_3)$ $f^\ast_2(s)$ $x^\ast$
$B_1$ $12+8=20$ $14+7=21$ $10+12=22$ $20$ $C_1$
$B_2$ $6+8=14$ $10+7=17$ $4+12=16$ $14$ $C_1$
$B_3$ $13+8=21$ $12+7=19$ $11+12=23$ $19$ $C_2 $

阶段1

image-20200602110511910
$$
f_1(A)=\min\left\{\begin{matrix}d(A,B_1)+f_2(B_1)\\\\d(A,B_2)+f_2(B_2)\\\\d(A,B_3)+f_2(B_3) \end{matrix} \right\}=\min\left\{\begin{matrix}2+20\\\\5+14\\\\1+19\end{matrix} \right\}=\min\left\{\begin{matrix}22\\\\19\\\\20\end{matrix} \right\}=19
$$
最优决策$A\rightarrow B_2$

状态变量$S_1={A}$,决策变量$X_1={B_1,B_2,B_3}$,转移方程$f_1(s)=d(s,x)+f_2^\ast(s)$

$s$ $f_1(s)(x=B_1)$ $f_1(s)(x=B_2)$ $f_1(s)(x=B_3)$ $f_1^\ast(s)$ $x^\ast$
$A$ $2+20=22$ $5+14=19$ $1+19=20$ $19$ $B_2$

回溯得到最优路径:$A\rightarrow B_2\rightarrow C_1\rightarrow D_1\rightarrow E$

8.2.3. 离散时间动态规划例题

已知离散系统方程
$$
x(k+1)=2x(k)+u(k),\ \ \ \ x(0)=1
$$
代价函数
$$
J=x^3(3)+\sum\limits_ {k=0}^2[x^2(k)+u^2(k)]
$$
式子中状态$x(k)$及控制$u(k)$均不受约束,求最优控制序列${u^\ast(0),u^\ast(1),u^\ast(2)}$使得代价函数极小

解:

  1. 第三阶段
    $$
    \begin{align}
    J_2^\ast[x(2)]&=\min\limits_ {u(2)}{[x^2(2)+u^2(2) ]+J_3^\ast[x(3)] }\\\\
    J_3^\ast[x(3)]&=x^2(3)=[2x(2)+u(2)]^2
    \end{align}
    $$
    所以
    $$
    J_2^\ast[x(2)]=\min\limits_ {u(2)}{x^2(2)+u^2(2)+[2x(2)+u(2)]^2 }
    $$
    由于$u(k)$无约束,故令
    $$
    \frac{\partial {\cdot}}{\partial u(2)}=2u(2)+2[2x(2)+u(2)]=0
    $$
    求得:
    $$
    u^\ast(2)=-x(2)
    $$
    代入$J^\ast_2[x(2)]$方程得:
    $$
    J_2^\ast[x(2)]=3x^2(2)
    $$

  2. 第二阶段
    $$
    \begin{align}
    J_1^\ast[x(1)]&=\min\limits_ {u(1)} {x^2(1)+u^2(1)+J_2^\ast[x(2)] }\\\\
    &=\min\limits_ {u(1)}{x^2(1)+u^2(1)+3[2x(1)+u(1)]^2 }
    \end{align}
    $$
    解得
    $$
    u^\ast(1)=-\frac{3}{2}x(1)\\\\
    J^\ast_1[x(1)]=4x^2(1)
    $$

  3. 第一阶段
    $$
    \begin{align}
    J^\ast_0[x(0)]&=\min\limits_ {u(0)}{x^2(0)+u^2(0)+J^\ast_1[x(1)] }\\\\
    &=\min\limits_ {u(0)}{x^2(0)+u^2(0)+4[2x(0)+u(0)]^2 }
    \end{align}
    $$
    解得
    $$
    u^\ast(0)=-\frac{8}{5}x(0)\\\\
    J^\ast_0[x(0)]=\frac{21}{5}x(0)
    $$
    代入已知的$x(0)=1$,解得
    $$
    \begin{matrix}
    u^\ast(0)=-\frac{8}{5}&x^\ast(1)=2x(0)+u^\ast(0)=\frac{2}{5}&J^\ast_0[x(0)]=\frac{21}{5}\\\\
    u^\ast(1)=-\frac{3}{5}&x^\ast(2)=2x(1)+u^\ast(1)=\frac{1}{5}&J^\ast_0[x(0)]=\frac{16}{25}\\\\
    u^\ast(1)=-\frac{1}{5}&x^\ast(2)=2x(1)+u^\ast(1)=\frac{1}{5}&J^\ast_0[x(0)]=\frac{3}{25}
    \end{matrix}
    $$

9. 极小值原理

9.1. 静态最优化问题及解

9.1.1. 一元函数的极值

设$J=f(u)\rightarrow [a,b]$上的单值连续可微函数,则

  1. $f'(u)\Big|_ {u=u^\ast}=0\&f''(u)\Big|_ {u=u^\ast}>0\Leftrightarrow f(u)在u=u^\ast处取极小值$
  2. $f'(u)\Big|_ {u=u^\ast}=0\&f''(u)\Big|_ {u=u^\ast}<0\Leftrightarrow f(u)在u=u^\ast处取极大值$

最小(大)值:$[a,b]$上极小(大)值中的最小(大)值
$$
J^\ast=f(u^\ast)=\min_ {u\in[a,b]}[f(u)]
$$

9.1.2. 多元函数的极值

设:$J=f(\pmb u),\pmb u=\begin{bmatrix}u_1&u_2&\cdots&u_n\end{bmatrix}^T$,则$J$取极值的必要条件与充分条件分别是

  1. 必要条件
    $$
    \frac{\partial f}{\partial \pmb u}\Bigg|_ {\pmb u=\pmb u^\ast}=\pmb 0
    $$

  2. 充分条件
    $$
    \frac{\partial f}{\partial \pmb u}\Bigg|_ {\pmb u=\pmb u^\ast}=\pmb 0\ \ \& \ \ \frac{\partial^2 f}{\partial \pmb u\partial \pmb u^T}\Bigg|_ {\pmb u=\pmb u^\ast}>0
    $$

9.1.3. 具有等式约束的条件极值

设连续可微的目标泛函:
$$
J=f(\pmb x,\pmb u)
$$
等式约束条件:
$$
\pmb g(\pmb x,\pmb u)=\pmb 0
$$

*例:*用一定面积的铁皮作圆柱形罐头盒,要求罐头盒容积为最大。设铁皮总面积为$A$,罐头盒高度为$l$,半径为$r$,则

  • 目标函数:$J=v(r,l)=\pi r^2l$
  • 等式约束:$g(r,l)=(2\pi r^2+2\pi rl)-A=0$

嵌入法(消元法)

从约束条件等式中解出某些变量,使问题变为无约束的极值问题

例:
$$
\begin{matrix}
J=v(r,l)=\pi r^2l&g(r,l)=(2\pi r^2+2\pi rl)-A=0
\end{matrix}
$$

$$
l=\frac{A-2\pi r^2}{2\pi r}\Rightarrow J=v(r)=\frac{rA}{2}-\pi r^3\\\\
\frac{\mathrm dJ}{\mathrm dr}=0\Rightarrow \begin{matrix}r^\ast=\sqrt{\frac{A}{6\pi}},&l^\ast=\sqrt{\frac{2A}{3\pi}}=2r,&J^\ast=\frac{\sqrt{6}}{18}A^{2/3}=2\pi r^3\end{matrix}
$$

因$\frac{\mathrm d^2 v(r)}{\mathrm dr}=-6\pi r<0$,故本极值问题为极大值

拉格朗日乘子法(增元法)

将约束条件式乘以乘子$\lambda$,与目标函数试相加,构成一个新的泛函,使问题变为无约束的极值问题

拉格朗日乘子法的一般形式

设连续可微的目标泛函:
$$
J=f(\pmb x.\pmb u)
$$
等式约束条件:
$$
\pmb g(\pmb x,\pmb u)=0
$$
构造拉格朗日函数:
$$
H=J+\lambda^T\pmb g(\pmb x,\pmb u)=f(\pmb x,\pmb u)+\lambda^T\pmb g(\pmb x,\pmb u)
$$
式子中$\lambda$为乘子矢量,与$\pmb g$同维列向量

求导:
$$
\begin{cases}
\frac{\partial H}{\partial \pmb x}=\pmb 0\\\\
\frac{\partial H}{\partial \pmb u}=\pmb 0\\\\
\frac{\partial H}{\partial \pmb \lambda}=\pmb 0
\end{cases}\Rightarrow \begin{cases}\frac{\partial f}{\partial \pmb x}+\Big(\frac{\partial \pmb g}{\partial \pmb x}\Big)^T\pmb \lambda=\pmb 0\\\\
\frac{\partial f}{\partial \pmb u}+\Big(\frac{\partial \pmb g}{\partial \pmb u}\Big)^T\pmb \lambda=\pmb 0\\\\
\pmb g(\pmb x,\pmb u)=\pmb 0
\end{cases}
$$

其中,
$$
\Big(\frac{\partial \pmb g}{\partial \pmb x}\Big)^T=\begin{bmatrix}\frac{\partial g_1}{\partial \pmb x}&\cdots&\frac{\partial g_n}{\partial \pmb x} \end{bmatrix}=\begin{bmatrix}
\frac{\partial g_1}{\partial x_1}&\cdots&\frac{\partial g_n}{\partial x_1}\\\\
\vdots&\ddots&\vdots\\\\
\frac{\partial g_1}{\partial x_n}&\cdots&\frac{\partial g_n}{\partial x_n}
\end{bmatrix}
$$

9.2. 泛函极值与变分法

9.2.1. 泛函基础

距离空间与距离

非空$X$称为是距离空间是指:$\forall \pmb x,\pmb y\in X$,存在实值泛函$d(\pmb x,\pmb y)$满足:

  1. $d(\pmb x,\pmb y)\geq 0$,$\forall \pmb x,\pmb y\in X$;$d(\pmb x,\pmb y)=0\Leftrightarrow \pmb x=\pmb y$
  2. $d(\pmb x,\pmb y)=d(\pmb y,\pmb x)$
  3. $d(\pmb x,\pmb y)\leq d(\pmb x,\pmb z)+d(\pmb z,\pmb y)$

式中,$d(\pmb x,\pmb y)$称为是距离空间$X$上的距离,$d(\pmb x,\pmb y)=|\pmb x-\pmb y|$

泛函的极值(自变量为函数)

若泛函$J$在任何一条与$\pmb y(\pmb x)$接近的曲线上都有:


$$
\Delta \pmb J=\pmb J[\pmb y(\pmb x)]-\pmb J(\pmb y_0(\pmb x))\geq 0
$$

则称$\pmb J$在$\pmb y_0(\pmb x)$上达到极小值


$$
\Delta \pmb J=\pmb J[\pmb y(\pmb x)]-\pmb J(\pmb y_0(\pmb x))\leq 0
$$

则称$\pmb J$在$\pmb y_0(\pmb x)$上达到极大值

9.2.2. 变分法的基本概念

变分问题与变分法

求泛函的极值问题称为变分问题,其方法为变分法

泛函的变分

设泛函$J[y(x)]$则其增量:
$$
\begin{align}
\Delta J&=J[y(x)+\Delta y(x)]-J[y(x)]\\\\
&=L[y(x),\Delta y(x)]+R[y(x),\Delta y(x)]
\end{align}
$$
$L[y(x),\Delta y(x)]$为$\Delta y(x)$的线性连续函数,$R[y(x),\Delta y(x)]$为$\Delta y(x)$的高阶无穷小项
$$
\begin{align}
\Delta J(\Delta y_1(x))&=J[y(x)+\Delta y_1(x)]-J[y(x)]\\\\
&=L[y(x),\Delta y_1(x)]+R[y(x),\Delta y_1(x)]
\end{align}
$$

$$
\begin{align}
\Delta J(\Delta y_2(x))&=J[y(x)+\Delta y_2(x)]-J[y(x)]\\\\
&=L[y(x),\Delta y_2(x)]+R[y(x),\Delta y_1(x)]
\end{align}
$$

$$
\begin{align}
\Delta J[\alpha_1\Delta y_1(x)+\alpha_2\Delta y_2(x)]=J[y(x)+\alpha_1\Delta y_1(x)+\alpha_2\Delta y_2(x)]-J[y(x)]\\\\
=L[y(x),\alpha_1\Delta y_1(x)+\alpha_2\Delta y_2(x)]-J[y(x)]+R[y(x),\alpha_1\Delta y_1(x)+\alpha_2\Delta y_2(x)]-J[y(x)]
\end{align}
$$

$$
L[y(x),\alpha_1\Delta y_1(x)+\alpha_2\Delta y_2(x)]-J[y(x)]\\\\
=\alpha_1L[y(x),\Delta y_1(x)]+\alpha_2L[y(x),\Delta y_2(x)]
$$

泛函的一阶变分为:
$$
\delta J=L[y(x),\delta y(x)]
$$

泛函变分的计算

  1. 利用定义式计算

    $$
    \begin{align}
    \Delta J&=J[y(x)+\delta y(x)]-J[y(x)]\\\\
    &=L[y(x),\delta y(x)]+R[y(x),\delta y(x)]\\\\
    &=\delta J+R[y(x),\delta y(x)]
    \end{align}
    $$

    例: $J[x]=\int_0^1x^2(t)\mathrm dt$

    $$
    \begin{align}
    \Delta J[x]&=\int_0^1[x(t)+\Delta x]^2\mathrm dt-\int_0^1x^2(t)\mathrm dt\\\\
    &=\int_0^12x(t)\Delta x\mathrm dt+\int_0^1[\Delta x]^2\mathrm dt\\\\
    \therefore \delta J&=\int_0^1 2x(t)\delta x\mathrm dt
    \end{align}
    $$

  2. 利用下式计算
    $$
    \delta J=\frac{\partial }{\partial a}J[y(x)+a\delta y(x)]\Big|_ {a=0}
    $$
    *证明:*
    $$
    \begin{align}
    \Delta J&=J[y(x)+a\delta y(x)]-J[y(x)]\\\\
    &=L[y(x),a\delta y(x)]+R[y(x),a\delta y(x)]
    \end{align}
    $$
    $L$项为$a\delta y(x)$的线性连续函数,$R$项为$a\delta y(x)$的高阶无穷小项
    $$
    \begin{align}
    &\therefore L[y(x),a\delta y(x)]=aL[y(x),\delta y(x)]\\\\
    &\therefore \lim_ {a\rightarrow 0}\frac{R[y(x),a\delta y(x)]}{a}=0\\\\
    &\therefore \frac{\partial }{\partial a}J[y(x)+a\delta y(x)]\Big|_ {a=0}=\lim_ {a\rightarrow 0}\frac{J[y(x)+a\delta y(x)]-J[y(x)]}{a}\\\\
    &=\lim_ {a\rightarrow 0}\frac{L[y(x),a\delta y(x)]+R[y(x),a\delta y(x)]}{a}
    =L[y(x),a\delta y(x)]=\delta J
    \end{align}
    $$
    *例:* $J =\int_0^1x^2(t)\mathrm dt$
    $$
    \begin{align}
    \delta J&=\frac{\partial }{\partial a}\int_0^1[x(t)+a\delta x(t)]^2\mathrm dt\Big|_ {a=0}\\\\
    &=\int_0^1\frac{\partial }{\partial a}[x(t)+a\delta x(t)]^2\mathrm dt\Big|_ {a=0}\\\\
    &=\int_0^1\frac{\partial}{\partial a}[x^2(t)+2a\delta x^2(t)+a^2\delta^2x^2(t)]\mathrm dt\Big|_ {a=0}\\\\
    &=\int_0^12x(t)\delta x\mathrm d t
    \end{align}
    $$

泛函的极值

可微泛函$J[y(x)]$在$y_0(x)$上达到极值的必要条件:
$$
\delta J=\delta J(\delta y)=0,\forall \delta y
$$
极小值:$\Delta J=J[y(x)]-J[y_0(x)]\geq 0$

极大值:$\Delta J=J[y(x)]-J[y_0(x)]\leq 0$

多元泛函的极值

设多元泛函为$J[y_1(x),y_2(x),\cdots,y_n(x)]$,则同样取极值的必要条件为:$\delta J=0$

多元泛函的变分
$$
\delta J=\frac{\partial}{\partial a}J[y_1+a\delta y_1,y_2+a\delta y_2,\cdots,y_n+a\delta y_n]\Big|_ {a=0}=\sum \delta J_ {y_i}
$$

9.2.3. 欧拉方程——泛函极值的必要条件

设泛函
$$
J(x)=\int_ {t_0}^{t_f}L[x(t),\dot x(t)]\mathrm d t
$$
在$[t_0,t_f]$上$L[x,\dot x,t]$二次连续可微

求极值轨线:$x^\ast(t)\Rightarrow J=\min$

极值的必要条件:$\delta J=0$

即泛函的一阶变分:
$$
\delta J=\int^{t_f}_ {t_0}\Big[\Big(\frac{\partial L}{\partial x}\Big)\delta x+\Big(\frac{\partial L}{\partial \dot x}\Big)\delta \dot x\Big]\mathrm dt=0
$$
其中,
$$
\int^{t_f}_ {t_0}\Big(\frac{\partial L}{\partial \dot x}\Big)\delta \dot x\mathrm dt=\Big(\frac{\partial L}{\partial \dot x}\Big)\delta x\Big|^{t_f}_ {t_0}-\int^{t_f}_ {t_0}\Big(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x}\Big)\delta x\mathrm dt
$$

$$
\delta J=\Big(\frac{\partial L}{\partial \dot x}\Big)\delta x\Big|^{t_f}_ {t_0}+\int^{t_f}_ {t_0}\Big(\frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x}\Big)\delta x\mathrm dt=0
$$
$x(t)$不受约束,$\delta x$任意,故泛函$J$取极值的必要条件为:

  1. 欧拉方程
    $$
    \frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x}=0
    $$

    其中,
    $$
    \begin{align}
    &\because L=L(x,\dot{x},t)\\\\
    &\therefore \frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x}\\\\&=\frac{\partial }{\partial \dot x}\Big(\frac{\partial L}{\partial \dot x}\Big)\frac{\mathrm d\dot x}{\mathrm dt}+\frac{\partial }{\partial x}\Big(\frac{\partial L}{\partial \dot x}\Big)\frac{\mathrm d x}{\mathrm dt}+\frac{\partial }{\partial t}\Big(\frac{\partial L}{\partial \dot x}\Big)\frac{\mathrm dt}{\mathrm dt}\\\\
    &=\frac{\partial ^2 L}{\partial \dot x^2}\ddot x+\frac{\partial ^2 L}{\partial x\partial \dot x}\dot x+\frac{\partial^2L}{\partial t\partial \dot x}
    \end{align}
    $$

  2. 横截条件
    $$
    \Big(\frac{\partial L}{\partial \dot x}\Big)\delta x\Big|^{t_f}_ {t_0}=0
    $$
    展开上式得:
    $$
    \Big(\frac{\partial L}{\partial \dot x}\Big)\Bigg|_ {t_f}\delta x(t_f)-\Big(\frac{\partial L}{\partial \dot x}\Big)\Bigg|_ {t_0}\delta x(t_0)=0
    $$
    分两种情况:

    (1) 固定端点
    $$
    \begin{matrix}\delta x(t_f)=0&\delta x(t_0)=0 \end{matrix}\\\\
    \Rightarrow \begin{matrix}x(t_0)=x_0&x(t_f)=x_f \end{matrix}
    $$
    (2) 自由端点

    a. 始端自由
    $$
    \begin{matrix}\delta x(t_f)=0&\delta x(t_0)\neq 0\end{matrix}\\\\
    \Rightarrow \begin{matrix}\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_0}=0&x(t_f)=x_f\end{matrix}
    $$
    b. 终端自由
    $$
    \begin{matrix}\delta x(t_f)\neq0&\delta x(t_0)= 0\end{matrix}\\\\
    \Rightarrow \begin{matrix}\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_f}=0&x(t_0)=x_0\end{matrix}
    $$
    c. 两端自由
    $$
    \begin{matrix}\delta x(t_f)\neq0&\delta x(t_0)\neq 0\end{matrix}\\\\
    \Rightarrow \begin{matrix}\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_0}=0&\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_f}=0\end{matrix}
    $$

例题: 如图求平面上两固定点连线最短的曲线

image-20200603173927254

解:
$$
(\mathrm ds)^2=(\mathrm dx)^2+(\mathrm dt)^2\Rightarrow \mathrm ds=\sqrt{(\mathrm dx)^2+(\mathrm dt)^2}
$$

$$
L=\int\mathrm ds=\int_ {t_0}^{t_f}\sqrt{(\mathrm dx)^2+(\mathrm dt)^2}=\int_ {t_0}^{t_f}\sqrt{1+\dot x^2}\mathrm dt
$$

  1. 欧拉方程
    $$
    \begin{align}
    \frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x}=0\\\\
    \Rightarrow \frac{\partial L}{\partial \dot x}=\frac{\dot x}{\sqrt{1+\dot x^2}}=C
    \end{align}
    $$

    $$
    \therefore \dot x(t)=a\Rightarrow x(t)=at+b
    $$

    其中,$a$和$b$由边界条件确定。

  2. 边界条件

    固定端点
    $$
    \begin{matrix}\delta x(t_f)=0&\delta x(t_0)=0 \end{matrix}\\\\
    \Rightarrow \begin{matrix}x(t_0)=x_0&x(t_f)=x_f \end{matrix}
    $$
    image-20200603174957602 两端自由
    $$
    \begin{matrix}\delta x(t_f)\neq0&\delta x(t_0)\neq 0\end{matrix}\\\\
    \Rightarrow \begin{matrix}\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_0}=0&\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_f}=0\end{matrix}
    $$

$$
\begin{align}
\frac{\partial L}{\partial \dot x}\Bigg|_ {t_0}&=\frac{\dot x}{\sqrt{1+\dot x^2}}\Bigg|_ {t_0}=C=0\\\\
\dot x\Big|_ {t_0}&=0\Rightarrow x(t_0)=k\\\\
\dot x\Big|_ {t_f}&=0\Rightarrow x(t_f)=k
\end{align}
$$

image-20200603180120731

​ 始端自由
$$
\begin{matrix}\delta x(t_f)=0&\delta x(t_0)\neq 0\end{matrix}\\\\
\Rightarrow \begin{matrix}\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_0}=0&x(t_f)=x_f\end{matrix}
$$
image-20200603180221227

终端自由
$$
\begin{matrix}\delta x(t_f)\neq0&\delta x(t_0)= 0\end{matrix}\\\\
\Rightarrow \begin{matrix}\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_f}=0&x(t_0)=x_0\end{matrix}
$$
image-20200603180257498

9.2.4. 多元函数的极值条件

设泛函
$$
J(\pmb x)=\int_ {t_0}^{t_f}L[\pmb x(t),\dot {\pmb x}(t)]\mathrm d t
$$
在$[t_0,t_f]$上$L[\pmb x,\dot {\pmb x},t]$二次连续可微,且
$$
\begin{matrix}\pmb x(t_0)=\pmb x_0&\pmb x(t_f)=\pmb x_f &\pmb x\in R^n\end{matrix}
$$
求极值轨线$\pmb x^\ast(t)\Rightarrow J=\min$

  1. 欧拉方程
    $$
    \frac{\partial L}{\partial \pmb x}=\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot {\pmb x}}=0\rightarrow 向量形式
    $$
    其中,
    $$
    L=[x_1,x_2,\cdots,x_n;\dot x_1,\dot x_2,\cdots,\dot x_n;t]\\\\
    \pmb x=[x_1,x_2,\cdots,x_n]^T
    $$

  2. 横截条件
    $$
    \Big(\frac{\partial L}{\partial \dot x}\Big)\delta x\Big|^{t_f}_ {t_0}=0
    $$

9.2.5. 可变端点问题

设泛函
$$
J(x)=\int_ {t_0}^{t_f}L[x(t),\dot x(t)]\mathrm d t
$$
在$[t_0,t_f]$上$L[x,\dot x,t]$二次连续可微,已知
$$
x(t_0)=x_0(固定始端)
$$
终端$[t_f,x(t_f)]$可沿着靶线$C(t)$变动,且$C(t)$具有连续的一阶导数,求极值轨线$x^\ast(t)\Rightarrow J=\min$
$$
J(x)=\int^{t_f}_ {t_0}L[x(t),\dot x(t),t]\mathrm dt
$$
故泛函$J$取极值的必要条件:
$$
\delta J=\delta J_x+\delta J_ {\dot x}+\delta J_ {t_f}=0
$$
又有
$$
\begin{align}
\delta J_x+\delta J_ {\dot x}&=\Big(\frac{\partial L}{\partial \dot x}\Big)\delta x\Big|_ {t_0}^{t_f}+\int^{t_f}_ {t_0}\Big(\frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x} \Big)\delta x\mathrm dt\\\\
\delta J_ {t_f}&=L(x,\dot x,t)\Big|_ {t_f}\cdot \delta t_f
\end{align}
$$

$$
\delta J=\Big(\frac{\partial L}{\partial \dot x}\Big)\delta x\Big|_ {t_0}^{t_f}+\int^{t_f}_ {t_0}\Big(\frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x} \Big)\delta x\mathrm dt+L(x,\dot x,t)\Big|_ {t_f}\cdot \delta t_f=0
$$

  1. 欧拉问题
    $$
    \frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x}=0
    $$

  2. 横截条件

    固定始端:$x(t_0)=x_0$

    终端横截条件:
    $$
    \Big(\frac{\partial L}{\partial \dot x}\Big)\delta x\Big|^{t_f}_ {t_0}+L(x,\dot x,t)\Big|_ {t_f}\cdot \delta t_f=0
    $$
    展开得:
    $$
    \begin{align}
    &\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_f}\cdot \delta x(t_f)-\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_0}\cdot \delta x(t_0)+L(x,\dot x,t)\Big|_ {t_f}\cdot \delta t_f\\\\
    =&\Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_f}\cdot\delta x(t_f)+L(x,\dot x,t)\Big|_ {t_f}\cdot\delta t_f=0
    \end{align}
    $$
    其中,各个量得几何关系表示如下:


    $$
    \begin{align}
    \delta x(t_f)&\approx \delta x_f-\dot x(t_f)\delta t_f\\\\
    &\approx \dot C(t_f)\delta t-\dot x(t_f)\delta t_f
    \end{align}
    $$
    即:
    $$
    \Big\{L+[\dot C(t)-\dot x(t)]\Big(\frac{\partial L}{\partial \dot x}\Big) \Big\}_ {t=t_f}=0
    $$

    • 若靶线$C(t)$为平行于$t$轴的直线,即$\dot C(t)=0$,则上式为:
      $$
      \Big\{L-\dot x(t)\Big(\frac{\partial L}{\partial \dot x}\Big)\Big\}_ {t=t_f}=0
      $$

    • 若靶线$C(t)$为垂直于$t$轴的直线,即$\dot C(t)\rightarrow \infty$,则上式为:
      $$
      \frac{L(t_f)}{\dot C(t_f)-\dot x(t_f)}+\Big(\frac{\partial L}{\partial \dot x}\Big)_ {t=t_f}=0\rightarrow \Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_f}=0
      $$

  3. 若终端固定,始端沿给定曲线$D(t)$变动,则有
    $$
    \Big\{L+[\dot x(t)-\dot D(t)]\Big(\frac{\partial L}{\partial \dot x}\Big) \Big\}_ {t=t_0}=0
    $$

    • 若$D(t)$为平行于$t$轴的直线,即$\dot D(t)=0$,则上式为:
      $$
      \Big\{L-\dot x(t)\Big(\frac{\partial L}{\partial \dot x}\Big)\Big\}_ {t=t_0}=0
      $$

    • 若$D(t)$为垂直于$t$轴的直线,即$\dot D(t)\rightarrow \infty$,则上式为:
      $$
      \Big(\frac{\partial L}{\partial \dot x}\Big)\Big|_ {t_0}=0
      $$

  4. 对多变量泛函,有矢量形式:

    欧拉方程:
    $$
    \frac{\partial L}{\partial \pmb x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial\dot{\pmb x}}=\pmb 0
    $$
    终端横截条件:
    $$
    \Big\{L+[\dot{\pmb C}(t)-\dot {\pmb x}(t)]^T\Big(\frac{\partial L}{\partial \dot {\pmb x}}\Big) \Big\}_ {t=t_f}=\pmb 0
    $$

9.2.6. 具有综合性性能泛函的情况

综合型性能指标:
$$
J=\Phi[x(t_f)]+\int_ {t_0}^{t_f}L[x(t),\dot x(t),t]\mathrm dt
$$
固定始端:$x(t_0)=x_0$

自由终端:$t=t_f$一定,$x_f$任意

求极值轨线$x^\ast(t)\Rightarrow J=\min$

泛函$J$取极值的必要条件:
$$
\delta J=0
$$
分部积分得:
$$
\delta J_x+\delta J_ {\dot x}=\int^{t_f}_ {t_0}\Big[\Big(\frac{\partial L}{\partial x} \Big)^T\delta x+\Big(\frac{\partial L}{\partial \dot x}\Big)^T\delta\dot x \Big]\mathrm dt
$$
其中,
$$
\int_ {t_0}^{t_f}\Big(\frac{\partial L}{\partial \dot x} \Big)^T\delta \dot x\mathrm dt=\Big(\frac{\partial L}{\partial \dot x} \Big)^T\delta x\Big|_ {t_0}^{t_f}-\int_ {t_0}^{t_f}\Big(\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x} \Big)^T\delta x\mathrm dt
$$

$$
\delta J_x+\delta J_ {\dot x}=
\Big(\frac{\partial L}{\partial \dot x} \Big)^T\delta x\Big|_ {t_0}^{t_f}+\int_ {t_0}^{t_f}\Big(\frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x} \Big)^T\delta x\mathrm dt
$$

$$
\delta J_ {x_f}=\Big\{\frac{\partial \Phi[x(t_f)]}{\partial x(t_f)}\Big\}^T\delta x(t_f)
$$

  1. 欧拉方程:

$$
\frac{\partial L}{\partial x}-\frac{\mathrm d}{\mathrm dt}\frac{\partial L}{\partial \dot x}=0
$$

  1. 横截条件:

    固定始端:
    $$
    x(t_0)=x_0
    $$
    自由始端:
    $$
    \Big(\frac{\partial L}{\partial \dot x} \Big)_ {t=t_f}=-\frac{\partial \Phi[x(t_f)]}{\partial x(t_f)}
    $$

9.2.7. 有约束条件的泛函极值

拉格朗日问题

设系统$\dot {\pmb x}(t)=f(\pmb x,\pmb u,t)$,其中$\pmb x\in R^n$,$\pmb u\in R^r$

$\pmb f(\pmb x,\pmb u,t)$为$n$维连续可微的矢量函数

设性能泛函
$$
J=\int_ {t_0}^{t_f}L(\pmb x,\pmb u,t)\mathrm dt
$$
固定始端:$\pmb x(t_0)=\pmb x_0$

终端状态:$\pmb x(t_f)$自由

求$\pmb u^\ast\rightarrow J=\min(\max)$

有约束条件的泛函极值分析思路:

利用拉格朗日乘子法$\rightarrow$将有约束条件的泛函极值问题$\rightarrow$转化为无约束条件的泛函极值问题

有约束条件的泛函极值分析方法:

  1. 写出约束方程:
    $$
    \pmb f(\pmb x,\pmb u,t)-\dot {\pmb x}(t)=0
    $$

  2. 构造增广泛函:

    $$
    J'=\int_ {t_0}^{t_f}\Big\{L(\pmb x,\pmb u,t)+\pmb \lambda^T[f(\pmb x,\pmb u,t)-\dot {\pmb x}] \Big\}\mathrm dt
    $$

    式中,$\pmb \lambda(t)=\begin{bmatrix}\lambda_1&\lambda_2&\cdots&\lambda_n\end{bmatrix}^T$ 为拉格朗日乘子向量

    令哈密顿函数:

    $$
    H(\pmb x,\pmb u,\pmb \lambda,t)=L(\pmb x,\pmb u,t)+\pmb \lambda^Tf(\pmb x,\pmb u,t)
    $$

    则转化为无约束条件的泛函极值问题:

    $$
    \begin{align}
    J'&=\int_ {t_0}^{t_f}\Big\{H(\pmb x,\pmb u,\pmb \lambda,t)-\pmb \lambda^T\dot {\pmb x} \Big\}\mathrm dt\\\\
    &=\int_ {t_0}^{t_f}\overline{H}(\pmb x,\dot {\pmb x},\pmb u,\pmb \lambda,t)\mathrm dt
    \end{align}
    $$

  3. 泛函极值的必要条件:$\delta J'=0$

    $$
    J'=\int_ {t_0}^{t_f}\Big\{H(\pmb x,\pmb u,\pmb \lambda,t)-\pmb \lambda^T\dot {\pmb x} \Big\}\mathrm dt
    $$

    $$
    \delta J'=\int_ {t_0}^{t_f}\Big[\Big(\frac{\partial H}{\partial x}\Big)^T\delta x+\Big(\frac{\partial H}{\partial u} \Big)^T\delta u-\lambda^T\delta \dot x \Big]\mathrm dt=0
    $$

    其中:
    $$
    -\int_ {t_0}^{t_f}\lambda^T\delta \dot x\mathrm dt=-\delta x^T\lambda\Big|_ {t_0}^{t_f}+\int_ {t_0}^{t_f}\dot\lambda\delta x\mathrm dt
    $$

    $$
    \delta J'=-(\delta x)^T\lambda\Big|_ {t_0}^{t_f}+\int_ {t_0}^{t_f}\Big[\Big(\frac{\partial H}{\partial x}+\dot\lambda \Big)^T\delta x+\Big(\frac{\partial H}{\partial u}\Big)^T\delta u\Big]\mathrm dt=0
    $$

    • 哈密顿正则方程
      $$
      \begin{cases}
      \dot{\pmb x}=\frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb \lambda}&状态方程\\\\
      \dot {\pmb \lambda}=-\frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb x}&伴随方程(协态方程)
      \end{cases}
      $$

    • 控制方程
      $$
      \frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb u}=0
      $$

    • 边界条件
      $$
      -(\delta \pmb x)^T\pmb \lambda\Big|_ {t_0}^{t_f}=-(\delta \pmb x)^T\pmb \lambda\Big|_ {t_f}+(\delta \pmb x)^T\pmb \lambda\Big|_ {t_0}=0
      $$

      • 固定端点:
        $$
        \begin{matrix}
        \delta \pmb x(t_f)=0&\delta \pmb x(t_0)=0\\\\
        \rightarrow \pmb x(t_0)=\pmb x_0&\pmb x(t_f)=\pmb x_f
        \end{matrix}
        $$

      • 自由端点

        终端自由
        $$
        \begin{matrix}
        \delta \pmb x(t_0)=0&\delta \pmb x(t_f)\neq0\\\\
        \rightarrow \pmb x(t_0)=\pmb x_0&\pmb \lambda(t_f)=0
        \end{matrix}
        $$
        两端自由
        $$
        \pmb \lambda\Big|_ {t_0}^{t_f}=0
        $$

  4. 求最优控制的步骤:

    • 构造增广泛函:
      $$
      J'=\int_ {t_0}^{t_f}\Big\{H(\pmb x,\pmb u,\pmb \lambda,t)-\pmb \lambda^T\dot {\pmb x} \Big\}\mathrm dt
      $$
      哈密顿函数:
      $$
      H(\pmb x,\pmb u,\pmb \lambda,t)=L(\pmb x,\pmb u,t)+\pmb \lambda^T\pmb f(\pmb x,\pmb u,t)
      $$

    • 控制方程:
      $$
      \frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb u}=0\rightarrow \pmb u^\ast(\pmb x,\pmb \lambda)
      $$

    • 将$\pmb u^\ast$代入哈密顿正则方程
      $$
      \begin{cases}
      \dot{\pmb x}=\frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb \lambda}\\\\
      \dot {\pmb \lambda}=-\frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb x}
      \end{cases}
      \Rightarrow
      \pmb x^\ast,\pmb \lambda^\ast
      $$

    • 利用边界条件定解

波尔扎问题

设系统$\dot {\pmb x(t)}=f(\pmb x,\pmb u,t)$,其中$\pmb x\in R^n$,$\pmb u\in R^r$

$\pmb f(\pmb x,\pmb u,t)$为$n$维连续可微的矢量函数

设性能泛函
$$
J= \Phi[\pmb x(t_f),t_f]+\int_ {t_0}^{t_f}L(\pmb x,\pmb u,t)\mathrm dt
$$
$\Phi$,$L$均为连续可微的函数

$\pmb x(t_0)=\pmb x_0$固定始端

终端状态$\pmb x_f$满足:$\pmb N[x(t_f),t_f]=0$

**$\pmb N\rightarrow q(q\leq N)$**维矢量函数,$t_f$待求终端时间

求$\pmb u^\ast\rightarrow J=\min(\max)$

  1. 构造增广泛函
    $$
    J'=\Phi[\pmb x(t_f),t_f]+\pmb \mu^T\pmb N[\pmb x(t_f),t_f]+\\\\
    \\\\\int_ {t_0}^{t_f}\Big\{L(\pmb x,\pmb u,t)+\pmb \lambda^T[\pmb f(\pmb x,\pmb u,t)-\dot {\pmb x}] \Big\}\mathrm dt
    $$

    式中,$\pmb \lambda(t)=\begin{bmatrix}\lambda_1&\lambda_2&\cdots&\lambda_n\end{bmatrix}^T$ 为拉格朗日乘子向量

    $\pmb \mu=\begin{bmatrix}\mu_1&\mu_2&\cdots&\mu_q\end{bmatrix}^T$为终端乘子矢量

    令哈密顿函数:

    $$
    H(\pmb x,\pmb u,\lambda,t)=L(\pmb x,\pmb u,t)+\pmb \lambda^T\pmb f(\pmb x,\pmb u,t)
    $$

    则转化为:

    $$
    J'=\Phi[\pmb x(t_f),t_f]+\pmb \mu^T\pmb N[\pmb x(t_f),t_f]+\int_ {t_0}^{t_f}\Big\{H(\pmb x,\pmb \mu,\pmb \lambda,t)-\pmb \lambda^T\dot {\pmb x}\Big\}\mathrm dt
    $$

  2. 泛函极值的必要条件
    $$
    \delta J'=\delta J_u'+\delta J_x'+\delta J'_ {\dot x}+\delta J'_ {t_f}+\delta J'_ {x_f}=0
    $$

    $$
    \begin{align}
    \delta J'x+\delta J' {\dot x}+\delta J_u'&=\int_ {t_0}^{t_f}\Big[\Big(\frac{\partial H}{\partial \pmb x}\Big)^T\delta \pmb x+\Big(\frac{\partial H}{\partial \pmb u} \Big)^T\delta \pmb u-\pmb \lambda^T\delta \dot {\pmb x} \Big]\mathrm dt\\\\
    &=-(\delta \pmb x)^T\pmb \lambda\Big|_ {t_0}^{t_f}+\int_ {t_0}^{t_f}\Big[\Big(\frac{\partial H}{\partial \pmb x}+\dot {\pmb \lambda}\Big)^T\delta \pmb x+\Big(\frac{\partial H}{\partial \pmb u} \Big)^T\delta \pmb u \Big]\mathrm dt\\\\
    &=-[\delta \pmb x(t_f)]^T\pmb \lambda(t_f)+\int_ {t_0}^{t_f}\Big[\Big(\frac{\partial H}{\partial \pmb x}+\dot {\pmb \lambda}\Big)^T\delta \pmb x+\Big(\frac{\partial H}{\partial \pmb u} \Big)^T\delta \pmb u \Big]\mathrm dt\\\\\\\\
    \delta J_ {t_f}&=\frac{\partial }{\partial t_f}\Big\{\Phi+\pmb \mu^T\pmb N+\int_ {t_0}^{t_f}{H(\pmb x,\pmb u,\pmb \lambda,t)-\pmb \lambda^T\dot {\pmb x}}\mathrm dt \Big\}_ {t=t_f}\delta t_f\\\\
    &=\Big[\frac{\partial \Phi}{\partial t_f}+\frac{\partial \pmb N^T}{\partial t_f}\pmb \mu+(H-\pmb \lambda^T\dot {\pmb x}) \Big]\Big|_ {t=t_f}\delta t_f\\\\
    &=\Big[\frac{\partial \Phi}{\partial t_f}+\frac{\partial \pmb N^T}{\partial t_f}\pmb \mu+H \Big]\Big|_ {t=t_f}\delta t_f-\pmb \lambda^T(t_f)\dot {\pmb x}(t_f)\delta t_f\ \ \ \ (\dot{\pmb x}(t_f)\delta t_f\approx\delta x_f-\delta x(t_f))\\\\
    &=\Big[\frac{\partial \Phi}{\partial t_f}+\frac{\partial \pmb N^T}{\partial t_f}\pmb \mu+H \Big]\Big|_ {t=t_f}\delta t_f-\pmb \lambda^T(t_f)\delta \pmb x_f+\pmb \lambda^T(t_f)\delta \pmb x(t_f)\\\\\\\\
    \delta J_ {x_f}&=(\delta \pmb x_f)^T\frac{\partial}{\partial \pmb x_f}{\Phi+\pmb \mu^T\pmb N}_ {t=t_f}\\\\
    &=\Big[\frac{\partial \Phi}{\partial x_f}+\frac{\partial \pmb N^T}{\partial \pmb x_f}\pmb \mu \Big]^T\Bigg|_ {t=t_f}\delta \pmb x_f
    \end{align}
    $$

    哈密顿正则方程:

    • 状态方程
      $$
      \dot {\pmb x}=\frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb \lambda}
      $$

    • 伴随方程
      $$
      -\dot{\pmb \lambda}=\frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb x}
      $$

    控制方程:
    $$
    \frac{\partial H(\pmb x,\pmb u,\pmb \lambda,t)}{\partial \pmb u}=0
    $$
    边界条件与横截条件:

    • 固定始端
      $$
      \pmb x(t_0)=\pmb x_0
      $$

    • 终端条件

      $x_f$固定时不存在
      $$
      \pmb \lambda(t_f)=\Big[\frac{\partial \Phi}{\partial \pmb x}+\Big(\frac{\partial \pmb N^T(x)}{\partial \pmb x} \Big)\pmb \mu \Big]\Bigg|_ {t=t_f}
      $$

      $$
      \pmb N[x(t_f)]=0
      $$

    • 终端时刻

      $t_f$固定时不存在
      $$
      H[\pmb x(t_f),\pmb u(t_f),\pmb \lambda(t_f),t_f]+\Big[\frac{\partial \Phi}{\partial t}+\Big(\frac{\partial \pmb N^T(x)}{\partial t} \Big)\pmb \mu \Big]\Big|_ {t=t_f}=0
      $$

例题:

给定系统$\dot{\pmb x}=\begin{bmatrix}0&1\\\\0&-1\end{bmatrix}\pmb x+\begin{bmatrix}0\\\\1\end{bmatrix}u$,且初始状态$\pmb x(0)=\pmb 0$,终端约束$x_1(2)+5x_2(2)=15$ ,性能指标:
$$
J=\frac{1}{2}[x_1(2)-5]^2+\frac{1}{2}[x_2(2)-2]^2+\frac{1}{2}\int_0^2u^2(t)\mathrm dt
$$
求令$J=\min$的$u^\ast$,$\pmb x^\ast$

解:

$t_f$给定,终端约束

  1. 构造增广泛函
    $$
    J'=\Phi[\pmb x(t_f),t_f]+\pmb \mu^TN[\pmb x(t_f),t_f]+\int_ {t_0}^{t_f}\Big\{H(\pmb x,u,\pmb \lambda,t)-\pmb \lambda^T\dot {\pmb x}\Big\}\mathrm dt
    $$
    令$\pmb \lambda=\begin{bmatrix}\lambda_1\\\\\lambda_2\end{bmatrix}$ ,$\pmb \mu=\begin{bmatrix}\mu\end{bmatrix}$


    $$
    H(\pmb x,u,\pmb \lambda,t)=L(\pmb x,u,t)+\pmb \lambda^Tf(\pmb x,u,t)=\frac{1}{2}u^2+(\lambda_1-\lambda_2)x_2+\lambda_2 u
    $$
    其中,
    $$
    \dot {\pmb x}=\pmb f=\begin{bmatrix}x_2\\\\-x_2+u\end{bmatrix}\\\\
    \Phi[\pmb x(t_f),t_f]=\frac{1}{2}[x_1(2)-5]^2+\frac{1}{2}[x_2(2)-2]^2\\\\
    N=x_1(2)+5x_2(2)-15=0
    $$

  2. 根据泛函极值的必要条件
    $$
    H=\frac{1}{2}u^2+(\lambda_1-\lambda_2)x_2+\lambda_2u
    $$
    正则方程
    $$
    \dot{\pmb x}=\frac{\partial H(x,u,\lambda,t)}{\partial \pmb\lambda}\Rightarrow
    \begin{matrix}
    \dot x_1=x_2\\\\
    \dot x_2=-x_2+u
    \end{matrix}\\\\
    \dot{\pmb \lambda}=-\frac{\partial H(x,u,\lambda,t)}{\partial \pmb x}\Rightarrow
    \begin{matrix}
    \dot{\lambda}_ 1=-\frac{\partial H}{\partial x_1}=0\\\\
    \dot{\lambda}_ 2=-\frac{\partial H}{\partial x_2}=\lambda_2-\lambda_1
    \end{matrix}
    $$

    $$
    \therefore \lambda_1(t)=c_1,\ \ \ \ \lambda_2(t)=c_2e^t+c_1
    $$

    控制方程
    $$
    \frac{\partial H(x,u,\lambda,t)}{\partial u}=0\Rightarrow u+\lambda_2=0
    $$

    $$
    \begin{align}
    \therefore\ u(t)&=-\lambda_2(t)=-c_2e^t-c_1\\\\
    x_1(t)&=-c_3e^{-t}-\frac{1}{2}c_2e^t-c_1t+c_4\\\\
    x_2(t)&=c_3e^{-t}-\frac{1}{2}c_2e^{t}-c_1
    \end{align}
    $$

  3. 边界条件与横截条件
    $$
    x(t_0)=x_0\Rightarrow x_1(0)=x_2(0)=0
    $$

    $$
    \pmb \lambda(t_f)=\Big[\frac{\partial \Phi}{\partial x}+\Big(\frac{\partial N^T(x)}{\partial x} \Big)\mu \Big]\Bigg|_ {t_f}\\\\
    N[x(t_f)]=0\\\\
    \Rightarrow c_1=-0.73,\ \ \ \ c_2=-0.13
    $$

    $$
    \therefore u(t)=-\lambda_2(t)=-c_2e^t-c_1=-0.13e^t-0.73
    $$

9.3. 极小值原理

9.3.1. 变分法求解最优控制问题的局限性

  1. 要求控制量$\pmb u(\cdot)$没有约束
    • 控制量有不等式约束$|\pmb u(t)|\leq \pmb u_ {\max}$
    • 控制量仅为孤立点集
  2. 要求$\partial H/\partial \pmb u$存在且连续
    • 最少燃料问题$J=\int_ {t_0}^{t_f}|\pmb u(t)|\mathrm dt$

9.3.2. 问题的描述

运动方程:
$$
\pmb{\dot x}=\pmb f[\pmb x(t),\pmb u(t),t]
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0\\\\
\psi(\pmb x_f,t_f)=\pmb0
$$
控制约束:
$$
\pmb u(t)\in \Omega,分段连续
$$
性能指标:
$$
\pmb J=\varphi(\pmb x_f,t_f)+\int_ {t_0}^{t_f}L(\pmb x,\pmb u,t)\mathrm dt
$$

条件:末端时刻$t_f$固定或自由 求解量
固定、自由或受约束 最优控制$\pmb u^\ast(t)$
向量函数$\pmb f(\cdot)$在$[t_0,t_f]$上连续且可微 最优轨线$\pmb x^\ast(t)$
标量函数$\varphi(\cdot)$,$L(\cdot)$在$[t_0,t_f]$上连续且二次可微 最优指标$\pmb J^\ast$

9.4.3. 最优解

最优解的表述

最优控制使得哈密顿函数取强极小

哈密顿函数
$$
H(\pmb x,\pmb u,\pmb\lambda,t)= L(\pmb x,\pmb u,t)+\pmb\lambda^T\pmb f(\pmb x,\pmb u,t)
$$
极小值问题的最优解是
$$
H^\ast= H(\pmb x^\ast,\pmb u^\ast,\pmb\lambda,t)=\min\limits_ {u\in \Omega} H(\pmb x^\ast,\pmb u,\pmb\lambda,t)
$$

最优解的求取

  1. 正则方程

    哈密顿函数
    $$
    H(\pmb x,\pmb u,\pmb \lambda,t)= L(\pmb x,\pmb u,t)+ \lambda^T\pmb f(\pmb x,\pmb u,t)
    $$
    状态方程
    $$
    \pmb {\dot x}=\frac{\partial H}{\partial \pmb\lambda}=\pmb f[\pmb x(t),\pmb u(t),t]
    $$
    协态方程
    $$
    \dot {\pmb\lambda}=-\frac{\partial H}{\partial \pmb x}
    $$

  2. 边界条件

    除初态$\pmb x(t_0)=\pmb x_0$之外,视不同的末端情况有如下的横截条件方程:

    • 末端固定:
      $$
      \pmb x(t_f)=\pmb x_f
      $$

    • 末端自由:
      $$
      \pmb \lambda(t_f)=\frac{\partial \pmb\varphi}{\partial \pmb x_f}
      $$
      $\pmb\varphi$是性能指标中的末值项

    • 末端受约束:
      $$
      \pmb \lambda(t_f)=\frac{\partial \pmb \varphi}{\partial \pmb x_f}+\frac{\partial \pmb \psi^T}{\partial \pmb x_f}\pmb\gamma(t_f)
      $$
      $\pmb \psi$是末端约束$\pmb \psi(\pmb x_f,t_f)=\pmb 0$

      式子中$\pmb \gamma(t_f)$是关于末端约束的拉格朗日乘子

  3. 极值条件

    • 对于定常系统:$H^\ast$为常数,特别当末端时刻$t_f$自由时常值为零:$H^\ast(t)=0$

    • 对于时变系统:

      • $t_f$固定:
        $$
        H^\ast(t)= H^\ast(t_f)-\int_ {t}^{t_f}\frac{\partial H(\tau)}{\partial \tau}\mathrm d\tau
        $$

      • $t_f$自由:
        $$
        H^\ast(t_f)=-\frac{\partial \pmb \varphi}{\partial t_f}-\frac{\partial \pmb \psi^T}{\partial t_f}\pmb \gamma(t_f)
        $$

例题

设一阶线性系统
$$
\dot{x}(t)=x(t)-u(t),\ \ \ \ x(0)=5
$$
已知控制约束为:
$$
0.5\leq u(t)\leq 1
$$
试求使性能指标
$$
J=\int_0^1 [x(t)+u(t)]\mathrm dt
$$
为极小时的最优控制$u^\ast(t)$及相应的最优性能指标$J^\ast$

解:

  1. 哈密顿函数
    $$
    H=L+\lambda\cdot f=(x+u)+\lambda (x-u)=(1+\lambda)x+(1-\lambda)u
    $$

  2. 极值条件
    $$
    H^\ast=H(x^\ast,u^\ast,\lambda,t)=\min\limits_ {u\in \Omega} H(x,u,\lambda,t)
    $$
    即最优控制使哈密顿函数取强极小,对于本题,显然有
    $$
    u^\ast(t)=
    \begin{cases}
    1,&\lambda>1\\\\
    0.5,&\lambda<1
    \end{cases}
    $$
    现确定$\lambda(t)$

  3. 正则方程
    $$
    \dot\lambda=-\frac{\partial H}{\partial x}=-(1+\lambda)
    $$
    解得:
    $$
    \lambda(t)=e^{-t}\lambda_0+\int_0^te^{-t}(-1)\mathrm d\tau=(\lambda_0-1)e^{-t}-1=ce^{-t}-1
    $$
    由末端自由且性能指标中不含末值项,故$\lambda(t_f)=0$,解得
    $$
    \lambda(t)=e^{1-t}-1
    $$
    令$\lambda>1$得到$t<1-\ln 2\approx 0.307$。于是最优控制是
    $$
    u^\ast(t)=\begin{cases}
    1,&0\leq t<1-\ln 2\\\\
    0.5,&t>1-\ln 2
    \end{cases}
    $$
    接着可计算最优轨线$x^\ast(t)$:
    $$
    x^\ast(t)=e^tx_0+\int_0^te^t(-1)\mathrm d\tau=(x_0-1)e^t+1=4e^t+1,\ \ \ \ 0<t<1-\ln 2
    $$
    特别地,当$t_1=1-\ln 2$时,$x(t_1)=2e+1$,此后
    $$
    \begin{align}
    x^\ast(t)&=e^{t-t_1}x(t_1)+\int_ {t_1}^te^{t-\tau}(-0.5)\mathrm d\tau=(2e+1)e^{t-t_1}+0.5(1-e^{t-t_1})\\\\
    &=(2e+0.5)\cdot 2e^{-1}e^t+0.5=(4+e^{-1})e^t+0.5,\ \ \ \ t>1-\ln 2
    \end{align}
    $$
    性能指标:
    $$
    \begin{align}
    J^\ast&=\int_0^{1-\ln 2}(4e^t+2)\mathrm dt+\int_ {1-\ln 2}^1[(4+e^{-1})e^t+1]\mathrm dt\\\\
    &=4(e^{1-\ln 2}-1)+2(1-\ln 2)+(4+e^{-1})(e-e^{1-\ln 2})+\ln 2\\\\
    &=4e-1.5-\ln 2\approx 8.68
    \end{align}
    $$

9.3.4. 极小值原理的意义

  1. 容许控制的条件放宽了
  2. 最优控制使得哈密顿函数取得强极小
  3. 不要求哈密顿函数对控制函数的可微性
  4. 给出了最优控制的必要而非充分条件

9.3.5. 极小值原理的应用

时间最优控制(梆梆控制,BangBang)

  • 控制矢量的各分量均取控制域的边界值
  • 控制量可不断从一个边值变换到另一个边值
  • 性能指标简单:$J=t_f$或$J=\int_ {t_0}^{t_f}\mathrm dt$

基本问题:线性定常系统的时间最优控制
$$
\dot {\pmb x}(t)=\pmb A\pmb x(t)+\pmb B\pmb u(t)
$$
其中,$\pmb x(0)=\pmb x_0$,$\pmb x(t_f)=\pmb 0$,$t_f$待求

性能指标:$\min\limits_u J=\int_ {t_0}^{t_f}\mathrm dt=t_f$

控制约束:$-1\leq u_i(t)\leq 1$

或$|u_i(t)|\leq 1$,$i=1,2,\cdots,r$

求$\pmb u^\ast\rightarrow J=\min$

取哈密顿函数:
$$
H(\pmb x,\pmb u,t)=1+\pmb \lambda^T(\pmb A\pmb x+\pmb B\pmb u)=1+\pmb x^T\pmb A^T\pmb \lambda+\pmb u^T\pmb B^T\pmb \lambda
$$
由$\min\limits_ {u\in U}H(\pmb x^\ast,\pmb \lambda^\ast,\pmb u,t)=H(\pmb x^\ast,\pmb \lambda^\ast,\pmb u^\ast,t)$
$$
\min\limits_ {u\in U} H\rightarrow \min \pmb u^T\pmb B^T\pmb \lambda
$$
得$\pmb u^\ast(t)=-SGN(\pmb B^T\pmb \lambda)$

其中,$sgn\ a=\begin{cases}+1&a>0\\\\0&a=0\\\\-1&a<0\end{cases}$

由正则方程组
$$
\dot {\pmb x}=\pmb {Ax}+\pmb {Bu}\\\\
\dot {\pmb \lambda} (t)=-\frac{\partial H}{\partial \pmb x}=-\pmb A^T\pmb \lambda
$$

$$
\pmb \lambda(t)=e^{-\pmb A^Tt}\pmb \lambda(0)=e^{-\pmb A^Tt}\pmb \lambda_0
$$

$$
\pmb u^\ast(t)=-SGN(\pmb B^T\pmb \lambda)=-SGN(\pmb B^Te^{-\pmb A^Tt}\pmb \lambda_0)
$$

  1. 时间控制是Bang-Bang控制,即开关控制

  2. 最优控制$\pmb u^\ast$是唯一的

    定理:线性定常系统$\sum (\pmb A,\pmb B,\pmb C)$,若存在时间最优控制$\pmb u^\ast$,则该最优控制$u_i^\ast(t),i=1,2,\cdots,r$是唯一的

  3. 最优控制得开关次数

    线性定常系统$\sum (\pmb A,\pmb B,\pmb C)$,若存在时间最优控制$\pmb u^\ast$满足$|u_i(t)|\leq 1,(i=1,2,\cdots,r)$且矩阵$A$得特征值均为实数。则每一个$u_i^\ast(t)$都是Bang-Bang控制,且在两个边界值之间最多切换$n-1$次

燃料最优控制
$$
J=\int_ {t_0}^{t_f}\Big|\sqrt{\pmb u^T(t)\pmb {Ru}(t)} \Big|\mathrm dt=\int_ {t_0}^{t_f}\sum\limits_ {j-1}^m\Big|c_ju_j(t)\Big|\mathrm dt
$$
**时间-燃料最优控制**

(复合指标)

9.4. 作业复习

9.4.1. 极小值原理的形式小结

定常系统

image-20200604113448645

时变系统

image-20200604113533172

9.4.2. 解题思路

本章题目一般已知动态方程、性能指标、控制约束,要求确定最优控制、最优轨线使得性能指标为极小值。

基本解题步骤:

  1. 构造哈密顿函数$H$
  2. 最优控制律(控制约束,哈密顿函数取强极小)
  3. 求解正则方程
  4. 代入横截条件

10. 二次型指标的线性最优控制

10.1. 最优跟踪问题

动态方程:
$$
\begin{align}
\dot{\pmb x}(t)&=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)\\\\
\pmb y(t)&=\pmb C\pmb x(t)
\end{align}
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0
$$
控制约束:
$$
控制\pmb u(\cdot)无约束
$$
性能指标:
$$
J=\pmb e^T(t_f)\pmb F\pmb e(t_f)+\int_ {t_0}^{t_f}[\pmb e^T(t)\pmb Q(t)\pmb e(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]\mathrm dt
$$
其中,$\pmb e(t)=\pmb y_l(t)-\pmb y(t),\pmb F\geq \pmb 0,\pmb Q(t)\geq \pmb 0,\pmb R(t)\geq \pmb 0$

  • 末项值:$J_1=\pmb e^T(t_f)\pmb F\pmb e(t_f)$
    • 末态误差向量尽可能小
  • 第一过程量:$J_2=\int_ {t_0}^{t_f}\pmb e^T(t)\pmb Q(t)\pmb e(t)\mathrm dt$
    • 动态跟踪误差的总度量
  • 第二过程量:$J_3=\int_ {t_0}^{t_f}\pmb u^T(t)\pmb R(t)\pmb u(t)\mathrm dt$
    • 控制能量消耗的总度量

10.2. 有限时间状态调节器

10.2.1. 问题描述

动态方程:
$$
\begin{align}\dot{\pmb x}(t)&=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)\\\\\pmb y(t)&=\pmb C\pmb x(t)\end{align}
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0,末端时刻t_f固定、有限
$$
控制约束:
$$
控制\pmb u(\cdot)无约束
$$
性能指标:
$$
J=\pmb x^T(t_f)\pmb F\pmb x(t_f)+\int_ {t_0}^{t_f}[\pmb x^T(t)\pmb Q(t)\pmb x(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]\mathrm dt
$$
其中,对称阵$\pmb F\geq \pmb 0,\pmb Q(t)\geq \pmb 0,\pmb R(t)> \pmb 0$且具有相应的维数,各元连续且有界

10.2.2. 最优解

最优控制:
$$
\pmb u^\ast(t)=-\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)\pmb x(t)
$$
其中,$\pmb P\geq \pmb 0$,为黎卡提矩阵微分方程:
$$
\dot{\pmb P}(t)+\pmb P(t)\pmb A(t)+\pmb A^T(t)\pmb P(t)-\pmb P(t)\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)+\pmb Q(t)=\pmb 0
$$
在边界条件$\pmb P(t_f)=\pmb F$下的解

最优轨线:
$$
\dot{\pmb x}(t)=[\pmb A(t)-\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)]\pmb x(t),\pmb x(t_0)=\pmb x_0
$$
最优性能指标:
$$
J^\ast=\pmb x^T(t_0)\pmb P(t_0)\pmb x(t_0)
$$

10.2.3. 有限时间状态调节器最优解的证明

用极小值原理证明最优控制

哈密顿函数:$H=[\pmb x^T\pmb Q\pmb x+\pmb u^T\pmb R\pmb u]+{\pmb \lambda}^T[\pmb{Ax}+\pmb {Bu}]$

协态方程:$\dot{{\pmb \lambda}}=-\frac{\partial H}{\partial \pmb x}=-2\pmb{Qx}-\pmb A^T\lambda$

横截条件:${\pmb \lambda}(t_f)=\frac{\partial }{\partial \pmb x(t_f)}[\pmb x^T(t_f)\pmb F\pmb x(t_f)]=2\pmb F\pmb x(t_f)$

极值条件:$\frac{\partial H}{\partial \pmb u}=2\pmb{Ru}+\pmb B^T\lambda$

$$
\frac{\partial^2 H}{\partial \pmb u\partial \pmb u^T}=2\pmb R>\pmb 0\Rightarrow \pmb u^\ast(t)=-\frac{1}{2}\pmb R^{-1}(t)\pmb B^T(t)\lambda(t)
$$

$$
H=[\pmb x^T(t)\pmb Q(t)\pmb x(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]+\lambda^T(t)[\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)]
$$

$$
\begin{matrix}
\dot {\pmb x}=\pmb {Ax}+\pmb {Bu}&\dot{\lambda}=-2\pmb {Qx}-\pmb A^T\lambda&\pmb u^\ast=-\frac{1}{2}\pmb R^{-1}\pmb B^T\lambda
\end{matrix}
$$

注意到,在最优控制条件下,增广状态与协态向量满足:

$$
\begin{matrix}
\frac{\mathrm d}{\mathrm dt}\begin{bmatrix}\pmb x(t)\\\\\pmb\lambda(t)\end{bmatrix}=
\begin{bmatrix}\pmb A&-\frac{1}{2}\pmb{BR}^{-1}\pmb B^T\\\\-2\pmb Q&-\pmb A^T \end{bmatrix}\begin{bmatrix}\pmb x(t)\\\\\pmb \lambda(t)\end{bmatrix}\\\\
\Downarrow\\\\
\begin{bmatrix}\pmb x(t_f)\\\\\pmb\lambda(t_f)\end{bmatrix}=
\pmb \Omega(t_f,t)\begin{bmatrix}\pmb x(t)\\\\\pmb\lambda(t)\end{bmatrix}&\Leftarrow& \pmb \Omega(t_f,t)=\begin{bmatrix}\pmb \Omega_ {11}(t_f,t)&\pmb \Omega_ {12}(t_f,t)\\\\\pmb \Omega_ {12}(t_f,t)&\pmb \Omega_ {22}(t_f,t) \end{bmatrix}\\\\
\Downarrow\\\\
\begin{matrix}
\pmb x(t_f)=\pmb \Omega_ {11}(t_f,t)\pmb x(t)+\pmb \Omega_ {12}(t_f,t)\pmb \lambda(t)\\\\
\pmb \lambda(t_f)=\pmb \Omega_ {21}(t_f,t)\pmb x(t)+\pmb \Omega_ {22}(t_f,t)\pmb \lambda(t)
\end{matrix}
&\Leftarrow&
\pmb \lambda(t_f)=2\pmb {Fx}(t_f)
\end{matrix}
$$

得:

$$
\begin{align}
\pmb \lambda(t)&=[\pmb \Omega_ {22}(t_f,t)-2\pmb {F\Omega}_ {12}(t_f,t)]^{-1}[2\pmb {F\Omega}_ {11}(t_f,t)-\pmb \Omega_ {21}(t_f,t)]\pmb x(t)\\\\
&\Downarrow\\\\
\pmb \lambda(t)&=2\pmb P(t)\pmb x(t),\pmb P(t_f)=\pmb F\\\\
\Downarrow \pmb u^\ast(t)&=-\frac{1}{2}\pmb R^{-1}(t)\pmb B^T(t)\lambda(t)\\\\
\pmb u^\ast(t)&=-\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)\pmb x(t)
\end{align}
$$

代入状态方程:

$$
\dot{\pmb x}=[\pmb A-\pmb {BR}^{-1}\pmb B^T\pmb P]\pmb x
$$

代入横截方程:

$$
\pmb P(t_f)=\pmb F
$$

代入协态方程:

$$
\begin{align}
2\dot{\pmb P}\pmb x+2\pmb P\pmb{\dot x}&=-2\pmb {Qx}-\pmb A^T\cdot 2\pmb{Px}\\\\
\dot{\pmb P}\pmb x+\pmb P(\pmb A-\pmb {BR}^{-1}\pmb B^T\pmb P)\pmb x&=-\pmb {Qx}-\pmb{A}^T\pmb{Px}\\\\
(\dot{\pmb P}+\pmb{PA}-\pmb{PBR}^{-1}\pmb B^T\pmb P+\pmb Q+\pmb A^T\pmb P)\pmb x(t)&=\pmb 0
\end{align}
$$

注意到$\pmb x(t)$的独立性,可得$\pmb P(t)$应满足的黎卡提方程:

$$
\begin{align}
\dot{\pmb P}(t)+\pmb P(t)\pmb A(t)+\pmb A^T(t)\pmb P(t)-\pmb P(t)\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)+\pmb Q(t)=\pmb 0\\\\
\dot{\pmb P}+\pmb P\pmb A+\pmb A^T\pmb P-\pmb P\pmb B\pmb R^{-1}\pmb B^T\pmb P+\pmb Q=\pmb 0,\pmb P(t_f)=\pmb F
\end{align}
$$

这是一个有末态的非线性矩阵微分方程

由最优控制导出最优轨线

这是将最优控制代入状态方程的直接结果

$$
\dot{\pmb x}(t)=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)\\\\
\pmb u^\ast(t)=-\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)\pmb x(t)
$$

注意到初始条件,即

$$
\dot{\pmb x}(t)=[\pmb A(t)-\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)]\pmb x(t),\pmb x(t_0)=\pmb x_0
$$

关于最优性能指标的证明

$$
\dot{\pmb x}=\pmb {Ax}+\pmb {Bu},\ \ \pmb x(t_0)=\pmb x_0,\ \ \pmb u^\ast=-\pmb R^{-1}\pmb B^T\pmb{Px}\\\\
\dot{\pmb P}+\pmb {PA}+\pmb A^T\pmb P-\pmb {PBR}^{-1}\pmb B^T\pmb P+\pmb Q=\pmb 0,\ \ \pmb P(t_f)=\pmb F
$$

定义标量函数

$$
V[\pmb x(t)]=\pmb x^T(t)\pmb P(t)\pmb x(t)
$$

对时间求导,并将状态方程、黎卡提方程代入得:

$$
\begin{align}
\frac{\mathrm dV}{\mathrm dt}&=\frac{\mathrm d}{\mathrm dt}[\pmb x^T(t)\pmb P(t)\pmb x(t)]=\dot{\pmb x}^T(t)\pmb P(t)\pmb x(t)+{\pmb x}^T(t)\dot{\pmb P}(t)\pmb x(t)+{\pmb x}^T(t)\pmb P(t)\dot{\pmb x}(t)\\\\
&=(\pmb {Ax}+\pmb{Bu})^T\pmb {Px}-\pmb x^T(\pmb{PA}+\pmb{A}^T\pmb P-\pmb {PBR}^{-1}\pmb B^T\pmb P+\pmb Q)\pmb x+\pmb x^T\pmb P(\pmb {Ax}+\pmb {Bu})\\\\
&=2\pmb x^T\pmb{PBu}+\pmb x^T(\pmb {PBR}^{-1}\pmb B^T\pmb P-\pmb Q)\pmb x\\\\
&=-\pmb x^T\pmb {Qx}-\pmb u^T\pmb {Ru}+(\pmb u+\pmb R^{-1}\pmb B^T\pmb {Px})^T\pmb R(\pmb u+\pmb R^{-1}\pmb B^T\pmb{Px})
\end{align}
$$

在最优轨线上,

$$
\frac{\mathrm dV}{\mathrm dt}=\frac{\mathrm d}{\mathrm dt}(\pmb x^{*T}\pmb {Px}^\ast)=-\pmb x^{*T}\pmb {Qx}^\ast-\pmb u^{*T}\pmb{Ru}^\ast\\\\
\pmb P(t_f)=\pmb F
$$

$$
J=\pmb x^T(t_f)\pmb {Fx}(t_f)+\int_ {t_0}^{t_f}[\pmb x^T(t)\pmb Q(t)\pmb x(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]\mathrm dt
$$

最优指标:
$$
\begin{align}
J^\ast&=\pmb x^{*T}(t_f)\pmb {Fx}^\ast(t_f)+\int_ {t_0}^{t_f}[\pmb x^T(t)\pmb Q(t)\pmb x(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]\mathrm dt\\\\
&=\pmb x^{*T}(t_f)\pmb {Fx}^\ast(t_f)-\int_ {t_0}^{t_f}\frac{\mathrm d}{\mathrm dt}(\pmb x^{*T}\pmb {Px}^\ast)\mathrm dt\\\\
&=\pmb x^{*T}(t_0)\pmb {P}(t_0)\pmb{x}^\ast(t_0)
\end{align}
$$

10.3. 无限时间状态调节器

10.3.1. 问题描述

运动方程:
$$
\dot{\pmb x}(t)=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0,末端时刻t_f\rightarrow \infty
$$
控制约束:
$$
控制\pmb u(\cdot)无约束
$$
性能指标:
$$
J=\int_ {t_0}^{t_f}[\pmb x^T(t)\pmb Q\pmb x(t)+\pmb u^T(t)\pmb R\pmb u(t)]\mathrm dt
$$
其中,定常加权阵$\pmb Q\geq \pmb 0,\pmb R\geq \pmb 0$且具有相应的维数

10.3.2. 最优解

若系统${\pmb A,\pmb B}$能控,则存在唯一的最优控制
$$
\pmb u^\ast(t)=-\pmb R^{-1}\pmb B^T\pmb {Px}(t)
$$
最优性能指标为:
$$
J^\ast=\pmb x^T_0\pmb{Px}_ 0
$$
其中,$\pmb P\geq 0$,是黎卡提矩阵代数方程:
$$
\pmb{PA}+\pmb A^T\pmb P-\pmb{PBR}^{-1}\pmb B^T\pmb P+\pmb Q=\pmb 0
$$
的唯一解

有限时间$\Rightarrow$无限时间
$$
\begin{align}
\pmb P(t_f)=0\\\\
\Downarrow t_f=\infty\\\\
\dot{\pmb P}(t)+\pmb P(t)\pmb A(t)+\pmb A^T(t)\pmb P(t)-\pmb P(t)\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)+\pmb Q(t)=\pmb 0\\\\
\Downarrow \pmb A(t)=\pmb A,\pmb B(t)=\pmb B,\pmb R(t)=\pmb R,\pmb Q(t)=\pmb Q\\\\
\lim\limits_ {t_f\rightarrow \infty}\pmb P(t)=\pmb P,0\leq t\ll t_f\\\\
\Downarrow \\\\
\pmb{PA}+\pmb A^T\pmb P-\pmb{PBR}^{-1}\pmb B^T\pmb P+\pmb Q=\pmb 0
\end{align}
$$

10.3.3. 最优解的存在性问题

最优控制问题有解的充分条件

系统能控是线性定常系统无限时间状态调节器问题有解的充分条件

最优控制存在的充要条件

性能指标中的被积函数绝对可积;或性能指标中不含系统不能控且不稳定的运动模态

10.3.4. 黎卡提代数方程解的正定问题

设矩阵$\pmb P$是黎卡提矩阵代数方程
$$
\pmb{PA}+\pmb A^T\pmb P-\pmb {PBR}^{-1}\pmb B^T\pmb P+\pmb Q=\pmb0
$$
的解,则$\pmb P$正定的充要条件是:若$\pmb H^T\pmb H=\pmb Q$,则矩阵对$(\pmb A,\pmb H)$能观

证明:

充分性

反证法:$\pmb P$不正定$\Rightarrow(\pmb A,\pmb H)$不能观

$\pmb P$正半定而非正定,存在$\pmb x_0\neq \pmb 0,\partial \pmb {Px}_ 0=\pmb 0$
$$
J^\ast=\int_0^{\infty}[\pmb x^{*T}(t)\pmb {Qx}^\ast(t)+\pmb u^{*T}(t)\pmb {Ru}^\ast(t)]\mathrm dt=\pmb x_0^T\pmb {Px}_ 0=0
$$
性能指标为0的唯一情况是北极函数恒为0,又$\pmb R>\pmb 0$,有$\pmb u^\ast(t)=\pmb 0$,于是$\pmb x^\ast(t)=e^{\pmb At}\pmb x_0$ ,进而有
$$
\begin{align}
J^\ast&=\pmb x_0^T\pmb {Px}_ 0=0=\int_0^{\infty}[\pmb x^{*T}(t)\pmb {Qx}^\ast(t)+\pmb u^{*T}(t)\pmb {Ru}^\ast(t)]\mathrm dt\\\\
&=\int_0^\infty \pmb x^{*T}(t)\pmb {Qx}^\ast(t)\mathrm dt=\int_0^\infty\pmb x_0^Te^{\pmb A^Tt}\pmb H^T\pmb He^{\pmb At}\pmb x_0\mathrm dt=\int_0^\infty |\pmb He^{\pmb At}\pmb x_0|^2\mathrm dt=0\\\\
&\Leftrightarrow\pmb He^{\pmb At}\pmb x_0=0,\forall t\in[0,\infty)
\end{align}
$$
在$t=0$处,对后等式两端同时对$t$微分$k$次,$k=1,2,\cdots,n-1$
$$
\pmb {HA}^k\pmb x_0=\pmb 0,\ \ \ \ k=1,2,\cdots ,n-1
$$
写成矩阵形式,有:
$$
\begin{bmatrix}
\pmb H\\\\\pmb {HA}\\\\\pmb {HA}^2\\\\\vdots\\\\\pmb {HA}^{n-1}
\end{bmatrix}\pmb x_0=\pmb M_o\pmb x_0=\pmb 0
$$
因$\pmb x_0\neq \pmb 0$,只有$\pmb M_o$不满秩,故$(\pmb A,\pmb H)$不能观,充分性证毕

必要性

$(\pmb A,\pmb H)$不能观$\Rightarrow \pmb P$不正定

若$(\pmb A,\pmb H)$不能观,存在$\pmb x_0\neq \pmb 0$,使$\pmb M_o\pmb x_0=\pmb 0$,即
$$
\pmb {HA}^k\pmb x_0=\pmb 0,k=1,2,\cdots,n-1\\\\
\pmb He^{\pmb At}\pmb x_0=\pmb H\Big(\sum\limits_ {k=0}^{n-1}\alpha_k(t)\pmb A^k \Big)\pmb x_0=\sum\limits_ {k=0}^{n-1}\alpha_k(t)(\pmb H\pmb A^k\pmb x_0)=\pmb 0
$$
令初态为$\pmb x(0)=\pmb x_0$,取$\pmb u=\pmb 0$时的性能指标为
$$
J=\int_0^\infty \pmb x^T(t)\pmb {Qx}(t)\mathrm dt=\int_0^\infty \pmb x_0^Te^{\pmb A^Tt}\pmb H^T\pmb He^{\pmb At}\pmb x_0\mathrm dt=0
$$
它显然是最优性能指标,故有:
$$
J^\ast=\pmb x_0^T\pmb {Px}_ 0=0
$$
因$\pmb x_0\neq \pmb 0$,故$\pmb P$为奇异阵,故不正定,证毕

10.3.5. 最优调节器的闭环稳定性问题

状态方程:$\dot{\pmb x}(t)=\pmb {Ax}(t)+\pmb {Bu}(t)$

最优控制:$\pmb u^\ast(t)=-\pmb R^{-1}\pmb B^T\pmb{Px}(t)$

其中,$\pmb P\geq \pmb 0$,且满足:
$$
\pmb{PA}+\pmb A^T\pmb P-\pmb {PBR}^{-1}\pmb B^T\pmb P+\pmb Q=\pmb0
$$
线性定常无限时间最优调节器是一个常增益状态反馈系统,其闭环方程为
$$
\dot{\pmb x}(t)=(\pmb A-\pmb{BR}^{-1}\pmb B^T\pmb P)\pmb x(t),\pmb x(0)=\pmb x_0
$$
定理:

线性定常无限时间调节器渐近稳定的充分条件是:$(\pmb A,\pmb B)$能控,且若$\pmb H^T\pmb H=\pmb Q$则矩阵对$(\pmb A,\pmb H)$能观

证明:

因$(\pmb A,\pmb H)$能观,故$\pmb P$正定,用李雅普诺夫稳定性理论证明闭环系统的稳定性,选正定泛函$V(\pmb x)=\pmb x^T\pmb {Px}$,于是
$$
\begin{align}
\dot V(\pmb x)&=\dot{\pmb x}^T\pmb {Px}+\pmb x^T\pmb P\dot{\pmb x}\\\\
&=\pmb x^T(\pmb A-\pmb {BR}^{-1}\pmb B^T\pmb P)^T\pmb {Px}+\pmb x^T\pmb P(\pmb A-\pmb {BR}^{-1}\pmb B^T\pmb P)\pmb x\\\\
&=\pmb x^T(\pmb A^T\pmb P+\pmb {PA}-2\pmb {PBR}^{-1}\pmb B^T\pmb P)\pmb x\\\\
&=-\pmb x^T(\pmb Q+\pmb {PBR}^{-1}\pmb B^T\pmb P)\pmb x\\\\
&=-\pmb x^T(t)\pmb {Qx}(t)-(\pmb u^\ast(t))^T\pmb R(\pmb u^\ast(t))
\end{align}
$$
由于$\pmb Q\geq\pmb 0$,$\pmb R>\pmb 0$故有$\pmb Q+\pmb {PBR}^{-1}\pmb B^T\pmb P\geq \pmb 0$,即正定泛函$V(\pmb x)$对时间的导数$\dot V(\pmb x)$为负半定函数,可知最优控制的闭环系统李雅普诺夫意义下稳定,现证明渐近稳定
$$
\dot V(\pmb x)=0\Rightarrow \pmb x^T\pmb {Qx}=0
$$
且$\pmb x^T\pmb {PBR}^{-1}\pmb B^T\pmb {Px}=\pmb u^{*T}\pmb {Ru}^\ast=0$

因$\pmb R>\pmb 0$故有$\pmb u^\ast=0$,此时闭环系统的状态方程退化为$\dot{\pmb x}=\pmb {Ax}$,它在初态$\pmb x(0)=\pmb x_0$下的解为:$\pmb x(t)=e^{\pmb At}\pmb x_0$,代入前式得:
$$
0=\pmb x^T\pmb {Qx}=\pmb x_0^Te^{\pmb A^Tt}\pmb H^T\pmb He^{\pmb At}\pmb x_0=|\pmb He^{\pmb At}\pmb x_0|^2
$$
矩阵对$(\pmb A,\pmb H)$能观时只有$\pmb x(0)=\pmb x_0=\pmb 0$,又$\pmb u^\ast=0$,故最优轨线$\pmb x(t)=\pmb 0$,于是得到闭环系统得渐近稳定性以至全局渐近稳定

结论:

线性定常无限时间最优调节器问题,非零最优控制下的闭环系统总是渐近稳定的

10.4. 具有给定稳定裕度的状态调节器

10.4.1. 问题描述

运动方程:
$$
\dot{\pmb x}(t)=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0,
$$
控制约束:
$$
控制\pmb u(\cdot)无约束
$$
性能指标:
$$
J=\int_ {0}^{\infty}e^{2\alpha t}[\pmb x^T(t)\pmb Q\pmb x(t)+\pmb u^T(t)\pmb R\pmb u(t)]\mathrm dt
$$
其中,$\pmb Q\geq \pmb 0,\pmb R> \pmb 0$且具有相应的维数

10.4.2. 最优解

最优控制:$\pmb u^\ast(t)=-\pmb R^{-1}\pmb B^T\overline{\pmb P}\pmb x(t)$

最优性能指标:$J^\ast=\pmb x_0^T\overline{\pmb P}\pmb x_0$

最优闭环系统:$\dot{\pmb x}(t)=(\pmb A-\pmb{BR}^{-1}\pmb B^T\overline{\pmb P})\pmb x(t)$,$\pmb x(0)=\pmb x_0$

闭环系统稳定性:渐进稳定的,且稳定度至少为$\alpha$

最优控制存在且唯一的充分条件:

系统${\pmb A,\pmb B}$能控,若$\pmb H^T \pmb H=\pmb Q$,$(\pmb A,\pmb H)$能观,$\overline{\pmb P}>\pmb 0$,是如下黎卡提矩阵代数方程的唯一解
$$
\overline{\pmb P}(\pmb A+\alpha\pmb I)+(\pmb A^T+\alpha\pmb I)\overline{\pmb P}-\overline{\pmb P}\pmb{BR}^{-1}\pmb B^T\overline{\pmb P}+\pmb Q=\pmb 0
$$

10.4.3. 化归性证明

定义:$\hat{\pmb x}(t)=e^{\alpha t}\pmb x(t)$,$\hat{\pmb u}(t)=e^{\alpha t}\pmb u(t)$


$$
\dot{\hat{\pmb x}}=\frac{\mathrm d}{\mathrm dt}[e^{\alpha t}\pmb x]=\alpha e^{\alpha t}\pmb x+e^{\alpha t}[\pmb{Ax}+\pmb{Bu}]=(\alpha\pmb I+\pmb A)\cdot e^{\alpha t}\pmb x+\pmb B\cdot e^{\alpha t}\pmb u
$$
即状态方程及初态变为:
$$
\dot{\hat{\pmb x}}=(\alpha\pmb I+\pmb A)\hat{\pmb x}+\pmb B\hat{\pmb u},\hat{\pmb x}(0)=\pmb x_0
$$
此时,最优性能指标变为:
$$
J=\int_ {0}^{\infty}[\hat{\pmb x}^T(t)\pmb Q\hat{\pmb x}(t)+\hat{\pmb u}^T(t)\pmb R\hat{\pmb u}(t)]\mathrm dt
$$

10.4.4. 关于稳定度的证明

对于变量代换:

$\hat{\pmb x}(t)=e^{\alpha t}\pmb x(t)$,$\hat{\pmb u}(t)=e^{\alpha t}\pmb u(t)$ $\Rightarrow$ ${\pmb x}(t)=e^{-\alpha t}\hat{\pmb x}(t)$,${\pmb u}(t)=e^{-\alpha t}\hat{\pmb u}(t)$

将后一个等式代入到关于$\hat{\pmb x}$和$\hat{\pmb u}$的最优解中,可立即得到
$$
{\pmb u}(t)=e^{-\alpha t}\hat{\pmb u}^\ast(t)=e^{-\alpha t}(-\pmb R^{-1}\pmb B^T\overline{\pmb P}\hat{\pmb x}(t))=-e^{-\alpha t}\pmb R^{-1}\pmb B^T\overline{\pmb P}\cdot e^{\alpha t}\pmb x(t)=-\pmb R^{-1}\pmb B^T\overline{\pmb P}\pmb x(t)
$$
此外,注意到变换后的状态轨线$\hat{\pmb x}^\ast(t)$是渐进趋于零状态的,即
$$
\lim\limits_ {t\rightarrow \infty}\hat{\pmb x}^\ast(t)=\lim\limits_ {t\rightarrow \infty} e^{\alpha t}\pmb x^\ast(t)=\pmb 0
$$
它表明$\pmb x^\ast(t)$可以比$e^{-\alpha t}$更快的速度收敛于零,称这样的闭环系统稳定度为$\alpha$

10.5. 有限时间离散系统状态调节器

10.5.1. 问题描述

状态方程:$\pmb x[k+1]=\pmb A[k]\pmb x[k]+\pmb B[k]\pmb u[k]$

边界条件:$\pmb x[k_0]=\pmb x_0$,末端时刻$k_N$固定、有限

控制约束:控制$\pmb u[\cdot]$无约束

性能指标
$$
J=\pmb x^T[k_N]\pmb {Fx}[k_N]+\sum\limits_ {k=k_0}^{k_N-1}(\pmb x^T[k]\pmb Q[k]\pmb x[k]+\pmb u^T[k]\pmb R[k]\pmb u[k])
$$
其中$\pmb F\geq \pmb 0$,$\pmb Q[k]\geq \pmb 0$,$\pmb R[k]> \pmb 0$且具有相应的维数

10.5.2. 最优解

最优控制:$\pmb u[k]=-\pmb K[k]\pmb x[k]$

最优性能指标:$J^\ast=\pmb x_0^T\pmb P[k_0]\pmb x_0$

其中,最优反馈增益序列:
$$
\pmb K[k]=(\pmb B^T[k]\pmb P[k+1]\pmb B[k]+\pmb R[k])^{-1}\pmb B^T[k]\pmb P[k+1]\pmb A[k]\ \ k=k_0,k_0+1,k_0+2,\cdots,k_N-1
$$
而$\pmb P[k]$是下列离散黎卡提差分方程的正半定对称解
$$
\pmb P[k]=(\pmb A[k]-\pmb B[k]\pmb K[k])^T\pmb P[k+1](\pmb A[k]-\pmb B[k]\pmb K[k])+\\\\
\pmb K^T[k]\pmb R[k]\pmb K[k]+\pmb Q[k],\ \ \ k=k_0,k_0+1,k_0+2,\cdots,k_N-1
$$
边界条件为:$\pmb P[k_N]=\pmb F$

10.5.3. 最优解的求解算法

$\pmb K[k]$和$\pmb P[k]$均与$\pmb x[\cdot]$无关,均可离线计算,从而可从末态边界条件出发,依次求出$\pmb P[k]$和$\pmb K[k]$:
$$
\pmb P[k_N]=\pmb F
$$

$$
\begin{align}
\pmb K[k]&=(\pmb B^T[k]\pmb P[k+1]\pmb B[k]+\pmb R[k])^{-1}\pmb B^T[k]\pmb P[k+1]\pmb A[k]\\\\
\pmb P[k]&=(\pmb A[k]-\pmb B[k]\pmb K[k])^T\pmb P[k+1](\pmb A[k]-\pmb B[k]\pmb K[k])+\pmb K^T[k]\pmb R[k]\pmb K[k]+\pmb Q[k]\\\\
k&=k_0,k_0+1,k_0+2,\cdots,k_N-1
\end{align}
$$

更简洁的表达:
$$
\begin{align}
\pmb Z_1(k)&=\pmb Q(k)+\pmb A^T(k)\pmb P(k+1)\pmb A(k)\\\\
\pmb Z_2(k)&=\pmb B^T(k)\pmb P(k+1)\pmb A(k)\\\\
\pmb Z_3(k)&=\pmb R(k)+\pmb B^T(k)\pmb P(k+1)\pmb B(k)
\end{align}
$$

$$
\begin{align}
\pmb K(k)&=\pmb Z_3^{-1}(k)\pmb Z_2(k)\\\\
\pmb P(k)&=\pmb Z_1(k)-\pmb Z_2^T(k)\pmb Z_3^{-1}(k)\pmb Z_2(k)
\end{align}
$$

10.6. 无限时间离散系统状态调节器

10.6.1. 问题描述

状态方程:$\pmb x[k+1]=\pmb A[k]\pmb x[k]+\pmb B[k]\pmb u[k]$

边界条件:$\pmb x[k_0]=\pmb x_0$

控制约束:控制$\pmb u[\cdot]$无约束

性能指标
$$
J=\sum\limits_ {k=0}^{\infty}(\pmb x^T[k]\pmb Q\pmb x[k]+\pmb u^T[k]\pmb R\pmb u[k])
$$
其中$\pmb Q\geq \pmb 0$,$\pmb R> \pmb 0$且具有相应的维数

10.6.2. 最优解

最优控制:$\pmb u[k]=-\pmb K\pmb x[k]$

最优性能指标:$J^\ast=\pmb x_0^T\pmb P\pmb x_0$

其中,最优反馈增益序列:
$$
\pmb K=(\pmb B^T\pmb{PB}+\pmb R)^{-1}\pmb B^T\pmb {PA}
$$
而$\pmb P$是下列离散黎卡提代数方程的正半定对称解
$$
\pmb P=(\pmb A-\pmb{BK})^T\pmb P(\pmb A-\pmb {BK})+\pmb K^T\pmb{RK}+\pmb Q
$$

10.7. 有限时间线性最优输出调节器

10.7.1. 问题描述

运动方程:
$$
\begin{align}\dot{\pmb x}(t)&=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)\\\\\pmb y(t)&=\pmb C(t)\pmb x(t)\end{align}
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0,末端时刻t_f固定、有限
$$
控制约束:
$$
控制\pmb u(\cdot)无约束
$$
性能指标:
$$
J=\pmb y^T(t_f)\pmb F\pmb y(t_f)+\int_ {t_0}^{t_f}[\pmb y^T(t)\pmb Q(t)\pmb y(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]\mathrm dt
$$
其中,$\pmb F\geq \pmb 0,\pmb Q(t)\geq \pmb 0,\pmb R(t)> \pmb 0$且具有相应的维数,各元连续且有界

10.7.2. 最优解

最优控制:
$$
\pmb u^\ast(t)=-\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)\pmb x(t)
$$
其中,$\pmb P\geq \pmb 0$,为黎卡提矩阵微分方程:
$$
\dot{\pmb P}(t)+\pmb P(t)\pmb A(t)+\pmb A^T(t)\pmb P(t)-\pmb P(t)\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)+\pmb C^T(t)\pmb Q(t)\pmb C(t)=\pmb 0
$$
在边界条件$\pmb P(t_f)=\pmb C^T(t_f)\pmb F\pmb C(t_f)$下的解

最优轨线:
$$
\dot{\pmb x}(t)=[\pmb A(t)-\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)]\pmb x(t),\pmb x(t_0)=\pmb x_0
$$
最优性能指标:
$$
J^\ast=\pmb x^T(t_0)\pmb P(t_0)\pmb x(t_0)
$$

10.7.3. 最优输出调节器的化归性证明

事实上,只需要把输出方程代入至性能指标的表达式中,便可立即得到:
$$
\begin{align}
J&=\pmb y^T(t_f)\pmb {Fy}(t_f)+\int_ {t_0}^{t_f}[\pmb y^T(t)\pmb Q(t)\pmb y(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]\mathrm dt\\\\
&=\pmb x^T(t_f)\pmb C^T(t_f)\pmb {FC}(t_f)\pmb x(t_f)+\int_ {t_0}^{t_f}[\pmb x^T\pmb C^T\pmb{QCx}+\pmb u^T\pmb {Ru}]\mathrm dt\\\\
&=\pmb x^T(t)\overline{\pmb F}\pmb x(t_f)+\int_ {t_0}^{t_f}[\pmb x^T\overline{\pmb Q}\pmb x+\pmb u^T\pmb {Ru}]\mathrm dt
\end{align}
$$
其中,$\overline{\pmb F}=\pmb C^T(t_f)\pmb{FC}(t_f)$,$\overline{\pmb Q}(t)=\pmb C^T(t)\pmb Q(t)\pmb C(t)$

由于
$$
\pmb F\geq \pmb 0,\pmb Q(t)\geq \pmb 0,\pmb R(t)>0
$$
不难验证:
$$
\overline{\pmb F}\geq \pmb 0,\overline{\pmb Q}(t)\geq \pmb 0,\pmb R(t)>0
$$
的成立几乎是无条件的(只需$\pmb C$有合适的维数即可),于是上述问题化归为由有限时间状态调节问题,它的最优解是自然的

10.8. 无限时间线性最优输出调节器

10.8.1. 问题描述

运动方程:
$$
\begin{align}\dot{\pmb x}(t)&=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)\\\\\pmb y(t)&=\pmb C\pmb x(t)\end{align}
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0
$$
控制约束:
$$
控制\pmb u(\cdot)无约束
$$
性能指标:
$$
J=\int_ {t_0}^{t_f}[\pmb y^T\pmb Q\pmb y+\pmb u^T\pmb R\pmb u]\mathrm dt
$$
其中,$\pmb Q(t)\geq \pmb 0,\pmb R(t)> \pmb 0$且具有相应的维数

10.8.2. 最优解

最优控制:
$$
\pmb u^\ast(t)=-\pmb R^{-1}\pmb B^T\pmb P\pmb x(t)
$$
若$(\pmb A,\pmb B)$能控、$(\pmb A,\pmb H)$能观,其中$\pmb H^T\pmb H=\pmb C^T\pmb{QC}$,则最优控制存在且唯一

最优轨线:
$$
\dot{\pmb x}=[\pmb A-\pmb {BR}^{-1}\pmb B^T\pmb P]\pmb x,\pmb x(0)=\pmb x_0
$$
闭环系统在非零最优控制下渐近稳定

最优性能指标:
$$
J^\ast=\pmb x^T_0\pmb P\pmb x_0
$$
其中,$\pmb P>0$,满足黎卡提矩阵代数方程:
$$
\pmb{PA}+\pmb A^T\pmb P-\pmb {PBR}^{-1}\pmb B^T\pmb P+\pmb C^T\pmb {QC}=\pmb 0
$$

10.9. 有限时间线性最优跟踪器

10.9.1. 问题描述

运动方程:
$$
\begin{align}\dot{\pmb x}(t)&=\pmb A(t)\pmb x(t)+\pmb B(t)\pmb u(t)\\\\\pmb y(t)&=\pmb C\pmb x(t)\end{align}
$$
边界条件:
$$
\pmb x(t_0)=\pmb x_0,末端时刻t_f固定、有限
$$
控制约束:
$$
控制\pmb u(\cdot)无约束
$$
性能指标:
$$
J=\pmb e^T(t_f)\pmb S\pmb e(t_f)+\int_ {t_0}^{t_f}[\pmb e^T(t)\pmb Q(t)\pmb e(t)+\pmb u^T(t)\pmb R(t)\pmb u(t)]\mathrm dt
$$
其中,$\pmb F\geq \pmb 0,\pmb Q(t)\geq \pmb 0,\pmb R(t)> \pmb 0$且具有相应的维数,各元连续且有界;$\pmb y_r(t)$表示期望输出向量,误差向量$\pmb e(t)$定义为
$$
\pmb e(t)=\pmb y_r(t)-\pmb y(t)=\pmb y_r(t)-\pmb C(t)\pmb x(t)
$$

10.9.2. 最优解

最优控制
$$
\pmb u^\ast(t)=-\pmb R^{-1}(t)\pmb B^T(t)[\pmb P(t)\pmb x(t)-\pmb g(t)]
$$
最优轨线
$$
\dot{\pmb x}=(\pmb A-\pmb{BR}^{-1}\pmb B^T\pmb P)\pmb x+\pmb{BR}^{-1}\pmb B^T\pmb g,\pmb x(t_0)=\pmb x_0
$$
最优性能指标
$$
J^\ast=\pmb x^T(t_0)\pmb P(t_0)\pmb x(t_0)-2\pmb g^T(t_0)\pmb x_0+\pmb \varphi(t_0)
$$
其中,

  1. $\pmb P\geq \pmb 0$,是黎卡提矩阵微分方程:
    $$
    \dot{\pmb P}(t)+\pmb P(t)\pmb A(t)+\pmb A^T(t)\pmb P(t)-\pmb P(t)\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)+\pmb C^T(t)\pmb Q(t)\pmb C(t)=\pmb 0
    $$
    在边界条件$\pmb P(t_f)=\pmb C^T(t_f)\pmb {SC}(t_f)$下的唯一解

  2. $\pmb g(t)$称为伴随向量,满足向量微分方程
    $$
    \dot{\pmb g}(t)+[\pmb A(t)-\pmb B(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)]^T\pmb g(t)+\pmb C^T(t)\pmb Q(t)\pmb y_l(t)=\pmb 0
    $$
    及边界条件$\pmb g(t_f)=\pmb C^T(t_f)\pmb{Sy}_ l(t_f)$

  3. 标量函数$\pmb \varphi(t)$满足微分方程
    $$
    \dot{\pmb \varphi}(t)=\pmb y_r^T(t)\pmb Q(t)\pmb y_r(t)+2\pmb g^T(t)\pmb R^{-1}(t)\pmb B^T(t)\pmb P(t)\pmb g(t)
    $$
    及边界条件$\pmb \varphi(t_f)=\pmb y_r^T(t_f)\pmb P(t_f)\pmb y_r(t_f)$

10.10. 无限时间线性最优跟踪器

10.10.1. 问题描述

状态空间方程:
$$
\dot{\pmb x}=\pmb{Ax}+\pmb{Bu}\\\\
\pmb y=\pmb {Cx}
$$
边界条件:
$$
\pmb x(0)=\pmb x_0
$$
控制约束:
$$
控制u(\cdot)无约束
$$
性能指标:
$$
J=\int_ {0}^{\infty} (\pmb e^T\pmb{Qe}+\pmb u^T\pmb {Ru})\mathrm dt
$$
其中,$\pmb Q\geq \pmb 0$,$\pmb R>\pmb 0$且具有相应的维数,$\pmb y_r(t)$表示期望输出的向量,误差向量$\pmb e(t)$定义为:
$$
\pmb e(t)=\pmb y_r(t)-\pmb y(t)=\pmb y_r(t)-\pmb {Cx}(t)
$$

10.10.2. 最优解

最优控制(近似):
$$
\pmb u^\ast=-\pmb R^{-1}\pmb B^T[\pmb {Px}-\pmb g(t)]
$$
最优轨线:
$$
\dot{\pmb x}=(\pmb A-\pmb{BR}^{-1}\pmb B^T\pmb P)\pmb x+\pmb {BR}^{-1}\pmb B^T\pmb g(t),\pmb x(0)=\pmb x_0
$$
最优性能指标:
$$
J^\ast=\pmb x_0^T\pmb{Px}_ 0-2\pmb g^T(0)\pmb x_0
$$
其中,

  1. $\pmb P>\pmb 0$满足黎卡提矩阵代数方程:
    $$
    \pmb {PA}+\pmb{A^T}\pmb P-\pmb {PBR}^{-1}\pmb B^T\pmb P+\pmb C^T\pmb {QC}=\pmb 0
    $$

  2. 伴随向量$\pmb g(t)=[\pmb A^T-\pmb{PBR}^{-1}\pmb B^T]^{-1}\pmb C^T\pmb Q\pmb y_r(t)$

此外,为保证最优控制近似解存在,要求$(\pmb A,\pmb B)$能控、$(\pmb A,\pmb H)$能观,其中,$\pmb H^T\pmb H=\pmb C^T\pmb{QC}$

10.11. 作业复习

10.11.1. 小结

本章题目主要以套模型为主,基本流程:辨识出调节器类型$\Rightarrow$代入参数$\Rightarrow$解黎卡提方程$\Rightarrow$求解结果。

辨识步骤:

  1. 性能指标含有$e^{2\alpha t}\Rightarrow$ 具有给定稳定裕度的状态调节器
  2. 动态方程为离散差分方程$\Rightarrow$离散系统的最优控制问题
    • 累加上限有限:有限时间离散系统状态调节器
    • 累加上限无穷:无限时间离散系统状态调节器
  3. 问题要求求解近似的最优控制等$\Rightarrow$ 线性最优跟踪问题
    • 积分上限有限:有限时间最优跟踪问题
    • 积分上限无穷:无限时间最优跟踪问题
  4. 性能指标中出现$\pmb y\Rightarrow$ 线性最优输出调节器
    • 积分上限有限:有限时间线性最优输出调节器
    • 积分上限无穷:无限时间线性最优输出调节器
  5. 其他$\Rightarrow$线性状态调节器
    • 积分上限有限:有限时间状态调节器
    • 积分上限无穷:无限时间状态调节器
分享

Wenbo Chen
作者
Wenbo Chen
CG Student

目录