这时候动态方程就变成了
\[\begin{array}{} \left\{ \begin{align} \boldsymbol{\dot{x}} &= \boldsymbol{(A-bk)x + bv} \\ \boldsymbol{y} &= \boldsymbol{Cx} \end{align} \right. \end{array}\]可以看出改变了系统矩阵,这时候就有可能让不稳定的模态变得稳定了。
闭环特征多项式为\(\mid \lambda\boldsymbol{I-(A-bk)}\mid\)。状态反馈改只变了系统矩阵及其特征值,其他的不变。
定理:状态反馈任意配置系统闭环极点的充要条件是系统可控。状态反馈不改变系统可控性。
这个定理实际上前面提过,但是没明显的提出来,一句话带过了。
(待证明)
具体的计算过程是个考试侧重的东西,实际使用的时候,matlab有个函数的,一下子就算出来了。
和状态反馈一样,输出反馈也可以反馈到输入或者微分处。输出反馈的优点是工程容易实现,因为输出量基本都是可测的。输出反馈至状态微分处,在工程上同样也难以实现,但是如果反馈至控制输入处,往往又不能任意配置系统的闭环极点。基本分析思路和前面是一样的,数学分析上有些小差别。
输出反馈到控制输入处,经典控制理论全是这么干的。
在极点配置时,状态反馈明显优于输出反馈,但工程上不一定所有的状态变量可以测量;另一方面,输出量一般是可测量的,然而输出反馈至状态微分处,在工程上同样也难以实现,但是如果反馈至控制输入处,往往又不能任意配置系统的闭环极点。
于是,一种很猛的方法出现了,将这两种反馈方案结合起来,利用系统的输出,通过状态观测器重构系统的状态,然后将状态估计值(计算机内存里的变量)反馈至控制输入处来配置系统极点的方案。
当重构状态向量的维数与系统状态的维数相同时,观测器称为全维状态观测器,否则称为降维观测器。显然,状态观测器可以使状态反馈真正得以实现。基本上可以认为实际系统都是用状态观测器实现状态反馈的。
这个这个估计的值和真实的值一样吗?一开始的状态值都不知道,这怎么估计呢?那应该是大差不差的,这个问题交给搞理论的证明一下,发现是数学上严格可以证明没有任何问题的。
有一个实际的系统在物理世界运行,然后还有个模拟的系统在计算机里跑着。
输入量同时输入到两个系统里,比较一下输出量,输出没有误差以后,可以不加证明的猜测,估计的状态变量值就等于实际的状态的值。当然证明了以后发现确实等于。
设系统动态方程
\[\begin{array}{} \left\{ \begin{align} \boldsymbol{\dot{x}} &= \boldsymbol{Ax+Bu} \\ \boldsymbol{y} &= \boldsymbol{Cx} \end{align} \right. \end{array}\]计算机里面跑的系统 \(\begin{array}{} \left\{ \begin{align} \boldsymbol{\dot{\hat{x}}} &= \boldsymbol{A\hat{x}+Bu} \\ \boldsymbol{\hat{y}} &= \boldsymbol{C\hat{x}} \end{align} \right. \end{array}\)
既然实际状态变量测不到,那么初值自然也不知道。模拟系统输出和真实系统输出也有差别。这时候有差别那就再来个反馈控制,用输出的偏差来消除输出的偏差,这样状态的偏差也逐渐就没有了。
观测器的输出反馈目的是配置观测器极点,提高观测器动态性能,使状态偏差趋向于零。
接下来设计状态观测器。
全维状态观测器动态方程为
\[\begin{array}{} \left\{ \begin{align} \boldsymbol{\dot{\hat{x}}} &= \boldsymbol{A\hat{x}+Bu} - \boldsymbol{H(\hat{y}-y)}\\ \boldsymbol{\hat{y}} &= \boldsymbol{C\hat{x}} \end{align} \right. \end{array}\]有
\[\boldsymbol{\dot{\hat{x}}} = \boldsymbol{(A-HC)\hat{x}+Bu + Hy}\]状态误差的状态方程
\[\boldsymbol{\dot{x} - \dot{\hat{x}}} = \boldsymbol{(A-HC)(x - \hat{x}})\]即
\[\boldsymbol{\dot{e}_x} = \boldsymbol{(A-HC)e_x}\]也就是说,建立观测器就是在建立一个新的反馈系统,使得状态的误差趋近于0.
实际选择H矩阵时,要防止反馈失真,通常希望观测器响应速度比状态反馈系统的响应速度快3~10倍。
引入状态观测器以后,观测器和原来的系统放在一起就是个复合系统,维数是2n,动态方程为
\[\begin{array}{l} \left\{ \begin{align} \left [ \begin{array} {c} \boldsymbol{\dot{x}} \\ \boldsymbol{\dot{\hat{x}}} \\ \end{array} \right ] &= \left [ \begin{array} {c} \boldsymbol{A} & \boldsymbol{-BK}\\ \boldsymbol{HC} & \boldsymbol{A-BK-HC}\\ \end{array} \right ] \left [ \begin{array} {c} \boldsymbol{x} \\ \boldsymbol{\hat{x}} \\ \end{array} \right ] + \left [ \begin{array} {c} \boldsymbol{B} \\ \boldsymbol{B} \\ \end{array} \right ] \boldsymbol{v} \\ \boldsymbol{y} &= \left [ \begin{array} {c} \boldsymbol{C} & \boldsymbol{0}\\ \end{array} \right ] \left [ \begin{array} {c} \boldsymbol{x} \\ \boldsymbol{\hat{x}} \\ \end{array} \right ] \end{align} \right. \end{array}\]写开来
\[\begin{array}{l} \left\{ \begin{align} \boldsymbol{\dot{x}} &= \boldsymbol{Ax-BK\hat{x}+Bv} \\ \boldsymbol{\dot{\hat{x}}} &= \boldsymbol{HCx} + \boldsymbol{(A-BK-HC)\hat{x}} + \boldsymbol{Bv} \end{align} \right. \end{array}\]可以看出来,这和哪个都不一样。但是有个分离定理说:若受控系统S(A,B,C)可控、可观测,则用状态观测器估计值形成状态反馈时,系统的极点和观测器极点可以分别独立进行。即K与H的设计可分别独立进行。
定理推不动了。就直接用吧。
当状态变量部分可直接用传感器测量,一部分不行,可以用降维状态观测器。
用状态反馈任意配置闭环极点的冲要条件是:受控系统可控
状态反馈不改变系统可控性,但可能影响可观性。
输出到状态微分反馈不改变可观性,但可能改变可控性
输出至输入的反馈不改变可控可观性
不可控部分渐进稳定,状态反馈可镇定。
极点任意配置的条件
前面有了状态反馈控制了,来看一个问题,如何确定特征值即极点呢?做题倒是题目给出了极点,但是实际使用的时候什么样的极点是好的?
在优化理论中,引入cost function的概念,来帮助选择反馈增益k。
引入代价函数,能量函数,目标函数
\[J = \int_0^\infty \boldsymbol{x^TQx}\] \[\min{J} = \int_0^\infty (\boldsymbol{x^TQx + u^TRu}) \mathrm d t\]在满足系统稳定的时候找一个满足代价函数的最小值,