原文标题:Systems with persistent disturbances: predictive control with restricted constraints
摘要
本论文解决在此场景下的LDTS(线性离散时间系统)的predictive state control:持续有界扰动、控制约束。
通常情况:约束和扰动会使得控制器不可行、不稳定。
结果通过仿真图像展示。
1. 介绍
- predictive control law: 最小化moving horizon performance index(考虑控制量、状态约束)
- 没有扰动的控制已被充分讨论:(Keerthi & Gilbert, 1988)
- 如何保证稳定:ensure feasibility, 即admissible input sequence(满足约束和terminal conditions),但nominal cost constrained minimization for future state vectors在扰动下无法实现
- 旧方法:min-max最优化(Lee and Yu 1997,Scokaert and Mayne 1998),但是两大缺点:计算成本高;在最坏情况下的扰动下表现糟糕。
- 正确的考量:在所有可能的扰动下,最小化nominal performance index。例如,给予合适的约束(Casavola and Mosca,1996;Gossner et al.,1997)。
- 本文基于Gossner的结果做了很大改进,提出了robust predictive controller。1. 使用了状态-空间框架,因此可用于多变量系统,原只考虑SISO系统。2. 适用于任何stablizing terminal control law,原只用于dead-beat terminal conditions。3. 不仅在有界状态响应和无扰动下保证了渐进稳定,还保证在终端线性反馈和扰动下,状态收敛于最小可行鲁棒不变集(the set of all states reachable from the origin under the disturbance input and the terminal linear constant feedback)。
2. 问题成型
2.1 集合的相关定义
- :所有元素的组合的和
- :同上,作差
- : 对所有元素用M映射
- : 所有使Ma=的a
- : 所有使a+包含于的a
- :A内部
2.2 系统定义
- 凡满足(2)的扰动称为admissible
- 可稳定
- 都包含原点
- 都是compact set(闭集合且无聚点)
2.3 控制目标
设计一个非线性的状态反馈——,能使系统到达原点的邻域Ω(尽量小),并在满足所有约束和条件下reduce to a linear well-tuned feedback。
- nominal feedback: ,无约束下的最优控制,假设已知并固定。因此渐进稳定的nominal闭环系统是:
的所有特征值在单位圆内。
Definition 1: ,若对所有x和w,都有也在内,则称为d-invariant,扰动不变集。
- :在nominal feedback下满足约束的状态。
- 重新定义Ω:闭环系统的的最小d-invariant。
- : 标称线性闭环系统的j步可达集(从原点出发,有扰动w)。1. 时极限存在,且为最小compact d-invariant set, 即。即,有d-invariant。
2.4 重申控制目标
新目标:使非线性反馈渐进趋于nominal feedback,即:3. Robust predictive control via 约束限制
NPC Nominal Predictive Control:无扰动下的控制
RPC Robust Predictive Control:考虑扰动
: 在t时刻根据nominal feedback计划的未来动作
: 根据得到的不考虑扰动的对的预估,
3.1 NPC
根据t时刻的状态:
- 损失函数:
-
约束
- 求最优解:
- ,代入
Remark 2: N为控制时域,代表总共考虑几步。N越大表现越好,可行域越大但计算成本越高。
Remark 3:J代表和nomianl control的偏差。若F是无约束的LQ反馈增益并要获得最小的u和x的二次损失,则,P来自Riccati方程,此时u和x的二次损失变为知名的LQ方程:
Remark 4:,最优控制序列的第一项依赖,用以定义
Remark 5: 每个x和u都需要在k>0时满足约束,但无穷多的约束可化简为有限个()。
3.2 RPC
考虑扰动,真实的x和u如下:
都由无扰动预测和扰动下的强制响应两项组成。因此,NPC中的(18)约束改写为更严格的:
, 其中:
将NPC的约束(18)改为如上即RPC算法,根据计算。
3.3 实现中的问题
为将无限多的约束(21)减少,实际上当时,等价于,其中,在XUW都是多面体时i*可由LP工具离线确定。因此,约束(21)可改写为:
,
RPC问题也改写为:
其中,L M v是一些合适的矩阵,代表了约束(25)。这个RPC算法比原论文有两点不同:
- 采用状态x而不是输入-输出框架,从而可以考虑广义的状态约束如U W;
- nominal feedback不需要是deadbeat,反而deadbeat可能缩小可行域。
4. 主要结果
Definition 6:
对 admissible: 满足14-17、21约束
feasible:存在admissible的
4.1 Feasibility and stability
Lemma 7: 若对admissible 对也 admissible
证略。
Theorem 8: 若 feasible, RPC反馈,则1. x和u在所有时刻满足约束X U;2. ;3.
证略。
借Theorem 8可知,只要初始态为可行域,则通过RPC反馈可保证最终态收敛于。
4.2 吸引域(the domain of attraction)
:
解释1:可行的初始域,取决于N,也是RPC反馈下的闭环系统的吸引域,。
解释2:在扰动下在N步内收敛入.
若W X U都是凸多面体,都是凸多面体。且:
5. 比较
将RPC算法与已有的:1. NPC;2. deadbeat RPC;3. Command Governers 分别比较。对第3还进行融合测试。
测试例子中,给出A B D F矩阵,给出的约束条件,给出Q,R,F是根据Q R得出的LQ增益,系统特征值都在单位圆外。
5.1 和NPC比较
定义:
- :无扰动NPC下的吸引域
- :的最大不变集(?
-
: 比较扰动的影响
结论:RPC在域内可以处理最坏情况的扰动,保持稳定。
5.2 与deadbeat RPC比较
本算法吸引域更大,或者说,同样的吸引域,算力成本更低。
5.3 与Command Governor (CG)的连接
CG 的论文(Casavola
&Mosca (1996); Gilbert&Kolmanovsky (1999))
虽然CG原始的作用是定值跟踪(set point tracking),但也可用于调整。
以下是重塑的CG算法:
- N=0
- 将(16)的控制序列改为:
- 损失函数:
- :满足约束的自由度,取代N。
- : 平衡状态
- :输入
- :set of statically admissible commands
- :的最大d-invariant。
- CG算法可表示为:
- : 对任何, 有限时间后所有。即相当于RPC的。
- 对于CG算法,通过遍历的所有来扩大, 而RPC则通过N个自由控制步数来将来扩张到。显然N步的提升性能更好
- RPC也可用于定值追踪。,反馈command是。只要,即在N步自由控制后。
- 只要,即可从转换到。
- 可以将两者RPC和CG结合起来:
6. 总结
合适的约束限制可以使预测控制器更鲁棒。如果初始状态是可行的,则未来对于所有允许的扰动都是可行的。由于约束限制可以离线运算,可以避免在线的额外计算负担。