贯穿控制科学的两大主题“反馈”与“优化”
在生产过程中,人们始终在致力于寻找一种普适(一般的)方法,使得机器和设备的某个工作状态或参数在无人直接参与的情况下,自动地按照预定的规律运行,这就是自动控制。
自动控制的历史是与人类工业化的历史紧密联系的。历史上第一个有据可查的自动控制系统,是1788年瓦特在改进蒸汽机时发明的离心式调速器。当负载或蒸汽供给量发生变化时,离心式调速器能够根据这一变化自动地调节进汽阀门的开度,从而控制蒸汽机的转速。这一系统虽然简单,却完整地体现了控制理论的主题——反馈。
反馈,是指取出输出量通过传感设备的测量送回到输入端,并与输入信号相比较产生偏差信号的过程,反馈是一种通过人为干预试图改变原开环系统性能的手段。若反馈的信号是与输入信号相减,使产生的偏差递减,则称为负反馈。负反馈概念的精髓是利用误差来自动地减少误差。
控制理论的另一个主题是优化。所谓优化,在数学上可以归结为在有约束条件或无约束条件下求目标函数极值(最值)的问题。在控制理论中,目标函数刻画的是期望性能和系统实际性能间的差异,的自变量是一个函数,这样的称为泛函。我们要求一个使最小化,这个形成了整个控制作用时段中一个预先规划好的控制输入,这就是最优控制的主要内容,即轨迹优化问题。
反馈和优化在控制领域中复杂地交织在一起,控制理论将反馈作为优化的手段,其基本原因是要在不确定性存在的条件下达到性能目标。尽管对于不同系统,人们所期望的性能目标不尽相同,但是,对于任何一个自动控制系统,以下三个要求都是必须考虑的。
第一,稳定性是保证系统正常工作的先决条件。一个稳定的控制系统,理论上其被控量偏离期望值的偏差应当随时间的增长最终趋近于零,也就是被控量达到的稳态值与期望值一致。
第二,除了对系统的稳态性提出要求外,还必须对其从初始状态到稳态的过渡过程提出要求。衡量系统过渡过程优劣的一系列指标称为动态性能指标,其中最重要的是对过渡过程时间的度量。我们希望尽量缩短过渡过程的时间,这就是对控制系统快速性的要求。
第三,实际情况下,由于系统不断承受外界的干扰,而输出的观测又常受到噪声的影响,被控量的稳态值与期望值之间会存在误差,这就是稳态误差。一个理想的控制系统应当使稳态误差尽可能小,即控制系统的准确性要求。
1922年,米诺斯基在对船舶驾驶控制的研究中,率先提出了PID控制方法。
PID控制规律是比例、积分、微分这三种控制方法的叠加。PID中的比例调节规律,依据当前存在的偏差产生调节作用;积分依据偏差的持续累积,用于消除那种变化缓慢,幅度较小但持续存在的偏差;微分控制对速度敏感,依据未来的偏差,有预见的进行调节。PID控制消除偏差,是综合考虑了现在,过去和未来的结果。
PID控制原理简单,使用方便,对模型的适应性强,受到控制对象非线性和时变性的影响相对较小,其控制品质对被控对象特性的变化敏感程度较低。因此直至今日,PID控制在工业生产制造中仍然是最常用的控制方式。
许多情况下,对于一个系统的了解是不全面的,或者说所建立的模型充满着简化的假设,以至于不再确切,此时为系统建立一个合适的数学模型是特别困难的。即使我们可以写出一个系统的精确的动力学方程,它又是十分复杂,以至于无法在其基础上设计一套控制规律。因此,反馈控制(一种不基于模型的控制方式)十分重要,有效的反馈可以减少所有这些不确定性的影响,补偿由于任何原因引起的误差,从而为利用十分简化的模型来刻画复杂的系统铺平了道路。
一般常用的控制框架就是,基于模型设计的前馈控制部分和抑制由于建模不确定性产生的扰动的反馈控制部分。不要求模型要多精确,因为有反馈保证控制系统的基本性能指标。
这样,问题的关键就是寻找一个鲁棒的经验的模型,在有效数据基础上,可以用学习的方法来求得。所谓鲁棒性是指系统在受到干扰时维持原有特性的能力。所谓学习方法,是指用在一个动态系统上观察到的输入与输出数据来确定它的模型及其参数的过程。特别地,如果模型结构已经确定,只是其参数未知,那么就变成参数估计问题。现在常用的方法就是和机器学习、深度学习算法结合使用。
现代控制理论的发展
第二次世界大战中,美国集中了大量来自世界各地的顶尖学者,加之原子弹研制过程中产生的许多前所未有的复杂问题,推动了相关理论的一次大踏步的前进。
在控制领域,1942年,齐格勒和尼科尔斯提出了整定PID控制器参数的齐格勒-尼科尔斯方法,进一步夯实了PID控制的应用基础。维纳于1947年提出的控制论与贝塔朗菲于1945年提出的系统论,和香农于1948年提出的信息论并称为“三论”。
系统论对系统整体性的洞察,启发了控制领域学者对于复杂系统的研究。而信息论借鉴了物理学中“熵”的概念来刻画信息,并研究如何从被噪声污染的观察信号中重构原信息的问题。控制论则提供了一个把控制问题和通信问题统一考虑的框架,维纳利用随机过程理论,发展了在有噪声的情况下信号的滤波、预报和平滑的方法。另一方面,基于信息的反馈也为控制理论提供了新的视角。
在优化领域,以1947年丹齐格提出解决线性规划问题的单纯形法为开端,运筹学理论与强调不等式约束的线性和非线性规划理论也得到了长足发展。1951年,贝尔曼以最优统计决策和资源分配中的序贯规划问题的研究为基础,提出了完整的动态规划理论。这些理论在控制领域的主要贡献是,通过考虑初始状态参数化了的动态优化,建立最优性能的动态规划方程,从它的解确定最优的反馈控制律。
与此同时,计算机的诞生开启了信息时代的大门,也迅速开始与控制领域结合起来。越来越复杂的计算机使得研究者设计了便于计算机计算的数值方法,这种方法后来在控制中变得十分有用。计算机技术的进步使得对离散控制系统的研究日益重要,并开辟了计算机控制这一新的研究领域。
20世纪50年代,美苏冷战,两国开始对航天技术展开研究。因此,为航天器设计行之有效的控制也就显得至关重要。在航天技术中涌现的一系列新问题,亟需利用具有突破性的控制理论加以解决。
苏联学者最具有代表性的成果,是庞特里亚金于1959年提出的最大值原理。最大值原理突破了古典变分法在解决最优控制问题中的局限性,开辟了系统地研究受到状态和控制两方面的约束而使用不连续控制函数的最优轨迹的道路,形成对大量轨迹优化数值计算方法研究的冲力。
美国学者最具有代表性的贡献,是卡尔曼于1960年提出的卡尔曼滤波器。早期滤波器设计的维纳理论受到关于平稳随机过程的假设和要求解积分方程或分解傅里叶变换的限制,卡尔曼滤波则不受这些限制,而且容易编程实现。卡尔曼滤波是在系统有随机干扰和观测噪声时对状态进行最优估计的最简单高效的方法。因此,原始卡尔曼滤波及其扩展形式,也就被广泛应用于几乎所有需要从噪声和干扰如影随形的数据中估计系统状态的场合。卡尔曼滤波和PID控制是控制理论中以简单方法解决复杂问题,和以普适方法解决不同场合的问题的典型范式,成为控制理论中两座并峙的高峰。
除了提出卡尔曼滤波外,卡尔曼还首先引入状态空间法描述系统,将高阶系统表示为线性微分方程组的向量-矩阵形式,进而提出了能控性、能观性、标准分解等一系列基本概念、模型与方法,几乎以一己之力形塑了线性系统理论框架。
从线性系统理论的观点看,经典控制理论中的传递函数只描述了系统的能控能观部分。此外,基于时域的、以向量-矩阵形式描述的状态空间表示,不仅在形式上更为自然,而且也更容易在计算机上编程实现。而状态反馈、极点配置、状态观测器等方法的提出,又使得线性系统理论能够完整地指导实际控制系统的设计与校正,而且成为将成果普遍化到非线性系统上的标准典范和对所有新的控制规范的基础,并与最优控制一道开创了现代控制理论。
20世纪70年代至今,控制领域又不断涌现出了新的成果,非线性控制、鲁棒控制、自适应控制、随机控制等理论与方法竞相争妍。随着计算机科学的发展,尤其是人工智能的发展和计算机硬件的革新换代,控制理论和计算机科学的联系越来越密切。人工智能中的深度神经网络和凸优化等方法在控制领域得到广泛运用,而结合计算机视觉理论对机器人进行控制,又是控制理论与实际结合的一个显例。
2016年7月2日,控制领域的巨擘卡尔曼溘然长逝。就在卡尔曼逝世四个月前,人工智能AlphaGo击败了世界排名第一的李世石,使得人工智能受到了前所未有的关注。实际上,人工智能从最初的知识学习,到后来的机器学习(统计学习),再到现在由大数据驱动的深度学习以及强化学习,都体现着反馈和优化这两个控制领域的主题。图像识别、语音识别、自然语言处理等领域的一大理论源泉就是控制科学中的模式识别理论;在无人驾驶、智能物流、无人机、移动机器人等应用中,控制理论也发挥着重要作用。甚至可以说,人工智能就是当面对海量数据时,利用计算机实现的控制方法。控制理论的未来也必须依赖于与计算机科学更加紧密和深刻的结合。
从传递函数到状态空间,从PID控制到卡尔曼滤波,控制理论的发展始终与人类社会的发展紧密相连。从蒸汽时代到电气时代再到信息时代,寻找简单高效的普适方法,控制动态系统达到人们期待的性能,始终是技术进步和科学革命所追求的目标,因而也将不断地为控制系统带来崭新的方法、理论和范式。