一类离散时间非线性系统的控制方法-王璨博士
2023-08-23
1前言
自适应控制已经和我们在一起几十年了。关于这一课题已经出版了许多书籍,发表了数千篇论文,应用数量呈现稳步增长。自适应控制技术和方法通常假设被控对象的结构是已知的,而参数可能是未知的或慢时变的。然而对于一个实际的非线性模型,模型的结构往往很难识别,有时甚至是不可能的。更进一步,建模理论是在假设真实系统在模型集中的前提下,在覆盖真实系统的模型集中建立一个模型,或者在辨识的模型上以偏差和方差误差逼近真实系统。人们认识到从第一性原理得到的模型或从数据中辨识得到的模型是真实系统的近似,存在一定的误差。换句话说,未建模动态总是存在于建模过程中。因此,由自适应控制设计方法设计的闭环控制系统,被认为别无选择,只能使用,将继承未建模动态所造成的天生不安全。这促使我们研究基于数据驱动的无模型控制方法,该方法不需要被控系统的任何模型信息。
数据驱动控制是指控制器的设计仅依赖于被控对象的输入/输出( I / O )测量数据,不需要显式地使用系统模型,但可以利用系统动力学或系统结构的隐式信息进行设计,如直接自适应控制、子空间预测控制等。基于数据驱动的无模型控制方法是指控制器的设计仅仅基于被控对象的输入/输出测量数据,而没有显式或隐式地利用被控对象的结构或动力学信息,无论被控对象是线性还是非线性。由于数据驱动的无模型自适应控制方法在控制器设计中不需要被控对象的模型,因此建模过程、未建模动态以及关于被控对象动态的理论假设都不存在。迄今为止,在文献中可以找到许多数据驱动的控制方法,但不同的作者使用不同的名称:基于数据,数据驱动,无模型,迭代学习控制( ILC ),无伪控制( UC ),虚拟参考反馈调节( VRFT ),迭代反馈调节( IFT )等。也许第一种数据驱动的控制方法是Ziegler- Nichols过程来整定比例-积分-微分( PID )控制器。但它是基于被控对象的阶跃响应,是图解法,不能推广到其他控制问题。对于有限时间间隔上的可重复控制任务,ILC是最适合的具有数据驱动特性的控制方法。UC方法在过去的十年中得到了广泛的研究。该方法直接使用对象的在线I / O测量数据递归地"伪造"不满足性能指标的控制器。其他数据驱动的控制方法,如VRFT和IFT都可以归入控制器参数整定的框架。VRFT是针对一个未知的离散时间单输入单输出( SISO ) LTI系统设计的,不需要过程模型的辨识,其控制器设计问题在控制器结构先验已知的假设下借助虚拟参考信号转化为控制器参数的辨识问题。对于未知离散时间SISO LTI系统,IFT也被提出。而不是使用最小化器进行一次控制器参数整定, IFT控制器设计需要在每次迭代中递归地进行3次实验,以计算控制器参数。对于这两种方法,从理论和应用的角度来看,最主要的问题是对稳定性和实现的关注。
最近,针对一类具有系统框架的离散时间SISO非线性系统,无模型自适应控制( MFAC )方法被提出。采用一种新的动态线性化技术( DLT ),利用伪偏导数( PPD )的概念,沿闭环系统的动态工作点建立一系列等效的局部动态线性化数据模型,而不是辨识对象的非线性模型。仅利用被控对象的I / O测量数据即可估计时变PPD。DLT包括紧形式动态线性化( CFDL )、部分形式动态线性化( PFDL )和完全形式动态线性化( FFDL )。由于篇幅限制,我们在本文中只呈现前两个。
基于等效动态线性化数据模型的MFAC方法概述如下。
1)在CFDL、PFDL和FFDL中选择一种动态线性化数据模型。
2)仅利用在线测量值I/O数据估计等效动态线性化数据模型中的时变参数PPD
3)设计基于等效动态线性化数据模型的MFAC算法。
4)迭代更新控制器的PPD参数。
5)重复步骤2。
与其他自适应控制方案相比,MFAC具有一些吸引人的特性,使其适用于许多实际控制任务。首先,MFAC仅使用被控对象的实时测量值I/O数据。不需要被控对象的数学模型和结构信息,这意味着我们可以独立设计控制器,也意味着我们可以针对某一类工业实际过程开发通用控制器。其次,MFAC不需要任何外部测试信号和训练过程,这些都是基于神经网络的非线性自适应控制所必需的,因此是一种成本较低的控制器。第三,MFAC简单易实现,计算负担小,鲁棒性强。第四,在一定的假设条件下,保证了离散时间SISO非线性系统基于CFDL的MFAC ( CFDLMFAC )和基于PFDL的MFAC ( PFDL-MFAC )的收敛性和稳定性与其他数据驱动控制方法,如VRFT、IFT、UC等相比,这是一个突出的特点。第五, MFAC具有系统性的框架,包括一类离散时间非线性SISO、多输入单输出、多输入多输出( MIMO )系统的一系列等效动态线性化数据模型,以及一系列控制器设计方法,如一步前向权重控制、预测控制、迭代学习等 MFAC控制。最后,MFAC已成功应用于化工、直线电机控制及注塑成型、PH值控制、机器人焊接等多个实际领域。
由于MIMO非线性系统的复杂性,大多数针对SISO系统开发的技术无法直接推广到MIMO系统。MIMO非线性控制系统设计的主要难点之一是输入耦合。为了对输入进行解耦,通常需要解耦矩阵已知且可逆。然而,很难保证解耦矩阵的非奇异性。这在实际应用中限制太大。值得注意的是,到目前为止,研究一般非线性离散时间系统的自适应控制问题的文章很少,而且都是针对某些特殊类型的非线性。
本文将针对SISO非线性离散时间的无模型自适应控制方法推广到MIMO非线性系统,并给出了新的稳定性和收敛性证明。值得注意的是,由于输入输出耦合,将SISO系统的控制器设计和理论分析结果推广到MIMO情形并不是一个简单的问题。更进一步,将未知SISO非线性系统的结果推广到未知MIMO情况是一个更困难的问题本文的主要贡献如下。
1)假设被控对象是未知的 MIMO离散时间非线性系统,但除了基于神经网络的控制方法外,几乎所有现有的非线性系统自适应控制方法都假设其精确已知。
2)本文的假设条件是闭环数据的在线I/O关系图,而其他自适应控制方法的假设条件是动力学模型或状态。
3)MFAC方法不需要任何训练过程,而基于神经网络的控制通常需要具有丰富的开环系统离线I/O数据的训练过程。
4)仅利用被控对象的量测I/O数据设计了MFAC方案。这些MFAC方案中没有出现传统的未建模动态,因此与其他基于模型的控制方法相比具有很强的鲁棒性。
5)所提出的MIMO离散非线性系统MFAC方案的分析方法也是一种新颖的基于等效动态线性化虚拟数据模型的数据驱动分析方法。
对于无模型或数据驱动的方法,我们意识到文献中提出的许多主张,即某种特定的控制技术是"无模型或数据驱动的"。然而,这些主张大多基于隐式系统建模的需要。例如,模糊控制器经常被认为是无模型的;然而,在所有的模糊控制器中,模糊规则都是以语言形式参与控制器的。类似的论点也可以适用于其他自称是无模型的控制器,例如一些使用神经网络的控制系统,其中神经网络在控制器中充当系统模型。尽管无模型方法适用于许多实际系统,但对于可以确定精确系统模型的系统,无模型方法通常是不合适的。当然,其中一个原因是,有了可靠的模型,控制器的设计才能达到理论保证的最优性。更进一步,有了可靠的模型,理论分析和许多其他的事情,如可控性,状态滤波和估计,状态预测,系统性能监测,状态反馈等,都可以据此进行。
本文其余部分安排如下。第二节介绍了一类离散时间MIMO非线性系统的CFDL和PFDL技术。在第三节中,设计了CFDL - MFAC和PFDL - MFAC方案,分析了MFAC系统的收敛性和BIBO稳定性。在第四节中,给出了一些数值模拟研究来证明MFAC方案的有效性和正确性。第五部分给出结论。
2 MIMO非线性离散时间系统的动态线性化
本节给出了被控对象的等效动态线性化数据模型。这些描述在下一节中用于设计和分析数据驱动的无模型自适应控制系统。
考虑如下MIMO非线性离散时间系统:
y(k+1)=f(y(k),,,,,u(k-ny),u(k),,,,,u(k-nu)
其中y(k)∈Rp和u(k)∈Rp分别为系统在时刻k的输出和输入,ny和nu为未知阶数,p是已知正数,f(...)∈Rp为未知非线性向量值函数。
A. 紧格式动态线性化
非线性系统(1)的紧格式动态线性化基于以下假设。
假设1:关于控制输入u(k)的偏导数f(...)是连续的。
注1:从实际的角度来看,施加在模型上的这些假设是合理的和可接受的。假设1是一般非线性系统控制系统设计的典型条件。假设2对控制输入变化驱动的系统输出变化率施加一个上界限制。从"能量"的角度来看,如果控制输入能量的变化在有限高度内,系统内部的能量变化率不可能趋于无穷大。
理论1:对于非线性系统(1),若对于每个固定的k,满足假设1和2,且有‖Δu(k)≠0‖,则必存在一个参数向量Φ(k),称为伪偏导数矩阵,这样系统(1)可以转化为如下等价的CFDL描述:
证明:见附录A。
注2:沿着闭环系统的动态运行点建立CFDL数据模型。根据定理1,对于每个固定的k,存在时变的PPD矩阵Φ(k),使得非线性系统可以转化为CFDL数据模型。从定理的证明可以看出,PPD矩阵的存在性在理论上是由严格的数学分析(微分中值定理)保证的,是一种精确等价的线性化描述。此外,由附录A中的( A3 )可知,PPD参数矩阵在 CFDL数据模型( 2 )不是唯一的。
注3:由定理1的证明可知,直到时刻k,Φ(k)与系统的输入和输出有关。然而,Φ(k)在某种意义上是一个微分信号且对任意的k都有界,因此我们可以将Φ(k)视为一个慢时变参数,如果‖Δu(k)≠0‖且‖Δu(k)‖的幅值不太大,则可以忽略其与控制输入u ( k )的关系,这将通过重置机制和控制输入指标函数中的可调设计参数来保证,并将在下一节中展示。
注4:几种典型的线性化方法,如泰勒线性化、反馈线性化、分段线性化、正交函数逼近线性化等都可以在文献中找到。MIMO非线性系统的泰勒线性化是利用泰勒展开式求得平衡点处的常值雅克比矩阵。然而,由于高阶项被忽略,线性化模型本质上是一个近似表达式。反馈线性化是将非线性系统转化为线性系统,从而可以应用著名且强大的线性设计技术。这种线性化方法在很多情况下都得到了应用,但需要精确的数学模型和全状态测量,且难以处理参数不确定性或扰动。分段线性化通过分段进行泰勒展开来提高线性化精度,但需要更多被控对象的模型信息。正交函数逼近线性化利用一组正交基函数来逼近非线性,然而线性化后的模型中会出现大量的参数,并且随着正交基函数的增多,参数的数量也会成倍增加,这给辨识算法带来了沉重的计算负担。与上述线性化方法相比,本文提出的线性化方法在设计或分析控制系统问题时具有以下优点。首先,CFDL仅基于被控对象的I/O数据,不需要模型动态,而其他都是基于模型的。第二,CFDL数据模型( 2 )是对原系统( 1 )的等价描述,因为严格的数学分析保证了PPD矩阵的存在,然而泰勒模型或分段线性化模型是一种"线性化模型"。最后,CFDL数据模型简单,利用闭环系统采集的量测数据容易估计PPD矩阵的动态行为,而正交函数逼近线性化给辨识算法带来了沉重的计算负担。
B. 偏格式动态线性化
由式( 2 )可知,式( 1 )的所有系统非线性都被压缩到PPD矩阵Φ(k)中。然而,从自适应控制的角度来看,在利用式( 2 )设计自适应控制系统时,未知参数PPD Φ(k)必须通过某种参数估计算法结合系统I / O实测数据进行估计。如果PPDΦ(k)的动态是如此复杂以至于任何估计算法都无法跟踪它,那么一个合理而直观的策略是将其分解为几个分量,换句话说,需要开发另一个动态线性化数据模型来捕捉不同时刻不同输入变化驱动的动态。为此,PFDL技术是在另外两个类似的假设下提出的。
假设3:偏导数f(...)关于控制输入u(k),...,u(k-L+1)是连续的。L为正的常数,称为离散时间非线性系统线性化的控制输入长度常数。
假设4:系统(1)是广义Lipschitz的,