• 首页
  • 科学成果
  • 一类离散时间非线性系统的数据驱动控制方法-丁凯博士

一类离散时间非线性系统的数据驱动控制方法-丁凯博士

2023-08-21

摘要:本文针对一类离散时间单输入单输出非线性系统,基于一种新的动态线性化技术,提出了一种新的数据驱动控制方法——无模型自适应控制。该方法的主要特点是控制器的设计仅依赖于被控对象的输入和输出测量数据。理论分析表明,该方法保证了有界输入和有界输出的稳定性和跟踪误差单调收敛。对比实验验证了所提方法的有效性。


1前言

      自适应控制已有几十年的研究历史。关于这一课题已经出版了许多书籍,发表了数千篇论文,并在实际系统中得到了广泛的应用。大多数自适应控制技术和方法通常假设系统的结构是已知线性的,参数可能是未知的或慢时变的。然而,对于复杂的实际系统,被控对象的结构往往难以确定,参数难以辨识,这使得自适应控制的设计和应用受到质疑。这促使我们研究数据驱动的控制方法。

      数据驱动控制方法侧重于仅利用被控对象的输入输出测量数据来设计控制器。由于这些方法在控制器设计中不需要被控对象的模型,建模过程、未建模动态和关于被控对象动态的理论假设都消失了。目前,基于数据驱动的控制方法有很多,但不同的作者对其命名不同:基于数据的控制、基于数据驱动的控制、无模型自适应控制(MFAC)、迭代学习控制(ILC)、无伪控制(UC)、虚拟参考反馈整定(VRFT)和迭代反馈整定(IFT)。也许第一个数据驱动的控制方法是Ziegler–Nichols过程来整定PID控制器。然而,它是基于模型的阶跃响应。此外,该方法是图形化的,无法推广到其他控制方法。对于有限时间间隔上的可重复控制任务,ILC方法也是一种典型的数据驱动控制方法。在过去的十年中,UC方法得到了广泛的研究;它直接利用被控对象的在线I/O测量数据,递归地"伪造"不满足性能指标的控制器。其他基于数据驱动的控制方法,如VRFT和IFT,都可以归入控制器参数整定的框架。VRFT是针对一个未知的离散时间单输入单输出(SISO)线性时不变(LTI)系统设计的,不需要借助于过程模型的辨识。本质上是在控制器结构已知的假设下,通过定义虚拟参考信号,将控制器设计问题转化为控制器参数的辨识问题。若理想控制器在参数化控制器候选集中,则最佳控制器参数为符合辨识准则的最小值。对于未知离散时间的SISO线性时不变系统,IFT也被建议使用。与使用虚拟参考信号进行一次控制器参数辨识不同,IFT控制器设计需要在每次迭代中通过一次控制器参数优化递归地进行3次实验来计算控制器参数。对于这两种方法,从应用的角度来看,最主要的问题是实施性和稳定性。

      MFAC方法是针对一类一般离散时间的SISO非线性系统提出的。采用一种新的动态线性化技术,利用伪偏导数(pseudo-partialderived,PPD)的概念,沿闭环系统的动态工作点建立等效的动态线性化模型,而不是辨识一个或多或少的对象非线性模型。仅利用被控对象的I/O测量数据即可估计时变PPD。动态线性化技术包括偏格式动态线性化(PFDL)、紧凑形式动态线性化(CFDL)和全形式动态线性化(FFDL)。限于篇幅,我们仅呈现前两种技术。对最后一种技术感兴趣的读者应该参考。

      与其他自适应控制方案相比,MFAC方法具有许多优点,使其适用于许多实际控制应用。首先,MFAC仅依赖于被控对象的实时测量数据,这意味着我们可以独立开发一类工业实际过程的通用控制器。其次,MFAC不需要任何外部测试信号和训练过程,而这却是基于神经网络的非线性自适应控制所必需的,因此它是一种成本较低的控制器。第三,MFAC简单易实现,计算负担小,鲁棒性强。第四,在一些实际假设条件下,基于CFDL的MFAC(CFDL-MFAC)方法的单调收敛性和有界输入有界输出(BIBO)稳定性可以得到保证,这是与其他数据驱动控制方法相比的突出特点。最终,MFAC在化工、直线电机控制、注塑成型工艺、PH值控制等多个实际应用中得到成功实现。

      本文的主要贡献在于证明了BIBO稳定性和跟踪误差的单调收敛性,并通过三容水箱系统的对比实验验证了MFAC的有效性和优越性。

      本文的结构安排如下。第二节针对一类离散时间SISO非线性系统提出了PFDL和CFDL技术。第三节设计了PFDL-MFAC和CFDL-MFAC,分析了MFAC系统的单调收敛性和BIBO稳定性。第四部分给出了在三容水箱系统上使用IFT、VRFT和MFAC的实验结果。第五部分给出结论。


2离散时间SISO非线性系统的动态线性化技术

      在这里,一个非线性系统的等效动态线性化描述被提出,然后在下一节用于设计和分析。

      离散时间SISO非线性系统的控制问题如下:

1.png

      其中y(k)和u(k)分别为系统在时刻的输出和输入,ny和nu为未知阶数,f(...)为未知非线性函数。

      系统(1)也称为NARX模型。Hammerstein模型、Wiener模型、双线性模型等非线性系统模型可以表示为(1)的特例。

      非线性系统(1)的偏格式动态线性化基于以下假设。

   11.png

      注1:从实际的角度来看,施加在模型上的这些假设是合理的和可接受的。假设1是一般非线性系统控制系统设计的典型条件。假设2对控制输入变化驱动的系统输出变化率施加一个上界限制。从"能量"的角度来看,如果控制输入能量的变化在有限高度内,系统内部的能量变化率不可能趋于无穷大。例如,在本论文第四节中,如果三容水箱系统的输入泵流量变化有界,则泵流量引起的三容水箱系统输出液位变化显然不能趋向于无穷大。正如假设2中定义的正的常数一样,液位和泵流量之间必然存在一个最大的比例因子。许多其他实际工业系统,如温度控制系统或压力控制系统,也可以满足这一假设。

     理论1:对于非线性系统(1),对于所有‖Δu(k)≠0‖,则必存在一个参数向量Φ(k),称为伪偏导数向量,这样系统(1)可以转化为如下等价的PFDL描述:

2.png

      注3:由定理1的证明可知,Φ(k)与系统的输入和输出有关。然而,Φ(k)在某种意义上是一个"微分"信号,且对任意k有界,因此当且仅当‖Δu(k)≠0‖的且不太大时,可以看作Φ(k)是一个慢时变参数,且可以忽略其与控制输入u(k)的关系,这将由控制输入指标函数中的重置机制和可调设计参数来保证,将在下一节中给出。

     注4:从附录A中的(A6)式可以看出,PFDL模型(2)中的PPD参数并不唯一,因为每个固定k的多变量标量线性方程(A5)的解并不唯一。

      注5:大量的数值模拟和实验表明,当且仅当ny和nu未知时,可以将L设定为从1到近似阶数之和区间内的整数。从应用的角度来看,L对于简单系统可以取1,对于复杂系统可以取最大值。如果L=1,则PFDL模型(2)变为CFDL模型

  

3.png

这对于控制器在实际中的设计和实现来说更加容易和简单。

       注6:PFDL模型对于控制系统设计有几个有用的优点。首先,动态线性化技术仅基于对象的I/O数据,不需要模型动力学。其次,(2)是系统(1)的等价模型。它与其他线性化形式有很大不同,如泰勒线性化,省略了高阶项,在数学上是一种近似模型。不同的是,PFDL模型是一个具有时变参数向量的精确描述,其存在性由微分中值定理保证。第三,难以获得适用于复杂模型的数学模型。即使有一个复杂系统的精确模型,由于结构、阶次和模型参数可能是时变的,阶数可能过高,或者数学描述可能过于复杂。在这种情况下,从控制器设计的角度来看,得到的模型不再可用,需要进行一些其他的模型简化和模型降阶处理。然而,PFDL模型简单,PPD的I/O动态行为很容易利用闭环系统采集的测量数据进行估计。最后,PFDL模型与时变参数L呈线性关系,可直接用于控制系统设计。因此,许多现有的基于模型的控制器设计和分析方法可以借鉴到MFAC的研究中。与其他数据驱动控制方法(如IFT、VRFT等)相比,MFAC方法的这一固有特性使其具有开放性。


3MFAC系统设计及稳定性分析

      在这里,我们将展示如何使用上一节提出的PFDL模型来设计MFAC方案。PFDL模型是具有时变PPD参数向量的线性模型。如果PPD参数向量可用,则动态线性化模型可作为被控对象的真实模型,进而可将所有基于模型的理论纳入控制器设计。

      对于一步超前控制器,可能需要在一步中引入过多的控制量,特别是在参数整定的早期阶段,其中是期望的参考信号。一般情况下,加权一步前向控制器可能导致稳态跟踪误差。因此我们采用如下控制输入指标函数来设计控制律:

4.png

     注7:显然,在( 8 )式中,不仅是一个惩罚因子,而且是分母的一部分,这意味着系统( 1 )被系统( 2 )所替代的替代域可以被限制在某个合理的范围内,从而约束PPD的变化过快。实际上,是MFAC系统设计的重要参数。理论分析表明,合适的选择可以保证控制系统的稳定性或提高控制系统的性能。

      注8:控制律( 8 )仅由被控对象的I / O测量数据设计,具有递推形式。它与文献中的控制律完全不同,并且与系统的任何显式模型动力学和结构信息无关。

      注9:由于未知参数PPD是时变的,常规投影或最小二乘算法不能很好地跟踪它。因此需要采用一些时变参数估计算法来估计未知PPD,如修正投影算法、带时变遗忘因子的最小二乘算法、泄漏递推最小二乘算法[等。

     本文以修正投影算法为例,对未知PPD向量进行估计。

     定义未知PPD估计的指标函数为

5.png

      注10:为了使参数估计算法具有更强的跟踪时变参数的能力,应采取如式( 12 )所示的重置机制。

      注11:控制方案( 11 ) - ( 13 )有一个需要在线更新的有向PPD向量,与传统的自适应控制系统有很大不同,其中通常有2n模型参数需要在线估计,这里n表示被控对象的阶数。对于简单 SISO非线性系统,L可设为1,如前注5所述。在这种情况下,需要在线更新的控制器参数个数只有一个。因此,PFDL - MFAC格式( 11 ) - ( 13 )变为如下更简单的CFDL - MFAC格式:

6.png

      注12:由PFDL - MFAC方案( 11 ) - ( 13 )和由CFDL - MFAC格式( 14 ) - ( 16 )可知,MFAC格式与被控对象的任何显式或隐式模型动力学和结构信息都没有关系,仅利用被控系统的实测I/O数据估计PPD参数。这就是我们称之为无模型自适应控制的原因。

      对于PFDL - MFAC格式的稳定性和收敛性 ( 11 ) - ( 13 ),需要做另一个假设。

      假设3:对于任意k,PPD向量的第一个元素7.png,其中ε为任意小的正的常数。不失一般性,我们假设8.png

      注13:此假设与文献中控制输入方向的限制类似。事实上,许多实际系统都可以满足这一假设,如温度控制或压力控制。


4试验研究

      包括MFAC在内的三种数据驱动控制方法。为了考察所提方法的控制性能,在三容水箱系统上实现了VRFT和IFT (图1 )。该系统由3个储罐串联组成。每个水箱有手动进水阀和手动出水阀。泵流量可通过电动调节阀从流量0 l / min平滑调节至最大流量32 l / min。采用精度为0.25 cm的扩散硅压力传感器检测液位。控制输入信号为泵的流量,输出信号为下罐T3的液位。在控制器参数整定实验中,采用的采样周期为1 s,实验时间为400 s。三个储罐的上罐手动进水阀和出水阀均开启。中罐和下罐的入口阀门关闭。所需的液位

下箱体设置为5 cm。

   9.png

      为了比较三种数据驱动控制方法的鲁棒性,在过程达到稳态后关闭上罐入口阀门,打开下罐入口阀门。由于上水箱进水口关闭,下水箱进水口打开,改变了厂房的动态。这三种方法的跟踪性能如图2所示,数值指标包括均方根

10.png

时间乘绝对误差的积分

111.png

      对于控制输入变化的测量,如表1所示。从实验结果可以看出,这三种数据驱动方法都可以很好地适用于这种物理三容水箱系统,即使系统结构是时变的。

      然而,我们想指出以下几点。

      1)MFAC方法易于实现。MFAC的控制性能优于其他两种方法。MFAC控制输入信号的振动越小,对执行阀的磨损越小。

      2)MFAC是在线自适应控制方法,不需要任何测量数据采集过程,而VRFT和IFT是离线方法,数据采集过程不可避免。

      3)对于IFT方法,其控制性能不如MFAC和VRFT。其原因可能来自于测量的数据对数量有限和步长参数求解不当。


5结束语

      基于一种新颖的动态线性化技术,针对一类SISO离散时间非线性系统,提出了一种数据驱动控制方法,包括PFDL-MFAC和CFDL-MFAC。该方法仅利用被控对象的在线I/O数据直接设计控制器。PFDL-MFAC控制器存在需要在线更新的参数,比传统的自适应控制系统更容易设计。此时,PFDL-MFAC方案变为CFDL-MFAC方案,CFDL-MFAC对于简单装置更易于设计和实现。MFAC方案的理论支持的BIBO稳定性和单调收敛性分析是与其他数据驱动控制方法相比的突出特点。实验结果说明了MFAC方案的有效性。本工作的所有结果都可以推广到MIMO非线性离散时间系统中,作者希望在另外的论文中发表。

      我们未来的研究将集中在MFAC的跟踪控制上。我们相信,目前的MFAC方法将在工业实际系统中得到广泛应用。