欠驱动系统是指系统控制输入数目小于系统自由度的一类非线性系统.相比全驱动系统,欠驱动系统由于减少了部分执行器,使其成本低、轻巧灵活、能耗少、易维护,这些特点使得欠驱动系统在机器人、柔性装置、起重机械、基准系统等领域应用广泛.然而,由于欠驱动系统输入数量缺失、非线性、参数摄动、多目标、易受干扰等特点,使得其控制难度较高,至今仍被认为是自动控制领域主要的开放问题之一,相关科研人员采用各种方法或方法的组合进行了持续研究,提出了诸多控制策略.
目前模型线性化设计方法被广泛应用于欠驱动系统,这种方法忽视了名义模型和实际模型的差别,外部扰动和模型的不确定性很容易使系统不稳定.为了解决这种问题,许多学者将自适应控制、滑模控制、预测控制、部分反馈控制、轨迹跟踪控制等方法或方法的组合应用于欠驱动系统,实现了某欠驱动装置或者某一类欠驱动装置的控制,如倒立摆、球棒系统、各种欠驱动机器人、水面船舶、航天器、各式吊车等[1-8].然而这些方法在系统初始条件变化、参数不确定、外界干扰条件下,控制效果大打折扣.为了提升欠驱动系统的控制性能,学者们将模糊方法、神经网络等和上述控制方法相结合,得到了某一欠驱动系统的智能控制算法,如鲁棒自适应模糊控制[9]、自适应B样条模糊滑模控制[10]、并行神经网络滑模控制[11]、自适应神经网络滑模控制[12]以及自适应迭代学习控制器等[13].然而,模糊控制需要根据专家知识,由模糊推理机获得模糊控制器的输出,神经网络需要采集大量样本,通过训练得出内部权值,学习算法需要耗费太长在线学习时间,这就使控制器设计难度大大增加,难以应用于工程实际.而且,目前欠驱动系统的控制主要是利用直接、间接驱动部分的动力学耦合作用,通过各种不同的控制策略使某特定的欠驱动系统实现特定运动,不便推广到具有更多自由度的一般欠驱动系统.
自抗扰控制(ADRC)技术采用扩张状态观测器(ESO)对系统的总和扰动进行实时并补偿,把不同被控对象都化成积分器串联型进行控制[14].由于抗干扰能力良好,自抗扰控制已用于潜艇[15]、扭转系统[16]、无人舰船[17]、双足机器人[18]等欠驱动系统的控制,但在应用时需要根据实验结果整定众多的控制参数,技术要求高、工作量大,所得结果也只是根据各性能指标折中取值,整体控制性能难以达到最优.针对以上不足,本文提出了欠驱动多输入多输出(MIMO)系统的集中式自抗扰控制(centralized active disturbance rejection control, CADRC)法.该方法将欠驱动系统分为直接驱动部分和间接驱动部分,根据直接驱动部分的当前状态和目标状态,设计直接驱动部分的虚拟控制律;利用统一的扩张状态观测器对欠驱动部分的扰动和不确定部分进行统一估计及补偿,并设计间接驱动部分的虚拟控制律;将直接和间接驱动部分的虚拟控制律有机组合后形成综合控制律,实现了欠驱动系统的CADRC,并应用Lyapunov方法对CADRC法的稳定性进行了严格的数学证明.以二级倒立摆为例,证明了该方法参数整定容易,控制效果好.
考虑如下的m输入、n输出的欠驱动MIMO系统(1≤m<n):
(1)
式(1)所示的欠驱动系统的独立控制变量个数小于系统自由度,将其分为直接驱动部分式(2)和间接驱动部分式(3),直接驱动部分是直接受驱动器的激励,并产生等输出的部分,所对应的输入输出的自由度相等,间接驱动部分通过与直接驱动部分自由度的耦合,来实现相关执行器的动作.
(2)
(3)
假定欠驱动MIMO系统(1)的目标状态为系统误差为ei,则ei=vi-xi(i=1,2,…,m).间接驱动部分需通过与直接驱动部分之间的动力学耦合关系进行间接控制.因此,定义复合误差信号为间接控制部分j对直接控制部分i的影响系数.通过对的控制就可以实现欠驱动系统所有自由度的控制,因此,可在设计直接驱动部分的虚拟控制律和间接驱动部分的虚拟控制律的基础上,根据间接驱动部分和直接驱动部分之间的动力学耦合关系,将这两个部分的控制律进行有机组合,形成系统的实际控制律ui,实现对欠驱动系统所有自由度的控制.为简单起见,将和对ui有影响的虚拟控制律进行线性组合,作为直接驱动部分i的实际控制律,即该控制律将能实现直接驱动部分i和间接驱动部分j的有效控制.
为使系统(1)能收敛于目标点,需要对系统进行状态反馈控制.式(2)所示的欠驱动MIMO系统的直接驱动部分可表示为
(4)
为体现普适性,采用常规的误差比例-微分(PD)反馈控制设计yi的虚拟控制律:
(5)
其中,ki1, ki2为反馈控制律增益.
式(3)所示的欠驱动MIMO系统的间接驱动部分可表示为
(6)
为便于分析,将式(6)进一步表示为
(7)
其中,bj为bji的估计值, fj(·)为状态量yj环的总和扰动,包括yj环的内扰、外扰和系统耦合及不确定性部分,
设未知扰动fj(·)有界且可微:
其中,是正实数.令则式(7)可扩张为
(8)
其中
根据式(8)设计线性扩张状态观测器(LESO):
(9)
其中,Zj=[zj1 zj2 zj3]T是向量Xj的状态估计,是yj的状态估计,L是观测增益向量,采用基于迭代步长h的三阶线性扩张状态观测器的参数序列[19]:
将yj的虚拟控制律设计为
(10)
将和式(10)代入式(7),可得
(11)
其中,下标k=m+1,m+2,…, j-1, j+1,…,n,ej3为yj的总和扰动fj(·)与其估计值zj3的误差,ej3=fj(·)-zj3.
从式(11)中可以看出,当ej3收敛于0时,系统最终将不受fj(·)的影响,而实际由控制律控制,对也采用PD控制律设计,即
(12)
其中,kj1,kj2为反馈控制律增益.
由于间接驱动部分要由驱动器进行间接控制,间接驱动部分的控制律将对驱动器的实际控制律产生影响,因此,需将直接驱动部分和间接驱动部分的控制律进行合成,以实现欠驱动系统所有自由度的控制,为简单起见,采用线性组合方式作为系统控制律:
(13)
对直接驱动部分,将式(13)代入式(2)可得
(14)
对间接驱动部分,将式(13)代入式(3)可得
(15)
将扩张状态观测器的观测误差定义为ej=[ej1,ej2,ej3]T,则
(16)
将欠驱动MIMO系统的误差定义为ψ(t)=[ψ1,ψ2,…,ψ2n-1,ψ2n]T,则
(17)
根据以上各式,将系统误差微分方程更新为
(18)
(19)
因此,和可扩张为
(20)
其中,Aψ为ψ(t)的系数矩阵,Aej为ej的系数矩阵,
为使Aψ为Hurwitz稳定矩阵,将Aψ的特征值λ都配置在点上,即
(21)
求解式(21),可得
(22)
其中,为方程(21)的解,具体解析式由实际系统决定,则
(23)
即对于输入输出数目均为m的MIMO系统而言,不论m和n的数值为多少,式(23)所示的自抗扰控制控制律始终只有一个可调参数
将式(8)和式(9)两个方程组相减,可得误差变量ej所满足的微分方程组:
(24)
式中
可得其特征值分别为
当h>0时,其特征值的实部均小于0,则矩阵A-LC为Hurwitz稳定矩阵,则对于任意给定的对称正定矩阵Q,存在对称正定矩阵P满足Lyapunov方程:
(A-LC)TP+P(A-LC)+Q=0.
(25)
定义扩张状态观测器的Lyapunov函数为
(26)
对V0针对时间t求导,得
(27)
其中,λmin(Q)是矩阵Q的最小特征值.
当时,有因此线性扩张状态观测器在零点大范围渐进稳定.当时,系统的观测值会出现一定误差.由式(16)和式(22)可得稳态误差范围为
(28)
由式(20)的系统误差微分方程可知,因为Aψ为Hurwitz稳定矩阵,因此对于任意给定的对称正定矩阵存在对称正定矩阵满足如下Lyapunov方程:
(29)
定义系统误差微分方程的Lyapunov函数为
(30)
(31)
当时,根据线性扩张状态观测器的收敛性分析可知,即有则系统在零点大范围渐进稳定;当时,整个系统将存在稳态误差.令式(8)左边全等于0,再将式(28)代入其中,可求得系统的稳态误差范围为
(32)
为验证本文所提控制方法的有效性,以深圳市元创兴科技有限公司生产的直线二级倒立摆系统为分析对象,进行实验验证,二级倒立摆系统的数学模型可表示为
(33)
其中
状态方程中的六个状态量分别代表小车位移、小车速度、一级摆杆摆动角度、一级摆杆摆动角速度、二级摆杆摆动角度、二级摆杆摆动角速度,其他各符号的含义及具体数值见表1.
表1 直线二级倒立摆系统的物理参数[20]
Table 1 Physical parameters of the 2-stage inverted pendulum system[20]
parametervalueparametervalue1st rod mass m1/kg0.124length from the 1st rod axis to its centroid l1/m0.152nd rod mass m2/kg0.111length from the 2nd rod axis to its centroid l2/m0.25mass of block m3/kg0.1gravity g/(m/s2)9.81
将表1中的物理参数代入以上各式,求得: c11=52.797, c12=-16.100, c13=3.740 7, c21=-44.526 7, c22=-43.928 8, c23=0.597.
二级倒立摆的控制目标是当小车到达目标位置时,摆杆处于垂直稳定的平衡位置,因此倒立摆的目标状态为
根据式(5)设计直接驱动部分,即小车位移的虚拟反馈控制律为
(34)
根据式(12)设计间接驱动部分,即摆杆1的摆角θ1和摆杆2的摆角θ2的虚拟控制律为
(35)
(36)
将式(34)~(36)代入式(13)中,得直线二级倒立摆的状态反馈控制律:
(37)
根据式(37),b1 ,b2分别为c13, c23的估计值,取实际值,即b1=c13,b2=c23.
根据直线二级倒立摆的稳定点坐标,将系统误差定义为
(38)
根据以上各式,得出直线二级倒立摆系统的误差微分方程:
(39a)
(39b)
(39c)
对二级倒立摆的误差微分方程进行扩张,得
(40)
其中
根据式(21),可得
(41)
将表1中的系统参数代入之后,求解方程(41),可得
(42)
根据b1=c13,b2=c23,可得b1=3.740 7, b2=0.597,数值计算迭代步长根据系统硬件取h=0.01 s,经过充分整定后,优选为6,将以上数据代入式(37),得出二级倒立摆的控制律,即可对二级摆进行控制.
在实验中,假定小车的目标位置为0.2 m,在5 s处对小车施加50% 的阶跃扰动,在10 s处对二级摆杆施加50%的阶跃扰动,运用CADRC法和元创兴公司提供的标准LQR法对二级倒立摆进行控制,实验结果如图1所示.图中从上至下4条曲线分别表示台车位移x、一级摆杆摆角θ1、二级摆杆摆角θ2和台车驱动力u,结果表明: 1) 采用CADRC法,小车运行平稳,基本无超调,最大驱动力仅0.2 N,小车稳定在目标位置所耗时间约仅2.0 s,运行过程中一级摆杆的最大摆动角度仅为1.2°,二级摆杆的摆动角度不到1°,采用LQR法,小车稳定在目标位置所耗时间约为4.5 s,启动时达到了5 N,运行过程中一级摆杆的最大摆动角度为2.2°,二级摆杆的摆动角度不到1.7°,说明CADRC法控制下倒立摆系统具有更好的快速性、更好的稳摆性能; 2) 在5 s处对小车施加50%的阶跃扰动后,CADRC法控制下小车控制力远小于LQR法,一、二级摆摆杆的摆动时间仅LQR法的一半,摆动角度也小于LQR法,在10 s处对一级摆杆施加50%的阶跃扰动后,CADRC法控制下小车只有微动,小车控制力及一、二级摆杆的摆动角度均远小于LQR法,说明CADRC法控制下倒立摆系统具有更好的鲁棒和抗干扰性能.
(a) x
(b) θ1
(c) θ2
(d) u
图1 CADRC法和LQR法控制下二级倒立摆的稳摆和抗干扰结果
Fig. 1 Results of the 2-stage inverted pendulum with disturbances
controlled with the CADRC and LQR methods
1) 通过利用统一的扩张状态观测器对系统的总和扰动进行统一估计,并设计虚拟控制律进行补偿,加强了欠驱动系统的自抗扰能力;将直接和间接驱动部分的虚拟控制律有机组合成综合控制律,实现了欠驱动系统的CADRC.
2) 运用Lyapunov方法将欠驱动MIMO系统的待整定参数减少到了极点配置1个参数,显著减少了参数整定难度,也从根本上保障了CADRC法的稳定性.
3) 二级倒立摆和桥式吊车的控制实验表明,CADRC法比LQR法具有更优良的稳摆和抗干扰性能.
参考文献(References):
[1] ABDEL R E, NAYFEH A H, MASOUD Z N. Dynamics and control of cranes: a review[J]. Journal of Vibration and Control, 2003, 9(7): 863-908.
[2] RAMLI L, MOHAMED Z, ABDULLAHI A M, et al. Control strategies for crane systems: a comprehensive review[J]. Mechanical Systems and Signal Processing, 2017, 95(10): 1-23.
[3] MUKHTAR F H, HWA J Y, IMTIAZ A C, et al. Current development on using rotary inverted pendulum as a benchmark for testing linear and nonlinear control algorithms[J]. Mechanical Systems and Signal Processing, 2019, 116(1): 347-369.
[4] BARA J E, HOMAYOUN N. A review of quadrotor: an underactuated mechanical system[J]. Annual Reviews in Control, 2018, 46: 165-180.
[5] 郭晨, 汪洋, 孙富春. 欠驱动水面船舶运动控制研究综述欠驱动水面船舶运动控制研究综述[J]. 控制与决策, 2011, 24(3): 321-329.(GUO Chen, WANG Yang, SUN Fuchun. Survey for motion control of underactuated surface vessels[J]. Control and Decision, 2011, 24(3): 321-329.(in Chinese))
[6] 易中贵, 戈新生. 基于 Gauss 伪谱法的欠驱动航天器姿态优化控制[J]. 应用数学和力学, 2017, 38(12): 1319-1330.(YI Zhonggui, GE Xinsheng. Optimal attitude control of underactuated spacecrafts with the Gauss pseudospectral method[J]. Applied Mathematics and Mechanics, 2017, 38(12): 1319-1330.(in Chinese))
[7] 赵晨, 戈新生. 基于虚拟完整约束的欠驱动起重机控制方法[J]. 应用数学和力学, 2019, 40(3): 302-310.(ZHAO Chen, GE Xinsheng. A control method for underactuated cranes based on virtual holonomic constraints[J]. Applied Mathematics and Mechanics, 2019, 40(3): 302-310.(in Chinese))
[8] 陈彦杰. 欠驱动机器人系统的运动规划方法及应用研究[D]. 博士学位论文. 长沙: 湖南大学, 2017.(CHEN Yanjie. Research on motion planning methods for underactuated robotic systems and their applications[D]. PhD Thesis. Changsha: Hunan University, 2017.(in Chinese))
[9] WU T S, KARKOUB M, YU W S, et al. Anti-sway tracking control of tower cranes with delayed uncertainty using a robust adaptive fuzzy control[J]. Fuzzy Sets and Systems, 2016, 290(5): 118-137.
[10] CHENG K H. Adaptive B-spline-based fuzzy sliding-mode control for an auto-warehousing crane system[J]. Applied Soft Computing, 2016, 48(11): 476-490.
[11] LEE L H, HUANG P H, SHIH Y C, et al. Parallel neural network combined with sliding mode control in overhead crane control system[J]. Journal of Vibration and Control, 2014, 20(5): 749-760.
[12] BENHELLAL B, HAMERLAIN M, OUIGUINI R, et al. Decoupled adaptive neuro-fuzzy sliding mode control applied in a 3D crane system[J]. Journal of Electrical Engineering, 2014, 14(1): 313-319.
[13] QIAN Y Z, FANG Y C, LU B. Adaptive repetitive learning control for an offshore boom crane[J]. Automatica, 2017, 82(82): 21-28.
[14] HAN J Q. From PID to active disturbance rejection control[J]. IEEE Transactions on Industrial Electronics, 2009, 56(3): 900-906.
[15] 李荣辉. 欠驱动水面船舶航迹自抗扰控制研究[D]. 博士学位论文. 大连: 大连海事大学, 2013.(LI Ronghui. Active disturbance rejction based tracking control of underactuated surface ships[D]. PhD Thesis. Dalian: Dalian Maritime University, 2013.(in Chinese))
[16] 王紫东. 基于欠驱动性的双足机器人高能效行走控制研究[D]. 博士学位论文. 杭州: 浙江大学, 2016.(WANG Zidong. Control strategy of biped robots based on underactuation[D]. PhD Thesis. Hangzhou: Zhejiang University, 2016.(in Chinese))
[17] RAMIREZ N M, SIRA R H, GARRIDO M R, et al, Linear active disturbance rejection control of underactuated systems: the case of the Furuta pendulum[J]. ISA Transactions, 2014, 53(4): 920-928.
[18] 韩京清. 自抗扰控制技术: 估计补偿不确定因素的控制技术[M]. 北京: 国防工业出版社, 2008.(HAN Jingqing. Active Disturbance Rejection Control Technique: the Technique for Estimating and Compensating the Uncertainties[M]. Beijing: National Defense Industry Press, 2008.(in Chinese))
[19] GAO Z Q. Scaling and bandwidth-parameterization based controller tuning[C]//Proceedings of the American Control Conference. Denver, Colorado, USA, 2003.
[20] 深圳市元创兴科技有限公司. 直线倒立摆实验指导书[M]. 深圳: 深圳市元创兴科技有限公司, 2008.(Shenzhen Yuan Chuang Hsing Technology Co Ltd. Experimental Guide for Straight Inverted Pendulum[M]. Shenzhen: Shenzhen Yuan Chuang Hsing Technology Co Ltd, 2008.(in Chinese))