基于层级结构的空地协同预设时间最优容错控制_Automation_2011

http://blog.sina.com.cn/u/1304706164

首页博文目录关于我

个人资料

微博

加好友发纸条

写留言加关注

博客等级：
博客积分：

博客访问：
关注人气：
获赠金笔：0支
赠出金笔：0支
荣誉徽章：

正文字体大小：大中小

基于层级结构的空地协同预设时间最优容错控制

(2024-09-09 14:46:59)

引用本文

成旺磊, 张柯, 姜斌. 基于层级结构的空−地协同预设时间最优容错控制. 自动化学报, 2024, 50(8): 1589−1600 doi: 10.16383/j.aas.c230699

Cheng Wang-Lei, Zhang Ke, Jiang Bin. Hierarchical-based prescribed-time optimal fault-tolerant control for air-ground cooperative system. Acta Automatica Sinica, 2024, 50(8): 1589−1600 doi: 10.16383/j.aas.c230699

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c230699

关键词

空−地协同，执行器故障，预设时间编队，图博弈，最优控制

摘要

研究了发生执行器故障的无人机−无人车异构编队系统的层级预设时间最优编队控制问题. 以保容错性能和收敛速度的优化控制为研究主线, 以层级控制、图博弈理论和预设时间控制为技术基础, 构建了一种预设时间最优容错控制算法. 虚拟层设计了基于一致性跟踪误差和能量消耗的二次型性能指标函数, 借助耦合哈密顿−雅克比−贝尔曼(Hanmilton-Jacobi-Bellman, HJB)方程和强化学习求解近似最优控制策略, 实现多智能体的同步最优控制和交互纳什均衡. 实际控制层基于最优信号并利用滑模控制和自适应技术, 设计了预设时间容错跟踪控制器, 实现对最优编队轨迹的有限时间跟踪. 在保证全局收敛时间完全不依赖于系统的初始状态和控制器参数的同时, 也有效实现对执行器故障参数的逼近. 最后, 通过仿真实验验证了所提控制策略的有效性.

文章导读

异构多智能体系统(Heterogeneous multiagent systems, HMASs)是具有明显状态空间维度、动力学特性及信息感知、决策和交互能力等结构和功能差异的智能体集群系统, 可以在复杂环境下通过交互网络实现相互协作, 进而共同完成特定任务[1]. 由无人机(Unmanned aerial vehicles, UAVs)和无人车(Unmanned ground vehicles, UGVs)构成的空−地异构编队系统综合了无人机对广阔区域的快速侦查和无人车对地面目标的精确定位等优势, 凸显功能互补. 跨域协同系统具备多种有效载荷携带、数据采集和任务分配能力, 在跟踪追逃、协同救援、资源勘查及辐射搜索等军用和民用领域正得到日益广泛的应用[2].

编队控制是多智能体领域的重要研究方向, 如果多智能体系统通过调整各对象的相对相位关系, 使其形成并保持特定的几何构型, 那么就认为完成了预期的编队任务[3]. 目前, 多智能体编队策略主要包含分布式、分散式和集中式控制[4]. 集中式要求至少一个智能体能够获得其他所有智能体的状态信息, 然后做统一规划, 因此过分依赖交互网络, 灵活性和容错性差. 基于局部信息的分布式和分散式控制则具有更强的鲁棒性, 其中利用邻居节点信息的分布式编队策略考虑到不同智能体应对外界干扰和故障能力的差异, 并充分利用了群体资源优势实现协同编队, 因此, 在异构多智能体编队控制的研究领域备受欢迎[5-6]. 分布式空−地协同编队问题到目前为止也有了些许研究成果. 文献[7]研究了无人机−无人车编队系统的分布式跟踪控制问题, 设计了基于虚拟领导者观测器的时变编队控制器并给出了可行性条件. 文献[8]针对空−地异构编队系统设计了一种切换拓扑下基于一致性理论的分布式控制方法. 文献[9]针对轮式无人车和四旋翼构成的领导−跟随编队系统设计了基于反步法的跟踪控制器, 实现编队误差的渐近收敛. 然而, 上述成果均依赖于精确的模型参数, 并未考虑外界干扰和模型不确定性等因素带来的影响. 而无人机和无人车均是易受外界干扰的非线性系统, 尤其是无人机作为一种具有动不稳定性和强耦合特性的复杂系统, 极易受到外界气流影响, 高空作业受到的空气阻力和陀螺效应还会导致模型不确定性[10]. 因此, 研究空−地多智能体系统的鲁棒控制具有重要的实际意义.

多智能体系统在长期运行过程中不可避免地会出现状态渐变或突变, 导致个体及其相互作用的特性和机制受到约束, 比如执行器的物理限制和通信能力受限等, 进而引发执行器及系统元部件出现故障, 破坏多智能体系统的稳定性以至于难以完成既定的任务[11-12]. 为了提高系统的稳定性和安全性, 容错控制技术是不可或缺的一环, 容错机制可为个体稳定性、多智能体系统全局稳定性、任务实现和性能保持等提供技术保证[13-14]. 然而, 目前空−地异构编队系统的容错控制问题还未展开系统性研究. 文献[15]研究了通讯网络故障下的空−地协同编队系统位置环和姿态环的容错控制问题. 文献[16]基于强化学习研究了空−地通信故障下的鲁棒最优编队控制问题, 利用数据信息设计了分布式跟踪控制律. 文献[17]研究了通信链接故障和执行器故障下的空−地多种类无人器的迭代容错学习律, 有效减少了对模型参数的依赖. 文献[18]针对执行器故障下的无人机和无人车异构编队系统, 设计了一种实时任务重规划的容错方案, 保证了全局的任务执行能力.

在实践工程中, 系统良好的暂态性能是非常重要的. 上述方案均存在调节时间过长的弊端, 为了提高系统的机动响应性能, 文献[19]针对空−地协同系统, 基于非奇异快速终端滑模和反步法技术设计了一种有限时间容错编队方案. 文献[20]进一步提出了空−地协同系统的固定时间容错编队控制方案, 保证了收敛时间的可设计性. 实际上, 不管有限时间稳定还是固定时间稳定, 系统的收敛时间总是与控制器参数甚至系统初始状态相关, 而且符号函数的使用必然导致控制输入的非连续性, 这极大影响着工程上的应用前景. 最近, 文献[21]和[22]分别提出了预设时间和实际预设时间控制方法. 不同于有限时间和固定时间控制, 预设时间控制的收敛时间完全不依赖于系统的初始状态和控制器参数, 预估时间更切合实际收敛时间. 由于预设时间控制是基于常规的状态反馈控制而实现, 所以控制输入是连续且光滑的. 然而, 针对空−地异构多智能体系统的预设时间容错编队控制问题鲜有报道.

在众多实际系统中, 智能体不仅被动地接受指令, 还需要在与其他个体交互的过程中优化自身某些性能指标, 以形成一种反映个体及多智能体系统的理性行为, 因此优化控制备受关注[23]. 文献[24]针对离散非线性动态切换系统提出了一种基于事件触发和神经网络的迭代最优控制方法. 文献[25]进一步将事件触发机制引入多智能体系统的最优一致性问题. 文献[26]针对受执行器故障的离散多智能体系统, 设计了一种基于强化学习的自适应容错跟踪控制器. 文献[27]将强化学习与滑模控制技术相融合, 实现了对高阶多智能体系统的最优一致性跟踪控制. 文献[28]针对二阶多智能体系统提出了一种有限时间鲁棒控制算法, 提高了传统优化算法的收敛速度. 文献[29]提出一种基于强化学习的固定时间优化控制算法, 保证被控系统的稳定时间不受系统初始状态的影响. 在基于博弈论相关的优化控制方面, 文献[30]针对高阶多智能体系统分布式自适应Nash均衡解的搜索法则, 实现全局对最优点的一致性跟踪. 文献[31]设计了基于博弈论和积分强化学习的最优迭代学习算法, 在线实现多智能体系统的近似最优鲁棒包容控制. 然而, 在空−地协同异构多智能体系统领域的相关成果却极为少见. 文献[32]针对空−地协同无人器, 利用博弈学习理论设计了一种3-D最优路径规划策略, 但未涉及轨迹的最优跟踪控制问题.

基于上述研究现状, 本文针对受到外界干扰及执行器故障的空−地协同编队系统, 研究带有层级结构的预设时间容错最优控制问题, 创新点如下所述:

1)本文研究有向拓扑网络下的异构多智能体系统, 放宽了网络拓扑约束条件. 设计的预设时间容错控制器实现有限时间的误差收敛, 且收敛时间完全不受其他任何因素的影响, 显著提高系统机动性的同时进一步提高了收敛时间的人为可干预性.

2)从功能实现的角度构造了层级结构, 上层虚拟层和下层实际控制层的设计避免了故障对健康智能体的影响, 提高了单体和多智能体系统的可靠性和安全性. 设计自适应律估计执行器故障参数和不确定性干扰并通过控制器实现补偿, 可有效处理智能体结构差异、拓扑不确定性和未知故障带来的影响.

3)在虚拟层设计了基于图博弈理论的最优轨迹生成规则, 同步实现子系统和全局系统的优化, 从智能决策和智能学习等角度提升系统的整体性能. 区别于传统的执行−评价网络和迭代优化过程, 本文设计的自适应学习律和近似最优控制器降低了算法复杂度, 提升了工程应用潜力.

图 1 异构多智能体系统的结构图

图 2 通讯拓扑结构

图 3 虚拟层多智能体X轴一致性跟踪误差

由于空−地异构多智能体的机载系统功能单元多, 各个智能体易产生诸如偏置、失效等突发执行器故障, 而且难以对其进行精确的状态描述, 传统的容错方法难以实现快速有效的处理. 本文针对这一问题, 设计了一种多层级容错控制方案, 虚拟层构建了一种分布式最优一致性跟踪控制器, 实际控制层设计了一种分散式自适应预设时间容错控制器, 在保证全局编队误差预设时间收敛的同时, 有效估计了执行器故障参数, 实现安全迅速调整设备功能, 维持系统整体健康度, 确保预期编队任务的顺利执行. 最后的仿真实验验证了所提算法的有效性.

未来的研究方向将聚焦异构多智能体系统的交联特性和故障机理, 开发模型与多源数据混合驱动的健康维护机制与方法, 拓展和深化系统从单源到多源、从单一到复杂、从分散到综合的人机共融故障诊断和容错控制机制, 进一步为现代机载系统的安全运行提供技术支撑.

作者简介

成旺磊

南京航空航天大学自动化学院博士后研究人员. 主要研究方向为多智能体系统的容错控制及应用. E-mail: cwl2020nuaa@163.com

张柯

南京航空航天大学自动化学院教授. 主要研究方向为故障诊断与容错控制及应用. E-mail: kezhang@nuaa.edu.cn

姜斌

南京航空航天大学自动化学院教授. 主要研究方向为故障诊断与容错控制及应用. 本文通信作者. E-mail: binjiang@nuaa.edu.cn

阅读┊ 收藏 ┊ 喜欢 ▼ ┊打印┊举报/Report

前一篇：考虑动车组周转和到发线运用的高铁列车运行多计划协同调整

后一篇：基于仿真机理和改进回归决策树的二噁英排放建模

新浪BLOG意见反馈留言板　欢迎批评指正