人工智能的蓬勃发展,离不开数据这一核心支柱。
近年来,随着人工智能技术的广泛应用,以数据为核心的系统表征方法迅速渗透到控制领域,控制系统的设计方法正迎来一场从模型驱动向数据驱动的范式变革,即从传统的模型驱动控制(modelic control,即model-driven control)到数据驱动控制(datatic control,即data-driven control)。
对于控制系统而言,系统的稳定性、可控性及标准型是控制理论的基本问题。数据驱动控制不依赖于被控对象的数学模型,而是直接通过输入/输出(I/O,Input /Output)数据与控制器连接,并根据 I/O 数据对系统状态进行调整。
其优点是控制器的设计不依赖于复杂的系统模型,但却无法保证控制系统的稳定性和鲁棒性。因此,需要构建基于数据的控制性能定义和分析方法,以进一步完善数据驱动控制的理论框架。
近年,清华大学李升波教授课题组在数据驱动控制系统(datatic control system)的特性分析方面,取得了一系列原创性理论成果 [1-3]。
该研究团队借鉴传统控制理论的基础理论,提出了一套全新的数据驱动分析框架,包括系统数据描述方式的特点与制约、用于稳定性检验的 η-检验算法、从“精确可控性”到“微域可控性”概念拓展,用于可控性检验的 MECS 算法,以及用于训练算法性能提升的数据描述标准型等。
具体来说:
- 系统稳定性方面,提出了首个适用于数据驱动控制系统的稳定性判定算法 η-检验,解决了数据描述方式空间不连续造成的稳定性判定难题:利用系统动力学的利普希茨连续性(Lipschitz continuity),将离散数据点上的状态转移信息延拓到未知的连续空间,并据此计算出李雅普诺夫(Lyapunov)函数的导数上界,从而判定系统的李雅普诺夫稳定性。
- 数据标准型方面,提出了一种基于数据的系统描述新形式,每个标准形式的样本由转移和属性组成,分别用于描述系统变化规律和人为定义特征。适当增加的属性组分,不仅便于提升系统描述的准确性,还能提升最优控制策略的训练效率,为数据驱动控制算法的高效实现提供新的思路。
- 系统可控性方面,提出了用于数据驱动控制系统的“微域可控性”概念,将传统的点对点可控性拓展到点对区域的形式,进而将状态转移信息从离散数据点延拓到数据点之间的连续空间中。基于这一原理,该研究团队提出了首个数据驱动控制系统的可控性检验算法 MECS(maximum expansion of controllable subset),通过树搜索迭代寻找系统的微域可控状态。
这三项研究成果既具有联系又互为补充,通过重新定义数据驱动系统的稳定性、标准型及可控性,为分析该类系统的特性提供了核心算法和实用工具,这对数据驱动控制器的综合设计具有重要的指导意义。
人工智能如何赋能自动控制?
自动控制技术的发展,与社会的进步息息相关。
第一次工业革命通过普及机械化技术,为后来的自动化奠定了基础。第二次工业革命通过电气化和通信技术,初步实现了模拟自动化。
在第三次工业革命中,借助于计算机与半导体技术,通过数字信号实现自动化的技术趋于成熟。进入第四次工业革命后,以人工智能为核心技术,融合大数据、云计算和物联网等技术,实现了从感知到决策的智能飞跃。
自动控制领域的理论发展历史悠久,在传统的模型驱动控制范式下,已形成了一套全面且普适的基础理论。
然而,在人工智能时代,自动控制系统的设计范式已发生变革,从使用传递函数、状态空间为基础的控制器设计与优化,过渡到使用数据训练和优化以参数化函数为基础的控制器。
李升波指出,“以自动驾驶领域为例,由于车辆模型非线性,车辆之间交互随机,车辆行驶场景复杂,很难使用一个特定的动力学模型对其进行精确描述。因此,自动驾驶的感知、决策和规划在数据驱动范式下进行研究会有更好的效果。”
正是由于传统的模型驱动方法依赖于建模的精确性,导致复杂系统的建模变得困难,因此直接利用系统生成的数据来设计控制器,成为人工智能范式下自动控制领域研究的关键方向。
由于模型驱动范式与数据驱动范式之间存在显著的差别,因此到目前为止,数据驱动范式下的控制理论体系尚未完全建立,且无法直接用模型驱动的理论进行迁移。
首先,模型驱动范式理论使用模型来描述,在复杂系统下存在建模误差,而数据驱动范式则通过离散的状态转移数据点对系统进行精确描述,但数据点之间存在着间隙,这导致数据点之间的系统信息无法直接得到。
其次,在理论层面,传统模型驱动范式下的控制算法设计以矩阵分析为基础,而数据驱动范式下的算法以迭代优化理论为基础。
除此之外,二者的控制策略承载体也存在差距,前者依赖于显式的控制方程 (如黎卡提方程),而后者依赖于参数化的神经网络。
综上所述,传统模型驱动范式下的基础理论在数据驱动范式下并不适用。因此,如何在数据驱动范式下建立系统的标准型、稳定性判定和可控性判定等基础理论,成为数据驱动范式下首先需要回答的问题。
稳定性:系统描述从离散数据点到连续空间的延拓
系统的稳定性是控制器设计的首要考量因素,稳定性判定理论是闭环控制的基石。
在模型驱动的控制系统中,稳定性判定理论已较为成熟。早期的理论包括劳斯-赫尔维茨(Routh-Hurwitz)判据和奈奎斯特(Nyquist)判据,它们是经典控制理论的重要基础。
此后,由俄国数学家亚历山大·米哈伊洛维奇·李雅普诺夫(Aleksandr Mikhailovich Lyapunov)提出的李雅普诺夫稳定性及其判定理论是应用最为广泛的稳定性理论,这也为现代控制理论的崛起奠定了基础。
模型驱动的稳定性判定理论依赖已知的系统动力学模型。例如,判定李雅普诺夫稳定性需要利用动力学模型计算连续空间中,李雅普诺夫函数对时间的导数。
然而,在数据驱动的控制系统中,数据点只能提供空间上离散的系统描述,因此数据点之间的描述缺失导致模型驱动的稳定性判定理论不适用于数据驱动的系统。
为解决该问题,研究人员提出首个适用于数据驱动控制系统的稳定性判定算法 η-检验。
这一算法的基本原理是利用系统动力学的利普希茨连续性,将数据点上的状态转移信息延拓到未知区域,并据此计算出李雅普诺夫函数的导数上界,从而判定系统的李雅普诺夫稳定性。
实验表明,η-检验算法能够准确判定数据驱动控制系统的稳定性、不稳定性和临界稳定性。该研究为数据驱动系统的稳定性判定提供了有效方法。
该工作的第一作者、清华大学博士生杨雨杰表示:“如果有了数据驱动的系统稳定性判定算法,就可以仅依赖数据,在将控制器应用于实际系统之前,事先判断出其稳定性。这对数据驱动控制算法的设计具有重要的指导意义。”
日前,相关论文以《关于数据驱动控制系统的稳定性》(On the Stability of Datatic Control Systems)为题发表在预印本网站arXiv上 [1]。
标准型:数据驱动算法效率的新方向
标准型是数据描述方式的一个新问题,对后续算法的效率具有重要影响。
以强化学习为例,训练算法往往涉及大量的迭代计算,如果没有关注数据样本的内在特性(例如因果性、局部性等),往往导致每步训练迭代都会重复计算一些所需信息(例如各样本之间的范数距离等),增加了不必要的计算负担。
该研究工作的第一作者、清华大学博士生占国建解释说:“因果性是指状态转移与控制动作的动态依赖性,每一步的动作都影响了下一步的状态,而下一步的状态又决定了未来的状态,这种因果关系链贯穿于整个状态转移和控制动作的序列。局部性是指每步的控制动作至多依赖于有限的历史交互信息,这允许了在线采样过程高效计算与存储训练所需的信息。”
利用数据样本的这两个内在特性,研究人员为数据驱动控制系统提出了“数据标准型”的全新概念。
每个数据样本由转移和属性两个部分组成,其中转移用于描述系统的变化规律,属性用于描述人为定义的特征。适当增加的属性组分不仅可以辅助系统描述,还能为控制器的训练提供便利并提高效率。
实验表明,采用标准形式的数据可以将控制器的训练时间从 21 小时缩短至 7 小时,效率提高近 3 倍,同时显著减少了训练中的不稳定现象。
李升波表示:“研究提出的数据标准型用少量的存储空间换取了显著的时间优势,填补了基于数据的系统描述标准形式的空缺,为提高数据驱动算法效率提供了新的方向。”
前不久,相关论文以《控制系统的数据描述标准型》(Canonical Form of Datatic Description in Control Systems)为题发表在预印本网站arXiv上 [2]。
可控性:将定义从“点对点”扩展为“点对区域”
可控性是控制系统的一项基本属性,判断一个系统是否具有可控制性是控制理论研究的核心问题之一。在模型驱动的系统中,已有广泛的研究关注可控性判定理论。
该研究工作的作者之一、清华大学博士生陶乐天表示,尽管模型驱动的控制系统在可控性检验的理论方面已经趋近成熟,但由于数据驱动的控制系统只能依赖于离散的数据点,这限制了对系统行为的完整描述。因此,传统基于模型的可控性检验方法对于数据驱动的控制系统来说并不适用。
为解决上述问题,研究人员第一次提出“微域可控性”概念和其检验方法,用于解决数据驱动控制系统空间描述不完整的可控性检验难题。
传统的可控性是指系统状态能在有限时间内从任何初始点精确地转移到目标状态,又称精确可控性。
与之不同,微域可控性将精确的点对点可控性延伸至点对区域的形式,关注系统状态是否能够转移到目标状态附近的一个小邻域内。这一概念将状态转移信息从离散的数据点,扩展到数据点之间的连续空间中。
基于微域可控性的定义,研究人员提出了首个适用于一般非线性数据驱动控制系统的可控性检验算法——MECS。该算法通过对可控状态树进行搜索,迭代进行选择、扩展、评估、修剪四个步骤,从而寻找最大可控集。
实验结果表明,MECS 算法仅通过数据就能判定数据集中的微域可控状态,进而检验系统的可控性。
“有了微域可控性的概念,我们就可以纯粹靠数据来检验一个系统对象是否具有可控性,而在此之前这是无法实现的。之前的方法需要先建立一个显式的系统动力学模型,然后再依据该模型来检验系统的可控性。很明显,如果模型不准确,系统的可控性检验也是不准确的。”该工作的共同研究者、清华大学博士生杨雨杰说。
近日,相关论文以《非线性数据驱动控制系统的可控性检验》(Controllability Test for Nonlinear Datatic Systems)为题发表在预印本网站arXiv上 [3]。
稳定性、标准型和可控性是控制系统研究的基石,在数据驱动的系统描述范式下,这些概念得到了进一步的完善和发展。
李升波及其课题组的研究生们通过深入研究这三个核心问题的本质属性,构建了一套全新的数据驱动分析框架,为未来“人工智能+自动控制”领域的交叉研究奠定了重要基础。
端到端自动驾驶:数据驱动控制范式的典型应用
自动驾驶技术是人工智能领域的一大突破,具有提升日常出行安全性、效率性和便捷性的巨大潜力。
然而,传统方法往往依赖于精确模型和人工规则,难以利用数据实现性能提升,在面对未知或复杂交通场景时智能性受到限制,通常只能实现 L1 或 L2 级辅助驾驶功能。
相比之下,端到端自动驾驶系统通过全模块神经网络化,直接利用高维特征向量,实现原始感知数据到车辆控制指令的信息传递。
这不仅显著减少了从传感器到执行器的信息损失,而且还给系统赋予了数据驱动的闭环迭代能力,为实现更高级别自动驾驶开辟了新路径。
实现安全高效端到端自动驾驶系统的一个核心挑战是:如何对该类数据驱动的系统进行标准形式的描述,并在确保系统稳定性和可控性的前提下实现性能的持续提升。
此前,该领域研究尚未得到充分探索。李升波课题组构建的数据驱动分析框架成功填补了这一空白,为端到端自动驾驶技术提供了核心理论支持。
通过深入研究和应用这一理论框架,该团队成功开发了国内首套端到端自动驾驶系统 iDrive,涵盖了“感知-预测-决控”的全链路环节,并率先完成了中国城市工况的开放道路验证。
该系统由三个数据训练完成的基座模型组成:感知基座模型、预测基座模型和决控基座模型,是一个典型的“三段式”端到端自动驾驶系统。
“我们秉持蚂蚁搬家的精神,从理论、算法、工具链到应用验证,逐一构建了端到端自动驾驶系统研发的完备体系。”这一研究工作的参与者、清华大学博士生吕尧如是说。
他指出,为支撑系统开发,课题组还提出了综合性能排名国际第一的强化学习算法(DSAC,Distributional Soft Actor-Critic),构建了时空分离的交通参与者行为预测模型(SEPT,Scene Encoding Predictive Transformer),研发了具备自主知识产权的最优策略强化学习求解器(GOPS,General Optimal control Problem Solver)和大规模自动驾驶训练软件(LasVSim,Large Scale autonomous Vehicle Simulator)。
参考资料:
1. Yujie Yang, Zhilong Zheng, Shengbo Eben Li. On the stability of datatic control systems.arXiv:2401.16793, 2024.
2.Guojian Zhan, Ziang Zheng, Shengbo Eben Li. Canonical Form of Datatic Description in Control Systems.arXiv:2403.01768, 2024.
3.Yujie Yang, Letian Tao, Likun Wang, Shengbo Eben Li. Controllability Test for Nonlinear Datatic Systems.arXiv:2405.09317,2024.
4. Hyungjin Choi, Umesh Vaidya, Yongxin Chen.A Convex Data-Driven Approach for Nonlinear Control Synthesis.Mathematics2021, 9(19), 2445.
5. Derong Liu, Pengfei Yan,Qinglai Wei. Data-Based Controllability and Observability Analysis of Linear Discrete-Time Systems.Information Sciences288, 20, 2014, 314-329.
6. Henk J. van Waarde, Jaap Eising, Harry L. Trentelman, M. Kanat Camlibel. Data informativity: a new perspective on data-driven analysis and control.arXiv:1908.00468, 2019.
7.https://www.tsinghua.edu.cn/info/1175/110869.htm
运营/排版:何晨龙