人工智能技术在智能驾驶控制中的应用-刘湘辉博士

2022-11-17

一、引言

智能驾驶车辆是一个综合系统,集成了环境感知、行为决策及运动规划等多种技术。它不仅是智能交通系统的重要组成部分,也是人工智能在车辆工程中应用的热点,同时也是汽车工业重点发展的方向。智能驾驶系统大多采用分层结构,如感知层、决策层、控制层和执行机构等,其中,控制层是整个系统中的关键环节,也是一个重点研究领域[1]。在常用的分层结构中,控制层接收来自决策层的行为决策命令及路径规划信息,然后产生底层各执行机构相应的动作,实现准确跟踪路径并合理控制车辆的速度。

智能车辆的控制可解耦为横向和纵向控制,传统的控制方法一般从数学解析模型入手,将控制问题转化为优化问题,并使用数学算法进行求解。然而,较高精度的动力学和运动学模型都具有复杂的结构和大量的参数,往往求解困难,实时性较差。近年来,越来越多的基于人工智能的方法被引入智能汽车决策和控制中,开辟了一条和传统汽车工程完全不同的研究思路。人工智能通常是指通过计算机技术来呈现人类智能,涵盖了计算机、仿生学、心理学及统计学等多门学科。李德毅院士提出了一种基于人工智能技术的自学习型控制决策核心的概念,并命名为“驾驶脑”[2]。

智能车辆可视为一种轮式机器人,当处于复杂环境中时,如真实场景下的交通流中,传统的基于先验模型的控制器往往无法预见所有的复杂状况,而人工智能则具有自学习能力,智能控制器会在探索环境的过程中不断训练,从而逐步学习并优化其模型。传统的控制方法也可以结合人工智能技术,如模型预测控制(Model Predictive Control, MPC)的代价函数可以通过机器学习来获得,从而获得更好的稳定性和鲁棒性[3]。深度学习是人工智能领域具有革命性的技术,在智能驾驶感知层获得了众多成熟的应用,而且深度学习与强化学习相结合,还产生了深度强化学习(Deep Reinforcement Learning, DRL)。DRL具有深度学习的感知能力,还具有强化学习的决策能力,不但可以对输入的诸如图像(或雷达点云)这样的高维数据进行特征提取,还可以通过强化训练得到控制策略[4]。人工智能方法的大量引入,使得智能驾驶系统在控制层面得到了更多的解决思路。

二、传统智能驾驶控制技术现状

1.1智能驾驶系统构架

智能驾驶车辆系统的架构包括分层架构和端到端架构两种[5]。大部分智能驾驶系统采用分层架构,如划分为感知、决策、控制和执行机构4个层次,如图1所示。端到端架构则通过深度学习等人工智能方法,直接将图像等传感器数据映射为控制器输出。

image.png

图1 通用无人驾驶系统框图

1.2传统智能驾驶控制方法

大部分智能驾驶系统采用分层架构,控制层处于决策层和执行器之间,作为一个关键环节,起到了承上启下的作用[6]。大多数研究都将控制层解耦为纵向控制和横向控制两种。纵向控制主要针对车辆纵向行驶时的速度和距离进行控制,既要满足车辆运动学和动力学约束,还要保证车辆的纵向安全车距,其输出大多为车辆加速度,并转化为具体的油门和制动指令。横向控制主要控制车辆的转向,引导车辆沿规划的路径行驶。横向控制器可视为一个路径跟踪控制器,其目标就是最小化车辆和规划路径之间的横向偏差和方向偏差,同时也要兼顾车辆的平滑运动以维持稳定性和舒适性。

三、基于AI的智能驾驶控制方法

2.1学习型控制器

与具有固定参数的控制器不同,随着时间的推移,学习型控制器利用训练信息不断学习其模型。基于每批收集的训练数据,真实系统模型的近似值变得更加准确。研究者在很多工作中已经引入了简单的函数逼近器,用于训练学习型控制器,例如高斯过程建模或支持向量回归等。人工智能中的机器学习技术也常用于学习动力学模型,从而改进迭代学习控制和模型预测控制中的先验系统模型。迭代学习控制主要应用于以重复模式工作的系统中,如智能控制的路径跟踪,并成功应用于越野地形导航,以及自动泊车和转向动力学建模等。模型预测控制一般通过解决优化问题来计算控制动作,能够处理具有状态和输入约束的复杂非线性系统。将机器学习与MPC相结合学习驾驶模型等[7]。

学习型控制器的主要优点是,它们将传统的基于模型的控制理论与学习算法完美地结合在一起。这使得设计者仍然可以使用已建立的方法进行控制器设计和稳定性分析,以及在系统识别和预测中应用强大的学习组件。

2.2端到端的智能驾驶控制

与传统的智能驾驶系统的分层架构不同,端到端的智能驾驶控制将原始图像等传感器数据直接映射到底层,取消了感知层和决策规划层。控制模型大多由深度神经网络构成,其模型的训练大致可以分为两大类:一类为模仿学习,主要基于监督式学习训练;另一类则基于强化学习的方法训练,大多使用深度神经网络,而且研究趋势逐渐由单一的图像传感器映射向多传感器数据融合的方向发展[8]。Sallab[9]使用深度强化学习DQN和DDAC方法并基于TORCS模拟器,实现了车道保持任务。Bojarski[10]使用深度学习技术来实现端到端的无人驾驶,即直接将感知层的图像映射到执行机构的动作。

四、AI方法在智能驾驶控制中的挑战

智能驾驶实验具有极大的危险性,当前基于人工智能方法训练的模型大多使用视频游戏模拟引擎进行训练和仿真,如TROCS、CarSim和CARLA等。基于模拟仿真环境训练的模型往往因为虚拟世界的建模误差,而在真实实验平台上表现欠佳,生成对抗网络和对抗学习的出现则提供了一个解决思路[11]。多智能体强化学习是强化学习目前发展的一个主要方向。在真实的交通场景中,驾驶员的决策往往是多个交通参与者相互博弈的结果。这种场景并不完全符合强化学习的理论基础———马尔科夫性,即在智能驾驶应用中,状态转换不但依赖于智能体自身的策略,也包括环境中其他参与者的策略。多智能体强化学习方法, 如minimax-Q Learning、Nash-Q learning等,就是用于解决这一问题的。然而,多智能体强化学习的训练算法比单智能体要复杂得多。