摘要
人机互信水平是影响人机协同系统表现的关键因素之一。提出了一种考虑人机信任匹配的主从博弈协同控制策略。建立评估驾驶人和机器相互信任程度的方法,在此基础上根据人机信任匹配程度进行协同驾驶中的权重分配;采用模型预测控制框架并结合主从博弈进行最优化求解,得出最优的协同控制策略;通过驾驶人在环实验,验证了所提出的协同控制策略的有效性。结果表明,对于不同信任匹配程度的驾驶人,所提出的策略使得驾驶人路径跟踪精度平均提高了70.91%,驾驶负担平均降低了44.03%。所提出的策略能提升车辆的驾驶表现,减轻驾驶人操作负担。
自动驾驶的出现减轻了驾驶人负担,甚至能减小事故风
在人机协同驾驶中,驾驶权的实时分配策略决定车的行驶轨迹。Fang
自动驾驶系统与驾驶人之间的相互信任程度影响人机共驾的水平。在人机共驾中,自动驾驶系统作为驾驶人的合作伙伴参与到整个系统控制中,信任的存在有助于建立良好的协作关系,提高系统的效率与驾驶安全
在人机协同驾驶中,驾驶人与自动驾驶系统均可独立完成驾驶任务,被视为2个独立的智能体,而博弈论是解决2个智能体协同控制问题的有效方法。Ji
本文提出了一种考虑人机信任匹配的人机协同控制策略。根据人机信任匹配程度进行协同驾驶中的权重动态分配,在人机信任匹配程度低时优先保障驾驶安全性。最后,通过驾驶人在环实验验证了所提策略下的驾驶表现,以减轻驾驶人操作负担。
构建了基于人机信任匹配的主从博弈协同控制框架,如

图1 基于人机信任匹配的主从博弈协同控制框架
Fig.1 Cooperative control framework based on human-machine trust matching in Stackelberg Game
基于广泛使用的二自由度车辆动力学模型,构建协同控制车辆转向的预测控制模

图2 二自由度车辆模型
Fig.2 Two-degree of freedom vehicle model
(1) |
, |
式中:为车辆纵向速度;为车辆前轮侧偏刚度;为车辆后轮侧偏刚度;为车辆质量;为车辆前轴中心到质心的距离;为车辆后轴中心到质心的距离;为车辆绕z轴的转动惯量;为方向盘的转动惯量。
基于零阶保持方法采用采样周期将连续的车辆动力学及运动学系统离散化,得到以下离散状态模型:
(2) |
式中:为第k个采样时刻的状态向量;为系统离散化之后对应的矩阵;、分别为系统离散化之后、所对应的矩阵;为第k个采样时刻车辆的横向位移。
本节介绍了驾驶人对机器与机器对驾驶人信任程度的计算方式,以此计算人机互信程度,并进行驾驶权重分配。
驾驶人对机器的信任程度可以从驾驶人与机器转角冲突的大小上得到体
(3) |
式中,为减小冲突指标值波动的常数,。的值越大,驾驶人对机器的信任程度越低。
驾驶人的实时驾驶能力是影响机器对驾驶人信任程度的重要因素。选择反映驾驶稳定性的指标和驾驶安全性的指标评估驾驶人的实时驾驶能力,计算式分别
(4) |
(5) |
式中:为方向盘转动速率;为碰撞时间平均值;为时间节点;Δ为到时刻方向盘转角的变化;为采样个数;为前车与主车之间的距离;为主车速度;为前车速度。用于衡量驾驶人的车辆控制能力,值越大,驾驶人的驾驶稳定性越差,驾驶能力越
(6) |
的值越大,机器对驾驶人的信任程度越低。
人机互信程度严重影响协同驾驶时的驾驶性能。对于线控转向车辆,驾驶权重的合理分配是提高人机协同性能的关键。因此,设计了基于人机信任匹配程度的驾驶权重分配策略。当驾驶人对机器信任程度高、机器对驾驶人信任程度也高时,人机信任匹配程度高,驾驶人与机器享有同等的权重。若人机信任匹配程度较低,则分为2种情况:当驾驶人对机器信任程度高、机器对驾驶人信任程度低时,机器享有更高的权重;当驾驶人对机器信任程度低、机器对驾驶人信任程度高时,驾驶人的权重大,按照驾驶人的意愿行驶。驾驶人对机器的信任程度和机器对驾驶人的信任程度都低时,人机信任不匹配,以驾驶的安全性为首要目标进行驾驶权重分配。基于以上规则,权重分配指标定义
(7) |
式中,、为影响波动程度的常数,,。随和的变化如

图3 r、H和M之间的关系
Fig.3 Relationship among r, H and M
当驾驶人对机器的信任程度高(低H)时,根据驾驶人的驾驶能力进行权重分配。当机器对驾驶人的信任程度低(高M)时,机器认为驾驶人能力较差,分配给驾驶人较低的权重;当机器对驾驶人的信任程度高(低M)时,驾驶人享有与机器相当的权重。
随着H值的增大,驾驶人对机器信任程度降低。如果机器对驾驶人的信任程度高(低M),就代表机器认同驾驶人的驾驶能力,驾驶人的驾驶权重大于机器;如果机器对驾驶人的信任程度低(高M),机器就保有一定的驾驶权重,使得机器通过影响车辆轨迹提醒驾驶人追寻自己的目标,若驾驶人接受机器的目标则冲突解决,但若驾驶人仍然通过保持较大的与机器不同的转角来对抗机器,导致高H,则增加,控制权将转移给驾驶人。得到后,驾驶权重计算式为
(8) |
又因为,可得,。
基于模型预测控制框架,使用主从博弈实现最优求解,从而输出控制器的最优转角。
以为预测时域,设为控制时域,有;设预测步长为P,控制步长为Q。结合2节的系统状态方程,通过连续迭代可得预测方程为:
(9) |
假设驾驶人和共驾控制器的期望路径分别为:
(10) |
(11) |
为了以尽可能小的付出获得尽可能多的收益,即尽量提高对期望轨迹的跟踪精度,被控的输出轨迹与输入的参考轨迹之间的误差尽可能小,同时对应的驾驶人和机器的付出也尽量小,将驾驶人和共驾控制器的优化目标设为以下形式:
(12) |
式中:、、、为权重因子;、分别为驾驶人和控制器的目标函数。
本研究使用主从博弈进行最优化求解。在主从博弈中,驾驶人作为领导者根据期望路径先做出决策行为,控制器作为跟随者观察驾驶人的行为后做出控制决策。因此,可以通过逆向归纳法求主从博弈平衡
首先假设驾驶人行为已知,对控制器的目标函数求导,令其等于零,得到
(13) |
式中,。求解得到控制器在驾驶人特定行为下的最优决策,则表达式为
(14) |
式中,。同样对驾驶人目标函数求导,可得
(15) |
式中,。将控制器在驾驶人行为下的最优决策代入,解得驾驶人的最优决策为
(16) |
记,,,有:
(17) |
再将其代入控制器在驾驶人行为下的最优决策(14)中,可以解出控制器的最优控制决策为
(18) |
取
为了检验本文提出的基于人机信任匹配的人机协同控制策略的实际性能,采用驾驶人在环模拟驾驶形式开展实验验证,如

图4 驾驶人在环测试
Fig.4 Driver-in-the-loop test
参数名称 | 单位 | 参数值 |
---|---|---|
1 524.5 | ||
15.8 | ||
1.045 | ||
1.855 | ||
33 000 | ||
33 000 | ||
1 400 | ||
2 | ||
2 | ||
P | 1 | 50 |
Q | 1 | 50 |
驾驶人在环测试平台人机交互的主要硬件输入接口包括方向盘、制动和油门踏板。视觉交互界面通过显示屏将车辆实际行驶工况呈现给驾驶人,驾驶人接收到反馈信息后实时控制车辆行驶。平台的输入接口将驾驶人控制信息传回主机,控制器的输出转角由预测+控制滚动优化模型实时计算,通过主机中的人机互信评估和权限分配策略为双方提供真实的权限,两者加权融合后实现对仿真车辆的共同控制,完成人机共驾。
较高速度下超车是一种典型场景,该场景对驾驶人的驾驶能力有一定要求,当驾驶人想超越前车时,人机操作不完全一致,很容易导致人机信任不匹配。在此场景下,驾驶人和控制器的参考轨迹一致,驾驶人与控制器博弈结果为:在提升对参考轨迹跟踪精度的同时,尽量减小各自付出的努力,也就是各自的输出转角。如何获取参考轨迹不在本文研究范围内。
选取3名测试人员参与验证协同控制策略的超车测试,对基于信任匹配策略的有效性进行分析,将实验中主车车速设定为70 km·

图5 驾驶人1测试结果
Fig.5 Test results of driver 1

图6 驾驶人2测试结果
Fig.6 Test results of driver 2

图7 驾驶人3测试结果
Fig.7 Test results of driver 3
选取的3位驾驶人中,驾驶人1碰撞时间较小,驾驶安全性较差,驾驶人2对车辆控制的稳定性不足,驾驶人3拥有相对较好的驾驶表现。驾驶人1与驾驶人2的人机信任匹配程度较低,驾驶人3的人机信任匹配程度相对较高。
驾驶人1在手动驾驶时由于没有把控好与前车之间的距离,在超车开始时与前车距离过小,导致横向偏移过大,驾驶轨迹与参考轨迹偏差很大;在协同驾驶时,由
由
驾驶人3是驾驶表现最好的驾驶人。单独驾驶时驾驶轨迹比较贴合理想的参考轨迹,协同驾驶时驾驶人3的输出转角也和理想的转角较为贴合,机器对驾驶人的信任程度高,因此驾驶人3在换道开始后,被分配到的驾驶权重先稳步上升,之后一直保持在一个较高水平。车辆行驶轨迹一直与驾驶人的驾驶意愿一致,同时驾驶人输出转角的绝对值始终小于参考转角的绝对值,驾驶人的驾驶负担得到了有效降低。
为了进一步验证基于人机信任匹配的人机协同控制策略性能,使用2个指标来评价人机协同系统。路径跟踪指标为实际轨迹与参考轨迹之间的均方根误差,计算式为
(19) |
式中:、分别为纵向位置时车辆的横向位置和参考轨迹的横向位置。
此外,还采用了驾驶人负担评价指标,即驾驶人输出的前轮转角平均标准差。截取换道过程数据并按照1s的间隔进行分割,然后分别计算分割得到的驾驶人输出的转角数据标准差,最后求均值。该指标表征了驾驶人在换道过程中调整转向的频繁程度,能一定程度上反映驾驶人的负
(20) |
式中:为截取的换道数据段数;为第s段的数据点个数;为第s段驾驶人转角数据的均值。
依据这2个指标得到的手动驾驶和人机协同驾驶2种情况的结果,如

图8 评价测试结果
Fig.8 Evaluation test results
可以看出,相比于手动驾驶,协同驾驶无论是路径跟踪精度还是驾驶人负担都得到改善,路径跟踪的精度平均提高了70.91%,驾驶负担平均降低了44.03%。由以上实验结果可以得出,所提出的人机协同控制策略在人机信任不匹配时能发挥很好的作用。
本文提出了一种考虑人机信任匹配的人机协同控制策略。该策略以人机冲突评估驾驶人对机器的信任程度,以驾驶能力评估机器对驾驶人的信任程度,并以此得出人机信任匹配程度。针对驾驶权分配问题,考虑人机相互信任水平,提出了基于人机信任匹配程度的驾驶权重分配方案,该分配方案在人机信任匹配程度低时发挥了很好的作用。当驾驶人能力较强但人机冲突较高、驾驶人对机器信任程度低时保障驾驶人的驾驶权,减小机器对驾驶人驾驶意愿的干扰;当驾驶人能力不足、机器对驾驶人信任程度低时,机器及时介入,提高驾驶表现。针对控制策略求解,采用主从博弈最优化求解的预测控制滚动优化模型,得到最优的人机协同控制策略,实现了有效的人机协同。通过驾驶人在环实验,验证了策略的有效性。结果表明,对于不同信任匹配程度的驾驶人,所提出的策略使得驾驶人路径跟踪精度平均提高了70.91%,驾驶负担降低了44.03%。未来在人机互信评价中考虑驾驶人的不确定性,如驾驶人个性化特征和对机器的初始信任程度,以实现更加准确的协同控制方案。
作者贡献声明
孙 剑:技术指导,论文完善。
阳友康:实验实施,论文撰写。
岳李圣飒:提供研究思路,技术指导,论文完善。
韩嘉懿:提供研究思路,论文完善。
王子衿:协助仿真实验,技术指导。
尹 恒:文献整理,论文撰写。
参考文献
TANG F, GAO F, WANG Z. Driving capability-based transition strategy for cooperative driving: from manual to automatic[J]. IEEE Access, 2020, 8: 139013. [百度学术]
GAO F, HE B, HE Y. Detection of driving capability degradation for human-machine cooperative driving [J]. Sensors, 2020, 20(7): 1968. [百度学术]
WU J, KONG Q, YANG K, et al. Research on the steering torque control for intelligent vehicles co-driving with the penalty factor of human-machine intervention [J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2023, 53(1): 59. [百度学术]
XING Y, LV C, CAO D, et al. Toward human-vehicle collaboration: review and perspectives on human-centered collaborative automated driving [J]. Transportation Research, Part C: Emerging Technologies, 2021, 128: 103199. [百度学术]
FANG Z, WANG J, WANG Z, et al. A human-machine shared control framework considering time-varying driver characteristics[J]. IEEE Transactions on Intelligent Vehicles, 2023, 8(7): 3826. [百度学术]
LÜ C, WANG H, CAO D, et al. A novel control framework of haptic take-over system for automated vehicles[C]// Proceedings of the 2018 IEEE Intelligent Vehicles Symposium. Piscataway: IEEE, 2018: 1596-1601. [百度学术]
LI R, LI Y, LI S E, et al. Driver-automation indirect shared control of highly automated vehicles with intention-aware authority transition[C]// Proceedings of the 2017 IEEE Intelligent Vehicles Symposium. Piscataway: IEEE, 2017: 26-32. [百度学术]
TRAN D, DU J, SHENG W, et al. A human-vehicle collaborative driving framework for driver assistance[J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 20(9): 3470. [百度学术]
刘俊, 时婉晴, 郭洪艳, 等. 一种驾驶权动态调整的人机主从博弈共驾方法[J]. 中国公路学报, 2022, 35(3): 127. [百度学术]
LIU Jun, SHI Wanqing, GUO Hongyan , et al. Stackelberg Game based driver-automation cooperative steering control with dynamic driving authority [J]. China Journal of Highway and Transport, 2022, 35(3): 127. [百度学术]
DAI C, ZONG C, ZHANG D, et al. A bargaining game-based human-machine shared driving control authority allocation strategy[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(10): 10572. [百度学术]
ABE G, SATO K, ITOH M. Driver trust in automated driving systems: the case of overtaking and passing[J]. IEEE Transactions on Human-Machine Systems, 2018, 48(1): 85. [百度学术]
ITOH M, PACAUX-LEMOINE M P. Trust view from the human-machine cooperation framework[C]// Proceedings of the 2018 IEEE International Conference on Systems, Man, and Cybernetics. Piscataway: IEEE, 2018: 3213-3218. [百度学术]
LU Y, LIANG J, YIN G, et al. A shared control design for steering assistance system considering driver behaviors[J]. IEEE Transactions on Intelligent Vehicles, 2023, 8(1): 90. [百度学术]
FANG Z, WANG J, LIANG J, et al. Authority allocation strategy for shared steering control considering human-machine mutual trust level[J]. IEEE Transactions on Intelligent Vehicles, 2024, 9(1): 2002. [百度学术]
JI X, YANG K, NA X, et al. Shared steering torque control for lane change assistance: a stochastic game-theoretic approach [J]. IEEE Transactions on Industrial Electronics, 2018, 66(4): 3093. [百度学术]
MA B, LIU Y, NA X, et al. A shared steering controller design based on steer-by-wire system considering human-machine goal consistency [J]. Journal of the Franklin Institute, 2019, 356(8): 4397. [百度学术]
LI M, SONG X, CAO H, et al. Shared control with a novel dynamic authority allocation strategy based on game theory and driving safety field[J]. Mechanical Systems and Signal Processing, 2019, 124: 199. [百度学术]
NA X, COLE D J. Linear quadratic game and non-cooperative predictive methods for potential application to modelling driver: AFS interactive steering control[J]. Vehicle System Dynamics, 2013, 51(2): 165. [百度学术]