本技术涉及计算机,具体涉及智能交通和自动驾驶等,特别涉及一种自动驾驶决策方法、装置、设备及存储介质。
背景技术:
1、随着ai以及自动驾驶技术的成熟,在未来自动驾驶车辆面临着巨大的挑战,即如何在与其他交通车辆发生时空冲突的情况下,推理他车的交互行为或者意图,进而针对性地制定驾驶策略。
2、现有技术中,部分研究人员采用滤波等基于规则的方法,根据交互车辆历史帧信息为其未来行为建模,然后为自车指定驾驶策略。然而,基于模型/规则的意图预测方法能很好地对交互车辆历史信息建模,但真实交通场景中不存在单个智能体,车辆行为会因他车行为实时调整,因此,该模型有效性将随时域延长而降低。
3、所以,亟需找到一种新的自动驾驶决策方法以解决上述技术问题。
技术实现思路
1、本技术提供了一种自动驾驶决策方法、装置、设备及存储介质,以解决他车行为对自车行为影响而导致模型有效性降低,进而影响自动驾驶决策准确性的问题。
2、所述技术方案如下:
3、第一方面,提供了一种自动驾驶决策方法,包括:
4、获取自动驾驶场景中目标自车的车辆信息,以及其它交互车辆的车辆信息;
5、基于所述目标自车的车辆信息和所述其它交互车辆的车辆信息,分别计算所述目标自车与存在驾驶冲突的每个交互车辆之间的冲突信息;其中,所述冲突信息至少包含所述目标自车与交互车辆的驾驶冲突区表征信息以及驾驶冲突表征信息;
6、根据所述冲突信息确定交互车辆对所述目标自车的碰撞风险评估结果;
7、基于历史决策数据对所述碰撞风险评估结果进行修正,确定以多元高斯分布构建的模型输出未来风险评估结果;
8、根据所述未来风险评估结果生成自动驾驶决策,所述自动驾驶决策用于辅助所述目标自车在自动驾驶过程中规避与其它交互车辆发生碰撞。
9、在一种可能的实现方式中,所述目标自车的车辆信息至少包含规划路径,所述其它交互车辆的车辆信息至少包含预测轨迹;
10、则基于所述目标自车的车辆信息和所述其它交互车辆的车辆信息,分别计算所述目标自车与存在驾驶冲突的每个交互车辆之间的冲突信息,具体包括:
11、为所述目标自车和其它交互车辆中每个车辆,分别构建表征车辆形状的多边形框,并基于旋转不变基元对每个车辆的多边形框进行分解,构建离散冲突基元;
12、基于所述离散冲突基元,以及所述目标自车的规划路径和所述其它交互车辆的预测轨迹,计算与所述目标自车存在驾驶冲突的每个交互车辆的冲突信息。
13、在一种可能的实现方式中,根据所述冲突信息确定交互车辆对所述目标自车的碰撞风险评估结果,具体包括:
14、根据以下公式,基于条件随机场计算每个交互车辆对所述目标自车,在不同风险模态的碰撞可能性:
15、
16、其中,所述,d代表危险,a代表需要关注,s代表安全;所述表示所述目标自车正常行驶到达冲突区域的时间;所述表示交互车辆正常行驶到达冲突区域的时间;所述表示交互车辆减速行驶至安全区域的时间;所述表示交互车辆j的危险评价值。
17、在一种可能的实现方式中,基于历史决策数据对所述碰撞风险评估结果进行修正,确定以多元高斯分布构建的模型输出未来风险评估结果,具体包括:
18、确定当前驾驶场景下的历史决策数据,收集碰撞以及无碰撞信息,统计所述历史决策数据中每份决策数据对应的特征量和碰撞结果,其中,每份决策数据对应的特征量是该决策数据中历史交互车辆对历史目标车辆在不同风险模态的碰撞可能性;
19、结合当前计算的交互车辆对目标车辆在不同风险模态的碰撞可能性,使用多元高斯分布构建的概率密度函数对碰撞风险评估结果进行修正,得到如下未来风险评估结果:
20、
21、其中,表示已知数据结果为碰撞的情况下交互车辆危险评估值分布为x的概率;表示数据结果为碰撞的概率;表示已知数据结果的情况下交互车辆危险评估值分布为x的概率。
22、在一种可能的实现方式中,根据所述未来风险评估结果生成自动驾驶决策,具体包括:
23、当时,确定目标车辆存在碰撞风险,接入应急速度规划刹车策略;
24、当时,确定目标车辆处于绝对安全,不改变当前驾驶策略;
25、当时,采用局部博弈推演均衡决策,生成自动驾驶策略;
26、其中,为安全阈值,为危险阈值。
27、在一种可能的实现方式中,采用局部博弈推演均衡决策,生成自动驾驶策略,具体包括:
28、基于局部博弈算法确定当前自动驾驶场景下参与博弈的目标自车和所有交互车辆的决策变量以及收益函数;其中,所述收益函数包含交互损失权重以及交互损失函数;
29、基于所述决策变量以及收益函数,采用纳什均衡策略,得到所述目标自车的均衡决策量;
30、基于所述均衡决策量生成所述目标自车的纵向驾驶规划策略。
31、第二方面,提供了一种自动驾驶决策装置,包括:
32、获取模块,用于获取自动驾驶场景中目标自车的车辆信息,以及其它交互车辆的车辆信息;
33、计算模块,用于基于所述目标自车的车辆信息和所述其它交互车辆的车辆信息,分别计算所述目标自车与存在驾驶冲突的每个交互车辆之间的冲突信息;其中,所述冲突信息至少包含所述目标自车与交互车辆的驾驶冲突区表征信息以及驾驶冲突表征信息;确定模块,用于根据所述冲突信息确定交互车辆对所述目标自车的碰撞风险评估结果;
34、修正模块,用于基于历史决策数据对所述碰撞风险评估结果进行修正,确定以多元高斯分布构建的模型输出未来风险评估结果;
35、生成模块,用于根据所述未来风险评估结果生成自动驾驶决策,所述自动驾驶决策用于辅助所述目标自车在自动驾驶过程中规避与其它交互车辆发生碰撞。
36、第三方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如上所述的方面和任一可能的实现方式的方法。
37、第四方面,提供了一种电子设备,包括:
38、至少一个处理器;以及
39、与所述至少一个处理器通信连接的存储器;其中,
40、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
41、第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
42、第六方面,提供了一种自动驾驶车辆,包括如上所述的电子设备。
43、本技术提供的技术方案的有益效果至少包括:
44、由上述技术方案可知,基于目标自车的车辆信息和所述其它交互车辆的车辆信息,分别计算所述目标自车与存在驾驶冲突的每个交互车辆之间的冲突信息;根据所述冲突信息确定交互车辆对所述目标自车的碰撞风险评估结果;基于历史决策数据对所述碰撞风险评估结果进行修正,确定以多元高斯分布构建的模型输出未来风险评估结果;根据所述未来风险评估结果生成自动驾驶决策。从而,使用通用、高效的交互空间拓扑算法计算冲突信息,适用于多种空间冲突场景;同时,通过二维全平面风险评估方法,基于交互空间构建局部交互博弈框架,分析最优联合策略数值解,自动可靠的自车驾驶决策。在少量数据调参的情况下,提升处理效率,有效考虑车辆间交互过程,提高了自动驾驶决策可靠性。
45、应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
1.一种自动驾驶决策方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述目标自车的车辆信息至少包含规划路径,所述其它交互车辆的车辆信息至少包含预测轨迹;
3.如权利要求1所述的方法,其特征在于,根据所述冲突信息确定交互车辆对所述目标自车的碰撞风险评估结果,具体包括:
4.如权利要求3所述的方法,其特征在于,基于历史决策数据对所述碰撞风险评估结果进行修正,确定以多元高斯分布构建的模型输出未来风险评估结果,具体包括:
5.如权利要求4所述的方法,其特征在于,根据所述未来风险评估结果生成自动驾驶决策,具体包括:
6.如权利要求5所述的方法,其特征在于,采用局部博弈推演均衡决策,生成自动驾驶策略,具体包括:
7.一种自动驾驶决策装置,其特征在于,包括:
8.一种电子设备,其特征在于,包括:
9.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
10.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
11.一种自动驾驶车辆,其特征在于,包括如权利要求8所述的电子设备。