0
点赞
收藏
分享

微信扫一扫

GeMap


实时根据传感器数据构建向量化高精地图对于预测和规划等下游任务至关重要,可以有效弥补离线高精地图实时性差的缺点。随着深度学习的发展,在线向量化高精地图构建逐渐兴起,代表性的工作如HDMapNet,MapTR等相继涌现。然而,现有的在线向量化高精地图构建方法缺乏对地图元素几何性质(包括元素的形状,垂直、平行等几何关系)的探索。从几何性质出发的在线高精地图构建方案

论文:https://arxiv.org/abs/2312.03341

主页:https://invictus717.github.io/GeMap/

代码:https://github.com/cnzzx/GeMap

中文视频解读:https://www.bilibili.com/video/BV1qN4y1e7hL/?vd_source=96a766e4a548cf05b04bf247d9824a01

介绍

实时构建向量化的高精地图对自动驾驶的下游预测和规划至关重要,最近的一些工作如MapTR, HDMapNet等为高精地图的构建奠定了坚实的基础,然而,对于城市道路系统中的地图要素,他们的形状和要素之间的位置关系对于构建计算高效地构建向量化的高精地图有着重要的意义,例如:平行,垂直,等间距,以及特定形状的地形。但这一方面目前尚在探索。

本文中,我们深入地讨论了高精地图中元素的几何性质,提出了向量化高精地图元素的几何表示,并在此基础上提出了GeMap这一在线向量高精地图构建方法,GeMap在nuScenes数据集上达到了69.4%的性能,更值得一提的是,在更大规模的Argoverse 2数据集上,GeMap取得了71.8%的mAP,高出了MapTR v2 4.4%。

为什么说高精地图有重要的几何性质?

向量化高精地图对道路上的元素进行了高度抽象,将每一个地图元素表示为二维点序列。而城市道路的设计是非常严格规范的。例如,在向量化的高精地图中,人行横道在多数情况下表现为方正的矩形平行四边形;又如,在不涉及分流合流的路段,相邻的两条车道是互相平行的。向量化高精地图中诸多类似的特点抽象为高精地图的几何性质,包括地图元素的形状(矩形、平行四边形、直线等),或者不同地图元素之间的关联性(彼此平行、垂直等)。这些几何性质通常强而有力地约束着地图元素,如果在线构建的神经网络能充分理解这些性质,就能更高效地构建向量化高精地图。

为什么针对高精地图提出几何表征?

现有的在线向量化高精地图构建方法对道路系统中的几何性质没有给出直观的数学描述。这并不意味着模型不能注意到地图元素的几何性质——然而,这些几何性质的特点就决定了,模型难以直接学到。这是为什么?

向量化高精地图的几何性质

向量化高精地图对道路上的元素进行了高度抽象,将每一个地图元素表示为二维点序列。而城市道路的设计具有特定的规范,例如,人行横道在多数情况下表现为方正的矩形平行四边形;在不涉及分流合流的路段,相邻的两条车道互相平行。高精地图中不同元素还具有许多类似的特点,这些常识性的规律,抽象为高精地图的几何性质,包括地图元素的形状(矩形、平行四边形、直线等),或者不同地图元素之间的关联(平行、垂直等)。几何性质强有力地约束着地图元素的表现形式,在线构建模型如果充分理解了几何性质,就能得到更精确的结果。

提出针对高精地图的几何表示的重要性

尽管理论上现有模型仍可能学到地图元素的几何性质,然而,几何性质的特点决定了至少在传统的设计下,模型并不容易学到。

  • 几何性质的不变性

中心车辆在道路上直线行驶,变道,或者转弯时,(在车辆坐标系下)地图元素的绝对坐标不断发生变化。而人行横道、车道、道路边界等的形状并不会随之改变;类似的,车道之间平行关系也不会改变。地图元素的几何性质是客观的,它的一个重要特点就是不变性。更具体的,是刚性不变性(对旋转、平移变换保持不变)。以往的工作,不论是使用朴素的折线表示,还是使用带控制点的多项式曲线(比如贝塞尔曲线、分段贝塞尔曲线),都基于绝对坐标,并在绝对坐标基础上端到端优化。基于绝对坐标的优化目标本身不具备刚性不变性,因此很难期待模型陷入的局部最优解包含对几何性质的理解。因此,一种能充分刻画几何性质且具有一定不变性的表示是必要的。

GeMap_向量化

图1. 几何不变性的示例。车辆右转时,绝对坐标会发生明显的变化。右图展示了一个对应的真实场景。

  • 几何性质的多样性

此外,尽管具有强烈的先验知识,道路的几何性质仍然是多样的。这些多样的几何性质总体上可以分为两大类,一类是关于单个地图元素的几何形状,一类是关于不同地图元素的几何关联。由于几何性质的多样性,穷举并人工地将几何性质转变为约束是不可能的,因此我们更希望模型能够端到端地自主学习多样的几何性质。

从几何性质出发的在线高精地图构建方案

GeMap的设计

高精地图中的通用几何表征

针对上述两个问题,我们首先改进表示方法。我们希望在传统的基于绝对坐标的表示之外,引入一种良好的几何表示,它需要满足:

  • 能刻画地图元素的形状
  • 能刻画地图元素之间的关联
  • 刚性不变性

为保证平移不变性,我们使用了相对量,即点之间的偏移向量;为进一步保证旋转不变性,我们选择了偏移向量的长度,以及不同偏移向量之间的夹角。这二者——长度和夹角——构成了我们提出的几何表示的基础。此外,为了更好地区分并刻画形状、关联两类不同的几何性质,我们还按照从简的原则进一步细化了设计:

为刻画形状,我们计算单个地图元素中相邻点之间的偏移向量,并计算偏移向量长度、相邻偏移向量之间的夹角。这一表示能够唯一确定任意的折线/多边形。两个形象的例子如下图所示:

GeMap_人工智能_02

图2. 几何形状表示。对于一个矩形,使用一个直角和两对相等的边就可以描述;对于一条直线,所有的夹角均为0度或者180。

GeMap_人工智能_03

图3. 几何关联表示。平行关系和垂直关系表现为偏移向量的夹角为0度或者90度;两点之间的距离可以一定程度反映车道宽度信息

GeMap_向量化_04

几何表示的基础是角度和距离,因此我们形象地将对应的几何损失称为”欧几里得损失“,也代表着这一损失对于旋转和平移变换的鲁棒性。

几何解耦注意力

一种被MapTR,PivotNet等采用的架构将地图元素上的每一个点对应到Transformer的一个查询。这一架构的问题在于:对两大类的几何性质不加区分。

在自注意力中,所有查询(也就是“点”)之间都平等地相互作用。然而,地图元素的形状对应着一组一组的查询。这些组之间的交互,在感知元素形状时就成为了累赘。反之在感知元素之间关联的时候,形状亦成为了冗余因素。这意味着将形状、关联的感知解耦,可能带来更好的结果

为了解耦对几何形状和关联处理,我们将自注意力分成两个步骤进行:

GeMap_解耦_05

几何解耦的注意力更形象的表示如下图所示。我们的实现方式比较朴素,直接使用mask控制注意力的范围。事实上,由于这两种注意力是互补的,合理地实现有可能让时间复杂度等同于进行单次自注意力。

GeMap_人工智能_06

图4. 几何解耦注意力。左侧为单个元素内部进行的形状注意力,右侧为元素之间进行的关联注意力。

实验结果

我们在nuScenes和Argoverse 2两个数据集上进行了大量实验。二者都是常用的大规模自动驾驶数据集,且都提供了地图标注。

主要结果

在nuScenes上,我们进行了三组实验。我们首先使用了一种比较纯粹的目标函数组合,只包括几何损失和其它必要的损失(如点到点距离、边的方向、分类),这一组合是为了体现我们提出的几何性质的重要价值,而不过多追求SOTA的结果。可以看到,在这种情况下,相比于MapTR,我们的方法能在mAP提升了%4。为了探索GeMap的极限,我们也加上了一些辅助目标,包括分割和深度估计,在这种情况下我们也取得了SOTA的结果(mAP提升%7)。值得注意的是,取得这样的提升并不需要牺牲太多的推理速度。最后,我们还尝试了引入额外的LiDAR模态输入,在额外模态输入的加持下,GeMap的性能也能取得进一步提升。

GeMap_人工智能_07

同样,在Argoverse 2数据集上,我们的方法也取得了非常突出的效果。

GeMap_高精_08

消融实验

在nuScenes上进一步进行的消融实验证明了几何损失和几何解耦注意力的价值。有趣的是,正如我们所预料的,直接使用几何损失反而会带来模型表现的下降。我们认为这是因为结构上的对形状和关联处理的耦合,导致模型很难优化几何表示;而在与几何解耦注意力结合之后,几何损失就发挥了应有的作用(从”+Euclidean Loss“到”Full“)。

GeMap_解耦_09

更多结果

此外,我们还在nuScenes上进行了可视化分析。可视化的结果表明,GeMap除了具有对旋转和平移的鲁棒性,在处理遮挡问题上也表现出了一定优势,如下图。图中有挑战性的地图元素使用橘色方框标出。

GeMap_向量化_10

图5. 可视化对比结果。

GeMap_高精_11

这可以解释为模型学到了几何性质,因此即使有遮挡,也能更好地猜出地图元素。例如,模型理解了车道线的形状,那么只需要”看到“一部分,就能够估计剩下的部分;模型理解了车道线之间的平行关系,或者车道的宽度特点,因此哪怕其中一条被遮挡,也能根据平行、宽度因素猜测被遮挡的部分。

总结

我们指出了地图元素所具有的几何性质,以及其对于在线向量化高精地图构建的价值。基于此,我们提出了一种强有力的方法,初步对这一价值进行了验证。此外,GeMap表现出的对遮挡的鲁棒性,或许预示着在其它自动驾驶任务(例如检测、占有预测等)中利用几何性质处理遮挡的思路——因为车辆和道路都具有相对规范的几何性质。当然,我们的方法本身也有很多可以进一步探索的地方。比如不同复杂度的几何元素是否可以适应性地使用不同的点来描述?是否能从概率的角度出发理解几何表示,让其对噪音更具鲁棒性?因为我们对于元素关联进行了简化,那么是否存在更好的几何关联的表示方法?这些都是进一步优化的方向。

举报
0 条评论