Laneatt:基于anchors的深度车道线检测,它类似一般的深度目标检测器,使用锚点进行特征池化步骤。由于车道线遵循规则的模式并高度相关,因此我们假设在某些情况下,全局信息对于推断其位置可能至关重要,尤其是在诸如遮挡,缺少车道标记等情况下。因此,我们提出了一种新颖的基于anchor的注意力机制,该机制聚集了全局信息。
LaneATT是一种基于锚的单级模型,类似YOLOv3或SSD。接收输入的RGB图像,输出的是车道的边界线。LaneATT使用Resnet作为特征提取,生成一个特征映射,然后汇集起来提取每个锚的特征。这些特性与一组由注意力模块产生的全局特征相结合,通过结合局部和全局特征,这在遮挡或没有可见车道标记的情况下可以更容易地使用来自其他车道的信息。 最后,将组合特征传递给全连接层,以预测最终的输出车道。
车道线和锚点的表示
沿图片纵向做等分操作,得到的等分点记作,其中
。
对于每条车道线,令 Y 固定,因此决定了每条车道线的差异;每个 Xi 都与对应的
形成车道线上的一个点。
由于车道线不会贯穿整张图像,令 s 和 e 分别表示 X 的开始索引和结束索引,用于表示车道线的连续有效点。
使用线而不是方框进行基于锚点的检测。这意味着锚点是一条虚线,由 原点 和 方向 表示锚点
。原点总是位于图像的左、右、下三个边界上。
Backbone
使用诸如ResNet的通用网络作为LaneATT的backbone。这一阶段的输出是一个特征映射,记作,每个锚的特征将通过池化过程提取。为降维,通道缩减,减少后续模块计算量,对 Fback 做 1X1 卷积,将输出结果记作
。
Anchor based feature pooling
对于每个anchor,都要从 F 中提取特征,使用坐标索引要从 F 中提取的特征点。先定义这些坐标点的 y 方向坐标:,使用如下公式求它们对应的 x 坐标:
这里的池化不是使用池化操作,而是使用锚点本身实现单级检测器。并且ROI pooling也是不需要的。
Attention mechanism
Proposal prediction
NMS
https://zhuanlan.zhihu.com/p/391366412