Waymo与Google Research发布自动驾驶领域中的一个关键技术三维多目标跟踪(3D Multi-Object Tracking,简称3D MOT)。这项技术对于自动驾驶汽车的安全行驶至关重要,因为它能够让汽车实时地识别并追踪周围的物体,比如其他车辆和行人,同时准确估计它们的速度和加速度等状态。例如,你坐在一辆自动驾驶汽车中,车辆需要不断地识别和追踪周围的物体。如果前方的车辆突然减速,你的车需要快速识别这一变化并调整自己的行驶状态以避免碰撞。STT模型就是帮助自动驾驶汽车做到这一点的关键技术之一,它能够实时地追踪每个目标,并预测它们接下来的动作。
主要功能:
- 目标追踪:在三维空间中持续追踪多个目标物体。
- 状态估计:准确预测目标物体的当前状态,如位置、速度和加速度。
主要特点:
- 基于Transformer的模型:论文提出了一个名为STT(Stateful Tracking)的模型,它使用Transformer架构来处理数据关联和状态估计。
- 联合优化:STT模型将数据关联和状态估计任务结合在一起,通过联合优化提高整体性能。
- 长期历史检测:模型利用长期的历史检测信息来提高追踪和状态预测的准确性。
- 实时性能:STT在Waymo开放数据集上展示了竞争性的实时性能。
工作原理:
STT模型的核心包括两个主要部分:
- 检测编码器(Detection Encoder):它将每个检测到的物体的几何、外观和运动特征编码为一个嵌入向量。
- 时间融合(Temporal Fusion):通过自注意力机制,将这些嵌入向量融合起来,形成描述每个轨迹历史的时序嵌入。
此外,STT还包括一个轨迹-检测交互(Track-Detection Interaction,TDI)模块,它计算轨迹和其周围检测之间的关系,并预测关联分数和状态。还有一个轨迹状态解码器(Track State Decoder,TSD),用于预测轨迹的状态。
具体应用场景:
STT模型主要应用于自动驾驶汽车的感知系统中,用于实时追踪和理解周围环境。例如,在城市街道上,自动驾驶汽车需要实时追踪周围的车辆和行人,预测它们可能的移动轨迹,以便做出安全的驾驶决策,如避障、变道或减速。
0条评论