上海启智研究院、 浙江大学、上海交通大学和清华大学的研究人员推出创新系统“Cross Anything System”(简称CAS),它是一个用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置。这个系统由一个高级推理模块和一个低级控制策略组成,它们共同工作,让机器人能够自主地规划路径并适应各种地形。例如,你有一个宠物狗,你告诉它去花园的另一边拿回飞盘。你的狗需要理解你的命令,观察地形,决定如何穿过草地、绕过障碍物,最终拿到飞盘并回来。CAS系统就像给了机器人狗这样的能力,让它能够理解环境并自主导航。
- 项目主页:https://cross-anything.github.io
主要功能:
- 使四足机器人能够理解复杂的3D环境。
- 规划出一条到达目的地的路径,即使在复杂的地形中。
- 低级控制策略保证机器人稳健行走。
主要特点:
- 高级推理模块:使用视觉-语言模型(VLM),进行任务分解和闭环子任务执行。
- 低级控制策略:采用概率退火选择(PAS)方法,通过强化学习训练控制策略。
- 通用性:在多种室内和室外场景中展示强大的泛化能力。
工作原理:
- 任务分解:将长期导航任务分解为一系列子任务,每个子任务包括动作和结束点。
- 子任务执行:机器人根据VLM的指令,依次执行每个子任务,形成闭环反馈,直到完成整个任务。
- 辅助模块:包括定位模块、轨迹细化模块和地形估计网络,辅助VLM进行更精确的任务执行。
- PAS方法:在强化学习中,通过逐步从完全使用真实值到完全使用预测值的过渡,训练出稳健的控制策略。
具体应用场景:
- 室内导航:在复杂的室内环境中,如办公室或仓库,机器人需要绕过障碍物或走楼梯。
- 室外导航:在户外,机器人可能需要穿越不平坦的地形,如草地、砂石地或小山坡。
- 搜索和救援:在灾难现场,机器人可以被派遣去搜索幸存者,需要穿越废墟和障碍。
论文中的实验结果表明,CAS系统在多种地形和路线上都表现出了准确性和鲁棒性,无论是在模拟环境还是现实世界中。此外,论文还讨论了系统的局限性,比如当前使用的SLAM方法在高频振动下可能不稳定,以及系统未来可能的改进方向,如集成拓扑地图或语义地图来提高导航能力。
0条评论