斯坦福大学的研究人员推出GET-Zero,它是一种用于机器人控制的模型架构和训练过程,能够实现对新硬件变化的立即适应,而无需重新训练。简单来说,GET-Zero通过一种称为Graph Embodiment Transformer(GET)的变换器模型,利用机器人的物理结构(即其关节和链接的图结构)作为学习到的结构偏差,来改进对机器人控制策略的泛化能力。
- 项目主页:https://get-zero-paper.github.io
- GitHub:https://github.com/real-stanford/get_zero
例如,一个机器人手部原本有四个关节,但因为某些原因需要更换为只有三个关节的版本。使用GET-Zero模型,我们可以在不重新训练的情况下,让机器人的控制策略适应这种硬件变化,继续执行物体旋转等任务。这在机器人硬件升级或损坏修复时特别有用,因为它减少了重新编程和训练的需求。
主要功能:
- 零样本泛化:能够控制之前未见过的机器人硬件配置。
- 硬件变化适应:当机器人的硬件发生变化时,如关节数量或链接长度变化,GET-Zero能够适应这些变化而不需要重新训练。
主要特点:
- 图结构编码:GET模型通过编码机器人的物理连接图,将关节作为单独的标记进行编码,并使用图连接性作为变换器注意力机制中的学习偏差。
- 体现意识蒸馏:通过行为克隆从特定体现的专家策略中提取示范数据,将其转化为体现意识的GET模型。
- 自模型损失:在蒸馏过程中,引入自模型损失以预测每个关节在3D空间中的位置,鼓励网络理解体现图并据此推断动作。
工作原理:
GET-Zero的核心是Graph Embodiment Transformer(GET),它通过以下几个步骤工作:
- 使用体现图的连接性作为结构偏差,通过注意力机制让局部关节信息进行交流。
- 通过行为克隆技术,将从多种机器人体现中收集的示范数据用于训练GET模型。
- 在训练过程中,引入自模型损失,使模型能够预测机器人关节的3D位置,从而提高泛化性能。
具体应用场景:
- 机器人手部操作:在不同的机器人手部配置下实现灵巧的物体旋转任务。
- 硬件变化适应:在机器人硬件因损坏或设计改进而发生变化时,能够快速适应新的硬件配置,无需重新训练控制策略。
0条评论