当前位置：首页 > 优惠 >机器人>文章详情

DAAG：结合了大语言模型、视觉语言模型和扩散模型，以提高强化学习中具身代理的样本效率和迁移学习能力

推荐人：暴走AI| 商城: AI | 8个月前 (07-31)| 分类：机器人 | 热度：315 ℃

已关闭评论

DAAG：结合了大语言模型、视觉语言模型和扩散模型，以提高强化学习中具身代理的样本效率和迁移学习能力

伦敦帝国理工学院和谷歌 DeepMind的研究人员推出新框架Diffusion Augmented Agents（简称DAAG），它结合了大语言模型、视觉语言模型和扩散模型，以提高强化学习中具身代理（embodied agents）的样本效率和迁移学习能力。简单来说，DAAG是一个帮助机器人或虚拟代理更好地学习和适应新任务的系统。

项目主页：https://sites.google.com/view/diffusion-augmented-agents

例如，我们有一个机器人，它需要学习如何根据指令将一个红色的立方体堆叠在绿色的立方体上。使用DAAG，机器人可以首先通过分解任务来学习识别和拾取红色立方体。然后，DAAG框架利用扩散模型增强机器人的观察，将之前关于拾取不同颜色立方体的经验转换为当前任务相关的经验，从而帮助机器人更快地学会将红色立方体放在绿色立方体上。这种方法不仅提高了学习效率，还使得机器人能够更好地泛化到新的或类似的任务中。

主要功能：

提高样本效率：DAAG通过使用扩散模型来增强过去的经验，使得代理在面对新任务时，能够更有效地利用有限的数据进行学习。
迁移学习：DAAG能够将代理在过去任务中获得的经验转移到新任务上，加速学习过程。
自主学习：DAAG不需要人类监督，可以自主地设置和评估子目标，即使在没有外部奖励的情况下也能进行。

主要特点：

Hindsight Experience Augmentation（HEA）：一种技术，通过扩散模型将代理过去的经验重新标记，使其与目标指令一致，从而增强学习信号。
自主性：大型语言模型协调整个过程，无需人类干预，适合终身学习场景。
减少标注数据需求：通过在数据增强中使用合成样本来微调视觉语言模型，减少了对奖励标记数据的需求。