当前位置：首页 > 优惠 >大语言模型>文章详情

新型自主强化学习方法DigiRL：专门用于训练能够在现实世界环境控制设备（如智能手机等）的智能代理

推荐人：暴走AI| 商城: AI | 10个月前 (06-22)| 分类：大语言模型 | 热度：189 ℃

已关闭评论

加州大学伯克利分校、伊利诺伊大学伯克利分校和谷歌 DeepMind的研究人员推出新型自主强化学习方法DigiRL，它专门用于训练能够在野外（即现实世界环境）控制设备（如智能手机等）的智能代理。这些智能代理可以通过图形用户界面（GUI）执行各种任务，比如网上购物、预订旅行或者操作移动设备等。

例如，你有一个智能助手，它可以通过智能手机上的GUI为你预订旅行。你告诉它你的目的地和日期，智能助手就会自动打开旅行应用，搜索航班，选择最合适的选项，并完成预订。在整个过程中，它可能会遇到各种挑战，如应用界面的变化或搜索结果的不确定性，但DigiRL训练的智能代理能够适应这些情况并成功完成任务。

DigiRL的核心功能是让预训练的视觉语言模型（VLMs）通过两个阶段的微调来学习控制真实GUIs：

DigiRL的工作原理可以概括为以下几个步骤：

DigiRL的应用场景包括但不限于：

DigiRL

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

下一篇： Latent Diffusion Models：用于在极短的时间内从2D图像数据高效生成3D场景

暂时木有评论

查看更多商品