OmniACT

优惠 数据集和基准测试OmniACT:评估虚拟代理在执行计算机任务方面的能力

  • 数据集和基准测试OmniACT:评估虚拟代理在执行计算机任务方面的能力
    AI
  • 这篇论文介绍了一个名为OmniACT的数据集和基准测试,旨在评估虚拟代理在执行计算机任务方面的能力。这些任务包括在桌面和网页应用中执行各种操作,如查看股票价格变化、在租房网站上查找房源、查看特定日期的天气等。OmniACT的目标是生成可执行的程序脚本,以自动化这些任务。 论文地址:https://arxiv.org/a... 阅读全文