GTA

栏目分类

推荐人：暴走AI 标签：GTA AI

10个月前 (07-13)AI

上海交通大学和上海人工智能实验室的研究人员推出新基准测试GTA（General Tool Agents），它是为了评估和提升大语言模型（LLMs）在现实世界场景中使用各种工具的能力而设计的。GTA基准测试的主要挑战在于，现有的评估方法往往使用人工智能生成的查询、单一步骤任务、虚拟工具和仅限文本的交互，这些都不能有效地揭... 阅读全文

直达链接好 0 不好 0 已关闭评论