大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型

分类:大语言模型 | 热度:134 ℃

IBM推出大型数据集API-BLEND,它旨在训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型(LLMs)。这些模型通常用于执行复杂的任务,比如预订酒店、预订餐厅或自动化工作招聘任务。API-BLEND数据集通过模拟真实世界的场景,包括API检测、插槽填充和API序列化等任务,来帮助研究人员开发和测试这些模型。

论文地址:https://arxiv.org/abs/2402.15491

主要功能:

  • 提供一个用于训练和系统测试工具增强型LLMs的大型数据集。
  • 包含多种真实世界场景,用于训练模型执行API任务。
  • 支持模型在不同领域(如语义解析、对话和数字助手)中使用API的能力。

主要特点:

  • 结合了人类注释的数据集和基于语法规则的方法,以及现成的数据集,以提高数据多样性。
  • 包含了超过190k个实例,包括训练、开发和测试数据。
  • 通过实验表明,使用API-BLEND数据集训练的模型在处理未知领域(OOD)数据时具有更好的泛化能力。

工作原理: API-BLEND数据集的创建涉及三个主要方法:

  1. 语言模型辅助生成:使用预训练的语言模型将现有的API输出转换为自然语言请求。
  2. 基于语法的生成:将现有的语义解析和个人助手注释转换为API数据。
  3. 现成数据集的使用:直接使用现有的数据集进行测试,以评估模型在未知领域的表现。

具体应用场景:

  • 在对话式AI系统中,API-BLEND可以帮助训练模型更好地理解和执行用户的复杂请求,如预订服务或查询信息。
  • 在自动化工作流程中,API-BLEND可以用于训练模型自动执行一系列API调用,以完成特定的任务。
  • 在研究环境中,API-BLEND可以作为评估和比较不同LLMs在API使用能力上的标准基准。

总的来说,API-BLEND为研究人员提供了一个宝贵的资源,用于开发和测试能够与外部工具和APIs交互的LLMs,这对于提高AI系统的实用性和智能性具有重要意义。

声明: 猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)! 点此爆料

0条评论

Hi,您需要填写昵称和邮箱!
姓名 (必填)
邮箱 (必填)
网站

暂时木有评论