当前位置：首页 > 优惠 >大语言模型>文章详情

大型数据集API-BLEND：训练和评估那些能够使用工具和外部应用程序接口（APIs）的大语言模型

推荐人：暴走AI| 商城: AI | 1年前 (2024-02-26)| 分类：大语言模型 | 热度：313 ℃

已关闭评论

大型数据集API-BLEND：训练和评估那些能够使用工具和外部应用程序接口（APIs）的大语言模型

AI

IBM推出大型数据集API-BLEND，它旨在训练和评估那些能够使用工具和外部应用程序接口（APIs）的大语言模型（LLMs）。这些模型通常用于执行复杂的任务，比如预订酒店、预订餐厅或自动化工作招聘任务。API-BLEND数据集通过模拟真实世界的场景，包括API检测、插槽填充和API序列化等任务，来帮助研究人员开发和测试这些模型。

论文地址：https://arxiv.org/abs/2402.15491

主要功能：

提供一个用于训练和系统测试工具增强型LLMs的大型数据集。
包含多种真实世界场景，用于训练模型执行API任务。
支持模型在不同领域（如语义解析、对话和数字助手）中使用API的能力。

主要特点：

结合了人类注释的数据集和基于语法规则的方法，以及现成的数据集，以提高数据多样性。
包含了超过190k个实例，包括训练、开发和测试数据。
通过实验表明，使用API-BLEND数据集训练的模型在处理未知领域（OOD）数据时具有更好的泛化能力。

工作原理： API-BLEND数据集的创建涉及三个主要方法：

语言模型辅助生成：使用预训练的语言模型将现有的API输出转换为自然语言请求。
基于语法的生成：将现有的语义解析和个人助手注释转换为API数据。
现成数据集的使用：直接使用现有的数据集进行测试，以评估模型在未知领域的表现。

具体应用场景：

在对话式AI系统中，API-BLEND可以帮助训练模型更好地理解和执行用户的复杂请求，如预订服务或查询信息。
在自动化工作流程中，API-BLEND可以用于训练模型自动执行一系列API调用，以完成特定的任务。
在研究环境中，API-BLEND可以作为评估和比较不同LLMs在API使用能力上的标准基准。

总的来说，API-BLEND为研究人员提供了一个宝贵的资源，用于开发和测试能够与外部工具和APIs交互的LLMs，这对于提高AI系统的实用性和智能性具有重要意义。

API-BLEND 大型数据集

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇： AgentOhana：为了解决大语言模型（LLMs）在代理任务中面临的数据多样性和复杂性问题而设计

下一篇： GPTVQ：压缩大语言模型（LLMs）的权重，以减少模型的大小并提高运行效率

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录