加拿大AI企业Cohere宣布推出Command-R,一款面向大规模生产工作负载的可扩展生成模型。Command-R具备以下特点:
✅ 高准确性:结合RAG(检索增强生成)和工具使用,实现高度精确的输出。
✅ 高效性能:低延迟、高吞吐量,满足企业级需求。
✅ 长上下文支持:长达128k的上下文长度,适应复杂任务。
✅ 竞争力价格:相较于其他模型,提供更优惠的价格。
✅ 多语言能力:支持10种主要语言,满足全球市场需求。
✅ 研究支持:在HuggingFace上提供模型权重,便于研究和评估。
测试显示,Command-R在可扩展生成模型类别中表现优于Mixtral、Llama 2-7B、GPT-3.5-turbo等模型。
🔍 以下是官方介绍全文翻译:
Command-R是一款针对RAG和工具使用的可扩展生成模型,旨在为企业提供生产级别的AI能力。
今天,我们隆重推出Command-R,这款新型大型语言模型专为满足大规模生产工作负载需求而设计。Command-R属于新兴的“可扩展”模型类别,这些模型兼具高效能和高准确度,帮助企业从概念验证阶段迈向实际生产应用。
Command-R是一款针对长上下文任务(如检索增强生成RAG和使用外部API及工具)而优化的生成模型。它与我们业内领先的Embed和Rerank模型协同工作,为RAG应用提供卓越的集成方案,并擅长处理企业用例。作为一款专为大型企业打造的模型,Command-R具备以下显著优势:
- 在RAG和工具使用方面展现出卓越的准确性
- 低延迟,高吞吐量
- 支持长达128k的上下文长度,价格更优惠
- 强大的跨10种主要语言处理能力
- 模型权重可在HuggingFace平台上用于研究和评估
Command-R将立即在Cohere的托管API上提供,并计划在不久的将来在各大云服务商平台上线。我们始终坚守Cohere的核心原则,即重视隐私和数据安全。
Command-R是我们一系列模型发布中的首款产品,这一系列旨在不断提升对企业大规模采用至关重要的能力。我们将很快分享更多令人振奋的信息。
“Scale正与一家财富500强企业紧密合作,为其客户支持团队构建一款定制化的知识管理应用。由于Scale GenAI平台的测试与评估工具与Cohere的模型实现了完美集成,客户得以轻松识别出Cohere的解决方案在优化总拥有成本(TCO)的同时,仍能维持卓越的性能表现,这对于企业的购买决策至关重要。”——Scale首席产品与技术官Arun C Murthy
高性能检索增强生成(RAG)
检索增强生成(RAG)已成为部署大型语言模型(LLMs)的关键模式。RAG赋予企业能力,让模型能够访问原本无法获取的私有知识。通过使模型在私有数据库中搜索并利用这些信息来形成回复,模型的准确性和实用性得以大幅提升。RAG的核心组成部分包括:
- 检索:在与用户请求相关的信息语料库中进行搜索。
- 增强生成:利用检索到的信息形成更精准、更有深度的回复。
在检索环节,Cohere的Embed模型通过增强对数百万甚至数十亿篇文档上下文和语义的理解,显著提升了检索的精准性和有效性。与此同时,Cohere的Rerank模型则进一步提高了检索信息的质量,通过自定义指标(如相关性和个性化)对结果进行优化。
在增强生成方面,一旦识别出最相关的信息,Command-R便能对这些信息进行总结、分析、整合,并以多种方式将其应用于实际工作中,从而提升员工的工作效率或创造出令人惊艳的新产品体验。值得一提的是,Command-R的一个独特功能是,在模型输出中会附带明确的引文,这不仅可以降低因误解信息而产生的风险,还能为用户提供更多源材料的上下文信息。
即便不依赖Cohere的Embed和Rerank模型,Command-R在可扩展生成模型类别中的表现也堪称卓越。而当这些模型协同工作时,其优势则更为明显,能够在更为复杂的领域中展现出更高的性能水平。
访问工具的能力
大型语言模型(LLMs)应作为核心推理引擎,不仅能够自动化任务并采取实际行动,而且远不止于处理文本的简单机器。Command-R利用工具(API),如代码解释器和其他用户自定义工具,使模型具备自动化高度复杂任务的能力。
工具使用功能赋予了企业开发人员将Command-R转化为自动化任务和工作流程引擎的能力,这些任务和工作流程涉及内部基础设施如数据库和软件工具,以及外部工具如CRM系统、搜索引擎等。这释放了跨多个系统耗时且繁琐的手动任务,这些任务通常需要复杂的推理和决策过程。
如今,您可以通过我们的API轻松访问工具使用功能,详情请点击此处了解。
支持全球商业的更多语言
Command-R旨在服务尽可能广泛的人群、组织和市场。该模型在全球商业的十大主要语言中表现出色,包括英语、法语、西班牙语、意大利语、德语、葡萄牙语、日语、韩语、阿拉伯语和中文。此外,我们的Embed和Rerank模型原生支持超过100种语言。
这使用户无论使用何种语言,都能从庞大的数据源中抽取答案,并以他们熟悉的语言进行清晰、准确的对话。
更长的上下文窗口与更实惠的价格
Command-R拥有更长的上下文窗口,初始版本支持最多128k个令牌。此次升级不仅降低了Cohere托管API的价格,还显著提升了Cohere私有云部署的效率。通过结合更长的上下文窗口和更优惠的价格,Command-R解锁了更多RAG用例,这些用例中额外的上下文信息能够显著提升性能表现。
可用性
为了使模型能够广泛应用,Cohere与所有主要的云提供商展开合作,同时也为受监管的行业和隐私敏感型用例提供本地部署方案。
如果您想了解贵公司如何以生产规模部署这些先进的RAG应用,请联系我们的销售团队。
现在,Command-R与RAG也已纳入Cohere的演示环境中,用户可以通过简单的聊天界面与模型进行互动,亲身体验其强大功能。
持续支持机器学习研究社区
我们既支持学术AI研究,也鼓励对模型进行独立评估。为此,我们的非营利性研究实验室Cohere For AI将公开发布这一版Command-R的权重,供研究使用。这是我们广泛支持ML生态系统的一部分,同时还提供研究计算资助和发布如Aya这样的开源研究成果。
对于所有企业和商业用途,Command-R将继续需要商业许可,并将与我们的Rerank和Embed模型同步更新。
您可以在HuggingFace上访问这些权重。
适用于企业的可扩展模型
在Cohere,我们致力于开发适用于生产规模应用的AI技术。随着企业从概念验证项目过渡到实际生产部署,采用可扩展的AI解决方案变得至关重要。
企业需要值得信赖的AI合作伙伴,因此,Cohere始终将云选择多样性和严格的数据隐私保护作为核心关注点。
我们期待收到用户对Command-R的反馈,并期待看到开发者们基于它开发出哪些创新应用。我们将继续提供可扩展的模型,助力企业取得更大成功。
0条评论