Nous Research推出基于 Llama 3.1的大语言模型Hermes 3,它专门针对接受指令和工具使用进行了优化,具备强大的推理和创造能力。Hermes 3模型以其中立的立场和高度的可控性脱颖而出,能够精确地响应用户的指令性陈述。例如,你有一个智能助手,它可以阅读你的指令,比如“列出旧金山值得一游的有趣地点”,或者“概述证明哥德巴赫猜想的方法”,然后给出回答。Hermes 3就是这样一个助手,但它做得更多,它能够以多种语言和风格回应,甚至能在角色扮演和创意写作中保持一致性。
- 模型地址:https://huggingface.co/collections/NousResearch/hermes-3-66bd6c01399b14b08fe335ea
主要功能:
- 遵循指令:Hermes 3能够响应用户的指令性陈述。
- 工具使用:模型可以请求执行外部计算或数据检索,并将结果整合到生成的文本中。
- 推理和创造:在推理任务和创造性应用中表现出色,如角色扮演和创意写作。
主要特点:
- 中立对齐:与可能基于道德理由拒绝指令的封闭模型不同,Hermes 3没有内在的偏见,它遵循系统提示和指令提示。
- 多领域性能:在多个公共基准测试中,Hermes 3表现出了开放权重模型中的最先进性能。
- 高级功能:包括使用XML标签进行结构化输出、实现临时存储器进行中间处理、生成内部独白以透明化决策过程等。
工作原理:
- 系统提示:模型根据系统提示设置世界观,并忠实地响应用户请求。
- 工具使用和检索增强生成(RAG):通过指定和调用工具,模型能够利用外部数据和工具。
- 数据混合:Hermes 3的训练数据包括了从多个来源收集和生成的高质量指令数据。
- 训练过程:包括监督式微调(SFT)和直接偏好优化(DPO)两个阶段。
具体应用场景:
- 角色扮演游戏:作为游戏角色与玩家进行多轮对话。
- 软件开发:生成复杂、功能性的代码片段,并提供详细的代码解释和文档。
- 教育和研究:在需要解决数学问题或进行科学推理的场景中提供帮助。
- 内容创作:在创意写作和内容生成中提供灵感和结构化输出。
报告还提到了Hermes 3模型的训练细节,包括数据的选择和过滤、训练的优化器设置、学习率调整等,以及模型在不同任务上的性能评估。此外,报告强调了模型的透明度和可控性,以及在构建与人类交互的系统时,将防护措施放在系统层面而非模型本身的重要性。
0条评论