当前位置：首页 > 情报 >AI情报>文章详情

英伟达发布 Mistral-NeMo-Minitron 8B 语言模型：精度、效率高，可在 RTX 工作站上部署

8个月前 (08-23) | 分类： AI情报 | 热度： 132 ℃

暂无评论

英伟达推出了 Mistral-NeMo-Minitron 8B，这是一款轻量级语言模型，不仅体积小巧，而且具备与大型模型相当的先进准确性。（来源）

【模型介绍】

Mistral-NeMo-Minitron 8B 是基于上个月发布的 Mistral NeMo 12B 开放模型的精简版本，该模型可以在 NVIDIA RTX 加速的工作站上运行。
性能表现：在多项基准测试中表现出色，包括 AI 聊天机器人、虚拟助手、内容生成器和教育工具等。
技术亮点：通过剪枝和蒸馏技术，将原模型的 1200 亿参数减少到 80 亿，同时保持了高准确性。
应用领域：适用于资源有限的组织，在降低成本和能耗的同时，易于部署在工作站或笔记本电脑上。

【部署方式】

开发者可以：
- 通过 NVIDIA NIM 微服务开始使用该模型，该服务提供标准的 API 接口。
- 从 Hugging Face 下载模型。
即将推出的 NVIDIA NIM 可以在几分钟内部署于任何 GPU 加速系统上。

【基准测试】

Mistral-NeMo-Minitron 8B 在九个流行的基准测试中表现出众，涵盖多种任务类型，如语言理解、常识推理、数学推理、摘要、编程等。

英伟达发布 Mistral-NeMo-Minitron 8B 语言模型：精度、效率高，可在 RTX 工作站上部署

【优化方案】

AI Foundry 平台 为开发者提供了一整套解决方案，用于创建并定制基础模型为 NIM 微服务。
剪枝与蒸馏：开发者可以下载 80 亿参数的模型，并通过 NVIDIA AI Foundry 定制更小、更优化的版本以适应特定应用场景。

【技术优势】

计算成本：相比于从头开始训练小模型，剪枝和蒸馏可以节省高达 40 倍的计算成本。
安全优势：在边缘设备上本地运行模型可以避免数据传输到服务器，提高安全性。

【其他发布】

英伟达同时发布了 Nemotron-Mini-4B-Instruct，这是一款针对 NVIDIA GeForce RTX AI PC 和笔记本电脑优化的小型语言模型，专为低内存使用和快速响应设计。

【体验渠道】

通过 ai.nvidia.com 的浏览器或 API 体验这两个模型作为 NIM 微服务。

更多详情，请参考英伟达技术博客和技术报告。

Mistral-NeMo-Minitron 英伟达

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！

上一篇：《魔戒》动画电影《指环王：洛汗之战》释出正式预告片，预定12月13日上映

下一篇：联想携手McAfee推出全球首款自动Deepfake检测器

猜你喜欢

查看更多商品

0条评论

暂时木有评论

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录