法国人工智能初创公司 Mistral 最近推出了一款新型视觉语言模型——Pixtral 12B,这是一款能够同时处理图像和文本的人工智能模型。此次Mistral依旧选择在X通过磁力链接发布,目前依旧有人下载后上传到Hugging Face上。
磁力链接:
magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%http://2Ftracker.opentrackr.org%3A1337%2Fannounce&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.ipv6tracker.org%3A80%2Fannounce
- 模型:https://huggingface.co/mistralai/Pixtral-12B-2409
- 官方介绍:https://huggingface.co/mistralai/Pixtral-12B-2409
模型特点:
- 参数规模: Pixtral 12B 拥有 120 亿参数,模型大小约为 24GB。
- 性能优势: 通常,参数数量越多,模型解决问题的能力越强。
功能介绍:
- 多模态处理: 基于 Mistral 的文本模型 Nemo 12B 构建,Pixtral 12B 能够处理任意数量、任意尺寸的图像,无论是通过 URL 还是 base64 编码。
- 任务执行: 理论上,Pixtral 12B 能够执行图像字幕生成、照片内物体数量统计等任务,与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等多模态模型相似。
获取与使用:
- 下载渠道: 可通过 GitHub 和 Hugging Face 平台上的 torrent 链接下载 Pixtral 12B。
- 许可要求: 可能遵循 Mistral 的标准开发许可,商业应用需要付费许可,研究和学术用途则不受限。
许可细节:
- Mistral 尚未明确 Pixtral 12B 适用的具体许可,但提供了一些在 Apache 2.0 许可下无限制的模型。
测试情况:
- 目前还没有可用的网络演示来测试 Pixtral 12B。Mistral 开发者关系负责人 Sophia Yang 在 X 平台上表示,Pixtral 12B 将很快在 Mistral 的聊天机器人和 API 服务平台 Le Chat 和 Le Platforme 上提供测试。
版权与数据:
- 目前尚不清楚 Mistral 用于开发 Pixtral 12B 的具体图像数据。
- 大多数生成式 AI 模型,包括 Mistral 的其他模型,都是基于网络上的大量公共数据进行训练的,这些数据通常受版权保护。
公司发展:
- Mistral 在完成由 General Catalyst 领投的 6.45 亿美元融资轮后推出了 Pixtral 12B,公司估值达到 60 亿美元。
- Mistral 被视作欧洲版的 OpenAI,策略包括发布免费的“开放”模型,对托管版本收费,并提供企业客户咨询服务。
0条评论