当前位置：首页 > 情报 >AI情报>文章详情

法国人工智能初创公司 Mistral 发布新型视觉语言模型Pixtral 12B

8个月前 (09-11) | 分类： AI情报 | 热度： 195 ℃

暂无评论

法国人工智能初创公司 Mistral 最近推出了一款新型视觉语言模型——Pixtral 12B，这是一款能够同时处理图像和文本的人工智能模型。此次Mistral依旧选择在X通过磁力链接发布，目前依旧有人下载后上传到Hugging Face上。

磁力链接：

magnet:?xt=urn:btih:7278e625de2b1da598b23954c13933047126238a&dn=pixtral-12b-240910&tr=udp%3A%2F%http://2Ftracker.opentrackr.org%3A1337%2Fannounce&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.ipv6tracker.org%3A80%2Fannounce

模型：https://huggingface.co/mistralai/Pixtral-12B-2409
官方介绍：https://huggingface.co/mistralai/Pixtral-12B-2409

模型特点：

参数规模： Pixtral 12B 拥有 120 亿参数，模型大小约为 24GB。
性能优势： 通常，参数数量越多，模型解决问题的能力越强。

功能介绍：

多模态处理： 基于 Mistral 的文本模型 Nemo 12B 构建，Pixtral 12B 能够处理任意数量、任意尺寸的图像，无论是通过 URL 还是 base64 编码。
任务执行： 理论上，Pixtral 12B 能够执行图像字幕生成、照片内物体数量统计等任务，与 Anthropic 的 Claude 系列和 OpenAI 的 GPT-4o 等多模态模型相似。

获取与使用：