当前位置：首页 > 优惠 >大语言模型>文章详情

MiniCPM-V：端侧可用的 GPT-4V 级多模态大模型

推荐人：暴走AI| 商城: AI | 11个月前 (06-07)| 分类：大语言模型 | 热度：213 ℃

已关闭评论

MiniCPM-V：端侧可用的 GPT-4V 级多模态大模型

AI

MiniCPM-V是面向图文理解的端侧多模态大模型系列。该系列模型接受图像和文本输入，并提供高质量的文本输出。自2024年2月以来，我们共发布了4个版本模型，旨在实现领先的性能和高效的部署，目前该系列最值得关注的模型包括：

MiniCPM-Llama3-V 2.5： MiniCPM-V系列的最新、性能最佳模型。总参数量8B，多模态综合性能超越 GPT-4V-1106、Gemini Pro、Claude 3、Qwen-VL-Max 等商用闭源模型，OCR 能力及指令跟随能力进一步提升，并支持超过30种语言的多模态交互。通过系统使用模型量化、CPU、NPU、编译优化等高效推理技术，MiniCPM-Llama3-V 2.5 可以实现高效的终端设备部署。
MiniCPM-V 2.0：MiniCPM-V系列的最轻量级模型。总参数量2B，多模态综合性能超越 Yi-VL 34B、CogVLM-Chat 17B、Qwen-VL-Chat 10B 等更大参数规模的模型，可接受 180 万像素的任意长宽比图像输入，实现了和 Gemini Pro 相近的场景文字识别能力以及和 GPT-4V 相匹的低幻觉率。

MiniCPM-V：端侧可用的 GPT-4V 级多模态大模型

在线体验地址：

https://huggingface.co/spaces/openbmb/MiniCPM-V-2

项目地址：

https://github.com/OpenBMB/MiniCPM-V

MiniCPM-V

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：开源工具chsrc ：一键为 Linux 更换最快的国内源，还支持为 Python、Brew、Emacs 等软件换最快的源

下一篇：可直播！开源虚拟数字人项目VirtualWife

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录