视觉模型

优惠苹果推出新型视觉模型4M-21：能够在多种不同的输入和输出模态之间进行转换和预测

推荐人：暴走AI 标签：4M-21 视觉模型 AI

10个月前 (06-16)AI

瑞士洛桑联邦理工学院 (EPFL)和苹果推出新型视觉模型4M-21，它是一个多模态、多任务的基础模型，能够在多种不同的输入和输出模态之间进行转换和预测。简单来说，4M-21就像一个多才多艺的艺术家，不仅能够理解一幅画（图像数据），还能根据这幅画创作出一首诗（文本描述）、一段音乐（深度信息）、甚至是一个舞蹈动作（3D人体... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型视觉模型GiT：通过一个通用的语言接口来处理各种视觉任务，从而实现一个视觉领域的通用模型

推荐人：暴走AI 标签：GiT 视觉模型 AI

1年前 (2024-03-15)AI

来自北京大学、马克斯·普朗克信息学研究所、香港中文大学（深圳）、苏黎世联邦理工学院、香港中文大学的研究团队推出新型视觉模型GiT（Generalist Vision Transformer），它的目标是通过一个通用的语言接口来处理各种视觉任务，从而实现一个视觉领域的通用模型。想象一下，有一个智能助手，它可以看一张图片，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠视觉模型大比拼Vision Arena：看看那个模型准确率最高？

推荐人：暴走AI 标签：Vision Arena 视觉模型 AI

1年前 (2024-02-12)AI

在科技日新月异的今天，各种视觉语言模型（VLMs）如GPT-4V、Gemini、Llava、Qwen-VL等层出不穷，它们各具特色，各有千秋。但究竟哪个模型更胜一筹呢？一个专为视觉模型打造的竞技场Vision Arena在Hugging Face上线。你可以轻松测试并比较不同的视觉模型。更激动人心的是，你可以同时测试两... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

视觉模型

优惠苹果推出新型视觉模型4M-21：能够在多种不同的输入和输出模态之间进行转换和预测

优惠新型视觉模型GiT：通过一个通用的语言接口来处理各种视觉任务，从而实现一个视觉领域的通用模型

优惠视觉模型大比拼Vision Arena：看看那个模型准确率最高？