CLoVe

栏目分类

推荐人：暴走AI 标签：CLoVe 视觉-语言模型 AI

1年前 (2024-02-26)AI

密歇根大学安娜堡分校、Netflix的研究人员发布论文介绍了一个名为CLoVe（Contrastive Language-Image Vision Models）的框架，旨在提高现有的视觉-语言模型（VLMs）在处理组合语言时的能力。VLMs，如CLIP模型，通常在识别图像中的对象方面表现出色，但在理解文本中单词顺序变... 阅读全文

直达链接好 0 不好 0 已关闭评论