情报 阿里旗下通义千问推出 Qwen2-VL:开源 2B / 7B 参数视觉大模型,处理任意分辨率图像无需分割成块

阿里巴巴旗下通义千问团队今天对 Qwen-VL(视觉语言、Vision Language)模型进行更新,推出 Qwen2-VL。Qwen2-VL 的一项关键架构改进是实现了动态分辨率支持(Naive Dynamic Resolution support)。与上一代模型 Qwen-VL 不同,Qwen2-VL 可以处理任... 阅读全文