新型视觉压缩技术

栏目分类

推荐人：暴走AI 标签：新型视觉压缩技术 AI

10个月前 (06-19)AI

清华大学、腾讯 PCG ARC 实验室和加州大学圣克鲁斯分校的研究人员推出新型视觉压缩技术VoCo-LLaMA，这项技术是专门为视觉-语言模型（Vision-Language Models，简称VLMs）设计的，目的是解决这些模型在处理高分辨率图像输入和视频时遇到的两个主要问题：有限的上下文窗口和高昂的计算成本。项目... 阅读全文

直达链接好 0 不好 0 已关闭评论