大型视觉-语言模型

优惠 针对大型视觉-语言模型(LVLMs)的推理加速技术FastV

  • 针对大型视觉-语言模型(LVLMs)的推理加速技术FastV
    AI
  • 来自阿里巴巴和北京大学推出FastV,这是一种针对大型视觉-语言模型(LVLMs)的推理加速技术。LVLMs是一类结合了图像识别和自然语言处理能力的人工智能模型,它们可以处理复杂的任务,比如根据图片内容生成描述、回答关于图像的问题等。然而,这些模型在处理图像信息时存在效率低下的问题,特别是在模型的深层结构中。 GitH... 阅读全文

    优惠 BBA:提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现

  • BBA:提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现
    AI
  • 来自香港大学、腾讯AI实验室的研究人员发布论文介绍了一种名为Bi-Modal Behavioral Alignment (BBA) 的方法,它是为了提高大型视觉-语言模型(LVLMs)在复杂多模态推理任务中的表现。BBA方法的核心在于它能够更好地利用视觉信息和领域特定语言(DSL)的表示,这两种信息在传统的Chain-... 阅读全文