PiTe

优惠 新型大型视频-语言模型PiTe:通过一种称为“像素-时间对齐”的技术,提高了模型理解和生成视频内容的能力

  • 新型大型视频-语言模型PiTe:通过一种称为“像素-时间对齐”的技术,提高了模型理解和生成视频内容的能力
    AI
  • 西湖大学和苏州大学的研究人员推出新型大型视频-语言模型PiTe,它通过一种称为“像素-时间对齐”的技术,提高了模型理解和生成视频内容的能力。PiTe模型的目标是通过精细的时空对齐,让机器更好地理解和回应与视频内容相关的语言指令。 论文地址:https://arxiv.org/abs/2409.07239 例如,你正在看... 阅读全文