大语言模型
优惠 VIDEOGAMEBUNNY模型:为理解视频游戏图像而特别定制的多模态大模型
4个月前 (07-24)AI
阿尔伯塔大学的研究人员推出VIDEOGAMEBUNNY模型,这是一个为理解视频游戏图像而特别定制的多模态大模型(LMM)。它基于Bunny模型,并对其进行了微调,以提高对视频游戏内容的理解能力。研究团队发布了中间检查点、训练日志以及一个包含185,259张来自413个游戏的视频游戏图像的广泛数据集,以及389,565个... 阅读全文
优惠 无需训练的视频大语言模型SlowFast-LLaVA:能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算
标签:SlowFast-LLaVA
AI
4个月前 (07-24)AI
苹果推出一个名为SlowFast-LLaVA(简称SF-LLaVA)的新方法,它是一种无需训练的视频大语言模型(LLM)。SF-LLaVA能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算。这种方法通过为视频LLM设计双流输入(Slow和Fast路径),有效地聚合了采样视频帧的特征。 论文... 阅读全文
优惠 多模态大语言模型评估框架MultiTrust
标签:MultiTrust
AI
4个月前 (07-22)AI
清华大学、北京航空航天大学、上海交通大学和RealAI的研究人员推出多模态大语言模型评估框架MultiTrust。简单来说,就是研究这些能够同时处理文本和图像等多种形式信息的人工智能模型是否值得信赖。这包括了它们在面对各种任务时的准确性、安全性、鲁棒性、公平性和隐私保护能力。 项目主页:https://multi-tr... 阅读全文
优惠 谷歌推出新型稀疏自编码器JumpReLU SAEs:用于提高语言模型激活的重建保真度
4个月前 (07-22)AI
谷歌推出新型稀疏自编码器(Sparse Autoencoders, SAEs),称为JumpReLU SAEs,它用于提高语言模型(Language Model, LM)激活的重建保真度。简单来说,这种技术可以帮助我们从大量文本数据中提取出关键信息,并且以一种非常节省资源的方式表示这些信息。论文还提到了一些限制和未来的... 阅读全文