这篇论文介绍了一个名为“Task Me Anything”(简称TASK-ME-ANYTHING)的基准测试生成引擎,它是为了评估大型多模态语言模型(MLMs)而设计的。这些模型能够处理包括图像、视频、文本等在内的多种类型的数据,但在实际应用中,开发者往往难以选择最适合其特定需求的模型。为了解决这个问题,TASK-ME... 阅读全文
佐治亚理工学院、斯坦福大学和亚马逊的研究人员发布论文,论文的主题是对开放性的语言模型(Open Language Models,简称LMs)进行深入的实验分析,以评估它们在不同类型的任务、应用领域和推理类型中的表现。简单来说,就像我们上学时参加不同科目的考试一样,这篇论文就是给这些语言模型出了一系列不同难度和类型的题目... 阅读全文
意大利博洛尼亚大学推出新型多模态大语言模型LLaNA(Large Language and NeRF Assistant),它专门设计用来理解和处理一种称为Neural Radiance Fields(NeRFs)的3D数据表示。NeRFs是一种先进的3D建模技术,能够捕捉物体的几何形状和逼真的外观,通常用于生成新视角... 阅读全文
哈佛大学肯普纳研究所、牛津大学的研究人员推出数据选择方法CoLoR-Filter(Conditional Loss Reduction Filtering),用于目标化的语言模型预训练。简单来说,CoLoR-Filter是一种智能的筛选工具,它可以帮助我们从大量数据中挑选出最有价值的一部分,以便更高效地训练语言模型,让... 阅读全文