优惠能量基世界模型EBWM：受人类认知启发的机器学习模型，旨在改善现有世界模型在模拟人类预测和规划能力方面的不足

AI

推荐人：暴走AI 标签：EBWM 能量基世界模型 AI

10个月前 (06-17)AI

弗吉尼亚大学、斯坦福大学和亚马逊的研究人员提出了一种新型的“能量基世界模型”（Energy-Based World Models，简称EBWM），这是一种受人类认知启发的机器学习模型，旨在改善现有世界模型在模拟人类预测和规划能力方面的不足。论文的核心观点是，尽管现有的自回归模型（如大型语言模型和计算机视觉中的帧预测模型... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 PiT：更细致地理解图像内容，而不是依赖于局部区域的信息

AI

推荐人：暴走AI 标签：PIT AI

10个月前 (06-17)AI

Meta AI和阿姆斯特丹大学的研究人员发布论文，论文的核心主题是对现代计算机视觉架构中一个长期存在的假设——局部性（locality）的必要性提出质疑。局部性是指在图像处理中，相邻像素之间的关联性比相隔较远的像素要强。传统上，包括卷积神经网络（ConvNets）在内的许多视觉模型都依赖于这种局部性偏见来设计和优化性能... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠偏好优化算法DiscoPOP：用于改善和控制大型语言模型输出的质量，使其更好地符合人类的价值观和偏好

AI

推荐人：暴走AI 标签：DiscoPOP 偏好优化算法 AI

10个月前 (06-16)AI

Sakana AI 与剑桥大学、牛津大学的研究人员推出DiscoPOP，如何使用大语言模型来自动发现和优化偏好优化算法。偏好优化算法主要用于改善和控制大型语言模型输出的质量，使其更好地符合人类的价值观和偏好。例如，我们有一个大型语言模型，我们希望它在生成文本时能够更好地符合人类的偏好。传统上，这需要人类专家设计损失函... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠数据集Recap-DataComp：使用LLaMA-3重新描述网络上的数十亿图像

AI

推荐人：暴走AI 标签：Recap-DataComp AI

10个月前 (06-16)AI

加州大学圣克鲁斯分校、爱丁堡大学、 JHU、 Adobe、和UT 奥斯汀的研究人员发布论文，论文的主题是关于如何使用一个名为LLaMA-3的先进语言模型来重新描述（recaption）网络上的数十亿图像，目的是改善图像与其文字描述之间的语义对齐，并提高图像生成模型的质量。项目主页：https://www.haqt... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠能够理解多种信息形式（比如文本、图像、视频、声音等）的全能型人工智能模型MiCo

AI

推荐人：暴走AI 标签：MiCo AI

10个月前 (06-16)AI

香港中文大学多媒体实验室、中国科学院大学人工智能学院、中国科学院自动化研究所和上海人工智能实验室的研究人员推出全能型人工智能模型MiCo，这是一种能够理解多种信息形式（比如文本、图像、视频、声音等）的全能型人工智能模型。我们可以把这种模型想象成一个超级大脑，它能够像人类一样，通过视觉、听觉等感官来感知世界，并且能够学习... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠综合性基准测试工具CS-Bench：专门设计用来评估大语言模型在计算机科学（CS）领域的性能

AI

推荐人：暴走AI 标签：CS-Bench 大语言模型 AI

10个月前 (06-16)AI

北京邮电大学推出综合性基准测试工具CS-Bench，它专门设计用来评估大语言模型（LLMs）在计算机科学（CS）领域的性能。CS-Bench是首个中英双语的计算机科学评估基准，旨在全面考察LLMs在计算机科学各个方面的知识和推理能力。例如，我们想要检验一个人工智能是否能够像计算机科学专业的学生一样，解决编程、算法、网络... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Visual SKETCHPAD：赋予了多模态语言模型一种新的可视化工具——素描板，以及在素描板上绘图的能力

AI

推荐人：暴走AI 标签：Visual SKETCHPAD 素描板 AI

10个月前 (06-16)AI

华盛顿大学、艾伦人工智能研究所和宾夕法尼亚大学的研究人员推出Visual SKETCHPAD，它赋予了多模态语言模型（LMs）一种新的可视化工具——素描板，以及在素描板上绘图的能力。这就像给计算机一个可以在上面画草图的画板，帮助它更好地理解和解决问题。例如，当你在解决一个几何问题时，你可能会在纸上画一些辅助线来帮助思... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新框架LMC：用于对大语言模型在高度主观任务上的表现进行基准测试

AI

推荐人：暴走AI 标签：LMC 基准测试大语言模型 AI

10个月前 (06-16)AI

Predibase、博科尼大学的研究人员推出新框架“Language Model Council”（LMC），用于对大语言模型（LLMs）在高度主观任务上的表现进行基准测试。这个框架通过民主化的过程来评估和排名模型，尤其是在情感智能、创造性写作或说服力等主观性强、缺乏普遍共识的任务上。LMC框架的局限性，如只研究了单轮... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型基准测试工具MUIRBENCH：用来评估多模态大语言模型在理解多图像方面的能力

AI

推荐人：暴走AI 标签：MUIRBENCH 基准测试工具多模态大语言模型 AI

10个月前 (06-16)AI

南加州大学、宾大、明尼苏达大学、加州大学戴维斯分校、威斯康星大学麦迪逊分校、加州大学洛杉矶分校、俄亥俄州立大学、字节跳动和微软研究院的研究人员推出新型基准测试工具MUIRBENCH，它专门用来评估多模态大型语言模型（LLMs）在理解多图像方面的能力。简单来说，MUIRBENCH测试的是，当AI面对多个图片时，它是否能够... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大型多语言多模态文档级语料库mOSCAR

AI

推荐人：暴走AI 标签：mOSCAR AI

10个月前 (06-16)AI

来自Inria 、法国国立科学研究院、巴黎政治大学、巴黎圣日耳曼大学信息科学系、法国国立科学研究院、巴黎政治大学信息科学发展与资源研究所、法国巴黎索邦大学、通用爬行基金会和巴黎萨克雷大学的研究人员推出大型多语言多模态文档级语料库mOSCAR，mOSCAR是为了支持和改进多模态大型语言模型（mLLMs）的研究而创建的，... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型多语言视觉问答基准测试CVQA：通过包含多种文化和语言，推动多模态AI系统的发展，特别是提高它们在理解和推理视觉及文本数据方面的能力

AI

推荐人：暴走AI 标签：CVQA AI

10个月前 (06-16)AI

MBZUAI推出新型多语言视觉问答（VQA）基准测试CVQA（Culturally-diverse Multilingual Visual Question Answering Benchmark），CVQA旨在通过包含多种文化和语言，推动多模态人工智能（AI）系统的发展，特别是提高它们在理解和推理视觉及文本数据方面的... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠估算生成式Ai在上下文学习中的“幻觉率”（hallucination rate）

AI

推荐人：暴走AI 标签：幻觉率 AI

10个月前 (06-16)AI

这篇论文的主题是关于估算生成性人工智能（Generative AI）在上下文学习（In-Context Learning, ICL）中的“幻觉率”（hallucination rate）。在上下文学习中，一个条件生成模型（Conditional Generative Model, CGM）会被提供一组数据集，并基于这个... 阅读全文

直达链接好 0 不好 0 已关闭评论