弗吉尼亚大学、斯坦福大学和亚马逊的研究人员提出了一种新型的“能量基世界模型”(Energy-Based World Models,简称EBWM),这是一种受人类认知启发的机器学习模型,旨在改善现有世界模型在模拟人类预测和规划能力方面的不足。论文的核心观点是,尽管现有的自回归模型(如大型语言模型和计算机视觉中的帧预测模型... 阅读全文
Meta AI和阿姆斯特丹大学的研究人员发布论文,论文的核心主题是对现代计算机视觉架构中一个长期存在的假设——局部性(locality)的必要性提出质疑。局部性是指在图像处理中,相邻像素之间的关联性比相隔较远的像素要强。传统上,包括卷积神经网络(ConvNets)在内的许多视觉模型都依赖于这种局部性偏见来设计和优化性能... 阅读全文
Sakana AI 与 剑桥大学、牛津大学的研究人员推出DiscoPOP,如何使用大语言模型来自动发现和优化偏好优化算法。偏好优化算法主要用于改善和控制大型语言模型输出的质量,使其更好地符合人类的价值观和偏好。例如,我们有一个大型语言模型,我们希望它在生成文本时能够更好地符合人类的偏好。传统上,这需要人类专家设计损失函... 阅读全文