当前位置：首页 > 优惠 >大语言模型>文章详情

能量基世界模型EBWM：受人类认知启发的机器学习模型，旨在改善现有世界模型在模拟人类预测和规划能力方面的不足

推荐人：暴走AI| 商城: AI | 1年前 (2024-06-17)| 分类：大语言模型 | 热度：238 ℃

已关闭评论

能量基世界模型EBWM：受人类认知启发的机器学习模型，旨在改善现有世界模型在模拟人类预测和规划能力方面的不足

AI

弗吉尼亚大学、斯坦福大学和亚马逊的研究人员提出了一种新型的“能量基世界模型”（Energy-Based World Models，简称EBWM），这是一种受人类认知启发的机器学习模型，旨在改善现有世界模型在模拟人类预测和规划能力方面的不足。论文的核心观点是，尽管现有的自回归模型（如大型语言模型和计算机视觉中的帧预测模型）在特定任务上表现出色，但它们在模拟人类的认知过程，特别是高级推理和规划方面，仍有局限。

例如，我们有一个自动驾驶系统，它需要预测接下来几秒内交通状况。使用EBWM，系统不仅能够生成对未来帧的预测，还能够评估这些预测的合理性，并根据预测的不确定性动态调整其处理速度和资源分配，从而更好地模拟人类的决策过程。论文还讨论了EBWM相对于传统自回归模型（TAMs）的优势，并通过实验展示了EBWM在数据和计算效率方面的可扩展性。此外，论文指出EBWM的一些局限性，如额外的超参数和对计算资源的高需求，这些都是未来研究需要解决的问题。

主要功能和特点：

模拟人类认知：EBWM尝试模仿人类如何通过内部认知过程来预测未来，并评估预测的合理性。
动态资源分配：与人类在不同难度的任务上分配不同时间进行预测类似，EBWM能够根据预测的复杂度动态分配计算资源。
连续状态空间的不确定性建模：EBWM能够在如视觉信号等连续状态空间中建模不确定性，这是传统离散模型所不具备的。

工作原理：

能量基模型（EBM）：EBWM使用EBM来预测给定上下文和预测未来状态的兼容性，其中低能量值表示高兼容性，高能量值表示低兼容性。
马尔可夫链蒙特卡洛（MCMC）方法：EBWM利用MCMC进行多次前向传播，通过迭代地细化预测，直到输出的能量收敛，从而实现更准确的预测。
能量基变压器（EBT）：为了使EBM能够并行处理多个预测，论文设计了EBT，这是一种针对EBM的Transformer架构变体。

具体应用场景：

高级推理和规划：EBWM可以用于需要复杂推理和长期规划的场景，如自动驾驶、机器人导航等。
智能搜索：在需要在状态空间中进行广泛搜索的任务中，EBWM能够智能地评估和改进生成的状态，提高搜索效率。
自然语言处理（NLP）：EBWM在NLP领域也展现出了良好的扩展性，可以用于语言模型的改进，提高对语言的理解能力。

EBWM 能量基世界模型

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇： PiT：更细致地理解图像内容，而不是依赖于局部区域的信息

下一篇：英伟达推出开源数据集HelpSteer2：为了训练能够指导大语言模型（LLMs）生成符合人类偏好的高质量回应的奖励模型而设计

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录