MAD-Bench – 猎游人

栏目分类

优惠基准测试MAD-Bench：系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力

推荐人：暴走AI 标签：MAD-Bench 多模态大语言模型 AI

1年前 (2024-02-21)AI

关于评估多模态大语言模型（MLLMs）在处理欺骗性提示（deceptive prompts）时的脆弱性，来自苹果的研究人员创建了一个名为MAD-Bench的基准测试，它包含了850个测试样本，分为六个类别，如不存在的对象、对象数量、空间关系和视觉混淆等，用以系统地检验MLLMs在面对文本提示和图像不一致时的冲突解决能力... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

开源软件

人工智能

电脑游戏

主机游戏

手机游戏

优惠 基准测试MAD-Bench：系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力

优惠基准测试MAD-Bench：系统地检验多模态大语言模型在面对文本提示和图像不一致时的冲突解决能力