当前位置：首页 > 优惠 >大语言模型>文章详情

attack-agent：多模态智能体的安全性研究，特别是探讨了这些智能体在面对对抗性攻击时的脆弱性

推荐人：暴走AI| 商城: AI | 10个月前 (06-19)| 分类：大语言模型 | 热度：142 ℃

已关闭评论

attack-agent：多模态智能体的安全性研究，特别是探讨了这些智能体在面对对抗性攻击时的脆弱性

卡内基·梅隆大学的研究人员发布论文，论文的主题是关于对多模态智能体（能够处理视觉和语言信息的AI系统）的安全性研究，特别是探讨了这些智能体在面对对抗性攻击时的脆弱性。多模态智能体被设计用来在真实环境中执行任务，比如网上购物代理，它们可以根据用户的指令来选择商品。论文通过实验表明，即使在对抗性攻击下，通过适当的防御措施，如组件间的一致性检查和指令层级，可以提高多模态智能体的安全性。研究者还讨论了这些发现对未来攻击和防御策略的影响。

项目主页：https://chenwu.io/attack-agent
GitHub：https://github.com/ChenWu98/agent-attack

例如，有一个在线购物的多模态智能体，它的任务是根据用户的指令“将最多的植物加入购物车”来选择商品。一个想要操纵智能体行为的卖家，可能只能修改自己商品列表中的图片而不能改变其他商品信息。卖家选择对产品图片进行微小的、不易察觉的修改，使得智能体误认为这个商品拥有最多的植物，即使实际上并非如此。这种对抗性攻击可能会使智能体执行错误的操作，比如将错误的商品加入购物车。