WILDTEAMING

优惠 自动化框架WILDTEAMING:专门用来挖掘和测试大语言模型的安全性漏洞

  • 自动化框架WILDTEAMING:专门用来挖掘和测试大语言模型的安全性漏洞
    AI
  • 华盛顿大学、艾伦人工智能研究所、首尔国立大学和卡内基梅隆大学推出自动化框架WILDTEAMING,它专门用来挖掘和测试大语言模型(LLMs)的安全性漏洞。简单来说,WILDTEAMING能够自动从真实的用户-聊天机器人交互中发现新的“越狱”(jailbreak)策略,这些策略是用户用来绕过语言模型的安全防护的技巧。然后... 阅读全文