语言记忆擦除

优惠 语言记忆擦除ELM:从语言模型中“抹去”特定概念的知识

  • 语言记忆擦除ELM:从语言模型中“抹去”特定概念的知识
    AI
  • 美国东北大学和Anthropic的研究人员发布论文,论文的主题是关于如何从语言模型中“抹去”特定概念的知识。想象一下,如果我们有一个人工智能助手,它在回答有关生物武器的问题时,我们并不希望它使用其在训练数据中学到的信息。我们希望它表现得就像从未见过这类信息一样。这就是所谓的“概念擦除”。 项目主页:https://el... 阅读全文