当前位置：首页 > 优惠 >大语言模型>文章详情

ECO：让大语言模型“忘记”它们所学到的某些知识

推荐人：暴走AI| 商城: AI | 1年前 (2024-06-17)| 分类：大语言模型 | 热度：229 ℃

已关闭评论

加州大学圣克鲁斯分校发布论文，论文的主题是关于如何让大语言模型（LLMs）“忘记”它们所学到的某些知识。例如，我们有一个聊天机器人，它通过学习大量的文本数据变得很聪明。但有一天，我们发现它学会了一些不应该被分享的秘密，比如某个人的个人信息。使用ECO方法，我们可以训练一个分类器来识别包含这个人信息的输入，然后在这些输入上应用“污染”，使得聊天机器人在接收到这些信息时，能够给出不包含敏感信息的回答，或者干脆拒绝回答。这样，我们就让聊天机器人“忘记”了它不应该记得的事情。

主要功能：

让大型语言模型能够“忘记”特定的信息，同时保持其他知识的完整性。

主要特点：

轻量级：不需要对模型本身进行修改，而是通过改变输入的方式来实现“忘记”。
高效：与传统的重新训练或梯度更新方法相比，这种方法更加高效，因为它不需要大规模的计算资源。
通用性：这种方法适用于不同规模的模型，从小规模到拥有数千亿参数的大型模型。

工作原理：

论文中提出的Embedding-Corrupted (ECO) Prompts方法，通过在模型的输入阶段引入“干扰”来实现知识的“遗忘”。具体来说，就是通过一个分类器来识别哪些输入（prompts）是需要被“忘记”的，然后对这些输入的嵌入（embeddings）进行“污染”，即在输入的嵌入向量中加入噪声或进行其他形式的修改，使得模型在处理这些输入时，就好像从未学习过这些信息一样。

具体应用场景：