AtP*

栏目分类

优惠 AtP*（Attribution Patching*）：用于定位大语言模型（LLM）中特定行为的组件

推荐人：暴走AI 标签：AtP* AI

1年前 (2024-03-04)AI

Google DeepMind发布论文介绍了一种名为AtP*（Attribution Patching*）的高效且可扩展的方法，用于定位大语言模型（LLM）中特定行为的组件。想象一下，你有一个非常复杂的机器，比如一个巨大的乐高城堡，你想知道城堡中的哪个部分（比如哪个乐高积木）对于城堡的某个特定功能（比如开门）至关重要。... 阅读全文

直达链接好 0 不好 0 已关闭评论