Model Surgery

优惠 模型手术(Model Surgery):通过直接编辑大语言模型的一小部分参数来调节其行为的方法

  • 模型手术(Model Surgery):通过直接编辑大语言模型的一小部分参数来调节其行为的方法
    AI
  • 清华大学自动化系和卡内基梅隆大学的研究人员推出“模型手术”(Model Surgery),这是一种通过直接编辑大语言模型(LLM)的一小部分参数来调节其行为的方法。这种方法特别适用于希望模型展现出某些理想行为特征,比如无毒性(non-toxicity)和抵抗越狱(jailbreak)尝试的能力。 GitHub:http... 阅读全文