PingPong

优惠 新型基准测试PingPong:专门用来评估语言模型在角色扮演方面的能力

  • 新型基准测试PingPong:专门用来评估语言模型在角色扮演方面的能力
    AI
  • 独立研究人员Ilya Gusev推出新型基准测试PingPong,它专门用来评估语言模型在角色扮演方面的能力。你可以把它想象成一个高级的“过家家”游戏,但是这里的玩家不是真人,而是人工智能(AI)模型。在这个游戏中,AI模型需要扮演特定的角色,并且与用户进行互动,就像真人一样进行对话。 项目主页:https://ily... 阅读全文