当前位置：首页 > 优惠 >大语言模型>文章详情

新型基准测试PingPong：专门用来评估语言模型在角色扮演方面的能力

推荐人：暴走AI| 商城: AI | 2年前 (2024-09-12)| 分类：大语言模型 | 热度：674 ℃

已关闭评论

独立研究人员Ilya Gusev推出新型基准测试PingPong，它专门用来评估语言模型在角色扮演方面的能力。你可以把它想象成一个高级的“过家家”游戏，但是这里的玩家不是真人，而是人工智能（AI）模型。在这个游戏中，AI模型需要扮演特定的角色，并且与用户进行互动，就像真人一样进行对话。

主要功能和特点：

工作原理： 这个基准测试包括三个主要部分：

这三个模型相互协作，玩家模型进行角色扮演，询问者模型与之互动，裁判模型则在背后打分，判断玩家模型的表现如何。

具体应用场景：

总的来说，这个基准测试为评估和改进AI在角色扮演和互动对话方面的能力提供了一个有效的工具。

PingPong

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：非线性任务的开放世界沙盒游戏《飙酷车神2》迎来历史最低价

下一篇：为新视角合成任务而设计的智能代理MVLLaVA

暂时木有评论

查看更多商品