中科院深圳先进技术研究院、北大、中科大以及零一万物等学术机构和企业的研究人员最近推出了 COIG-CQIA 中文高质量指令微调数据集,旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。他们的测试发现弱智吧的语料表现最出色。论文主要作者、深圳先进技术研究院研究生白岳霖澄清,他们只使用了弱智吧的标题,没有使用用户评论,“因为我们的目标是构建符合大模型指令微调质量需求的数据,而贴吧中网友的评论通常不适合直接作为微调数据,因此我们并没有将‘弱智吧’网友的评论纳入我们的数据中。”论文通讯作者、加拿大滑铁卢大学博士生张舸进一步解释:“‘弱智吧’中网友们绞尽脑汁想出来的‘弱智问题’,的确为大模型提供了角度清奇的高质量指令。但是帖子的回答,却有很多冒犯性表述甚至事实性错误,许多回答就是抖机灵、玩梗的,而GPT-4的回答基本上都‘很正经’,经过人工筛选基本上能得到较为可靠的回答。”(来源)
声明:
猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!
猜你喜欢
- 亚马逊考虑增加对Anthropic的投资,但有条件
- OpenAI 获得 chat.com 域名,简化 ChatGPT…
- Raycast发布增强版Raycast Notes:支持Mar…
- 谷歌将在沙特阿拉伯建立一个新的以AI为重…
- OpenAI 可能会与 Bing 共享您的 ChatGPT …
- 亚马逊Prime Video新增由AI驱动的X-Ray Re…
- Netflix 游戏副总裁 Mike Verdu 在公司内…
- Meta 核能 AI 数据中心计划受挫,在预定地…
- 英特尔被英伟达取代,退出道琼斯工业平均…
- 微软再次推迟Recall功能在Copilot+PC上的…
- GitHub Octoverse报告揭示开发者趋势变化…
- 谷歌Pixel 9推出全新独立天气应用,AI助力…
0条评论