中科院深圳先进技术研究院、北大、中科大以及零一万物等学术机构和企业的研究人员最近推出了 COIG-CQIA 中文高质量指令微调数据集,旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。他们的测试发现弱智吧的语料表现最出色。论文主要作者、深圳先进技术研究院研究生白岳霖澄清,他们只使用了弱智吧的标题,没有使用用户评论,“因为我们的目标是构建符合大模型指令微调质量需求的数据,而贴吧中网友的评论通常不适合直接作为微调数据,因此我们并没有将‘弱智吧’网友的评论纳入我们的数据中。”论文通讯作者、加拿大滑铁卢大学博士生张舸进一步解释:“‘弱智吧’中网友们绞尽脑汁想出来的‘弱智问题’,的确为大模型提供了角度清奇的高质量指令。但是帖子的回答,却有很多冒犯性表述甚至事实性错误,许多回答就是抖机灵、玩梗的,而GPT-4的回答基本上都‘很正经’,经过人工筛选基本上能得到较为可靠的回答。”(来源)
声明:
猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!
猜你喜欢
- 赛博耶稣?科技与宗教结合,瑞士卢塞恩市…
- 微软宣布Microsoft 365 Copilot重要更新:…
- 谷歌设立2000万美元基金助力AI科学探索
- Arc Search 正式上线 Android 版本
- 谷歌推出 Gemini iOS 应用程序
- 苹果发布 Mac 和 iPad 版 Logic Pro 的新…
- 苹果对视频编辑软件Final Cut Pro 11进行…
- Cursor开发商Anysphere 收购 Supermaven:…
- 亚马逊推出最新AI芯片,挑战英伟达的市场…
- 谷歌 DeepMind 开源 AlphaFold3:蛋白质结…
- 全球AI聊天机器人访问量激增,ChatGPT独占…
- 三星电子在HBM市场竞争中落后,寻求卷土重来
0条评论