中科院深圳先进技术研究院、北大、中科大以及零一万物等学术机构和企业的研究人员最近推出了 COIG-CQIA 中文高质量指令微调数据集,旨在为中文自然语言处理社区提供高质量且符合人类交互行为的指令微调数据。他们的测试发现弱智吧的语料表现最出色。论文主要作者、深圳先进技术研究院研究生白岳霖澄清,他们只使用了弱智吧的标题,没有使用用户评论,“因为我们的目标是构建符合大模型指令微调质量需求的数据,而贴吧中网友的评论通常不适合直接作为微调数据,因此我们并没有将‘弱智吧’网友的评论纳入我们的数据中。”论文通讯作者、加拿大滑铁卢大学博士生张舸进一步解释:“‘弱智吧’中网友们绞尽脑汁想出来的‘弱智问题’,的确为大模型提供了角度清奇的高质量指令。但是帖子的回答,却有很多冒犯性表述甚至事实性错误,许多回答就是抖机灵、玩梗的,而GPT-4的回答基本上都‘很正经’,经过人工筛选基本上能得到较为可靠的回答。”(来源)
声明:
猎游人 每天为你带来最新的游戏和硬件打折情报,帮你精心挑选值得玩的游戏,让您的钱花的更值!本站信息大部分来自于网友爆料,如果您发现了优质的游戏或好的价格,不妨爆料给我们吧(谢绝任何商业爆料)!
猜你喜欢
- Humane以1.16亿美元出售给惠普,Ai Pin即…
- 一份新的尸检报告显示,前 OpenAI 员工 Su…
- 美国和英国拒绝签署全球AI声明:地缘政治…
- Meta 推出新型脑部扫描仪:将想法转化为文…
- 微软研究:过度依赖人工智能可能导致认知…
- Salesforce 裁员 1000 人,同时招聘销售人…
- 仅有1000万美元的初创公司想在AI领域挑战O…
- ElevenLabs完成2.5亿美元C轮融资,估值达3…
- 苹果任命资深软件高管Kim Vorrath助力改进…
- 创始人夫妇涉嫌通过伪造财务记录欺骗AI投…
- Instagram模糊化或屏蔽堕胎药物教育信息,…
- 金融时报爆料,OpenAI的星际之门项目面临…
0条评论