优惠 字节跳动推出增强语言模型Mistral-C2F:增强小规模语言模型在对话和分析推理方面的能力
5个月前 (06-17)AI
字节跳动推出一种新型的大语言模型(LLM)——Mistral-C2F,它是为了增强小规模语言模型在对话和分析推理方面的能力的。想象一下,如果你有一个智能助手,它可以帮你写邮件、回答问题,甚至帮你分析复杂问题,但有时候它给出的回答可能不够深入或者不够个性化。Mistral-C2F模型就是为了解决这些问题而设计的。 例如,... 阅读全文
优惠 英伟达发布的Nemotron-4 340B系列模型家族
5个月前 (06-17)AI
英伟达发布的Nemotron-4 340B系列模型家族,包括Nemotron-4-340B-Base、Nemotron-4-340B-Instruct和Nemotron-4-340B-Reward。这些模型在多种任务上展现出了强大的性能,并且可以在单个DGX H100系统上的8个GPU中以FP8精度部署。模型的安全性评... 阅读全文
优惠 英伟达推出开源数据集HelpSteer2:为了训练能够指导大语言模型(LLMs)生成符合人类偏好的高质量回应的奖励模型而设计
标签:HelpSteer2英伟达
AI
5个月前 (06-17)AI
英伟达推出开源数据集HelpSteer2,它是为了训练能够指导大语言模型(LLMs)生成符合人类偏好的高质量回应的奖励模型而设计的。HelpSteer2数据集的特点是它包含了对回应的多属性评分,这有助于训练出能够更好地符合人类偏好的奖励模型。例如,你是一个在线客服聊天机器人的开发者,你希望机器人能够提供既准确又有帮助的... 阅读全文
优惠 数据集Recap-DataComp:使用LLaMA-3重新描述网络上的数十亿图像
标签:Recap-DataComp
AI
5个月前 (06-16)AI
加州大学圣克鲁斯分校、爱丁堡大学、 JHU、 Adobe、和UT 奥斯汀的研究人员发布论文,论文的主题是关于如何使用一个名为LLaMA-3的先进语言模型来重新描述(recaption)网络上的数十亿图像,目的是改善图像与其文字描述之间的语义对齐,并提高图像生成模型的质量。 项目主页:https://www.haqt... 阅读全文