人工智能
优惠 HyperCloning:用于加速大语言模型预训练的新策略
标签:HyperCloning
AI
2个月前 (09-20)AI
苹果推出了一个名为HyperCloning的方法,这是一种用于加速大语言模型预训练的新策略。它通过利用小型预训练模型的参数来初始化一个更大的模型,从而提高了训练效率和最终的准确性。因此,在训练开始之前,较大模型就已经继承了较小模型的预测能力和准确性。我们展示了训练这样一个初始化后的模型,在预训练大型语言模型所需的 GP... 阅读全文
优惠 大规模多模态预训练数据集 InfiMM-WebMath-40B:提升大语言模型在数学推理方面的能力
2个月前 (09-20)AI
字节跳动和中国科学院的研究人员推出大规模多模态预训练数据集 InfiMM-WebMath-40B,它旨在提升大语言模型(LLMs)在数学推理方面的能力。这个数据集特别为多模态学习环境设计,包含了图像和文本的结合,以帮助模型更好地理解和处理数学概念。 数据:https://huggingface.co/datasets/... 阅读全文
优惠 SSR-Speech:专为零样本(zero-shot)文本基础的语音编辑和文本到语音(TTS)合成设计
标签:SSR-Speech
AI
2个月前 (09-19)AI
约翰霍普金斯大学、腾讯人工智能实验室和南洋理工大学的研究人员推出新型神经编解码自回归模型SSR-Speech,它专为零样本(zero-shot)文本基础的语音编辑和文本到语音(TTS)合成设计,以实现稳定、安全和强大的性能。简单来说,SSR-Speech 能够根据文本指令修改或合成语音,而不需要在训练期间听到特定的说话... 阅读全文