当前位置：首页 > 情报 >AI情报>文章详情

摩尔线程发布业界首个基于国产GPU训练的大型开源语音模型 —— MooER

8个月前 (08-23) | 分类： AI情报 | 热度： 137 ℃

暂无评论

摩尔线程近日宣布开源其开发的音频理解大模型——MooER（摩耳），这标志着业界首个基于国产全功能GPU进行训练和推理的大型开源语音模型的诞生。

Github 地址：https://github.com/MooreThreads/MooER
技术文档：https://arxiv.org/pdf/2408.05101
技术演示：https://mooer-speech.mthreads.com:10077

摩尔线程发布业界首个基于国产GPU训练的大型开源语音模型 —— MooER

MooER模型亮点

国产GPU训练：MooER模型基于摩尔线程夸娥（KUAE）智算平台，展示了国产GPU的强大计算能力。
快速训练：该模型在短短38小时内完成了5000小时音频数据和伪标签的训练，效率惊人。
多语言支持：MooER不仅支持中文和英文的语音识别，还具备中译英的语音翻译能力。
接近工业级效果：在Covost2中译英测试集中，MooER-5K模型取得了25.2的BLEU分数，显示出接近工业级的效果。

开源贡献

代码开源：摩尔线程AI团队开源了推理代码以及5000小时数据训练的模型，为社区贡献了宝贵的资源。
持续贡献：团队计划进一步开源训练代码，并推出基于8万小时数据训练的模型，以促进技术交流和发展。

模型结构

MooER模型的结构由三个核心部分组成：

Encoder（编码器）：负责将输入的语音信号转换成特征表示。
Adapter（适配器）：用于调整和优化模型的输出，以适应不同的任务需求。
Decoder（解码器）：结合Large Language Model（大语言模型，LLM），生成最终的文本结果。

MooER 摩尔线程

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！

上一篇：联想携手McAfee推出全球首款自动Deepfake检测器

下一篇：快手旗下可灵AI推出会员订阅计划，首月19元起！

猜你喜欢

查看更多商品

0条评论

暂时木有评论

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录