当前位置：首页 > 情报 >AI情报>文章详情

中国电信人工智能研究院发布首个基于全国产化万卡集群训练的万亿参数大模型TeleChat2-115B

6个月前 (09-28) | 分类： AI情报 | 热度： 230 ℃

暂无评论

“中国电信人工智能研究院”官方公众号今日宣布，该院成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型，并正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。

全国产化替代新阶段

官方表示，这项科研成果标志着国产大模型训练真正实现全国产化替代，正式进入全国产自主创新、安全可控的新阶段。

TeleChat2-115B 模型特点

训练平台：基于中国电信自研的天翼云“息壤一体化智算服务平台”和人工智能公司“星海 AI 平台”训练完成。
效率与稳定性：在保证训练精度的前提下，通过多种优化手段提升模型训练效率和稳定性，实现了 GPU 同等算力计算效率超 93%，模型有效训练时长占比超 98%。
超大参数模型训练：采用大量小模型进行 Scaling，验证不同模型结构的有效性。
数据配比：基于小模型实验结果反馈，采用回归预测模型，得到较优数据配比。

后训练策略