智谱AI 今天宣布,其最新大模型 GLM-4-Flash 现已通过智谱AI大模型开放平台免费开放调用。智谱AI的GLM-4-Flash大模型,以其高效性能和多语言支持,将为开发者和企业提供更快速、更经济的AI服务。
GLM-4-Flash大模型特点:
- 快速响应:生成速度高达72.14 token/s,约等于115字符/s。
- 多轮对话:支持流畅的多轮对话功能。
- 网页浏览:具备网页浏览能力。
- 函数调用:支持Function Call(函数调用)。
- 长文本推理:支持最大128K上下文的长文本推理。
- 多语言支持:支持包括中文、英语、日语、韩语、德语等26种语言。
性能优化:
官方表示,通过采用自适应权重量化、多种并行化方式、批处理策略以及投机采样等技术,在推理层面实现了模型的延迟降低与速度提升。更大的并发量和吞吐量不仅提升了效率,而且显著降低了推理成本,使得免费推出成为可能。
预训练优势:
- 高质量数据:引入大语言模型进入数据筛选流程,获得10T的高质量多语言数据,数据量是ChatGLM3-6B模型的3倍以上。
- 高效预训练:采用FP8技术进行预训练,提高训练效率和计算量。
0条评论