法国人工智能初创公司 Mistral AI 今天发布了其首个专为编程设计的大语言模型(LLM)—— Codestral。尽管 Codestral 在某些基准测试中略低于其他模型,但它在上下文处理能力和多语言支持方面展现出了自己的优势。Mistral AI 的 Codestral 为编程领域带来了新的选择,虽然性能上的比较还有待进一步的验证和实际应用的检验,但其创新的多语言支持和上下文处理能力无疑值得关注。
Codestral 功能概览
- 多语言支持:Codestral 能够熟练使用80多种编程语言,包括 Python、Java、C、C++、JavaScript、Bash、Swift,以及1957年的 Fortran。
- 辅助开发:它可以帮助开发者完成函数、编写测试、填充代码等任务,降低代码错误和漏洞风险。
性能对比
Mistral AI 通过图表展示了 Codestral 22B 与其他同类大模型的性能对比,包括 CodeLlama 70B、DeepSeek Coder 33B 和 Llama 3 70B。Codestral 虽然只有220亿参数,但其上下文长度达到3.2万个 tokens,在 Python、SQL 等语言方面表现更佳。
- SQL spider基准测试:Llama 3 70B 得分率为 67.1%,而 Codestral 22B 为 63.5%。
- MBPP Python基准测试:DeepSeek Code 3B 得分率为 80.2%,Codestral 22B 为 78.2%。
0条评论