IBM 开源了它用于辅助编程的 Granite 代码模型,源代码托管在 GitHub 上,采用 Apache License 2.0 许可证,允许商业使用。与其它 AI 模型不同的是,IBM 致力于避免模型的版权问题,使用了开放数据集如 GitHub Code Clean、Starcoder、开放代码库和 GitHub issues 等进行训练。Granite 是 decoder-only 代码模型,可用于修 bug、解释代码和生成代码文档,使用了 116 种编程语言的代码进行训练,参数规模 30 亿、80 亿、200 亿和 340 亿。IBM 称测试显示 Granite 在开源代码模型中表现最出色。
- GitHub:https://github.com/ibm-granite/granite-code-models
- 模型地址:https://huggingface.co/collections/ibm-granite/granite-code-models-6624c5cec322e4c148c8b330
Granite 代码模型专为编程任务设计,能够执行代码生成、漏洞修复、代码解释和文档编写等多种功能。它们通过116种编程语言的代码训练而成,经过全面评估,在众多开源代码大语言模型中展现出了卓越的性能。
模型亮点
全能代码生成专家:Granite 代码模型在代码生成、解释、修复、编辑和翻译等多样化编程任务上,均展现出了强大的性能,真正实现了多功能集成。
企业级信赖之选:Granite 代码模型采用符合许可的IBM数据进行训练,遵循IBM的人工智能伦理原则,并得到IBM法律团队的指导,确保了企业级应用的可靠性。所有花岗岩代码模型均在Apache 2.0许可协议下发布,适用于研究和商业用途。
两种主要变体
-
Granite代码基础模型:这些基础模型专为代码相关任务设计,如代码修复、解释和合成。 -
Granite代码指令模型:这些模型通过结合Git提交、人类指令以及开源合成的代码指令数据集进行微调,以更好地跟随指令。
0条评论