当前位置：首页 > 优惠 >大语言模型>文章详情

使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目llm.c

推荐人：暴走AI| 商城: AI | 12个月前 (04-16)| 分类：大语言模型 | 热度：198 ℃

已关闭评论

使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目llm.c

AI

llm.c是一个使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目，无需庞大的245MB PyTorch或107MB cPython依赖。例如，GPT-2（CPU，fp32）的训练仅需要单个文件中约1000行的简洁代码。该代码能够立即编译并运行，且与PyTorch的参考实现完全吻合。之所以选择GPT-2作为首个工作示例，是因为它作为LLM领域的先驱，标志着现代技术栈的首次整合。

目前，我的工作重点包括：

直接CUDA实现，这将显著提升训练速度，并有望接近PyTorch的性能。
使用SIMD指令（如x86上的AVX2和ARM上的NEON，如Apple Silicon）来加速CPU版本。
探索更多现代架构，如Llama2、Gemma等。

开发者希望这个仓库专注于维护C和CUDA代码。当然，也非常欢迎将本仓库移植到其他编程语言的工作，但这些工作应在单独的仓库中进行。我非常乐意在“值得注意的分支”部分中链接到这些仓库，正如我在llama2.c的“值得注意的分支”中所做的那样。

使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目llm.c

CUDA llm.c

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇：开源AI搜索引擎Morphic，快速获取问题答案无需手动查找

下一篇： CodeTF：基于Python的Transformer一站式库，专为代码大语言模型（Code LLMs）和代码智能任务而设计

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录