llm.c

优惠 使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目llm.c

  • 使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目llm.c
    AI
  • llm.c是一个使用简单、纯粹的C/CUDA进行大语言模型训练的开源项目,无需庞大的245MB PyTorch或107MB cPython依赖。例如,GPT-2(CPU,fp32)的训练仅需要单个文件中约1000行的简洁代码。该代码能够立即编译并运行,且与PyTorch的参考实现完全吻合。之所以选择GPT-2作为首个工... 阅读全文