BitNet b1.58

优惠 新型大语言模型BitNet b1.58

  • 新型大语言模型BitNet b1.58
    AI
  • 这篇论文介绍了一种新型的大语言模型(LLM),称为BitNet b1.58。这种模型的核心特点是使用了1.58位的参数(或权重),这意味着每个参数只有三种可能的值:-1、0和1。这种设计不仅在保持模型性能的同时显著降低了计算成本,还在内存、延迟、吞吐量和能源消耗方面带来了显著的效益。 论文地址:https://arxi... 阅读全文