OneBit

优惠 OneBit:保持模型性能的同时,大幅减少模型的存储和计算开销

  • OneBit:保持模型性能的同时,大幅减少模型的存储和计算开销
    AI
  • 来自清华大学和哈尔滨工业大学的研究人员推出一种名为“OneBit”的方法,它旨在将大语言模型(LLMs)的权重矩阵量化到极低比特宽度,即1比特,以实现模型的高效部署。这种方法特别关注于在保持模型性能的同时,大幅减少模型的存储和计算开销。 论文地址:https://arxiv.org/abs/2402.11295 主要功... 阅读全文