Llama-3-8B-Instruct-80K-QLoRA

优惠 大模型微调技术QLoRA:可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型

  • 大模型微调技术QLoRA:可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型
    AI
  • 北京人工智能研究院和中国人民大学高瓴人工智能学院推出微调技术QLoRA,可以显著扩展大语言模型的上下文长度,特别是针对Llama-3-8B-Instruct模型,上下文长度是指模型在生成回答时能够考虑的输入信息的最大长度。开发者成功地将Llama-3模型的上下文长度从8,000个令牌(tokens)扩展到80,000个... 阅读全文