标签:DeepSeek-V2
AI
6个月前 (05-18)AI
DeepSeek-V2 是一个专家混合(Mixture-of-Experts,简称 MoE)语言模型,以其经济的训练成本和高效的推理能力而著称。DeepSeek-V2 在一个包含 8100 万亿个 token 的多样化和高质量语料库上进行了预训练。随后,通过监督式微调(Supervised Fine-Tuning,简称... 阅读全文