大语言模型
优惠 学习率调整方法“Schedule-Free”:模型能够自动地根据当前的训练情况来调整学习率,无需你手动设置计划
标签:Schedule-Free
AI
4个月前 (05-27)AI
Meta研究人员推出一种新的学习率调整方法“Schedule-Free”(无计划的)学习。在机器学习中,尤其是深度学习,学习率是一个非常重要的超参数,它决定了模型参数更新的幅度。正确的学习率调整策略对于模型能否快速收敛到一个好的解至关重要。例如,你要训练一个能够识别图片中物体的深度学习模型。在训练过程中,你需要不断调整... 阅读全文
优惠 视觉-语言连接器Dense Connector:提升多模态大语言模型(MLLMs)中视觉编码器的潜力
4个月前 (05-24)AI
清华大学、悉尼大学、百度、亚马逊网络服务和香港中文大学的研究人员推出视觉-语言连接器Dense Connector,提升多模态大语言模型(MLLMs)中视觉编码器的潜力。MLLMs是一类能够同时处理文本和视觉信息的人工智能模型,它们在理解和生成文本、以及视觉识别方面表现出色。然而,目前的研究和开发主要集中在语言能力的提... 阅读全文
优惠 深度求索推出DeepSeek-Prover,提升大语言模型在数学定理证明方面的能力
4个月前 (05-24)AI
深度求索推出DeepSeek-Prover,提升大语言模型(LLMs)在数学定理证明方面的能力。具体来说,研究者们开发了一个名为DeepSeek-Prover的系统,它能够通过大规模合成数据来增强定理证明的能力。通过这种方式,DeepSeek-Prover不仅能够提升数学证明的自动化水平,还能够通过提供大量的合成数据来... 阅读全文