大语言模型
优惠 中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力
标签:LLaMA-2 7B语言模型
AI
6个月前 (03-09)AI
这篇论文探讨了即使是中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力。研究者们发现,尽管这些模型在随机生成答案时准确率不高,但通过从256个随机生成的答案中选择最佳答案,它们在GSM8K和MATH这两个数学基准测试上的准确率分别达到了97.7%和72.0%。这表明,这些模型已经具备... 阅读全文
优惠 Backtracing:从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容
标签:Backtracing
AI
6个月前 (03-09)AI
斯坦福大学研究团队推出Backtracing,它的目标是从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容。想象一下,你是一位讲师,你的学生在听完你的讲座后提出了一些问题。你想知道他们为什么会提出这些问题,以便改进你的教学内容。Backtracing就是帮助你找到学生问题背后的具体原因。 GitHub:... 阅读全文
优惠 为GPT4Free项目提供UI界面:FreeGPT WebUI v2
6个月前 (03-08)AI
GPT4Free是一个由开发者Xtekky在GitHub上发布的开源项目,它可以免费地使用GPT-3.5、GPT-4、llama、gemini-pro、bard、claude等多种大模型,不过GPT4Free使用起来比较麻烦。今天为大家介绍的FreeGPT WebUI v2是一个GPT4Free的UI界面,让大家可以更... 阅读全文
优惠 Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放
7个月前 (03-07)AI
📢 Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放,它以更低的训练成本实现了接近 GPT-4 的卓越性能——仅消耗了后者 40% 的计算资源进行训练。🚀 💡在编码、数学等高智商领域,Inflection-2.5 实现了显著跃升,展现更强实力! 📰Pi 现已集成实时网络搜索... 阅读全文
优惠 新型网络架构DenseMamba:针对大语言模型的一种高效状态空间模型
标签:DenseMamba空间模型
AI
7个月前 (03-06)AI
这篇论文介绍了一个名为DenseMamba的新型网络架构,它是针对大语言模型(LLMs)的一种高效状态空间模型(SSM)。大型语言模型,如GPT-3和BERT,通常依赖于Transformer架构,这种架构在处理长文本时计算和内存需求非常高。DenseMamba旨在解决这个问题,通过改进SSM来降低计算复杂度,同时保持... 阅读全文