大语言模型

优惠 零一万物宣布开源Yi-9B模型

  • 零一万物宣布开源Yi-9B模型
    AI
  • 国内大模型独角兽零一万物宣布开源Yi-9B模型,Yi-9B的实际参数为8.8B,默认上下文长度是4K tokens。零一万物公布的数据显示,在综合能力方面(Mean-All),Yi-9B 的性能超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B... 阅读全文

    优惠 如何通过强化学习来提升大语言模型的推理能力

  • 如何通过强化学习来提升大语言模型的推理能力
    AI
  • 这篇论文探讨了如何通过强化学习(Reinforcement Learning, RL)来提升大语言模型(Large Language Models, LLMs)的推理能力。研究者们尝试了多种RL算法,包括专家迭代(Expert Iteration, EI)、近端策略优化(Proximal Policy Optimiza... 阅读全文

    优惠 中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力

  • 中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力
    AI
  • 这篇论文探讨了即使是中等规模的通用语言模型(如LLaMA-2 7B)在数学问题解决方面也表现出了强大的能力。研究者们发现,尽管这些模型在随机生成答案时准确率不高,但通过从256个随机生成的答案中选择最佳答案,它们在GSM8K和MATH这两个数学基准测试上的准确率分别达到了97.7%和72.0%。这表明,这些模型已经具备... 阅读全文

    优惠 Backtracing:从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容

  • Backtracing:从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容
    AI
  • 斯坦福大学研究团队推出Backtracing,它的目标是从文本中追溯并找到最有可能引发特定查询(如问题或评论)的那部分内容。想象一下,你是一位讲师,你的学生在听完你的讲座后提出了一些问题。你想知道他们为什么会提出这些问题,以便改进你的教学内容。Backtracing就是帮助你找到学生问题背后的具体原因。 GitHub:... 阅读全文

    优惠 通过分类方法来训练价值函数,以提高深度强化学习的可扩展性和性能

  • 通过分类方法来训练价值函数,以提高深度强化学习的可扩展性和性能
    AI
  • 这篇论文的主题是关于如何通过分类方法来训练价值函数,以提高深度强化学习(Deep Reinforcement Learning, RL)的可扩展性和性能。在深度强化学习中,价值函数是一个核心组件,它通常由神经网络参数化,并通过最小化均方误差(Mean Squared Error, MSE)来匹配引导目标值。然而,将这种... 阅读全文

    优惠 为GPT4Free项目提供UI界面:FreeGPT WebUI v2

  • 为GPT4Free项目提供UI界面:FreeGPT WebUI v2
    AI
  • GPT4Free是一个由开发者Xtekky在GitHub上发布的开源项目,它可以免费地使用GPT-3.5、GPT-4、llama、gemini-pro、bard、claude等多种大模型,不过GPT4Free使用起来比较麻烦。今天为大家介绍的FreeGPT WebUI v2是一个GPT4Free的UI界面,让大家可以更... 阅读全文

    优惠 Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放

  • Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放
    AI
  • 📢 Inflection发布全新模型:Inflection-2.5,已经正式向 Pi 用户全面开放,它以更低的训练成本实现了接近 GPT-4 的卓越性能——仅消耗了后者 40% 的计算资源进行训练。🚀 💡在编码、数学等高智商领域,Inflection-2.5 实现了显著跃升,展现更强实力! 📰Pi 现已集成实时网络搜索... 阅读全文

    优惠 AMD联合LM Studio推出专属AMD ROCm技术的LM Studio版本,可在本地运行开源大语言模型

  • AMD联合LM Studio推出专属AMD ROCm技术的LM Studio版本,可在本地运行开源大语言模型
    AI
  • 继英伟达发布Chat with RTX后!AMD联合LM Studio推出专属AMD ROCm技术的LM Studio版本,用户现在可以在其平台上本地化运行开源大语言模型(LLM),并构建专属的AI聊天机器人。这一功能支持具有XDNA NPU的Ryzen 7000/8000系列处理器以及内置AI加速核心的Radeon ... 阅读全文

    优惠 AI智能助理浏览器插件Buffup.ai,免费用户每天30次对话次数

  • AI智能助理浏览器插件Buffup.ai,免费用户每天30次对话次数
    AI
  • Buffup.ai是一款集成了业内领先的ChatGPT-4和Claude3模型的AI智能助理浏览器插件,旨在为您带来前所未有的效率提升。 免费使用功能 与ChatGPT-4和Claude3直接对话 解答各类问题,涵盖广泛领域 成为您工作和学习的得力助手 免费访问由全球用户创建的数千个AI机器人 如何使用Buffup.A... 阅读全文

    优惠 新型网络架构DenseMamba:针对大语言模型的一种高效状态空间模型

  • 新型网络架构DenseMamba:针对大语言模型的一种高效状态空间模型
    AI
  • 这篇论文介绍了一个名为DenseMamba的新型网络架构,它是针对大语言模型(LLMs)的一种高效状态空间模型(SSM)。大型语言模型,如GPT-3和BERT,通常依赖于Transformer架构,这种架构在处理长文本时计算和内存需求非常高。DenseMamba旨在解决这个问题,通过改进SSM来降低计算复杂度,同时保持... 阅读全文

    优惠 Design2Code:多模态大语言模型在前端开发中的应用

  • Design2Code:多模态大语言模型在前端开发中的应用
    AI
  • 来自斯坦福大学、佐治亚理工学院、微软和谷歌DeepMind的研究人员推出Design2Code项目,它探索了多模态大语言模型(LLM)在前端开发中的应用。这项任务的目标是将视觉设计直接转化为代码实现,从而改变了前端开发的工作流程。想象一下,如果你有一个网站的设计草图,你希望有一个工具能够自动为你生成实现这个设计的网站代... 阅读全文

    优惠 新型推荐系统架构Wukong:解决现有推荐模型在处理大规模数据集时的效率和质量问题

  • 新型推荐系统架构Wukong:解决现有推荐模型在处理大规模数据集时的效率和质量问题
    AI
  • 这篇论文介绍了一个名为Wukong的新型推荐系统架构。Wukong的目标是解决现有推荐模型在处理大规模数据集时的效率和质量问题。在推荐系统中,我们通常希望模型能够理解用户的行为和偏好,从而推荐用户可能感兴趣的内容,比如电影、商品或者新闻。简而言之,Wukong就像是一个智能的推荐助手,它能够理解和学习用户的行为模式,然... 阅读全文