优惠零一万物宣布开源Yi-9B模型

AI

推荐人：暴走AI 标签：Yi-9B 零一万物 AI

1年前 (2024-03-09)AI

国内大模型独角兽零一万物宣布开源Yi-9B模型，Yi-9B的实际参数为8.8B，默认上下文长度是4K tokens。零一万物公布的数据显示，在综合能力方面（Mean-All），Yi-9B 的性能超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠如何通过强化学习来提升大语言模型的推理能力

AI

推荐人：暴走AI 标签：大语言模型 AI

1年前 (2024-03-09)AI

这篇论文探讨了如何通过强化学习（Reinforcement Learning, RL）来提升大语言模型（Large Language Models, LLMs）的推理能力。研究者们尝试了多种RL算法，包括专家迭代（Expert Iteration, EI）、近端策略优化（Proximal Policy Optimiza... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠中等规模的通用语言模型（如LLaMA-2 7B）在数学问题解决方面也表现出了强大的能力

AI

推荐人：暴走AI 标签：LLaMA-2 7B 语言模型 AI

1年前 (2024-03-09)AI

这篇论文探讨了即使是中等规模的通用语言模型（如LLaMA-2 7B）在数学问题解决方面也表现出了强大的能力。研究者们发现，尽管这些模型在随机生成答案时准确率不高，但通过从256个随机生成的答案中选择最佳答案，它们在GSM8K和MATH这两个数学基准测试上的准确率分别达到了97.7%和72.0%。这表明，这些模型已经具备... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Backtracing：从文本中追溯并找到最有可能引发特定查询（如问题或评论）的那部分内容

AI

推荐人：暴走AI 标签：Backtracing AI

1年前 (2024-03-09)AI

斯坦福大学研究团队推出Backtracing，它的目标是从文本中追溯并找到最有可能引发特定查询（如问题或评论）的那部分内容。想象一下，你是一位讲师，你的学生在听完你的讲座后提出了一些问题。你想知道他们为什么会提出这些问题，以便改进你的教学内容。Backtracing就是帮助你找到学生问题背后的具体原因。 GitHub：... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠通过分类方法来训练价值函数，以提高深度强化学习的可扩展性和性能

AI

推荐人：暴走AI 标签：AI 深度学习 AI

1年前 (2024-03-09)AI

这篇论文的主题是关于如何通过分类方法来训练价值函数，以提高深度强化学习（Deep Reinforcement Learning, RL）的可扩展性和性能。在深度强化学习中，价值函数是一个核心组件，它通常由神经网络参数化，并通过最小化均方误差（Mean Squared Error, MSE）来匹配引导目标值。然而，将这种... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠为GPT4Free项目提供UI界面：FreeGPT WebUI v2

AI

推荐人：暴走AI 标签：FreeGPT WebUI v2 GPT4Free AI

1年前 (2024-03-08)AI

GPT4Free是一个由开发者Xtekky在GitHub上发布的开源项目,它可以免费地使用GPT-3.5、GPT-4、llama、gemini-pro、bard、claude等多种大模型，不过GPT4Free使用起来比较麻烦。今天为大家介绍的FreeGPT WebUI v2是一个GPT4Free的UI界面，让大家可以更... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Inflection发布全新模型：Inflection-2.5，已经正式向 Pi 用户全面开放

AI

推荐人：暴走AI 标签：Inflection-2.5 Pi AI

1年前 (2024-03-07)AI

📢 Inflection发布全新模型：Inflection-2.5，已经正式向 Pi 用户全面开放，它以更低的训练成本实现了接近 GPT-4 的卓越性能——仅消耗了后者 40% 的计算资源进行训练。🚀 💡在编码、数学等高智商领域，Inflection-2.5 实现了显著跃升，展现更强实力！ 📰Pi 现已集成实时网络搜索... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 AMD联合LM Studio推出专属AMD ROCm技术的LM Studio版本，可在本地运行开源大语言模型

AI

推荐人：暴走AI 标签：AMD LM Studio 大语言模型 AI

1年前 (2024-03-07)AI

继英伟达发布Chat with RTX后！AMD联合LM Studio推出专属AMD ROCm技术的LM Studio版本，用户现在可以在其平台上本地化运行开源大语言模型（LLM），并构建专属的AI聊天机器人。这一功能支持具有XDNA NPU的Ryzen 7000/8000系列处理器以及内置AI加速核心的Radeon ... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 AI智能助理浏览器插件Buffup.ai，免费用户每天30次对话次数

AI

推荐人：暴走AI 标签：AI智能助理 Buffup.ai ChatGPT-4 Claude3 AI

1年前 (2024-03-07)AI

Buffup.ai是一款集成了业内领先的ChatGPT-4和Claude3模型的AI智能助理浏览器插件，旨在为您带来前所未有的效率提升。免费使用功能与ChatGPT-4和Claude3直接对话解答各类问题，涵盖广泛领域成为您工作和学习的得力助手免费访问由全球用户创建的数千个AI机器人如何使用Buffup.A... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型网络架构DenseMamba：针对大语言模型的一种高效状态空间模型

AI

推荐人：暴走AI 标签：DenseMamba 空间模型 AI

1年前 (2024-03-06)AI

这篇论文介绍了一个名为DenseMamba的新型网络架构，它是针对大语言模型（LLMs）的一种高效状态空间模型（SSM）。大型语言模型，如GPT-3和BERT，通常依赖于Transformer架构，这种架构在处理长文本时计算和内存需求非常高。DenseMamba旨在解决这个问题，通过改进SSM来降低计算复杂度，同时保持... 阅读全文

直达链接好 1 不好 0 已关闭评论

优惠 Design2Code：多模态大语言模型在前端开发中的应用

AI

推荐人：暴走AI 标签：Design2Code AI

1年前 (2024-03-06)AI

来自斯坦福大学、佐治亚理工学院、微软和谷歌DeepMind的研究人员推出Design2Code项目，它探索了多模态大语言模型（LLM）在前端开发中的应用。这项任务的目标是将视觉设计直接转化为代码实现，从而改变了前端开发的工作流程。想象一下，如果你有一个网站的设计草图，你希望有一个工具能够自动为你生成实现这个设计的网站代... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型推荐系统架构Wukong：解决现有推荐模型在处理大规模数据集时的效率和质量问题

AI

推荐人：暴走AI 标签：Wukong 推荐系统 AI

1年前 (2024-03-06)AI

这篇论文介绍了一个名为Wukong的新型推荐系统架构。Wukong的目标是解决现有推荐模型在处理大规模数据集时的效率和质量问题。在推荐系统中，我们通常希望模型能够理解用户的行为和偏好，从而推荐用户可能感兴趣的内容，比如电影、商品或者新闻。简而言之，Wukong就像是一个智能的推荐助手，它能够理解和学习用户的行为模式，然... 阅读全文

直达链接好 0 不好 0 已关闭评论