优惠微软新研究模拟试错（STE）法：使7B大模型测试成绩超GPT-4

AI

推荐人：暴走AI 标签：STE 微软 AI

1年前 (2024-03-09)AI

微软和俄亥俄州立大学的研究人员发布论文，提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法，即模拟试错（STE）法，并将其开源。该方法协调了试错、想象和记忆三个关键机制。ToolBench实验结果显示，STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力，让Mistral-Instruct-7B实... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠零一万物宣布开源Yi-9B模型

AI

推荐人：暴走AI 标签：Yi-9B 零一万物 AI

1年前 (2024-03-09)AI

国内大模型独角兽零一万物宣布开源Yi-9B模型，Yi-9B的实际参数为8.8B，默认上下文长度是4K tokens。零一万物公布的数据显示，在综合能力方面（Mean-All），Yi-9B 的性能超越了DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠如何通过强化学习来提升大语言模型的推理能力

AI

推荐人：暴走AI 标签：大语言模型 AI

1年前 (2024-03-09)AI

这篇论文探讨了如何通过强化学习（Reinforcement Learning, RL）来提升大语言模型（Large Language Models, LLMs）的推理能力。研究者们尝试了多种RL算法，包括专家迭代（Expert Iteration, EI）、近端策略优化（Proximal Policy Optimiza... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠中等规模的通用语言模型（如LLaMA-2 7B）在数学问题解决方面也表现出了强大的能力

AI

推荐人：暴走AI 标签：LLaMA-2 7B 语言模型 AI

1年前 (2024-03-09)AI

这篇论文探讨了即使是中等规模的通用语言模型（如LLaMA-2 7B）在数学问题解决方面也表现出了强大的能力。研究者们发现，尽管这些模型在随机生成答案时准确率不高，但通过从256个随机生成的答案中选择最佳答案，它们在GSM8K和MATH这两个数学基准测试上的准确率分别达到了97.7%和72.0%。这表明，这些模型已经具备... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Backtracing：从文本中追溯并找到最有可能引发特定查询（如问题或评论）的那部分内容

AI

推荐人：暴走AI 标签：Backtracing AI

1年前 (2024-03-09)AI

斯坦福大学研究团队推出Backtracing，它的目标是从文本中追溯并找到最有可能引发特定查询（如问题或评论）的那部分内容。想象一下，你是一位讲师，你的学生在听完你的讲座后提出了一些问题。你想知道他们为什么会提出这些问题，以便改进你的教学内容。Backtracing就是帮助你找到学生问题背后的具体原因。 GitHub：... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠通过分类方法来训练价值函数，以提高深度强化学习的可扩展性和性能

AI

推荐人：暴走AI 标签：AI 深度学习 AI

1年前 (2024-03-09)AI

这篇论文的主题是关于如何通过分类方法来训练价值函数，以提高深度强化学习（Deep Reinforcement Learning, RL）的可扩展性和性能。在深度强化学习中，价值函数是一个核心组件，它通常由神经网络参数化，并通过最小化均方误差（Mean Squared Error, MSE）来匹配引导目标值。然而，将这种... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠为GPT4Free项目提供UI界面：FreeGPT WebUI v2

AI

推荐人：暴走AI 标签：FreeGPT WebUI v2 GPT4Free AI

1年前 (2024-03-08)AI

GPT4Free是一个由开发者Xtekky在GitHub上发布的开源项目,它可以免费地使用GPT-3.5、GPT-4、llama、gemini-pro、bard、claude等多种大模型，不过GPT4Free使用起来比较麻烦。今天为大家介绍的FreeGPT WebUI v2是一个GPT4Free的UI界面，让大家可以更... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 fal.ai：提供AI模型服务的云端 API 平台

AI

推荐人：暴走AI 标签：API fal.ai AI

1年前 (2024-03-08)AI

fal.ai是一个可以提供AI模型服务的云端 API 平台，提供了 Stable Diffusion相关模型、Whisper、AnimateDiff等，你可以通过API的方式搭建网站或者在本地运行这些模型，无需购买显卡，大家可以看看！官网地址：https://fal.ai/ 开源程序：https://github.c... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于SD模型的AI绘画网站Distillery，支持训练自己专属Lora模型

AI

推荐人：暴走AI 标签：Distillery Lora模型 AI

1年前 (2024-03-08)AI

Distillery是一个基于Stable Diffusion模型的AI图像生成器，目前架设在Discord上，他们有自己训练的模型，支持多种模式，如文生图、图生图、还可以训练自己专属的Lora模型。官方还提供了详细的教程，大家可以根据教程使用该服务。... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Inflection发布全新模型：Inflection-2.5，已经正式向 Pi 用户全面开放

AI

推荐人：暴走AI 标签：Inflection-2.5 Pi AI

1年前 (2024-03-07)AI

📢 Inflection发布全新模型：Inflection-2.5，已经正式向 Pi 用户全面开放，它以更低的训练成本实现了接近 GPT-4 的卓越性能——仅消耗了后者 40% 的计算资源进行训练。🚀 💡在编码、数学等高智商领域，Inflection-2.5 实现了显著跃升，展现更强实力！ 📰Pi 现已集成实时网络搜索... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 AMD联合LM Studio推出专属AMD ROCm技术的LM Studio版本，可在本地运行开源大语言模型

AI

推荐人：暴走AI 标签：AMD LM Studio 大语言模型 AI

1年前 (2024-03-07)AI

继英伟达发布Chat with RTX后！AMD联合LM Studio推出专属AMD ROCm技术的LM Studio版本，用户现在可以在其平台上本地化运行开源大语言模型（LLM），并构建专属的AI聊天机器人。这一功能支持具有XDNA NPU的Ryzen 7000/8000系列处理器以及内置AI加速核心的Radeon ... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠华人创业者联手推出AI视频生成工具Haiper，效果如何？

AI

推荐人：暴走AI 标签：AI视频生成 Haiper AI

1年前 (2024-03-07)AI

在 OpenAI释出Sora后，还要挤进AI视频生成这个领域创业的公司，没有点真本事应该是很难获得用户关注的，近几天不知道大家有没有看到一家叫Haiper的初创公司的新闻通稿，号称已完成两轮融资，两位创始人拥有 TikTok和DeepMind的背景，牛津大学毕业，已经开始与京东展开了合作，不过他们推出的面向C端用户的服... 阅读全文

直达链接好 0 不好 0 已关闭评论