AI

优惠 小型语言模型Orca-Math:解决小学数学问题方面

  • 小型语言模型Orca-Math:解决小学数学问题方面
    AI
  • 微软的研究人员发布论文介绍了一个名为Orca-Math的小型语言模型(SLM),它在解决小学数学问题方面表现出色。尽管数学问题解决一直被认为是小型语言模型的一个复杂任务,但Orca-Math在GSM8K基准测试上达到了约87%的准确率,而训练数据仅有20万个合成数学问题。 论文地址:https://arxiv.org/... 阅读全文

    优惠 CLoVe:提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力

  • CLoVe:提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力
    AI
  • 密歇根大学安娜堡分校、Netflix的研究人员发布论文介绍了一个名为CLoVe(Contrastive Language-Image Vision Models)的框架,旨在提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力。VLMs,如CLIP模型,通常在识别图像中的对象方面表现出色,但在理解文本中单词顺序变... 阅读全文

    优惠 “放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现

  • “放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现
    AI
  • Meta、巴黎综合理工学院的研究人员发布论文探讨了一个有趣的概念,即“放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现。这里的“放射性”指的是,当一个模型(我们称之为Alice的模型)的输出被用作另一个模型(Bob的模型)的训练数据时,Alice能否检测到这种使用。这就像是在模型训练过程... 阅读全文

    优惠 MobileLLM:如何在移动设备上高效使用大语言模型

  • MobileLLM:如何在移动设备上高效使用大语言模型
    AI
  • 这篇论文的主题是关于如何在移动设备上高效使用大语言模型(LLMs)。随着云计算成本的增加和对延迟的担忧,移动设备上的大型语言模型变得越来越重要。论文的重点是设计拥有不到十亿参数的高质量大型语言模型,这对于移动部署来说是一个实用的选择。 论文地址:https://arxiv.org/abs/2402.14905 想象一下... 阅读全文

    优惠 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分

  • 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分
    AI
  • 来自苹果和密歇根大学的研究人员发布论文探讨了如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分。作者提出了一种策略,将复杂推理任务分解为问题分解阶段和问题解决阶段,并展示了这种两阶段策略能够胜过单一阶段解决方案。他们进一步假设,与问题解决相比,问题分解更容易被蒸馏到一个更小的模型中,因为问题解决需要大量的... 阅读全文

    优惠 ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率

  • ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率
    AI
  • 微软发布论文介绍了一种名为ChunkAttention的新方法,它旨在提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率。自注意力是LLMs的核心组成部分,但在推理长序列时会导致显著的延迟。ChunkAttention通过利用多个LLM请求共享系统提示(system promp... 阅读全文

    优惠 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型

  • 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型
    AI
  • IBM推出大型数据集API-BLEND,它旨在训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型(LLMs)。这些模型通常用于执行复杂的任务,比如预订酒店、预订餐厅或自动化工作招聘任务。API-BLEND数据集通过模拟真实世界的场景,包括API检测、插槽填充和API序列化等任务,来帮助研究人员开发和测... 阅读全文

    优惠 AgentOhana:为了解决大语言模型(LLMs)在代理任务中面临的数据多样性和复杂性问题而设计

  • AgentOhana:为了解决大语言模型(LLMs)在代理任务中面临的数据多样性和复杂性问题而设计
    AI
  • Salesforce的研究人员发布论文介绍了一个名为AgentOhana的系统,它是为了解决大语言模型(LLMs)在代理任务中面临的数据多样性和复杂性问题而设计的。AgentOhana的目标是将来自不同环境的代理轨迹数据整合到一个统一的格式中,以便更有效地训练和优化AI代理。 论文地址:https://arxiv.or... 阅读全文

    优惠 FlowMDM:根据文本描述生成连续的、无缝的人类动作序列

  • FlowMDM:根据文本描述生成连续的、无缝的人类动作序列
    AI
  • 西班牙巴塞罗那大学的研究人员发布论文介绍了一个名为FlowMDM的创新方法,它能够根据文本描述生成连续的、无缝的人类动作序列。想象一下,你只需要告诉系统“向前走,然后慢慢坐下”,FlowMDM就能创造出一个人物从站立到行走再到坐下的连贯动作视频。这在虚拟现实、游戏开发和机器人技术等领域有着广泛的应用前景。FlowMDM... 阅读全文

    优惠 Open WebUI – 仿照 ChatGPT,为本地大语言模型提供图形化界面的开源项目

  • Open WebUI – 仿照 ChatGPT,为本地大语言模型提供图形化界面的开源项目
    AI
  • Open WebUI 是一个仿照 ChatGPT 界面,为本地大语言模型提供图形化界面的开源项目,可以非常方便的调试、调用本地模型。你能用它连接你在本地的大语言模型(包括 Ollama 和 OpenAI 兼容的 API),也支持远程服务器。Docker 部署简单,功能非常丰富,包括代码高亮、数学公式、网页浏览、预设提示... 阅读全文

    优惠 微软开源生成式AI风险识别工具PyRIT,用于帮助安全专业人士和机器学习工程师识别生成式AI系统的风险

  • 微软开源生成式AI风险识别工具PyRIT,用于帮助安全专业人士和机器学习工程师识别生成式AI系统的风险
    AI
  • 微软2月22日发布了一款开源自动化框架PyRIT,这是一款Python风险识别工具包,用于帮助安全专业人士和机器学习工程师识别生成式AI系统的风险。微软的AI红队已使用该工具检查包括Copilot在内生成式AI系统中风险。PyRIT 框架的工作原理是:PyRit Agent向目标生成式AI系统发送恶意提示词,在收到生成... 阅读全文

    优惠 AI音乐生成工具Riff:你的音乐创作神器

  • AI音乐生成工具Riff:你的音乐创作神器
    AI
  •  Riff是一款AI音乐生成工具,可以选择风格、乐器,再书写提示词生成音乐,生成的音乐可用于视频、播客的BGM使用。 为什么选择Riff? 尖端的AI技术:Riff采用最新的AI技术,将您的创意迅速转化为美丽且无版权费用的音乐,完美融入您的项目中。 高清音乐库:沉浸在高质量的音乐世界中,无需担心版权或许可问题,为您的创... 阅读全文