大语言模型

优惠 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分

  • 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分
    AI
  • 来自苹果和密歇根大学的研究人员发布论文探讨了如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分。作者提出了一种策略,将复杂推理任务分解为问题分解阶段和问题解决阶段,并展示了这种两阶段策略能够胜过单一阶段解决方案。他们进一步假设,与问题解决相比,问题分解更容易被蒸馏到一个更小的模型中,因为问题解决需要大量的... 阅读全文

    优惠 ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率

  • ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率
    AI
  • 微软发布论文介绍了一种名为ChunkAttention的新方法,它旨在提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率。自注意力是LLMs的核心组成部分,但在推理长序列时会导致显著的延迟。ChunkAttention通过利用多个LLM请求共享系统提示(system promp... 阅读全文

    优惠 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型

  • 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型
    AI
  • IBM推出大型数据集API-BLEND,它旨在训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型(LLMs)。这些模型通常用于执行复杂的任务,比如预订酒店、预订餐厅或自动化工作招聘任务。API-BLEND数据集通过模拟真实世界的场景,包括API检测、插槽填充和API序列化等任务,来帮助研究人员开发和测... 阅读全文

    优惠 AgentOhana:为了解决大语言模型(LLMs)在代理任务中面临的数据多样性和复杂性问题而设计

  • AgentOhana:为了解决大语言模型(LLMs)在代理任务中面临的数据多样性和复杂性问题而设计
    AI
  • Salesforce的研究人员发布论文介绍了一个名为AgentOhana的系统,它是为了解决大语言模型(LLMs)在代理任务中面临的数据多样性和复杂性问题而设计的。AgentOhana的目标是将来自不同环境的代理轨迹数据整合到一个统一的格式中,以便更有效地训练和优化AI代理。 论文地址:https://arxiv.or... 阅读全文

    优惠 FlowMDM:根据文本描述生成连续的、无缝的人类动作序列

  • FlowMDM:根据文本描述生成连续的、无缝的人类动作序列
    AI
  • 西班牙巴塞罗那大学的研究人员发布论文介绍了一个名为FlowMDM的创新方法,它能够根据文本描述生成连续的、无缝的人类动作序列。想象一下,你只需要告诉系统“向前走,然后慢慢坐下”,FlowMDM就能创造出一个人物从站立到行走再到坐下的连贯动作视频。这在虚拟现实、游戏开发和机器人技术等领域有着广泛的应用前景。FlowMDM... 阅读全文

    优惠 Open WebUI – 仿照 ChatGPT,为本地大语言模型提供图形化界面的开源项目

  • Open WebUI – 仿照 ChatGPT,为本地大语言模型提供图形化界面的开源项目
    AI
  • Open WebUI 是一个仿照 ChatGPT 界面,为本地大语言模型提供图形化界面的开源项目,可以非常方便的调试、调用本地模型。你能用它连接你在本地的大语言模型(包括 Ollama 和 OpenAI 兼容的 API),也支持远程服务器。Docker 部署简单,功能非常丰富,包括代码高亮、数学公式、网页浏览、预设提示... 阅读全文

    优惠 微软开源生成式AI风险识别工具PyRIT,用于帮助安全专业人士和机器学习工程师识别生成式AI系统的风险

  • 微软开源生成式AI风险识别工具PyRIT,用于帮助安全专业人士和机器学习工程师识别生成式AI系统的风险
    AI
  • 微软2月22日发布了一款开源自动化框架PyRIT,这是一款Python风险识别工具包,用于帮助安全专业人士和机器学习工程师识别生成式AI系统的风险。微软的AI红队已使用该工具检查包括Copilot在内生成式AI系统中风险。PyRIT 框架的工作原理是:PyRit Agent向目标生成式AI系统发送恶意提示词,在收到生成... 阅读全文

    优惠 CodeMate:为开发者设计的革命性搜索引擎

  • CodeMate:为开发者设计的革命性搜索引擎
    AI
  • CodeMate是一款专门为编程人员设计的实用型解决方案引擎,其核心技术基于生成式人工智能,旨在帮助开发者快速有效地解决各类编程问题。 主要特性与优势 即时性解答: CodeMate运用强大的AI能力,可在短时间内针对用户的复杂编程问题提供准确的答案,大大缩短了问题解决的时间。 多语言支持: 用户可以根据实际项目需求选... 阅读全文

    优惠 基于AI技术和视觉化手段打造的新一代知识图谱搜索工具「Globe Explorer」

  • 基于AI技术和视觉化手段打造的新一代知识图谱搜索工具「Globe Explorer」
    AI
  • 「Globe Explorer」是一款致力于革新知识获取与解析方式的创新工具,它巧妙地运用AI技术和视觉化手段,旨在打造一个基于真实来源、层次分明、图文并茂的知识图谱世界。不同于传统搜索引擎简单的信息罗列,「Globe Explorer」以独特的架构化和可视化的形式,引领用户轻松纵览复杂知识体系,并深挖各个细节。 核心... 阅读全文

    优惠 阿里巴巴推出多智能体平台AgentScope:帮助开发者更容易地构建和协调大语言模型(LLMs)的多智能体应用

  • 阿里巴巴推出多智能体平台AgentScope:帮助开发者更容易地构建和协调大语言模型(LLMs)的多智能体应用
    AI
  • 阿里巴巴推出多智能体平台AgentScope,它旨在帮助开发者更容易地构建和协调大语言模型(LLMs)的多智能体应用。AgentScope以消息交换为核心通信机制,提供了丰富的语法工具、内置资源和用户友好的交互方式,显著降低了开发和理解的难度。为了实现健壮和灵活的多智能体应用,AgentScope提供了内置和可定制的容... 阅读全文

    优惠 Copilot Evaluation Harness:评估大语言模型(LLMs)在软件开发环境中的编程辅助功能

  • Copilot Evaluation Harness:评估大语言模型(LLMs)在软件开发环境中的编程辅助功能
    AI
  • 微软研究人员发布论文介绍了一个名为Copilot Evaluation Harness的工具,它用于评估大语言模型(LLMs)在软件开发环境中的编程辅助功能。LLMs,如OpenAI的GPT-3.5/4和Code Llama,有潜力通过作为智能、聊天驱动的编程助手来显著提高开发者的生产力。然而,直接使用这些模型可能并不... 阅读全文

    优惠 小型的多模态模型TinyLLaVA:型结合了视觉和语言处理能力,以更好地理解和生成与图像相关的文本

  • 小型的多模态模型TinyLLaVA:型结合了视觉和语言处理能力,以更好地理解和生成与图像相关的文本
    AI
  • 这篇论文介绍了一个名为TinyLLaVA的框架,它旨在设计和分析小型的大型多模态模型(LMMs)。这些模型结合了视觉和语言处理能力,以更好地理解和生成与图像相关的文本。TinyLLaVA框架通过实验研究了不同视觉编码器、连接模块、语言模型、训练数据和训练方法对模型性能的影响。研究结果表明,通过使用高质量的数据和有效的训... 阅读全文