AI

优惠 Gorilla:连接海量 API 的大语言模型

  • Gorilla:连接海量 API 的大语言模型
    AI
  • 加州大学伯克利分校发布论文的主题是关于如何将大语言模型(Large Language Models,简称LLMs)适应于特定领域的检索增强生成(Retrieval Augmented Generation,简称RAG)任务。简单来说,就是研究如何让AI模型在处理特定领域的问题时,能够更准确地利用相关文档来提供答案。例如... 阅读全文

    优惠 谷歌推出新型机器学习架构和训练方法DiPaCo

  • 谷歌推出新型机器学习架构和训练方法DiPaCo
    AI
  • 谷歌发布论文介绍了一个名为DiPaCo(Distributed Path Composition)的新型机器学习架构和训练方法。DiPaCo的核心思想是将大型神经网络模型分解为多个模块,这些模块可以通过路径进行分布式计算。这种方法的目的是减少在训练过程中所需的通信量,从而使得在资源有限或连接不良的计算环境中也能有效地训... 阅读全文

    优惠 Google Research发布论文介绍了一种新技术,旨在提升视觉-语言模型(VLMs)的推理能力

  • Google Research发布论文介绍了一种新技术,旨在提升视觉-语言模型(VLMs)的推理能力
    AI
  • Google Research发布论文介绍了一种新技术,旨在提升视觉-语言模型(VLMs)的推理能力。VLMs是一种人工智能模型,它能够理解和处理包含图像和文本的信息,例如图表、图形和图解。尽管VLMs在多模态任务上的表现越来越强,但它们的推理能力仍然有限,尤其是相对于大型语言模型(LLMs)而言。 主要功能和特点: ... 阅读全文

    优惠 微软推出TnT-LLM框架:利用大语言模型(LLMs)来进行文本挖掘的工具

  • 微软推出TnT-LLM框架:利用大语言模型(LLMs)来进行文本挖掘的工具
    AI
  • 微软和华盛顿大学的研究团队发布TnT-LLM框架,它是一个利用大语言模型(LLMs)来进行文本挖掘的工具。文本挖掘是指从大量文本数据中提取有用信息和见解的过程,这对于数据分析和应用至关重要。想象一下,你有一个巨大的聊天记录数据库,你想理解用户在对话中的主要意图和讨论的主题。传统的方法是通过人工来标记和分类这些文本,但这... 阅读全文

    优惠 Google DeepMind推出新型框架Vid2Robot:让机器人通过观看人类执行任务的视频来学习并执行相同任务的系统

  • Google DeepMind推出新型框架Vid2Robot:让机器人通过观看人类执行任务的视频来学习并执行相同任务的系统
    AI
  • Google DeepMind推出新型框架Vid2Robot,它是一个让机器人通过观看人类执行任务的视频来学习并执行相同任务的系统。简而言之,Vid2Robot能够让机器人通过观察人类的动作视频来理解任务意图,并在自己的环境中复现这些动作。 主要功能和特点: 视频条件策略学习: Vid2Robot可以直接从人类演示视频... 阅读全文

    优惠 Agent-FLAN:改进大语言模型(LLMs)作为智能代理(agents)的能力

  • Agent-FLAN:改进大语言模型(LLMs)作为智能代理(agents)的能力
    AI
  • 中国科学技术大学和 上海人工智能实验室的研究团队推出Agent-FLAN,它旨在改进大语言模型(LLMs)作为智能代理(agents)的能力。智能代理是指能够理解环境、做出决策并采取行动的系统。尽管现有的LLMs在各种自然语言处理(NLP)任务中表现出色,但它们在作为代理时的性能仍然不如基于API的模型。Agent-F... 阅读全文

    优惠 阿里推出DocOwl 1.5模型:用于理解文档图像的多模态大语言模型

  • 阿里推出DocOwl 1.5模型:用于理解文档图像的多模态大语言模型
    AI
  • 来自阿里巴巴和中国人民大学的研究团队推出DocOwl 1.5模型,它是一种用于理解文档图像的多模态大语言模型(MLLM)。DocOwl 1.5特别强调了结构信息在理解文本丰富图像(如文档、表格、图表等)中的重要性,并提出了一种统一结构学习方法来提升MLLM的性能。 GitHub地址:https://github.com... 阅读全文

    优惠 用于压缩大语言模型提示词的新方法LLMLingua-2

  • 用于压缩大语言模型提示词的新方法LLMLingua-2
    AI
  • 来自清华和微软的研究团队推出LLMLingua-2,它是一种用于压缩大语言模型(LLMs)提示词(prompts)的新方法,目的是在不丢失关键信息的同时提高效率和泛化能力。在大语言模型的使用中,提示词通常是一段文本,用来引导模型生成特定的输出或完成特定的任务。然而,这些提示可能会非常长,导致计算成本增加和信息感知能力下... 阅读全文

    优惠 谷歌发布GaussianFlow:用于创建4D动态内容的新技术

  • 谷歌发布GaussianFlow:用于创建4D动态内容的新技术
    AI
  • 这篇论文介绍了一个名为GaussianFlow的方法,它是一种用于创建4D动态内容的新技术。4D内容不仅包括3D空间的形状和外观,还包括随时间变化的动态信息。想象一下,你有一段视频,GaussianFlow能够根据这段视频生成一个可以随着时间改变的3D模型,这个模型不仅能够展示物体的形状和颜色,还能够展示物体随时间的运... 阅读全文

    优惠 超级提示生成器(ChatGPT Super Prompt Generator):快速构建 ChatGPT 提示并轻松获得您需要的答案

  • 超级提示生成器(ChatGPT Super Prompt Generator):快速构建 ChatGPT 提示并轻松获得您需要的答案
    AI
  • 作为AI的热爱者和ChatGPT等工具的日常使用者,我们深知编写提示的烦恼。这确实是一门精细的艺术——我们需要编写出既具体又能获得出色结果的提示,同时又要避免过于复杂导致AI难以理解。我们曾花费大量时间调整和完善提示,但结果往往不尽如人意。 我们深知必须找到更好的方法。因此,我们将对有效提示编写的所有理解浓缩成一个工具... 阅读全文

    优惠 AI/ML API:1个API连接100+ AI模型

  • AI/ML API:1个API连接100+ AI模型
    AI
  • AI/ML API为开发者提供通过单一API访问超过100个AI模型的机会,确保全天候创新。以比GPT-4低80%的成本提供同等性能,并具备与OpenAI的无缝兼容性,实现轻松过渡。... 阅读全文

    优惠 在线图片编辑工具Fotor:删除背景、生成照片、模糊图像等

  • 在线图片编辑工具Fotor:删除背景、生成照片、模糊图像等
    AI
  • Fotor是一个在线图片编辑工具,提供了强大的图像处理工具,让您轻松完成各种图片编辑需求,官方近期推出了AI 照片编辑工具箱:删除背景、生成照片、模糊图像等等!以您想要的任何方式设计和编辑照片,就像呼吸一样简单,而且全部免费!... 阅读全文