大语言模型

优惠 新型商品推荐系统RDRec:利用大语言模型来理解和生成推荐理由,从而提高推荐的相关性和准确性

  • 新型商品推荐系统RDRec:利用大语言模型来理解和生成推荐理由,从而提高推荐的相关性和准确性
    AI
  • 日本山梨大学的研究人员推出新型推荐系统RDRec(Rationale Distillation for LLM-based Recommendation),这个推荐系统的核心思想是利用大语言模型(LLM)来理解和生成推荐理由,从而提高推荐的相关性和准确性。总的来说,RDRec是一个先进的推荐系统,它通过深入理解用户的选... 阅读全文

    优惠 如何使用大语言模型来自动生成规划领域的模型

  • 如何使用大语言模型来自动生成规划领域的模型
    AI
  • IBM Research发布论文,探讨如何使用大语言模型(LLMs)来自动生成规划领域的模型。在人工智能规划领域,创建领域模型通常需要人工手动完成,这限制了规划技术的普及和应用。为了使规划过程更加自动化和易于访问,研究者们希望能够自动从简单的文本描述中生成这些领域模型。 例如,你有一个物流公司,需要规划无人机的送货路线... 阅读全文

    优惠 Layer-Condensed KV Cache:如何高效地部署和运行大语言模型,以便在真实世界的应用中实现高吞吐量和低延迟

  • Layer-Condensed KV Cache:如何高效地部署和运行大语言模型,以便在真实世界的应用中实现高吞吐量和低延迟
    AI
  • 上海科技大学与上海市智能视觉与成像工程技术研究中心的研究人员推出Layer-Condensed KV Cache,如何高效地部署和运行大型语言模型(LLMs),以便在真实世界的应用中实现高吞吐量和低延迟。大型语言模型因其庞大的参数数量和深度的网络结构,在自然语言处理(NLP)任务中表现出色,但它们在部署时面临着巨大的内... 阅读全文

    优惠 ChatFlow:低成本效益的方式训练大语言模型,特别是针对中文这样的非英语语言

  • ChatFlow:低成本效益的方式训练大语言模型,特别是针对中文这样的非英语语言
    AI
  • 来自深圳大学计算机科学与软件工程学院、腾讯AI实验室、 武汉大学和西交利物浦人工智能与先进计算学院的研究人员推出ChatFlow,这是一种成本效益的方式训练大型语言模型(LLMs),特别是针对中文这样的非英语语言。大型语言模型在自然语言处理(NLP)领域有着广泛的应用,但训练这些模型来处理除了英语之外的语言面临很多挑战... 阅读全文

    优惠 IBM推出INDUS:为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务

  • IBM推出INDUS:为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务
    AI
  • 由IBM Research AI和其他合作机构共同开发的一套大语言模型INDUS,这些模型专门为科学应用而设计,能够处理地球科学、生物学、物理学、太阳物理学、行星科学和天体物理学等领域的专业任务。 主题介绍: 想象一下,你有一个超级助手,它能够阅读和理解大量的科学文献,并且能够回答你关于这些领域的复杂问题。这就像是拥有... 阅读全文

    优惠 Two Platforms推出多语言大语言模型架构SUTRA,它能够理解、推理并用超过50种语言生成文本

  • Two Platforms推出多语言大语言模型架构SUTRA,它能够理解、推理并用超过50种语言生成文本
    AI
  • Two Platforms推出多语言大语言模型(LLM)架构SUTRA,它能够理解、推理并用超过50种语言生成文本。SUTRA的设计独特之处在于它将核心概念理解与语言特定处理分离开来,这有助于实现可扩展和高效的多语言对齐和学习。SUTRA采用了专家混合(Mixture of Experts,MoE)框架,既用于语言处理... 阅读全文

    优惠 腾讯推出全面基准测试Plot2Code:评估多模态大语言模型在将科学图表转换为可执行代码方面的能力而设计

  • 腾讯推出全面基准测试Plot2Code:评估多模态大语言模型在将科学图表转换为可执行代码方面的能力而设计
    AI
  • 腾讯推出全面基准测试Plot2Code,它是为了评估多模态大语言模型(MLLMs)在将科学图表转换为可执行代码方面的能力而设计的。MLLMs在视觉领域的应用取得了显著进展,但它们在将视觉图表转换为代码方面的能力尚未得到充分评估。Plot2Code旨在填补这一空白,提供一个公平且深入的评估框架。 通俗介绍: 想象一下,你... 阅读全文

    优惠 SambaNova推出新型AI加速器SambaNova SN40L:解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题

  • SambaNova推出新型AI加速器SambaNova SN40L:解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题
    AI
  • SambaNova推出新型AI加速器SambaNova SN40L,它通过采用数据流架构和专家组合(Composition of Experts,简称CoE)的方法,有效扩展了AI的内存容量。这种加速器旨在解决大型单一AI模型(如GPT-4)在训练、服务和维护时面临的成本高昂和挑战性问题。 通俗介绍: 想象一下,你有一... 阅读全文

    优惠 微软推出大型信息丰富的网络数据集MS MARCO Web Search

  • 微软推出大型信息丰富的网络数据集MS MARCO Web Search
    AI
  • 微软推出大型信息丰富的网络数据集MS MARCO Web Search,它包含了数百万真实点击的查询-文档标签。这个数据集是首次尝试,旨在模拟现实世界中的网页文档和查询分布,为各种类型的下游任务提供丰富的信息,并鼓励在多个研究领域进行创新,例如通用的端到端神经索引器模型、通用嵌入模型,以及使用大型语言模型的下一代信息访... 阅读全文

    优惠 Hugging Face推出具有8亿参数的视觉-语言模型Idefics2

  • Hugging Face推出具有8亿参数的视觉-语言模型Idefics2
    AI
  • 这篇论文的主题是关于构建视觉-语言模型(Vision-Language Models,简称VLMs)。这类模型结合了图像处理和自然语言处理的能力,能够理解图像内容并根据图像内容生成文字描述,或者根据文字描述找到相关的图像。论文中提到的Idefics2模型就是一个具有8亿参数的视觉-语言模型,它在多种多模态基准测试中表现... 阅读全文

    优惠 亚马逊AWS推出新型大型多模态语言模型SpeechVerse:能够理解和执行自然语言指令,处理各种语音相关的任务

  • 亚马逊AWS推出新型大型多模态语言模型SpeechVerse:能够理解和执行自然语言指令,处理各种语音相关的任务
    AI
  • 亚马逊AWS推出新型大型多模态语言模型SpeechVerse,它能够理解和执行自然语言指令,处理各种语音相关的任务。SpeechVerse通过结合预训练的语音和文本基础模型,并在学习过程中保持这些模型的参数固定,实现了这一功能。它使用从语音基础模型中提取的连续潜在表示来进行指令微调,以在多种语音处理任务上实现最佳的零样... 阅读全文

    优惠 SpeechGuard:集成语音和大语言模型(SLMs)的安全性和鲁棒性

  • SpeechGuard:集成语音和大语言模型(SLMs)的安全性和鲁棒性
    AI
  • 亚马逊AWS发布论文探讨集成语音和大语言模型(SLMs)的安全性和鲁棒性。SLMs是一类能够遵循语音指令并生成相关文本回答的AI系统,它们在最近变得越来越流行。然而,这些模型的安全防护和抵御恶意攻击的能力还不是很清楚。 主要功能: SLMs能够处理语音输入,并据此生成文本回答。 它们被设计来遵循用户的语音指令。 主要特... 阅读全文