大语言模型

优惠 可在手机上运行的微型语言模型MobiLlama

  • 可在手机上运行的微型语言模型MobiLlama
    AI
  • 来自穆罕默德·本·扎耶德人工智能大学、澳大利亚国立大学、阿尔托大学、墨尔本大学、林雪平大学的研究人员推出小型语言模型MobiLlama,它是为了满足资源受限设备上的高效、准确语言处理需求而设计的。在当今大语言模型(LLM)如ChatGPT等越来越流行的背景下,这些大型模型虽然功能强大,但在需要在设备上直接处理数据、节省... 阅读全文

    优惠 检索增强生成(RAG)的框架MIRAGE,旨在提高大语言模型在医学问答(QA)任务中的性能

  • 检索增强生成(RAG)的框架MIRAGE,旨在提高大语言模型在医学问答(QA)任务中的性能
    AI
  • 美国国立卫生研究院国家医学图书馆发布论文的主题是关于如何提高大语言模型(LLMs)在医学领域问题回答(QA)任务中的性能。LLMs在很多领域都表现出色,但在医学问题回答上,它们有时会生成听起来合理但实际上是错误的回答,这种现象被称为“幻觉”(hallucination)。此外,LLMs的训练数据可能不包含最新的医学知识... 阅读全文

    优惠 Mistral AI推出最新模型Mistral Large,性能仅次于GPT 4

  • Mistral AI推出最新模型Mistral Large,性能仅次于GPT 4
    AI
  • Mistral AI在当地时间2月26日发布了其最新的Mistral Large模型,该模型在性能上仅次于GPT 4。Mistral Large是一款功能强大的多语言模型,适用于各种复杂的推理任务,包括文本理解、转换和代码生成。 卓越的推理能力:Mistral Large具备顶级的推理能力,能够处理复杂的多语言推理任务... 阅读全文

    优惠 搞迷信!免费生肖和星座AI聊天机器人Zodiac Chat AI

  • 搞迷信!免费生肖和星座AI聊天机器人Zodiac Chat AI
    AI
  • Zodiac Chat AI是一款免费的在线占星术工具,旨在彻底改变个人与其星座和占星术之间的互动方式。这款用户友好的平台利用先进的人工智能技术,只需一键点击,就能提供个性化的解读、深刻的预测和详尽的星座分析。无论您是资深的占星术爱好者还是充满好奇的新手,Zodiac Chat AI都会基于您独特的星盘,为您提供关于爱... 阅读全文

    优惠 小型语言模型Orca-Math:解决小学数学问题方面

  • 小型语言模型Orca-Math:解决小学数学问题方面
    AI
  • 微软的研究人员发布论文介绍了一个名为Orca-Math的小型语言模型(SLM),它在解决小学数学问题方面表现出色。尽管数学问题解决一直被认为是小型语言模型的一个复杂任务,但Orca-Math在GSM8K基准测试上达到了约87%的准确率,而训练数据仅有20万个合成数学问题。 论文地址:https://arxiv.org/... 阅读全文

    优惠 CLoVe:提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力

  • CLoVe:提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力
    AI
  • 密歇根大学安娜堡分校、Netflix的研究人员发布论文介绍了一个名为CLoVe(Contrastive Language-Image Vision Models)的框架,旨在提高现有的视觉-语言模型(VLMs)在处理组合语言时的能力。VLMs,如CLIP模型,通常在识别图像中的对象方面表现出色,但在理解文本中单词顺序变... 阅读全文

    优惠 大语言模型(LLMs)在处理不同长度输入时的表现,特别是它们在处理长文本时的推理能力

  • 大语言模型(LLMs)在处理不同长度输入时的表现,特别是它们在处理长文本时的推理能力
  • 巴伊兰大学、艾伦人工智能研究所的研究人员发布论文探讨了大语言模型(LLMs)在处理不同长度输入时的表现,特别是它们在处理长文本时的推理能力。尽管LLMs在许多任务上取得了显著进展,但它们在不同输入长度下的性能稳定性尚不清楚。为了深入了解这一点,研究者们设计了一个新的问答(QA)推理框架,专门用来评估输入长度对LLMs性... 阅读全文

    优惠 “放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现

  • “放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现
    AI
  • Meta、巴黎综合理工学院的研究人员发布论文探讨了一个有趣的概念,即“放射性”(radioactivity)在大语言模型(LLMs)生成的文本中的表现。这里的“放射性”指的是,当一个模型(我们称之为Alice的模型)的输出被用作另一个模型(Bob的模型)的训练数据时,Alice能否检测到这种使用。这就像是在模型训练过程... 阅读全文

    优惠 MobileLLM:如何在移动设备上高效使用大语言模型

  • MobileLLM:如何在移动设备上高效使用大语言模型
    AI
  • 这篇论文的主题是关于如何在移动设备上高效使用大语言模型(LLMs)。随着云计算成本的增加和对延迟的担忧,移动设备上的大型语言模型变得越来越重要。论文的重点是设计拥有不到十亿参数的高质量大型语言模型,这对于移动部署来说是一个实用的选择。 论文地址:https://arxiv.org/abs/2402.14905 想象一下... 阅读全文

    优惠 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分

  • 如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分
    AI
  • 来自苹果和密歇根大学的研究人员发布论文探讨了如何有效地从大语言模型(LLMs)中提取和压缩推理任务的关键部分。作者提出了一种策略,将复杂推理任务分解为问题分解阶段和问题解决阶段,并展示了这种两阶段策略能够胜过单一阶段解决方案。他们进一步假设,与问题解决相比,问题分解更容易被蒸馏到一个更小的模型中,因为问题解决需要大量的... 阅读全文

    优惠 ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率

  • ChunkAttention:提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率
    AI
  • 微软发布论文介绍了一种名为ChunkAttention的新方法,它旨在提高大语言模型(LLMs)在处理长序列时的自注意力(self-attention)模块的效率。自注意力是LLMs的核心组成部分,但在推理长序列时会导致显著的延迟。ChunkAttention通过利用多个LLM请求共享系统提示(system promp... 阅读全文

    优惠 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型

  • 大型数据集API-BLEND:训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型
    AI
  • IBM推出大型数据集API-BLEND,它旨在训练和评估那些能够使用工具和外部应用程序接口(APIs)的大语言模型(LLMs)。这些模型通常用于执行复杂的任务,比如预订酒店、预订餐厅或自动化工作招聘任务。API-BLEND数据集通过模拟真实世界的场景,包括API检测、插槽填充和API序列化等任务,来帮助研究人员开发和测... 阅读全文