大语言模型

优惠 Recurrent Drafter:提高大语言模型的解码效率

  • Recurrent Drafter:提高大语言模型的解码效率
    AI
  • 苹果发布论文介绍了一种名为“Recurrent Drafter”(简称ReDrafter)的新方法,旨在提高大语言模型(Large Language Models,简称LLMs)的解码效率。大型语言模型是人工智能领域的一种先进技术,它们通过学习大量文本数据,能够生成连贯、有意义的文本,就像人类写作一样。但是,这些模型通... 阅读全文

    优惠 如何评估和理解大语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)

  • 如何评估和理解大语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)
    AI
  • 这篇论文的主题是关于如何评估和理解大型语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)。奖励模型在训练过程中扮演着至关重要的角色,它们通过人类反馈来引导模型学习如何更好地与人类价值观和偏好相一致。简单来说,就像你在训练一只宠物时用奖励来告诉它哪些行为是好的,奖励模型也是这样告诉语言模型哪些回答... 阅读全文

    优惠 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念

  • 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念
    AI
  • 这篇论文探讨了一个有趣的问题:我们是否总是需要更大的视觉模型来获得更好的视觉理解?作者们提出了一种名为“Scaling on Scales”(S2)的方法,这是一种在图像尺度上进行扩展的策略,而不是简单地增加模型的大小。具体来说,他们使用了预训练的小型视觉模型(例如ViT-B或ViT-L),并在多个图像尺度上运行这些模... 阅读全文

    优惠 D-MoLM:帮助语言模型(LMs)理解和解释三维分子结构

  • D-MoLM:帮助语言模型(LMs)理解和解释三维分子结构
    AI
  • 来自中国科学技术大学、新加坡国立大学和华为云的研究团队推出3D-MoLM,它旨在帮助语言模型(LMs)理解和解释三维分子结构。想象一下,你有一个复杂的化学分子,想要了解它的具体结构和特性,但是没有专业的化学知识。3D-MoLM能够通过分析分子的三维结构和相关文本描述,生成关于这个分子的详细解释,就像一个虚拟的化学专家一... 阅读全文

    优惠 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型

  • 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型
    AI
  • 来自北航的研究团队推出大语言模型微调框架LLAMAFACTORY,它是一个用于高效微调大语言模型(LLMs)的统一平台。LLAMAFACTORY通过整合一系列最新的高效训练方法,使用户能够灵活地自定义微调100多个不同的LLMs,而无需编码,只需通过内置的Web界面LLAMABOARD即可完成。LLAMAFACTORY... 阅读全文

    优惠 HyperLLaVA:用于增强多模态大语言模型(MLLMs)性能的技术

  • HyperLLaVA:用于增强多模态大语言模型(MLLMs)性能的技术
    AI
  • 来自浙江大学、上海科技大学、 重庆大学、 阿里巴巴集团和哈尔滨工业大学的研究团队推出HyperLLaVA,它是一种用于增强多模态大型语言模型(MLLMs)性能的技术。HyperLLaVA的目标是改进现有的MLLMs,如LLaVA,通过动态调整模型的视觉和语言处理部分,使其能够更好地理解和生成与视觉内容相关的文本。总的来... 阅读全文

    优惠 使用进化算法来自动化创建强大的基础模型

  • 使用进化算法来自动化创建强大的基础模型
    AI
  • 这篇论文介绍了一种新颖的方法,使用进化算法来自动化创建强大的基础模型。基础模型(Foundation Models)是指那些经过大量数据训练,能够处理多种任务的人工智能模型,比如语言理解和生成、数学推理等。在人工智能领域,这些模型通常需要大量的计算资源和数据来训练,成本很高。 想象一下,你有一个会做数学题的机器人A和一... 阅读全文

    优惠 轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构

  • 轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构
    AI
  • 来自悉尼大学的研究团队论文介绍了一种名为EfficientVMamba的轻量级视觉模型,它是一种结合了全局和局部特征提取能力的网络架构。想象一下,你有一个超级助手,它能够在保持图像细节的同时,快速地从大量图片中识别出不同的物体。EfficientVMamba就像这样一个助手,但它专注于图像处理和识别任务。 主要功能和特... 阅读全文

    优惠 创新模型Uni-SMART:万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容

  • 创新模型Uni-SMART:万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容
    AI
  • 这篇论文介绍了一个名为Uni-SMART的创新模型,它是一个万能的科学多模态分析和研究转换器,专门设计用于深入理解科学文献中的多模态内容。随着科学知识的快速增长,学术论文的数量急剧增加,这使得深入分析文献变得既耗时又具有挑战性。Uni-SMART通过结合大型语言模型(LLMs)的强大文本总结能力和对多模态元素(如分子结... 阅读全文

    优惠 VideoAgent:模仿人类理解长视频的认知过程,使用大语言模型作为中心代理,来迭代地识别和编译关键信息以回答问题

  • VideoAgent:模仿人类理解长视频的认知过程,使用大语言模型作为中心代理,来迭代地识别和编译关键信息以回答问题
    AI
  • 这篇论文介绍了一个名为VideoAgent的系统,它模仿人类理解长视频的认知过程,使用大型语言模型(LLM)作为中心代理,来迭代地识别和编译关键信息以回答问题。VideoAgent将视频理解过程视为一系列状态、动作和观察的序列,并通过与视觉语言模型(VLM)和对比语言-图像模型(CLIP)的交互来获取和处理视觉信息。 ... 阅读全文

    优惠 多模态智能代理VideoAgent:为了更好地理解和解释视频内容而设计

  • 多模态智能代理VideoAgent:为了更好地理解和解释视频内容而设计
    AI
  • 这篇论文介绍了一个名为VideoAgent的多模态智能代理,它是为了更好地理解和解释视频内容而设计的。想象一下,你有一个视频,里面有很多人和物体在移动,还有很多事情发生。VideoAgent就像一个超级助手,能够理解视频中的内容,并回答关于视频的问题。 主要功能: VideoAgent的主要功能是视频理解。它可以分析视... 阅读全文

    优惠 新型模型MindEye2:能够从大脑活动(fMRI)中重建出人们所看到的视觉图像

  • 新型模型MindEye2:能够从大脑活动(fMRI)中重建出人们所看到的视觉图像
    AI
  • 这篇论文介绍了一个名为MindEye2的新型模型,它能够从大脑活动(fMRI)中重建出人们所看到的视觉图像。这个模型的出现,标志着我们离理解人类视觉感知的神经基础又近了一步。MindEye2的创新之处在于,它能够使用仅有1小时的fMRI训练数据,就能产生高质量的图像重建结果。例如,如果我们想要了解一个观看自然风景图片的... 阅读全文