人工智能

优惠 Recurrent Drafter:提高大语言模型的解码效率

  • Recurrent Drafter:提高大语言模型的解码效率
    AI
  • 苹果发布论文介绍了一种名为“Recurrent Drafter”(简称ReDrafter)的新方法,旨在提高大语言模型(Large Language Models,简称LLMs)的解码效率。大型语言模型是人工智能领域的一种先进技术,它们通过学习大量文本数据,能够生成连贯、有意义的文本,就像人类写作一样。但是,这些模型通... 阅读全文

    优惠 如何评估和理解大语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)

  • 如何评估和理解大语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)
    AI
  • 这篇论文的主题是关于如何评估和理解大型语言模型(LLMs)中的奖励模型(Reward Models,简称RMs)。奖励模型在训练过程中扮演着至关重要的角色,它们通过人类反馈来引导模型学习如何更好地与人类价值观和偏好相一致。简单来说,就像你在训练一只宠物时用奖励来告诉它哪些行为是好的,奖励模型也是这样告诉语言模型哪些回答... 阅读全文

    优惠 Meta发布室内场景重建方法SceneScript:能够直接从视频流中预测出室内场景的三维模型

  • Meta发布室内场景重建方法SceneScript:能够直接从视频流中预测出室内场景的三维模型
    AI
  • Meta发布了一种使用自回归结构化语言模型重建场景的方法SceneScript。该方法使用场景语言编码器-解码器架构,直接从编码的视觉数据中推断出一组结构化的语言命令。为了训练SceneScript,作者生成并发布了一个大规模的合成数据集,名为Aria Synthetic Environments,包含10万个高质量的... 阅读全文

    优惠 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念

  • 模型缩放策略Scaling on Scales:挑战传统上认为“越大越好”的观念
    AI
  • 这篇论文探讨了一个有趣的问题:我们是否总是需要更大的视觉模型来获得更好的视觉理解?作者们提出了一种名为“Scaling on Scales”(S2)的方法,这是一种在图像尺度上进行扩展的策略,而不是简单地增加模型的大小。具体来说,他们使用了预训练的小型视觉模型(例如ViT-B或ViT-L),并在多个图像尺度上运行这些模... 阅读全文

    优惠 D-MoLM:帮助语言模型(LMs)理解和解释三维分子结构

  • D-MoLM:帮助语言模型(LMs)理解和解释三维分子结构
    AI
  • 来自中国科学技术大学、新加坡国立大学和华为云的研究团队推出3D-MoLM,它旨在帮助语言模型(LMs)理解和解释三维分子结构。想象一下,你有一个复杂的化学分子,想要了解它的具体结构和特性,但是没有专业的化学知识。3D-MoLM能够通过分析分子的三维结构和相关文本描述,生成关于这个分子的详细解释,就像一个虚拟的化学专家一... 阅读全文

    优惠 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型

  • 大语言模型微调框架LLAMAFACTORY:使用户能够灵活地自定义微调100多个不同的大语言模型
    AI
  • 来自北航的研究团队推出大语言模型微调框架LLAMAFACTORY,它是一个用于高效微调大语言模型(LLMs)的统一平台。LLAMAFACTORY通过整合一系列最新的高效训练方法,使用户能够灵活地自定义微调100多个不同的LLMs,而无需编码,只需通过内置的Web界面LLAMABOARD即可完成。LLAMAFACTORY... 阅读全文

    优惠 HyperLLaVA:用于增强多模态大语言模型(MLLMs)性能的技术

  • HyperLLaVA:用于增强多模态大语言模型(MLLMs)性能的技术
    AI
  • 来自浙江大学、上海科技大学、 重庆大学、 阿里巴巴集团和哈尔滨工业大学的研究团队推出HyperLLaVA,它是一种用于增强多模态大型语言模型(MLLMs)性能的技术。HyperLLaVA的目标是改进现有的MLLMs,如LLaVA,通过动态调整模型的视觉和语言处理部分,使其能够更好地理解和生成与视觉内容相关的文本。总的来... 阅读全文

    优惠 Zigzag Mamba:解决现有扩散模型在处理视觉数据时的可扩展性和计算复杂性问题

  • Zigzag Mamba:解决现有扩散模型在处理视觉数据时的可扩展性和计算复杂性问题
    AI
  • 慕尼黑大学的研究团队发布论文介绍了一种名为Zigzag Mamba(ZigMa)的新型扩散模型,它是为了解决现有扩散模型在处理视觉数据时的可扩展性和计算复杂性问题。扩散模型是一种深度学习技术,用于生成图像、视频等内容,但它们在处理大规模数据时面临挑战。总的来说,ZigMa是一种新型的扩散模型,它通过改进数据处理方式和优... 阅读全文

    优惠 RadSplat:用于实时渲染复杂场景的轻量级技术

  • RadSplat:用于实时渲染复杂场景的轻量级技术
    AI
  • 谷歌发布论文介绍了一个名为RadSplat的方法,它是一种用于实时渲染复杂场景的轻量级技术。实时渲染是指能够即时生成图像的过程,这对于视频游戏、虚拟现实和增强现实等应用非常重要。RadSplat结合了辐射场(Radiance Fields)和高斯点渲染(Gaussian Splatting)的优点,以实现900多帧每秒... 阅读全文

    优惠 使用进化算法来自动化创建强大的基础模型

  • 使用进化算法来自动化创建强大的基础模型
    AI
  • 这篇论文介绍了一种新颖的方法,使用进化算法来自动化创建强大的基础模型。基础模型(Foundation Models)是指那些经过大量数据训练,能够处理多种任务的人工智能模型,比如语言理解和生成、数学推理等。在人工智能领域,这些模型通常需要大量的计算资源和数据来训练,成本很高。 想象一下,你有一个会做数学题的机器人A和一... 阅读全文

    优惠 轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构

  • 轻量级视觉模型EfficientVMamba:结合了全局和局部特征提取能力的网络架构
    AI
  • 来自悉尼大学的研究团队论文介绍了一种名为EfficientVMamba的轻量级视觉模型,它是一种结合了全局和局部特征提取能力的网络架构。想象一下,你有一个超级助手,它能够在保持图像细节的同时,快速地从大量图片中识别出不同的物体。EfficientVMamba就像这样一个助手,但它专注于图像处理和识别任务。 主要功能和特... 阅读全文

    优惠 新型光学流估计架构NeuFlow:在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术

  • 新型光学流估计架构NeuFlow:在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术
    AI
  • 这篇论文介绍了一种名为NeuFlow的新型光学流估计架构,这是一种在机器人和其他边缘设备上实时、高精度估计图像中物体运动的技术。光学流估计在计算机视觉领域扮演着重要角色,它帮助我们理解图像中物体是如何移动的,这对于机器人定位、地图构建、物体追踪和活动识别等应用至关重要。 主要功能: NeuFlow的主要功能是提供一种既... 阅读全文