AI

优惠 Meta推出FLAME:提高大语言模型在遵循自然语言指令时的事实准确性

  • Meta推出FLAME:提高大语言模型在遵循自然语言指令时的事实准确性
    AI
  • 来自滑铁卢大学、卡内基梅隆大学和Meta的研究人员推出FLAME,提高大语言模型(LLMs)在遵循自然语言指令时的事实准确性。大语言模型(比如常见的聊天机器人或者智能助手)在被训练去更好地遵循指令时,有时会生成一些错误的事实信息,这就像是它们在“幻想”或“虚构”一些不存在的事情。这篇论文研究了如何改进这一过程,使得这些... 阅读全文

    优惠 免费 AI 音乐素材库StockTune:无版权束缚的AI音乐创作伙伴

  • 免费 AI 音乐素材库StockTune:无版权束缚的AI音乐创作伙伴
    AI
  • 想要为视频、播客或是各类项目添上一抹音乐氛围,却苦于版权顾虑?不妨探索一下「StockTune」——由StockCake团队匠心打造的免费AI音乐素材库。StockTune以零门槛的姿态,向所有创意人士敞开大门,提供丰富多元的AI生成音乐,无论是背景配乐还是灵感激发,这里都能满足你的需求。 无需复杂的注册流程,Stoc... 阅读全文

    优惠 开放平台LEGENT:开发能够物理交互或在模拟环境中互动的“体现智能”(embodied intelligence)代理

  • 开放平台LEGENT:开发能够物理交互或在模拟环境中互动的“体现智能”(embodied intelligence)代理
    AI
  • 清华大学和中南大学的研究人员推出开放平台LEGENT,它旨在开发能够物理交互或在模拟环境中互动的“体现智能”(embodied intelligence)代理。这些代理能够理解并生成类似人类的文本,并执行真实图像中的任务。尽管大语言模型(LLMs)和大型多模态模型(LMMs)在文本和图像理解方面取得了显著进展,但将它们... 阅读全文

    优惠 Ag2Manip框架:机器人系统自主学习新的操作技能,特别是在没有特定领域示范的情况下

  • Ag2Manip框架:机器人系统自主学习新的操作技能,特别是在没有特定领域示范的情况下
    AI
  • 北京通用人工智能国家重点实验室、 清华大学自动化系、北京大学人工智能研究院、加州大学洛杉矶分校和北京大学电子电气与计算机学院的研究人员推出Ag2Manip框架,机器人系统自主学习新的操作技能,特别是在没有特定领域示范的情况下。这项研究的目标是提高机器人在制造、服务自动化等行业的自主性和适应性。 例如,我们有一个机器人,... 阅读全文

    优惠 Cohere推出PoLL:如何更有效地评估大语言模型的生成质量

  • Cohere推出PoLL:如何更有效地评估大语言模型的生成质量
    AI
  • Cohere发布论文,这篇论文的主题是关于如何更有效地评估大语言模型(LLMs)的生成质量。随着这些模型变得越来越先进,准确评估它们的性能也变得越来越具有挑战性。传统的评估方法,比如使用单一的大型模型(比如GPT-4)作为评判,不仅成本高昂,而且可能会引入模型内部的偏见。为了解决这个问题,研究者们提出了一种新的方法,即... 阅读全文

    优惠 斯坦福大学推出BlenderAlchemy:利用视觉语言模型来编辑3D图形的智能系统

  • 斯坦福大学推出BlenderAlchemy:利用视觉语言模型来编辑3D图形的智能系统
    AI
  • 斯坦福大学研究人员推出BlenderAlchemy,它是一个利用视觉语言模型(Vision-Language Models,简称VLMs)来编辑3D图形的智能系统。这个系统特别适用于需要精细调整的3D图形设计工作,比如电影制作和游戏设计中的高质量场景创建。通过这种方式,BlenderAlchemy不仅提高了3D设计的效... 阅读全文

    优惠 华为方舟实验室推出新型自我推测解码框架Kangaroo:加速大语言模型的推理过程,同时保持一致的采样分布

  • 华为方舟实验室推出新型自我推测解码框架Kangaroo:加速大语言模型的推理过程,同时保持一致的采样分布
    AI
  • 华为方舟实验室推出新型自我推测解码框架Kangaroo,它旨在加速大语言模型(LLMs)的推理过程,同时保持一致的采样分布。在自然语言处理领域,大型语言模型通常需要逐步生成文本序列,这个过程称为自回归解码,它计算成本高且速度慢。Kangaroo通过自我推测解码来解决这个问题,它使用一个固定的浅层子网络作为自我草稿模型,... 阅读全文

    优惠 视觉-语言数据集DOCCI:旨在提高文本到图像(T2I)和图像到文本(I2T)研究的质量和深度,通过提供详细的人类标注的英文描述来增强模型学习的能力

  • 视觉-语言数据集DOCCI:旨在提高文本到图像(T2I)和图像到文本(I2T)研究的质量和深度,通过提供详细的人类标注的英文描述来增强模型学习的能力
    AI
  • 谷歌、普林斯顿大学和北卡罗来纳大学教堂山分校的研究人员推出新的视觉-语言数据集,名为“DOCCI”(Descriptions of Connected and Contrasting Images)。这个数据集旨在提高文本到图像(T2I)和图像到文本(I2T)研究的质量和深度,通过提供详细的人类标注的英文描述来增强模型... 阅读全文

    优惠 3D场景表示方法SUNDAE:通过一种称为“光谱剪枝”的技术来优化和压缩3DGS模型,同时使用神经网络补偿来保持渲染质量

  • 3D场景表示方法SUNDAE:通过一种称为“光谱剪枝”的技术来优化和压缩3DGS模型,同时使用神经网络补偿来保持渲染质量
    AI
  • 来自清华大学人工智能产业研究院、伦敦帝国理工学院、北京航空航天大学、北京理工大学、中国科学院大学、 香港中文大学(深圳)、中国电信人工智能研究院(TeleAI)EVOL实验室的研究人员推出新的3D场景表示方法SUNDAE,它通过一种称为“光谱剪枝”的技术来优化和压缩3D高斯溅射(3D Gaussian Splattin... 阅读全文

    优惠 大语言模型在小学数学问题上的表现

  • 大语言模型在小学数学问题上的表现
    AI
  • Scale AI发布论文,论文的主题是关于大语言模型(Large Language Models,简称LLMs)在小学数学问题上的表现。研究人员们对这些模型进行了仔细的考察,特别是它们在解决数学问题时是否真正具备推理能力,还是仅仅因为训练数据中包含了与测试题目过于相似的问题,导致模型只是简单地“记住”了答案。 例如,我... 阅读全文

    优惠 对Llama-3进行模型编辑的实证研究

  • 对Llama-3进行模型编辑的实证研究
    AI
  • 加州大学伯克利分校的研究人员发布关于论文,这篇论文的主题是对大语言模型(LLMs)进行模型编辑的实证研究,特别是针对最新的大型语言模型Llama-3。研究的核心问题是探讨在对模型进行编辑时,是否更大的编辑批量(batch size)总是能带来更好的效果。实验结果表明,对于Llama-3模型,当进行4096次编辑时,使用... 阅读全文

    优惠 新型音频编解码器SemantiCodec:能够在极低的比特率下对音频进行压缩和重建,同时保留丰富的语义信息

  • 新型音频编解码器SemantiCodec:能够在极低的比特率下对音频进行压缩和重建,同时保留丰富的语义信息
    AI
  • 来自萨里大学和上海交通大学的研究人员推出新型音频编解码器SemantiCodec,它能够在极低的比特率下对音频进行压缩和重建,同时保留丰富的语义信息。这种编解码器特别适合于需要在保持音频质量的同时减少数据大小的场景,例如在带宽有限的网络环境中传输音频或者在存储空间受限的设备上存储音频。 实验结果显示,SemantiCo... 阅读全文