AI

优惠 动态激活组合Dyn:用于在生成过程中动态调整一个或多个属性的引导强度

  • 动态激活组合Dyn:用于在生成过程中动态调整一个或多个属性的引导强度
    AI
  • 米兰比可卡大学和格罗宁根大学的研究人员推出Dyn(动态激活组合,Dynamic Activation Composition),用于在生成过程中动态调整一个或多个属性的引导强度。如何有效地控制和引导大型语言模型(LLMs)的生成过程,以确保输出符合特定的属性要求,同时保持语言的流畅性。通过这种方式,Dyn方法能够在确保... 阅读全文

    优惠 跨模态基准测试SIUO:训练和评估AI模型,使其能够正确处理这种复杂的跨模态安全问题

  • 跨模态基准测试SIUO:训练和评估AI模型,使其能够正确处理这种复杂的跨模态安全问题
    AI
  • 复旦大学和新加坡国立大学的研究人员推出跨模态基准测试SIUO,如何确保当人工智能(尤其是具有视觉和语言能力的大模型,即LVLMs)在处理跨模态(例如图像和文本)输入时,其输出是安全和符合道德的。随着人工智能在人类生活中越来越普及,这项研究的重要性日益凸显。 项目主页:https://sinwang20.github.i... 阅读全文

    优惠 新技术GRASS:用于训练大语言模型的高效优化方法

  • 新技术GRASS:用于训练大语言模型的高效优化方法
    AI
  • 卡内基梅隆大学的研究团队推出新技术GRASS(GRAdient Structured Sparsification),它是一种用于训练大语言模型(LLMs)的高效优化方法。GRASS的核心在于利用结构化稀疏梯度来减少训练过程中所需的内存和计算资源,从而提高训练大型语言模型的效率和可扩展性。论文还提到了GRASS的一些实... 阅读全文

    优惠 实时对话模拟器DialSim:专门用来评估对话代理在长期对话中的理解和应对能力

  • 实时对话模拟器DialSim:专门用来评估对话代理在长期对话中的理解和应对能力
    AI
  • 韩国科学技术研究院和首尔国立大学推出实时对话模拟器DialSim,它专门用来评估对话代理(也就是我们通常所说的聊天机器人或者智能助手)在长期对话中的理解和应对能力。想象一下,如果你的智能助手不仅能够流畅地回答你的问题,还能够记住之前的对话内容,并在多天甚至更长时间的对话中保持话题的连贯性,那么这个助手的智能程度就相当高... 阅读全文

    优惠 新型文本句子分割模型SAT:将一大块文本分解成单独的句子

  • 新型文本句子分割模型SAT:将一大块文本分解成单独的句子
    AI
  • 这篇论文介绍了一个名为“Segment Any Text (SAT)”的新型文本句子分割模型。句子分割是自然语言处理(NLP)中的一个基础任务,目的是将一大块文本分解成单独的句子。这项技术对于很多应用来说都非常关键,比如机器翻译、文本摘要、情感分析等。SAT模型在多个数据集上进行了评估,包括不同语言和领域的文本,表现出... 阅读全文

    优惠 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计

  • 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计
    AI
  • Salesforce AI Research推出APIGen系统,它是一个自动化的数据生成管道,专门为生成可验证、多样化的函数调用数据集而设计。这个系统的目标是提高函数调用代理模型(一种人工智能模型)的性能,这些模型能够根据自然语言指令执行API(应用程序编程接口)调用。使用APIGen生成的数据集训练的模型,在Ber... 阅读全文

    优惠 新型多模态大语言模型MG-LLaVA

  • 新型多模态大语言模型MG-LLaVA
    AI
  • 上海交通大学、上海人工智能实验室和南洋理工大学的研究人员推出新型多模态大语言模型MG-LLaVA,它在视觉理解任务上取得了显著的进步。例如,你有一个能够“看”图片和“读”文字的智能助手,但以前的这种助手只能处理低分辨率的图片,这限制了它们理解细节的能力。MG-LLaVA通过增加多粒度视觉处理能力,比如低分辨率、高分辨率... 阅读全文

    优惠 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题

  • 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题
    AI
  • 香港大学 、中国科学院信息与通信技术研究所、香港中文大学深圳分校、清华大学、爱丁堡大学、英伟达和香港科技大学的研究人员推出新方法MIGU(基于幅度的梯度更新,用于持续学习),旨在解决语言模型(LMs)在持续学习(Continual Learning, CL)中面临的灾难性遗忘问题。灾难性遗忘是指模型在学习新知识时会遗忘... 阅读全文

    优惠 YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型

  • YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型
    AI
  • 德克萨斯大学奥斯汀分校和马萨诸塞大学阿默斯特分校的研究人员推出创新方法YOUDREAM,它能够根据文本描述生成高质量、解剖学上可控且一致的3D动物模型。YOUDREAM是一个强大的工具,它结合了文本描述、3D姿态控制和先进的神经网络技术,为3D内容创造提供了一个既灵活又准确的解决方案。 项目主页:https://you... 阅读全文

    优惠 Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb

  • Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb
    AI
  • Hugging Face推出大规模文本数据集FineWeb,它是专门为训练大语言模型而设计的。FineWeb数据集来源于Common Crawl的96个快照,包含15万亿个token,这些数据被用来训练性能更好的LLMs。此外,论文还介绍了FineWeb-Edu,这是一个从FineWeb中筛选出来的、专注于教育文本的子... 阅读全文

    优惠 MemServe:为了提高大语言模型服务的效率而设计

  • MemServe:为了提高大语言模型服务的效率而设计
    AI
  • 华为云,北京大学的研究人员推出MemServe,它是为了提高大语言模型(LLM)服务的效率而设计的。想象一下,大语言模型就像一个非常聪明的机器人,它可以阅读和理解人类的语言,并用它来回答问题或生成文本。但是,这些模型非常大,运行它们需要很多计算资源。MemServe就是用来帮助更高效地管理和运行这些大型模型的。总的来说... 阅读全文

    优惠 新型文本到视频生成基准测试ChronoMagic-Bench

  • 新型文本到视频生成基准测试ChronoMagic-Bench
    AI
  • 新型文本到视频(Text-to-Video, T2V)生成基准测试ChronoMagic-Bench。这个基准测试专门用来评估T2V模型在生成具有显著变化幅度和时间连贯性的延时视频方面的能力。简单来说,ChronoMagic-Bench就像是一个考试,它用来测试视频生成模型是否能够根据文本描述,制作出既符合描述又在视觉... 阅读全文