推荐类别

栏目分类

优惠 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计

  • 自动化数据生成管道APIGen:专门为生成可验证、多样化的函数调用数据集而设计
    AI
  • Salesforce AI Research推出APIGen系统,它是一个自动化的数据生成管道,专门为生成可验证、多样化的函数调用数据集而设计。这个系统的目标是提高函数调用代理模型(一种人工智能模型)的性能,这些模型能够根据自然语言指令执行API(应用程序编程接口)调用。使用APIGen生成的数据集训练的模型,在Ber... 阅读全文

    优惠 新型多模态大语言模型MG-LLaVA

  • 新型多模态大语言模型MG-LLaVA
    AI
  • 上海交通大学、上海人工智能实验室和南洋理工大学的研究人员推出新型多模态大语言模型MG-LLaVA,它在视觉理解任务上取得了显著的进步。例如,你有一个能够“看”图片和“读”文字的智能助手,但以前的这种助手只能处理低分辨率的图片,这限制了它们理解细节的能力。MG-LLaVA通过增加多粒度视觉处理能力,比如低分辨率、高分辨率... 阅读全文

    优惠 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题

  • 基于幅度的梯度更新的新方法MIGU:解决语言模型在持续学习中面临的灾难性遗忘问题
    AI
  • 香港大学 、中国科学院信息与通信技术研究所、香港中文大学深圳分校、清华大学、爱丁堡大学、英伟达和香港科技大学的研究人员推出新方法MIGU(基于幅度的梯度更新,用于持续学习),旨在解决语言模型(LMs)在持续学习(Continual Learning, CL)中面临的灾难性遗忘问题。灾难性遗忘是指模型在学习新知识时会遗忘... 阅读全文

    优惠 YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型

  • YOUDREAM:根据文本描述生成高质量、解剖学上可控且一致的3D动物模型
    AI
  • 德克萨斯大学奥斯汀分校和马萨诸塞大学阿默斯特分校的研究人员推出创新方法YOUDREAM,它能够根据文本描述生成高质量、解剖学上可控且一致的3D动物模型。YOUDREAM是一个强大的工具,它结合了文本描述、3D姿态控制和先进的神经网络技术,为3D内容创造提供了一个既灵活又准确的解决方案。 项目主页:https://you... 阅读全文

    优惠 Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb

  • Hugging Face推出专门为训练大语言模型而设计的大规模文本数据集FineWeb
    AI
  • Hugging Face推出大规模文本数据集FineWeb,它是专门为训练大语言模型而设计的。FineWeb数据集来源于Common Crawl的96个快照,包含15万亿个token,这些数据被用来训练性能更好的LLMs。此外,论文还介绍了FineWeb-Edu,这是一个从FineWeb中筛选出来的、专注于教育文本的子... 阅读全文

    优惠 MemServe:为了提高大语言模型服务的效率而设计

  • MemServe:为了提高大语言模型服务的效率而设计
    AI
  • 华为云,北京大学的研究人员推出MemServe,它是为了提高大语言模型(LLM)服务的效率而设计的。想象一下,大语言模型就像一个非常聪明的机器人,它可以阅读和理解人类的语言,并用它来回答问题或生成文本。但是,这些模型非常大,运行它们需要很多计算资源。MemServe就是用来帮助更高效地管理和运行这些大型模型的。总的来说... 阅读全文

    优惠 新型文本到视频生成基准测试ChronoMagic-Bench

  • 新型文本到视频生成基准测试ChronoMagic-Bench
    AI
  • 新型文本到视频(Text-to-Video, T2V)生成基准测试ChronoMagic-Bench。这个基准测试专门用来评估T2V模型在生成具有显著变化幅度和时间连贯性的延时视频方面的能力。简单来说,ChronoMagic-Bench就像是一个考试,它用来测试视频生成模型是否能够根据文本描述,制作出既符合描述又在视觉... 阅读全文

    优惠 提升观众观看体验!自动足球比赛解说生成模型MatchTime

  • 提升观众观看体验!自动足球比赛解说生成模型MatchTime
    AI
  • 上海交通大学和上海人工智能实验室的研究人员推出自动足球比赛解说生成模型MatchTime,目的是提升观众观看体验。足球作为全球最受欢迎的运动之一,拥有超过35亿的观众。精彩的解说能够为观众提供背景信息、分析和情感上的激动,但制作吸引人且富有洞察力的解说需要相当的专业知识,并且可能资源密集。随着人工智能,尤其是基础视觉-... 阅读全文

    优惠 Math-LLaVA:提升大语言模型在处理多模态数学问题上的能力

  • Math-LLaVA:提升大语言模型在处理多模态数学问题上的能力
    AI
  • 中国电子科技大学、新加坡科技设计大学、同济大学和新加坡国立大学的研究人员推出Math-LLaVA,提升大语言模型(LLMs)在处理多模态数学问题上的能力。多模态数学问题是指那些需要结合图像和文本信息来解决的数学问题,比如根据图表数据计算趋势或者解决几何问题。例如,设有一个图表展示了某地区过去五年的人口增长趋势,Math... 阅读全文

    优惠 数据集EHRCon:专门设计用来确保EHRs中的结构化表格和非结构化笔记之间的数据一致性

  • 数据集EHRCon:专门设计用来确保EHRs中的结构化表格和非结构化笔记之间的数据一致性
    AI
  • 韩国科学技术院、 三星医疗中心、麻省理工学院和多伦多大学推出EHRCon,关于电子健康记录(Electronic Health Records,简称EHRs)的数据一致性问题。EHRs是医院用来存储患者医疗记录的数字系统,其中既包括结构化数据(比如药物信息、诊断结果)也包括非结构化的临床笔记(比如医生的笔记)。这两种数... 阅读全文

    优惠 评估套件CharXiv:旨在更真实地测试多模态大语言模型在理解图表方面的性能

  • 评估套件CharXiv:旨在更真实地测试多模态大语言模型在理解图表方面的性能
    AI
  • 普林斯顿大学、威斯康星大学麦迪逊分校和香港大学的研究人员推出评估套件CharXiv,它旨在更真实地测试多模态大语言模型(MLLMs)在理解图表方面的性能。在现实世界的任务中,比如分析科学论文或财务报告,理解图表是一项关键技能。然而,现有的数据集往往关注过于简化和同质化的图表,以及基于模板的问题,这导致了对模型进展的乐观... 阅读全文

    优惠 nexa4ai推出新型AI规划代理Octo-planner:为了在边缘设备上实现高效决策和问题解决而设计

  • nexa4ai推出新型AI规划代理Octo-planner:为了在边缘设备上实现高效决策和问题解决而设计
    AI
  • nexa4ai推出新型AI规划代理Octo-planner,它是为了在边缘设备上实现高效决策和问题解决而设计的。你可以将Octo-planner想象成一个智能助手,它可以在你的智能手机或其他设备上运行,帮助完成复杂的任务。例如,你要计划一次旅行,需要订机票、酒店,还要制定行程。这些任务可能很繁琐,需要考虑很多细节。现在... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?