推荐类别

栏目分类

优惠 T2VHE协议:提高文生视频模型评估的可靠性、可重复性和实用性

  • T2VHE协议:提高文生视频模型评估的可靠性、可重复性和实用性
    AI
  • 上海人工智能实验室、新加坡国立大学、香港大学、威斯康星大学麦迪逊分校和加州大学圣地亚哥分校的研究人员推出T2VHE协议,重新思考文本到视频(Text-to-Video,简称T2V)模型的人类评估协议,目的是提高评估的可靠性、可重复性和实用性。随着T2V技术的发展,比如Gen2、Pika和Sora等模型的出现,如何有效地... 阅读全文

    优惠 TalkTuner:用于提高对话式AI透明度和控制性的仪表板

  • TalkTuner:用于提高对话式AI透明度和控制性的仪表板
    AI
  • 哈佛大学和Google 研究的研究人员推出 TalkTuner ,这是一个用于提高对话式人工智能(AI)透明度和控制性的仪表板(Dashboard)。这个仪表板的目的是让用户能够理解并控制AI聊天机器人的内部工作机制,特别是它如何根据对用户的了解来定制化回答。通过创建一个端到端的原型系统,展示了这种设计的可能性,并通过... 阅读全文

    优惠 新基准测试ChartMimic:专门用来评估大型多模态模型(LMMs)在将图表转换为代码方面的能力

  • 新基准测试ChartMimic:专门用来评估大型多模态模型(LMMs)在将图表转换为代码方面的能力
    AI
  • 清华大学、 香港中文大学、早稻田大学和腾讯人工智能实验室发布新基准测试ChartMimic,它专门用来评估大型多模态模型(LMMs)在将图表转换为代码方面的能力。你是一位物理学家,你有一个关于粒子速度分布的复杂图表,你想将这个图表转换成代码以便在报告中使用。使用ChartMimic,你可以上传这个图表,然后模型会分析图... 阅读全文

    优惠 AIRI推出一种新型的大型多任务强化学习数据集XLand-100B

  • AIRI推出一种新型的大型多任务强化学习数据集XLand-100B
    AI
  • AIRI推出一种新型的大型多任务强化学习数据集——XLand-100B。想象一下,你是一个拥有超能力的机器人,能够通过观察别人玩游戏来学习如何自己玩游戏,而且不需要别人告诉你每一步怎么走,你只需要看他们玩几次就能自己上手。这听起来是不是很酷?XLand-100B数据集就是用来训练像你这样的智能体的。总之,XLand-1... 阅读全文

    优惠 MaskLID:用于识别在一段话中混合使用的不同语言

  • MaskLID:用于识别在一段话中混合使用的不同语言
    AI
  • 慕尼黑大学和慕尼黑机器学习中心、索邦大学和法国国家科学研究院的研究人员推出MaskLID,它用于识别在一段话中混合使用的不同语言,也就是所谓的“代码切换”(Code-Switching,简称CS)。代码切换是指在一段话中交替使用两种或更多语言的现象,这在多语言社区中非常普遍,比如一个人在说话或写作时可能会在一段话中混入... 阅读全文

    优惠 轻量级大语言模型GEB-1.3B:为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计

  • 轻量级大语言模型GEB-1.3B:为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计
    AI
  • GEB推出新型轻量级大语言模型GEB-1.3B,这个模型是为了解决现有大型语言模型在资源需求、计算能力和响应延迟方面的限制而设计的。GEB-1.3B特别优化了在普通CPU上的运行效率,使其能够部署在更易于访问的设备上,如笔记本电脑和智能手机。例如,你需要一个能够快速回应用户指令并提供准确信息的智能助手,GEB-1.3B... 阅读全文

    优惠 GaussianSR:将低分辨率的输入视图转换成高分辨率的新视图

  • GaussianSR:将低分辨率的输入视图转换成高分辨率的新视图
    AI
  • 中国科学技术大学和微软亚洲研究院的研究人员推出GaussianSR,它能够将低分辨率的输入视图转换成高分辨率的新视图。这项技术在计算机视觉和图形学领域尤为重要,因为它可以用于生成高质量的视觉效果,例如在虚拟现实、增强现实或3D电影制作中。例如,你是一位电影制作人,需要将一些旧的低分辨率电影片段升级为高分辨率以适应现代大... 阅读全文

    优惠 新型基准测试BABILong:专门用来评估大语言模型处理超长文本上下文的能力

  • 新型基准测试BABILong:专门用来评估大语言模型处理超长文本上下文的能力
    AI
  • 新型基准测试BABILong,它专门用来评估大语言模型(LLMs)处理超长文本上下文的能力。想象一下,你有一款智能助手,它需要阅读一篇非常长的文档,然后根据文档内容回答一些非常具体的问题。但是,文档中只有一小部分信息是真正需要用来回答问题的,其余的都是干扰信息。BABILong就是用来测试智能助手是否能够准确地从海量文... 阅读全文

    优惠 Physics3D:通过视频扩散模型学习三维物体(3D objects)的各种物理属性

  • Physics3D:通过视频扩散模型学习三维物体(3D objects)的各种物理属性
    AI
  • 清华大学和斯坦福大学的研究人员推出新型方法Physics3D,它能够通过视频扩散模型学习三维物体(3D objects)的各种物理属性。简单来说,就是利用计算机模拟来预测和再现真实世界中物体的物理行为,比如一个球掉落在软垫上会如何弹跳,或者一块布料在风中如何飘动。例如,我们想在电脑游戏中创建一个场景,其中包含柔软的布料... 阅读全文

    优惠 新型大型多模态模型SliME:能够处理和理解高分辨率的图像和文本信息

  • 新型大型多模态模型SliME:能够处理和理解高分辨率的图像和文本信息
    AI
  • 中国科学院自动化研究所多模态人工智能系统国家重点实验室、中国科学院大学人工智能学院、松鼠AI、阿里巴巴集团和Meta AI的研究人员推出新型大型多模态模型SliME,这些模型能够处理和理解高分辨率的图像和文本信息。例如,你有一个智能助手,它不仅能读懂你给它的任何图片,还能理解图片中的细节,并回答你关于图片内容的问题。 ... 阅读全文

    优惠 新型视觉变换器家族Hibou:专门用于病理学领域

  • 新型视觉变换器家族Hibou:专门用于病理学领域
    AI
  • HistAI推出新型视觉变换器(Vision Transformers,简称ViTs)家族Hibou,它们专门用于病理学领域。病理学是研究疾病组织的科学,通过显微镜检查来诊断各种疾病,尤其是癌症。传统的病理学方法既耗时又容易出错,而数字病理学通过将玻片扫描成高分辨率的数字图像,让计算机算法进行分析,从而彻底改变了这一领... 阅读全文

    优惠 大型多任务语言理解(MMLU)基准测试进行深入分析和纠错

  • 大型多任务语言理解(MMLU)基准测试进行深入分析和纠错
    AI
  • 爱丁堡大学、 罗马大学、巴里理工大学、伦敦大学学院、特伦托大学、 AssemblyAI和 英国卫生安全局的研究人员对一个流行的大型多任务语言理解(MMLU)基准测试进行深入分析和纠错,MMLU是用来评估大型语言模型(LLMs)在多种语言任务上的表现,比如历史、数学、计算机科学等领域。但论文作者发现,尽管MMLU被广泛使... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?