推荐类别

栏目分类

优惠 VIDEOGAMEBUNNY模型:为理解视频游戏图像而特别定制的多模态大模型

  • VIDEOGAMEBUNNY模型:为理解视频游戏图像而特别定制的多模态大模型
    AI
  • 阿尔伯塔大学的研究人员推出VIDEOGAMEBUNNY模型,这是一个为理解视频游戏图像而特别定制的多模态大模型(LMM)。它基于Bunny模型,并对其进行了微调,以提高对视频游戏内容的理解能力。研究团队发布了中间检查点、训练日志以及一个包含185,259张来自413个游戏的视频游戏图像的广泛数据集,以及389,565个... 阅读全文

    优惠  新基准测试LONGVIDEOBENCH:为了评估大型多模态模型在处理长时间视频和语言交织输入时的理解能力而设计

  •  新基准测试LONGVIDEOBENCH:为了评估大型多模态模型在处理长时间视频和语言交织输入时的理解能力而设计
    AI
  • 新基准测试LONGVIDEOBENCH,它是为了评估大型多模态模型在处理长时间视频和语言交织输入时的理解能力而设计的。这个基准测试特别关注那些能够处理长达一小时的视频内容的模型。论文还提到了LONGVIDEOBENCH的挑战性,即使是最先进的专有模型(如GPT-4o、Gemini-1.5-Pro)也面临挑战,而开源模型... 阅读全文

    优惠 无需训练的视频大语言模型SlowFast-LLaVA:能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算

  • 无需训练的视频大语言模型SlowFast-LLaVA:能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算
    AI
  • 苹果推出一个名为SlowFast-LLaVA(简称SF-LLaVA)的新方法,它是一种无需训练的视频大语言模型(LLM)。SF-LLaVA能够同时捕捉视频的细节空间语义和长时序时间上下文,而不会超出常用LLM的令牌预算。这种方法通过为视频LLM设计双流输入(Slow和Fast路径),有效地聚合了采样视频帧的特征。 论文... 阅读全文

    优惠 CAS:用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置

  • CAS:用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置
    AI
  • 上海启智研究院、 浙江大学、上海交通大学和清华大学的研究人员推出创新系统“Cross Anything System”(简称CAS),它是一个用于四足机器人的导航系统,能够使机器人穿越复杂的3D地形到达目标位置。这个系统由一个高级推理模块和一个低级控制策略组成,它们共同工作,让机器人能够自主地规划路径并适应各种地形。例... 阅读全文

    优惠 新型视频预训练方法SIGMA:通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容

  • 新型视频预训练方法SIGMA:通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容
    AI
  • 阿姆斯特丹大学推出一种新型的视频预训练方法,名为SIGMA(Sinkhorn-Guided Masked Video Modeling)。这个方法的核心是通过一种特别的方式来学习视频数据的表示,以便让计算机能够更好地理解和处理视频内容。SIGMA方法就像是换了一种学习方式,它让计算机学习如何把视频分成一个个小块,然后教... 阅读全文

    优惠 三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述

  • 三维人体与物体交互F-HOI:能够理解和生成与人类与物体交互相关的精细描述
    AI
  • 北京通用人工智能研究院和 北京大学人工智能研究院的研究人员推出新模型F-HOI,它能够理解和生成与人类与物体交互相关的精细描述。主要是三维人体与物体交互(3D Human-Object Interaction, HOI)的精细语义对齐问题。想象一下,你有一个虚拟助手,能够观察一个人在视频中如何拿起一个瑜伽垫,然后不仅能... 阅读全文

    优惠 全新基准测试工具T2V-CompBench:用于评估文本到视频(Text-to-Video, T2V)生成模型的性能

  • 全新基准测试工具T2V-CompBench:用于评估文本到视频(Text-to-Video, T2V)生成模型的性能
    AI
  • 香港大学、香港中文大学和华为诺亚方舟实验室的研究人员推出全新基准测试工具T2V-CompBench,它专门用于评估文本到视频(Text-to-Video, T2V)生成模型的性能。T2V模型需要根据这个描述生成一段视频。但T2V-CompBench不仅测试模型能否生成视频,更重要的是测试它是否能够准确地组合多个对象、属... 阅读全文

    优惠 “诊断链(CoD)”:解决了大语言模型在医疗诊断领域中可解释性的问题

  • “诊断链(CoD)”:解决了大语言模型在医疗诊断领域中可解释性的问题
    AI
  • 深圳市大数据研究院和香港中文大学(深圳)的研究人员引入“诊断链”(CoD)的概念,解决了大语言模型在医疗诊断领域中可解释性的问题。CoD将诊断过程转化为一个模仿医生思维流程的诊断链条,从而提供了一条清晰的推理路径。此外,CoD还能输出疾病确信度分布,确保决策过程的透明度。 GitHub:https://github.c... 阅读全文

    优惠 新游发售 手游转型PC!韩国开发商nStarcube旗下海洋动作冒险游戏《游泳少女黛西》登陆Steam 22.1元

  • 手游转型PC!韩国开发商nStarcube旗下海洋动作冒险游戏《游泳少女黛西》登陆Steam
    STEAM
  • 韩国开发商nStarcube将其手游力作《游泳少女黛西(DAISY THE SWIMMER)》搬上PC平台,在Steam上正式发布。尽管首日评价褒贬不一,但这款海洋动作冒险游戏以其独特的搞笑海边打斗和养眼夏日风情,迅速成为夏季的一道亮丽风景。游戏还特别支持繁体中文字幕与界面,满足中文玩家的需求。 海滩上的冒险故事 游戏... 阅读全文

    优惠 在线工具CachedView:帮助用户快速查找和访问网页的备份或历史快照

  • 在线工具CachedView:帮助用户快速查找和访问网页的备份或历史快照
    工具
  • CachedView是一款非常实用的在线工具,它可以帮助用户快速查找和访问网页的备份或历史快照。通过将目标网址输入到CachedView的搜索框中,用户可以立即获取该网页在多个快照服务上的备份,包括但不限于: Google页面快照:Google搜索引擎通常会为每个索引的网页保存一个快照,CachedView可以帮你找到... 阅读全文

    优惠 Notion离线替代方案?开源离线的个人知识管理工具Eidos ,在一处管理你的所有个人数据

  • Notion离线替代方案?开源离线的个人知识管理工具Eidos ,在一处管理你的所有个人数据
    工具
  • Eidos 是一个开源的个人数据管理框架,旨在作为一个一站式解决方案,帮助用户管理和组织个人的所有数据。该项目由开发者 Mayneyao 主持,使用 TypeScript 编写,遵循 GNU Affero General Public License v3.0 许可证。Eidos 的主要特点在于它的离线可用性、与大语言... 阅读全文

    优惠 新型文本检索基准测试BRIGHT:用来评估和挑战检索系统在处理复杂查询时的表现

  • 新型文本检索基准测试BRIGHT:用来评估和挑战检索系统在处理复杂查询时的表现
    AI
  • 香港大学、 普林斯顿大学、华盛顿大学和Google Cloud AI 研究的研究人员推出新型文本检索基准测试BRIGHT,它专门设计用来评估和挑战检索系统在处理复杂查询时的表现。这些查询不仅需要关键词匹配,还需要深入的推理能力来识别相关文档。简单来说,BRIGHT测试的是检索系统是否能够“理解”查询背后的逻辑和上下文,... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?