推荐类别

栏目分类

优惠 为新视角合成任务而设计的智能代理MVLLaVA

  • 为新视角合成任务而设计的智能代理MVLLaVA
    AI
  • 中国科学院大学的研究人员推出智能代理MVLLaVA ,它专为新视角合成任务而设计。MVLLaVA 通过将多个多视图扩散模型与一个大型多模态模型 LLaVA 结合,能够高效处理广泛的任务。这个系统能够适应多种输入类型,包括单个图像、描述性标题,或者在语言指令的引导下改变观察视角。 项目主页:https://jamesjg... 阅读全文

    优惠 新型基准测试PingPong:专门用来评估语言模型在角色扮演方面的能力

  • 新型基准测试PingPong:专门用来评估语言模型在角色扮演方面的能力
    AI
  • 独立研究人员Ilya Gusev推出新型基准测试PingPong,它专门用来评估语言模型在角色扮演方面的能力。你可以把它想象成一个高级的“过家家”游戏,但是这里的玩家不是真人,而是人工智能(AI)模型。在这个游戏中,AI模型需要扮演特定的角色,并且与用户进行互动,就像真人一样进行对话。 项目主页:https://ily... 阅读全文

    优惠 新史低 非线性任务的开放世界沙盒游戏《飙酷车神2》迎来历史最低价 4.96元

  • 非线性任务的开放世界沙盒游戏《飙酷车神2》迎来历史最低价
    STEAM
  • 自2018年发售以来,育碧的沙盒竞速游戏《飙酷车神2》以其开放世界和多样载具竞速项目获得玩家好评。原价60美元的游戏,在Steam上迎来了史上最低的1美元出清价,现仅售4.96元。 游戏特色 《飙酷车神2》由育碧象牙塔工作室制作,提供了一个非线性任务的开放世界沙盒环境。玩家可以体验赛车、飞机、摩托车和快艇等多种载具的竞... 阅读全文

    优惠 开源跨平台思维导图工具 Simple mind map

  • 开源跨平台思维导图工具 Simple mind map
    工具
  • Mind-Map 是一个开源的思维导图工具,旨在帮助用户通过图形化的方式组织和展示思维过程。该工具由 WangLin2 创建,提供了丰富的功能,包括但不限于节点编辑、样式定制、导出功能等,适用于个人笔记、团队协作和教育场景等多个方面,拥有网页端及客户端(Windows、macOS、Linux) 网页端:https://... 阅读全文

    优惠 pin.gl:无需注册的即时屏幕分享工具

  • pin.gl:无需注册的即时屏幕分享工具
    工具
  • pin.gl 是一款简洁的PWA应用,它允许用户通过浏览器在不安装任何额外软件的情况下,实现屏幕画面或镜头的即时分享。这项服务无需注册账号,用户只需开启应用并设置一个Room code,即可生成分享者和观众两种链接,确保了最大的兼容性。 核心技术:WebRTC WebRTC(网页即时通讯)是目前主流浏览器支持的一项技术... 阅读全文

    优惠 新型模型架构LLaMA-Omni:实现与大语言模型(LLMs)的低延迟、高质量的语音交互

  • 新型模型架构LLaMA-Omni:实现与大语言模型(LLMs)的低延迟、高质量的语音交互
    AI
  • 中国科学院计算技术研究所智能信息处理重点实验室、中国科学院人工智能安全重点实验室和中国科学院大学的研究人员推出新型模型架构LLaMA-Omni,它旨在实现与大语言模型(LLMs)的低延迟、高质量的语音交互。例如,你可以通过语音与一个智能系统对话,就像与一个真正的助手交谈一样,而这个系统能够即时理解你的话并给出回应。 G... 阅读全文

    优惠 视频生成音频系统Draw an Audio:根据视频内容自动生成与之匹配的声音效果

  • 视频生成音频系统Draw an Audio:根据视频内容自动生成与之匹配的声音效果
    AI
  • 中国科学院自动化研究所和美团点评的研究人员推出视频生成音频系统Draw an Audio,这个系统能够根据视频内容自动生成与之匹配的声音效果,这在电影制作中被称为“Foley”艺术。例如,你给这个系统一段没有声音的视频,比如一个人在雪地上走路,系统就能自动为这段视频生成脚步声。 项目主页:https://yannqi.... 阅读全文

    优惠 歌曲生成系统SongCreator:能创作出一首包含旋律、伴奏和歌声的完整歌曲

  • 歌曲生成系统SongCreator:能创作出一首包含旋律、伴奏和歌声的完整歌曲
    AI
  • 清华大学深圳国际研究生院、香港中文大学的研究人员推出SongCreator,它是一个基于歌词生成完整歌曲的人工智能系统。想象一下,你给SongCreator提供一段歌词,它就能创作出一首包含旋律、伴奏和歌声的完整歌曲,就像一个虚拟的音乐家。 项目主页:https://songcreator.github.io Song... 阅读全文

    优惠 基准测试“MOCHI”:评估人类观察者和计算机视觉模型在三维形状推断任务上的一致性

  • 基准测试“MOCHI”:评估人类观察者和计算机视觉模型在三维形状推断任务上的一致性
    AI
  • 加州大学伯克利分校和麻省理工学院的研究人员推出基准测试“MOCHI”,旨在评估人类观察者和计算机视觉模型在三维形状推断任务上的一致性。这个任务要求参与者从三个不同视角的图像中识别出哪个图像显示的对象是不同的。研究者们通过这个任务来比较人类的表现和多种计算机视觉模型的表现。 GitHub:https://github.c... 阅读全文

    优惠 三维物体检测模型UniDet3D:能够从点云数据中识别和定位室内环境中的物体

  • 三维物体检测模型UniDet3D:能够从点云数据中识别和定位室内环境中的物体
    AI
  • 人工智能研究院推出三维物体检测模型UniDet3D,它能够从点云数据中识别和定位室内环境中的物体。这个模型特别适用于机器人和增强现实(AR)领域,因为它可以提供对三维空间中物体的精确理解。总的来说,UniDet3D通过在多个数据集上进行训练,提高了模型对不同室内环境的适应能力,使其能够在各种场景下准确地检测和定位三维物... 阅读全文

    优惠 机器人框架Robot Utility Models(RUMs):训练能够在新环境中零样本部署的机器人策略

  • 机器人框架Robot Utility Models(RUMs):训练能够在新环境中零样本部署的机器人策略
    AI
  • 纽约大学、Hello Robot、Meta的研究人员推出新的机器人框架Robot Utility Models(RUMs),它旨在训练能够在新环境中零样本部署的机器人策略。这些策略能够在没有进一步微调的情况下,直接泛化到新的环境和对象上。总的来说,RUMs通过结合多模态学习和自我批评机制,提高了机器人在新环境中的自主性... 阅读全文

    优惠 新型视觉-语言模型POINTS:通过一些高效且经济的策略来提升模型的性能

  • 新型视觉-语言模型POINTS:通过一些高效且经济的策略来提升模型的性能
    AI
  • 腾讯公司微信 AI 模式识别中心、上海交通大学和南京大学的研究人员推出新型视觉-语言模型POINTS,旨在通过一些高效且经济的策略来提升模型的性能。这个模型专注于处理图像和文本信息,使其在理解和生成与视觉内容相关的语言描述方面更加准确和高效。 论文:https://arxiv.org/abs/2409.04828 例如... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?