推荐类别

栏目分类

优惠 新型大型多模态模型LLaVA-3D:能够理解和处理三维(3D)空间信息,而不仅仅是传统的二维(2D)图像和视频

  • 新型大型多模态模型LLaVA-3D:能够理解和处理三维(3D)空间信息,而不仅仅是传统的二维(2D)图像和视频
    AI
  • 香港大学和上海人工智能实验室的研究人员推出新型大型多模态模型LLaVA-3D,它能够理解和处理三维(3D)空间信息,而不仅仅是传统的二维(2D)图像和视频。想象一下,你有一个AI助手,不仅能看懂图片和文字,还能理解图片中的物体在三维空间中的位置和关系,比如它们是靠近还是远离,或者它们之间的相互位置。 项目主页:http... 阅读全文

    优惠 多模态大语言模型EMOVA:使大语言模型具备端到端的语音能力,同时保持领先的视觉-语言性能。

  • 多模态大语言模型EMOVA:使大语言模型具备端到端的语音能力,同时保持领先的视觉-语言性能。
    AI
  • 香港科技大学、香港大学,、华为诺亚方舟实验室、香港中文大学、中山大学和南方科技大学的研究人员推出多模态大语言模型EMOVA,使大语言模型具备端到端的语音能力,同时保持领先的视觉-语言性能。通过一个语义-声学解耦的语音标记器,研究团队发现全模态对齐可以进一步增强视觉-语言和语音能力,相比于双模态对齐。此外,我们提出了一个... 阅读全文

    优惠 可学习剪枝方法MaskLLM:通过在大语言模型中建立半结构化(或“N:M”)稀疏性来减少推理过程中的计算开销

  • 可学习剪枝方法MaskLLM:通过在大语言模型中建立半结构化(或“N:M”)稀疏性来减少推理过程中的计算开销
    AI
  • 英伟达和新加坡国立大学的研究人员推出可学习剪枝方法MaskLLM,旨在通过在大语言模型中建立半结构化(或“N:M”)稀疏性来减少推理过程中的计算开销。MaskLLM不采用新的重要性标准,而是通过Gumbel Softmax采样将N:M模式显式建模为可学习的分布。这种方法促进了对大规模数据集的端到端训练,并具有两个显著优... 阅读全文

    优惠 开源免费的地址生成器Real Address Generator,能够快速生成包含姓名、电话、地址和邮编的真实感信息

  • 开源免费的地址生成器Real Address Generator,能够快速生成包含姓名、电话、地址和邮编的真实感信息
    工具
  • Real Address Generator 是一个免费的地址生成器,能够快速生成包含姓名、电话、地址和邮编的真实感信息。支持包括美国、英国、法国、德国、中国、日本、印度、澳大利亚、巴西、加拿大、俄罗斯、南非、墨西哥、韩国在内的多个国家和地区。 官网:https://realaddress.fuyiran.com Gi... 阅读全文

    优惠 TLD-List:域名价格比较的最佳工具,找到最省钱的解决方案

  • TLD-List:域名价格比较的最佳工具,找到最省钱的解决方案
    工具
  • 当您需要为您的网络项目注册域名时,选择一个既实惠又可靠的注册商至关重要。但面对众多域名后缀和注册商,如何找到最省钱的解决方案呢?这时,「TLD-List」域名资料库就能大显身手了。 TLD-List 简介 TLD-List 是一个专门用于比较不同域名后缀在各个注册商价格的在线工具。它收录了超过3400种域名后缀,无论您... 阅读全文

    优惠 Send.cm:免费的大文件传输平台,强调用户隐私保护

  • Send.cm:免费的大文件传输平台,强调用户隐私保护
    工具
  • Send.cm 提供了一个免费的大文件传输平台,强调用户隐私保护,包括端到端加密、无广告、无追踪器,且无需注册即可上传和下载文件。这项服务几乎拥有无限容量,只要文件在30天内被下载过,就会被保留,且没有流量或下载次数限制。用户每天享有30 GB的免费高速下载配额,并支持多种文件上传方式,包括直接通过网页界面上传和获取分... 阅读全文

    优惠 喜加一 Epic Games本周免费领取《精灵与老鼠》,下周免费游戏将是《Bear and Breakfast》 0元

  • Epic Games本周免费领取《精灵与老鼠》,下周免费游戏将是《Bear and Breakfast》
    Epic Games
  • Epic Games本周要免费送冒险游戏《精灵与老鼠(The Spirit and the Mouse)》,领取时间为9月26日晚上23点到10月3日晚上23点,在此之前免费领取即可永久保留这些作品。下周的免费游戏是管理冒险游戏《Bear and Breakfast》。 《精灵与老鼠》 《精灵与老鼠》是一款注重叙事的冒... 阅读全文

    优惠 新型多模态方法MonoFormer:核心思想是使用单一的Transformer来处理两种不同的生成任务

  • 新型多模态方法MonoFormer:核心思想是使用单一的Transformer来处理两种不同的生成任务
    AI
  • 百度 VIS 和悉尼科技大学的研究人员推出一种新型多模态方法,称为MonoFormer。这个方法的核心思想是使用单一的Transformer来处理两种不同的生成任务:基于自回归(autoregression)的离散文本生成和基于扩散(diffusion)的连续视觉生成。例如,你有一台机器,它可以读取一段文本然后创造出与... 阅读全文

    优惠 TIME-MOE:用于时间序列预测的大规模基础模型

  • TIME-MOE:用于时间序列预测的大规模基础模型
    AI
  • 普林斯顿大学、松鼠AI学习和格里菲斯大学的研究人员推出新框架TIME-MOE,它是一个用于时间序列预测的大规模基础模型。TIME-MOE的核心是一个新颖的、高效的解码器-只有的Transformer模型,它采用了专家混合(MoE)架构,能够在保持高性能的同时减少计算成本。 GitHub:https://github.c... 阅读全文

    优惠 新型框架TalkinNeRF:能够从单目视频学习动态的NeRF,以此来创建能够进行全身动作和说话的三维人物动画。

  • 新型框架TalkinNeRF:能够从单目视频学习动态的NeRF,以此来创建能够进行全身动作和说话的三维人物动画。
    AI
  • 石溪大学、Meta和Flawless AI的研究人员推出新型框架TalkinNeRF,它能够从单目视频(即只有一个摄像头拍摄的视频)学习动态的神经辐射场(NeRF),以此来创建能够进行全身动作和说话的三维人物动画。简单来说,这项技术可以根据你提供的视频,生成一个能够模仿视频中人物动作和表情的虚拟三维人物。 项目主页:h... 阅读全文

    优惠 新型3D框架DreamWaltz-G:根据文本描述生成具有表现力的3D高斯化身(即3D头像),并且这些头像可以进行动画化处理

  • 新型3D框架DreamWaltz-G:根据文本描述生成具有表现力的3D高斯化身(即3D头像),并且这些头像可以进行动画化处理
    AI
  • 香港大学、星尘智能、腾讯、中国科学技术大学和国际数字经济学院(IDEA)的研究人员推出新型框架DreamWaltz-G,它能够根据文本描述生成具有表现力的3D高斯化身(即3D头像),并且这些头像可以进行动画化处理。简单来说,这项技术可以根据你提供的描述文字,比如“穿着舞会礼服的女性”,自动创造出一个3D的、可以动的虚拟... 阅读全文

    优惠 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务

  • 通用型多智能体系统HyperAgent:解决各种编程语言中的软件工程(SE)任务
    AI
  • 越南FPT软件AI中心推出新型通用软件工程代理系统HyperAgent,这个系统能够自动执行多种编程任务,比如修复软件中的错误、添加新功能、改进代码质量等。与现有的基于LLM的软件代理不同,后者通常专注于特定任务,HyperAgent模仿人类开发者的工作流程,以应对多样化的SE挑战。它由四个专业代理组成(规划者、导航器... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?