推荐类别

栏目分类

优惠 谷歌推出零样本跨语言声音转换技术Zero-shot Cross-lingual Voice Transfer

  • 谷歌推出零样本跨语言声音转换技术Zero-shot Cross-lingual Voice Transfer
    AI
  • 谷歌推出了一种名为“Zero-shot Cross-lingual Voice Transfer”(零样本跨语言声音转换)的技术,它可以将一个人的语音转换到另一种语言中去。简单来说,就是如果你有一种语言的语音样本,这项技术能够让你的声音听起来像是在说另一种你从未说过的语言。 项目主页:https://google.gi... 阅读全文

    优惠 微软研究院推出SpaceBlender系统:利用生成式AI来创造VR环境中的3D空间的工具

  • 微软研究院推出SpaceBlender系统:利用生成式AI来创造VR环境中的3D空间的工具
    AI
  • 微软研究院推出SpaceBlender系统,它是一个利用生成式人工智能(AI)来创造虚拟现实(VR)环境中的3D空间的工具。简单来说,SpaceBlender可以把用户周围的真实环境转换成3D虚拟环境,让用户在VR中体验到融合了现实世界元素的虚拟空间。 项目主页:https://nels.dev/publication... 阅读全文

    优惠 英伟达推出MaskedMimic:用于控制虚拟角色动作的人工智能系统

  • 英伟达推出MaskedMimic:用于控制虚拟角色动作的人工智能系统
    AI
  • 英伟达推出MaskedMimic,它是一个用于控制虚拟角色动作的人工智能系统。想象一下,我们想要创造一个能够根据我们给定的条件做出各种动作的虚拟角色,比如在虚拟现实游戏中的人物或者电影里的动画角色。MaskedMimic就是专门用来实现这一目标的。 项目主页:https://research.nvidia.com/la... 阅读全文

    优惠 用于逆向渲染的技术MaterialFusion:能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照

  • 用于逆向渲染的技术MaterialFusion:能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照
    AI
  • 卡内基梅隆大学和特拉维夫大学的研究人员推出一个用于逆向渲染的技术MaterialFusion,能够从一组给定的物体图像中恢复物体的几何形状、表面反射特性(BRDF)和环境光照。简而言之,MaterialFusion能够从一个物体在不同角度拍摄的多张图片中,推断出物体的三维形状、材质和光照条件。例如,你是一名电影视觉特效... 阅读全文

    优惠 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力

  • 韩国科学院推出新型大型语言和视觉模型Phantom:通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力
    AI
  • 韩国科学院推出新型大型语言和视觉模型Phantom,它旨在通过一种高效的学习方式,在不显著增加模型大小的前提下,增强模型对视觉和语言知识的学习能力。例如,你是一名教师,需要向学生解释一个复杂的科学概念,你可以上传一个相关的图表并给出描述,Phantom能够生成一个详细的图像,帮助学生更好地理解这个概念。或者,如果你是一... 阅读全文

    优惠 RACER:让机器人在进行物体操控任务时更加健壮和能够自我纠错

  • RACER:让机器人在进行物体操控任务时更加健壮和能够自我纠错
    AI
  • 密歇根大学计算机科学与工程系和密歇根大学机器人系的研究人员推出RACER,让机器人在进行物体操控任务时更加健壮和能够自我纠错。我们可以把机器人想象成一个刚开始学做家务的孩子,孩子在尝试把饼干放到架子上时可能会犯错,比如抓错了物体或者没有抓稳。这篇论文提出的方法就像是给孩子一个指导手册,告诉它在犯错后如何纠正自己,并且能... 阅读全文

    优惠 赜深科技推出新技术V3:能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染

  • 赜深科技推出新技术V3:能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染
    AI
  • 赜深科技、上海科技大学和鲁汶天主教大学的研究人员推出新技术V3,它能够将体积视频(即三维视频)流式传输到移动设备上进行高质量渲染。简单来说,V3技术使用一种称为2D动态高斯(2D Dynamic Gaussians)的方法,将复杂的三维视频数据压缩成可以在移动设备上流畅播放的二维视频流。 项目主页:https://au... 阅读全文

    优惠 V-AURA:根据视频生成与之匹配的音频

  • V-AURA:根据视频生成与之匹配的音频
    AI
  • 坦佩雷大学和牛津大学的研究人员推出V-AURA模型,它用于根据视频生成与之匹配的音频。简单来说,V-AURA能够观察一段视频,并生成与之对应的、听起来很自然的音频。比如,如果视频显示一个人在弹吉他,V-AURA可以生成吉他声音的音频。 项目主页:https://v-aura.notion.site GitHub:htt... 阅读全文

    优惠 NASA推出新型人工智能模型Prithvi WxC:为了天气预报和气候研究而设计

  • NASA推出新型人工智能模型Prithvi WxC:为了天气预报和气候研究而设计
    AI
  • NASA推出新型人工智能模型Prithvi WxC,它是为了天气预报和气候研究而设计的。Prithvi WxC是一个大型的、多用途的模型,可以理解和预测天气模式。Prithvi WxC通过大量的数据训练,学习了天气变化的复杂模式,使其能够进行高质量的预测。这个模型的出现可能会改变我们进行天气预报和气候研究的方式。 Gi... 阅读全文

    优惠 音乐编解码器MuCodec:能够在极低的比特率下压缩和重建音乐

  • 音乐编解码器MuCodec:能够在极低的比特率下压缩和重建音乐
    AI
  • 清华大学深圳国际研究生院、腾讯人工智能实验室和香港中文大学的研究人员推出一个非常高效的音乐编解码器MuCodec,能够在极低的比特率下压缩和重建音乐。编解码器是一类软件,能够将音乐文件压缩成更小的体积进行存储或传输,同时保证在解压后尽可能保持音质。 项目主页:https://xuyaoxun.github.io/MuC... 阅读全文

    优惠 在线工具DNS.fish,专门用于查询网站的DNS记录

  • 在线工具DNS.fish,专门用于查询网站的DNS记录
    工具
  • DNS.fish,一个简单、强大且操作迅速的在线工具,专门用于查询网站的DNS记录。无论你是开发者、系统管理员,还是出于好奇想要探索,这项服务都能满足你的需求。 DNS.fish 的特点: 快速查询:提供快速的DNS记录查询服务。 API支持:支持通过API获取查询结果,使用curl命令即可获取特定域名的DNS记录。 ... 阅读全文

    优惠 CLAIRA:利用大语言模型来评估音频字幕质量的方法

  • CLAIRA:利用大语言模型来评估音频字幕质量的方法
    AI
  • 加州大学伯克利分校的研究人员推出了一个名为CLAIRA的系统,它是一个利用大语言模型来评估音频字幕质量的方法。例如,你有一段下雨和车辆驶过的音频,一个良好的音频字幕可能是“车辆在雨中驶过,水花四溅”。CLAIRA会评估这个字幕与参考字幕(如“雨中车辆驶过,伴有水花声”)的语义相似度,并给出一个高分和解释,说明为什么这个... 阅读全文
    我要爆料 我的收藏 顶部
    快速登录

    自动登录 忘记密码?