3D

优惠 新框架Part123:能够从单视图图像中重建出具有结构意义的部分(part-aware)的3D模型

  • 新框架Part123:能够从单视图图像中重建出具有结构意义的部分(part-aware)的3D模型
    AI
  • 香港大学和清华大学的研究人员推出新框架Part123,它能够从单视图图像中重建出具有结构意义的部分(part-aware)的3D模型。Part123利用了扩散模型(diffusion models)生成多视图一致的图像,并结合了Segment Anything Model(SAM),这是一个强大的通用图像分割模型,能够... 阅读全文

    优惠 3D建模系统CraftsMan:能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节

  • 3D建模系统CraftsMan:能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节
    AI
  • 香港科技大学、腾讯AI实验室的研究人员推出新颖3D建模系统CraftsMan,它能够生成高保真的3D几何体,这些几何体形状多样、网格拓扑规则,并具有详细的表面细节。更重要的是,CraftsMan允许以交互式的方式对几何体进行细化。CraftsMan通过结合3D原生扩散模型和交互式几何细化技术,为3D建模领域带来了一个既... 阅读全文

    优惠 加州大学圣地亚哥分校和Adob​​e 研究中心推出NDE:用于高效且准确地模拟镜面物体(如闪亮的金属或光泽油漆)的新视角合成

  • 加州大学圣地亚哥分校和Adob​​e 研究中心推出NDE:用于高效且准确地模拟镜面物体(如闪亮的金属或光泽油漆)的新视角合成
    AI
  • 加州大学圣地亚哥分校和Adob​​e 研究中心推出名为Neural Directional Encoding(NDE)的技术,它用于高效且准确地模拟镜面物体(如闪亮的金属或光泽油漆)的新视角合成。这类物体的光泽外观以及全局光照效果(包括环境中其他物体的反射)是忠实再现场景的关键组成部分。 主要功能: NDE的主要功能是... 阅读全文

    优惠 谷歌推出NeRF-Casting:用于改善神经辐射场在渲染高度反光物体时的外观效果

  • 谷歌推出NeRF-Casting:用于改善神经辐射场在渲染高度反光物体时的外观效果
    AI
  • 谷歌推出NeRF-Casting,它用于改善神经辐射场(Neural Radiance Fields,简称NeRFs)在渲染高度反光物体时的外观效果。NeRFs是一种用于3D场景表示和新视角合成的深度学习模型,但它们在处理反射强烈或镜面反射物体时常常遇到困难。 主要功能: NeRF-Casting的主要功能是提高NeR... 阅读全文

    优惠 文生3D模型Dreamer XL:将文本转换为高分辨率的3D模型

  • 文生3D模型Dreamer XL:将文本转换为高分辨率的3D模型
    AI
  • 来自英国杜伦大学、英国纽卡斯尔大学、中国地质大学的研究人员推出Dreamer XL,它用于将文本转换为高分辨率的3D模型。这项技术的目标是通过改进现有的文本到3D生成过程,生成更加逼真和详细的3D内容。例如,你想要创建一个虚拟现实游戏的环境,或者需要在建筑演示中展示一个新设计的建筑物。使用Dreamer XL,你只需提... 阅读全文

    优惠 三维场景理解模型Grounded 3D-LLM:通过结合三维视觉和语言模型,来处理和理解复杂的三维场景

  • 三维场景理解模型Grounded 3D-LLM:通过结合三维视觉和语言模型,来处理和理解复杂的三维场景
    AI
  • 来自上海人工智能实验室、浙江大学和香港中文大学的研究人员推出新型的三维场景理解模型——Grounded 3D-LLM(Grounded 3D Large Language Model)。这个模型旨在通过结合三维视觉和语言模型,来处理和理解复杂的三维场景。下面我将用通俗易懂的语言来介绍这个模型的主要功能、特点、工作原理以... 阅读全文

    优惠 浙江大学和字节跳动的研究人员推出新颖框架Coin3D:用于生成可控且交互式的3D资产

  • 浙江大学和字节跳动的研究人员推出新颖框架Coin3D:用于生成可控且交互式的3D资产
    AI
  • 浙江大学和字节跳动的研究人员推出新颖框架Coin3D,它用于生成可控且交互式的3D资产。Coin3D的核心思想是使用由基本形状(如球体、立方体、圆柱体等)组成的粗糙代理(proxy)来引导3D对象的生成,从而实现对生成过程的精细控制。这就像我们用乐高积木搭建模型一样,可以通过组合简单的积木来创造出复杂的结构。 例如,一... 阅读全文

    优惠 新型文本到3D生成框架Dual3D:它能够在短短1分钟内生成高质量的3D资产

  • 新型文本到3D生成框架Dual3D:它能够在短短1分钟内生成高质量的3D资产
    AI
  • 来自厦门大学、香港中文大学和上海人工智能实验室的研究人员推出新型文本到3D生成框架Dual3D,它能够在短短1分钟内生成高质量的3D资产。这项技术的关键在于一个创新的双模式多视图潜在扩散模型,这个模型能够从文本描述中高效地创建出三维物体。Dual3D是一个强大的工具,它结合了先进的AI技术,使得从文本描述到3D模型的生... 阅读全文

    优惠 谷歌推出CAT3D:从任意数量的生成或真实图像中创建3D场景

  • 谷歌推出CAT3D:从任意数量的生成或真实图像中创建3D场景
    AI
  • 谷歌推出CAT3D,它可以从任意数量的生成或真实图像中创建3D场景。CAT3D是一个强大的工具,它通过模拟真实世界的3D捕捉过程,使得从2D图像到3D场景的转换变得快速而高效,极大地推动了3D内容创作的边界。例如,你是一名游戏设计师、电影特效师或者虚拟现实内容创作者,你需要将一个真实世界的场景转换成3D模型,这在过去通... 阅读全文

    优惠 Toon3D:将手绘的卡通和动漫图像转换成三维模型

  • Toon3D:将手绘的卡通和动漫图像转换成三维模型
    AI
  • Teton.ai和加州大学伯克利分校的研究团队推出新技术Toon3D,它能够将手绘的卡通和动漫图像转换成三维模型。这项技术特别适用于那些在创作过程中没有使用三维渲染引擎的卡通和动漫场景,因为这些场景的图像通常在不同的视角下会存在几何上的不一致性。开发者还提供了Toon3D Labeler和Toon3D Dataset,... 阅读全文

    优惠 斯坦福大学推出BlenderAlchemy:利用视觉语言模型来编辑3D图形的智能系统

  • 斯坦福大学推出BlenderAlchemy:利用视觉语言模型来编辑3D图形的智能系统
    AI
  • 斯坦福大学研究人员推出BlenderAlchemy,它是一个利用视觉语言模型(Vision-Language Models,简称VLMs)来编辑3D图形的智能系统。这个系统特别适用于需要精细调整的3D图形设计工作,比如电影制作和游戏设计中的高质量场景创建。通过这种方式,BlenderAlchemy不仅提高了3D设计的效... 阅读全文

    优惠 3D场景表示方法SUNDAE:通过一种称为“光谱剪枝”的技术来优化和压缩3DGS模型,同时使用神经网络补偿来保持渲染质量

  • 3D场景表示方法SUNDAE:通过一种称为“光谱剪枝”的技术来优化和压缩3DGS模型,同时使用神经网络补偿来保持渲染质量
    AI
  • 来自清华大学人工智能产业研究院、伦敦帝国理工学院、北京航空航天大学、北京理工大学、中国科学院大学、 香港中文大学(深圳)、中国电信人工智能研究院(TeleAI)EVOL实验室的研究人员推出新的3D场景表示方法SUNDAE,它通过一种称为“光谱剪枝”的技术来优化和压缩3D高斯溅射(3D Gaussian Splattin... 阅读全文