人工智能

优惠 新型3D建模工具MagicClay:结合了Neural Fields和Meshes的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型

  • 新型3D建模工具MagicClay:结合了Neural Fields和Meshes的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型
    AI
  • 特拉维夫大学、Adobe 研究中心、加拿大蒙特利尔大学的研究人员推出新型3D建模工具MagicClay,它结合了神经场(Neural Fields)和三角网格(Meshes)的混合表示方法,允许用户通过文本提示来雕塑和编辑3D模型。这种方法旨在解决现有3D生成技术在艺术创作中的局限性,特别是在需要精细控制和逐步迭代的场... 阅读全文

    优惠 RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作

  • RT-Sketch系统:让机器人理解用户手绘的草图,并根据这些草图来执行动作
    AI
  • 斯坦福大学和谷歌的研究人员推出RT-Sketch系统,它是一个目标条件化的模仿学习(Imitation Learning, IL)策略,用于机器人操控任务。RT-Sketch的核心特点是它能够理解用户手绘的草图,并根据这些草图来执行动作。这种方法旨在解决自然语言指令可能存在的歧义性以及图像可能过于具体的问题。 项目主页... 阅读全文

    优惠 Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量

  • Modeling Collaborator框架:通过自然语言交互来替代人工标注,大幅减少定义概念所需的工作量
    AI
  • 来自华盛顿大学和谷歌的研究人员推出Modeling Collaborator框架,它是一个创新的工具,旨在帮助人们以最小的努力训练视觉模型来识别复杂或主观的视觉概念。在日常生活中,我们经常需要计算机视觉系统来识别图片中的内容,比如区分美食、艺术品或者判断某个场景是否安全。但是,传统的训练方法需要大量的手动标注工作,这既... 阅读全文

    优惠 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖

  • 加州大学伯克利分校最新研究:机器人双手协同拧瓶盖
    AI
  • 加州大学伯克利分校的研究人员发布论文,该主题是关于如何训练一个由两个多指机器人手组成的系统,使其能够旋转(拧开)各种类似瓶子物体的盖子。这个研究项目使用了深度强化学习(Deep Reinforcement Learning, DRL)技术,首先在模拟环境中训练控制策略,然后将这个策略零次转移(zero-shot tra... 阅读全文

    优惠 MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型

  • MovieLLM框架:旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大语言模型
    AI
  • 来自复旦大学和腾讯的研究人员推出MovieLLM框架,它旨在通过GPT-4生成的电影相关的合成数据(包括剧本、关键帧图像等)来训练多模态大型语言模型。这些模型经过训练后,能够更好地理解和处理长视频内容。简单来说,MovieLLM创建了一种模拟电影内容的数据集,这些数据集被用来训练AI模型,使其能够更好地理解和回答关于长... 阅读全文

    优惠 Anthropic 推出 Claude 3 系列大语言模型,革新认知任务处理性能

  • Anthropic 推出 Claude 3 系列大语言模型,革新认知任务处理性能
    AI
  • Anthropic在今天发布了其创新的Claude 3系列大语言模型(LLM),为各种认知任务设定了新的性能标准。该系列包含三个子模型:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,它们为用户提供了不同的智能、速度和成本选择,以满足多样化的人工智能应用需求。 卓越性能:超越G... 阅读全文

    优惠 Meta推出新型自监督学习方法Image World Models(IWM):通过学习一个世界模型来理解和预测图像的变化

  • Meta推出新型自监督学习方法Image World Models(IWM):通过学习一个世界模型来理解和预测图像的变化
    AI
  • Meta推出新型自监督学习方法Image World Models(IWM),它通过学习一个世界模型来理解和预测图像的变化。想象一下,你有一个智能相机,它不仅能拍摄照片,还能理解照片中的内容,并预测如果对照片进行某些修改(比如改变亮度或对比度),照片会变成什么样子。IWM就是这样一个系统,它可以帮助计算机更好地理解和处... 阅读全文

    优惠 RESONANCE RoPE(共振旋转位置编码):改善大语言模型(LLMs)在处理长文本时的性能

  • RESONANCE RoPE(共振旋转位置编码):改善大语言模型(LLMs)在处理长文本时的性能
    AI
  • 来自蒙特利尔大学、魁北克人工智能研究所、华为诺亚方舟实验室的研究人员发布论文介绍了一种名为RESONANCE RoPE(共振旋转位置编码)的技术,它旨在改善大语言模型(LLMs)在处理长文本时的性能。在训练时,模型通常处理较短的文本序列,但在实际应用中可能需要处理更长的文本,这就是所谓的“训练短-测试长”(TSTL)场... 阅读全文

    优惠 AtP*(Attribution Patching*):用于定位大语言模型(LLM)中特定行为的组件

  • AtP*(Attribution Patching*):用于定位大语言模型(LLM)中特定行为的组件
    AI
  • Google DeepMind发布论文介绍了一种名为AtP*(Attribution Patching*)的高效且可扩展的方法,用于定位大语言模型(LLM)中特定行为的组件。想象一下,你有一个非常复杂的机器,比如一个巨大的乐高城堡,你想知道城堡中的哪个部分(比如哪个乐高积木)对于城堡的某个特定功能(比如开门)至关重要。... 阅读全文

    优惠 数字人技术公司D-ID推出数字分身,上传知识库文件定制专属数字人

  • 数字人技术公司D-ID推出数字分身,上传知识库文件定制专属数字人
    AI
  • D-ID是一家提供AI拟真人影片产品服务和开发的公司。只需上传人物照片并输入要说的内容,AI语音机器人就能自动将其转换成音频。近日官方推出数字分身服务,这项服用与百度在过年期间推出的数字分身差不多,只是D-ID这项服务主要面向商业,你可以上传文件定制数字人的知识库,让数字人根据知识库内容来回答问题,此服务能实现只有2秒... 阅读全文

    优惠 Web VR应用Petty Paint:在虚拟现实中释放创造力

  • Web VR应用Petty Paint:在虚拟现实中释放创造力
    AI
  • Petty Paint是一款创新的Web VR应用,它将绘画的乐趣和创造力完美融入虚拟现实的体验中。这款模拟器让用户在虚拟的画布上尽情释放创造力,无论是经验丰富的艺术家还是绘画新手,都能在这里将创意转化为惊艳的视觉作品。 稳定扩散技术助力创作升级 Petty Paint的一大亮点是其集成了稳定扩散技术,这项特色让它与传... 阅读全文

    优惠 非盈利机构 AllenAI 推出完全开源的大语言模型 OLMo:不仅有模型还包括完整的训练代码、数据集和评估代码

  • 非盈利机构 AllenAI 推出完全开源的大语言模型 OLMo:不仅有模型还包括完整的训练代码、数据集和评估代码
    AI
  • 非盈利机构 AllenAI 正式推出完全开源的大语言模型 OLMo,此次开源不仅有模型还包括完整的训练代码、数据集和评估代码,官方宣布通过开放研究来加速语言模型科学的发展。首次发布的内容包括四个参数规模达到 70 亿的语言模型,这些模型具有不同的架构、优化器和训练硬件,另外还有一个参数规模为 10 亿的模型。所有这些模... 阅读全文