人工智能

优惠 索尼发布动作捕捉工具mocopi PC应用,革新3DCG制作流程

  • 索尼发布动作捕捉工具mocopi PC应用,革新3DCG制作流程
    AI
  • 索尼正式推出mocopi PC应用程序,专为电影、动画制作及3D虚拟形象直播等专业领域设计的动作捕捉工具。mocopi PC应用程序是收费软件,月费30元,提供一个月的免费试用期。自2023年9月手机版发布以来,mocopi已被广泛应用于VUP、社交VR以及电影动画制作。 传统与现代的结合 传统动作捕捉依赖于多摄像机工... 阅读全文

    优惠 字节跳动旗下扣子平台上线“模型广场”,不同 AI 大模型匿名打 PK

  • 字节跳动旗下扣子平台上线“模型广场”,不同 AI 大模型匿名打 PK
    AI
  • 字节跳动旗下扣子 Coze”平台上线“模型广场”功能,提供了一个大模型匿名打 PK 的“擂台”。用户可以在扣子官网(coze.cn)左侧导航栏中的“探索”列表找到“模型广场”,进入功能。其对战模式分为“随机 Bot 对战”“指定 Bot 对战”“纯模型对战”三种。 随机 Bot 对战:系统随机选择一个 Bot 进行模型... 阅读全文

    优惠 Luma AI推出AI视频生成项目Dream Machine,挑战OpenAI的Sora

  • Luma AI推出AI视频生成项目Dream Machine,挑战OpenAI的Sora
    AI
  • 今年初,OpenAI的Sora服务以其生成式AI视频技术震撼市场。本周,旧金山的Luma AI公司也宣布推出类似的AI视频服务——Dream Machine。Luma AI成立于2021年,由柏克莱大学的AI研究人员Alex Yu和前苹果Vision Pro开发人员Amit Jain联合创办。去年11月,该公司刚完成4... 阅读全文

    优惠 微软推出先进神经编解码语言模型VALL-E 2

  • 微软推出先进神经编解码语言模型VALL-E 2
    AI
  • 微软推出先进神经编解码语言模型VALL-E 2,它在零样本文本到语音合成(TTS)领域取得了突破性进展,首次实现了与人类同等水平的表现。VALL-E 2是一个纯粹的研究项目,目前还没有计划将其纳入产品或向公众开放。尽管VALL-E 2能够合成类似专业配音的语音,但其相似度和自然度取决于语音提示的长度和质量、背景噪音以及... 阅读全文

    优惠 谷歌推出新型AI模型PH-LLM:专门针对个人健康领域,能够理解和推理关于健康的数据和信息

  • 谷歌推出新型AI模型PH-LLM:专门针对个人健康领域,能够理解和推理关于健康的数据和信息
    AI
  • 谷歌推出新型人工智能模型“Personal Health Large Language Model”(简称PH-LLM),它专门针对个人健康领域,能够理解和推理关于健康的数据和信息。 通熟易懂的语言介绍: 想象一下,如果你有一个虚拟的健康顾问,它可以查看你的睡眠模式、运动习惯和生理反应,然后根据这些信息给你提供个性化的... 阅读全文

    优惠 IllumiNeRF:能够在不需要复杂的逆向渲染过程的情况下,实现对3D物体的重新照明

  • IllumiNeRF:能够在不需要复杂的逆向渲染过程的情况下,实现对3D物体的重新照明
    AI
  • 谷歌和伊利诺伊大学香槟分校的研究人员推出IllumiNeRF,它能够在不需要复杂的逆向渲染过程的情况下,实现对3D物体的重新照明。简单来说,这项技术可以让我们对一个物体在不同光照条件下的样子进行高质量的3D重建,并在新的视角下重新照明这些物体。 项目主页:https://illuminerf.github.io 例如,... 阅读全文

    优惠 高质量视频-文本数据集Vript以及基于该数据集训练出的视频字幕生成模型Vriptor

  • 高质量视频-文本数据集Vript以及基于该数据集训练出的视频字幕生成模型Vriptor
    AI
  • 上海交通大学、 北京航空航天大学和小红书公司推出高质量视频-文本数据集Vript以及基于该数据集训练出的视频字幕生成模型Vriptor。Vript数据集包含12K高分辨率视频,这些视频被精心注释,提供了详细、密集且类似剧本的字幕,覆盖超过42万个片段。与以往的视频-文本数据集相比,Vript的每个片段都有大约145个词... 阅读全文

    优惠 谷歌推出大语言模型Tx-LLM:专门为药物治疗领域设计

  • 谷歌推出大语言模型Tx-LLM:专门为药物治疗领域设计
    AI
  • 谷歌推出大语言模型Tx-LLM,它是专门为药物治疗领域设计的。例如,科学家想要发现一种新药来治疗糖尿病,他们可以使用Tx-LLM来分析不同的化合物,预测它们与糖尿病相关蛋白的结合强度,从而筛选出最有希望的候选药物。然后,Tx-LLM还可以预测这些候选药物的毒性,帮助科学家避免选择可能对患者有害的化合物。通过这种方式,T... 阅读全文

    优惠 ShiftAddLLM:通过后训练的位移加法重参数化技术来加速预训练的大语言模型

  • ShiftAddLLM:通过后训练的位移加法重参数化技术来加速预训练的大语言模型
    AI
  • 佐治亚理工学院 和Google DeepMind的研究人员推出ShiftAddLLM,它通过后训练的位移加法重参数化技术来加速预训练的大语言模型(LLMs)。这种方法旨在解决大语言模型在部署到资源受限设备时所面临的挑战,如高内存需求和延迟瓶颈。例如,你正在开发一款智能家居助手,需要使用大型语言模型来进行语音识别和自然语... 阅读全文

    优惠 多步推理语言代理HUSKY:一个统一的、开源的语言模型,能够处理涉及数值、表格和基于知识的复杂推理任务

  • 多步推理语言代理HUSKY:一个统一的、开源的语言模型,能够处理涉及数值、表格和基于知识的复杂推理任务
    AI
  • 华盛顿大学、 Meta AI和艾伦人工智能研究所的研究人员推出多步推理语言代理HUSKY,它是一个统一的、开源的语言模型,能够处理涉及数值、表格和基于知识的复杂推理任务。HUSKY通过迭代地生成和执行行动来解决给定的任务,直到达到终端状态。例如,你是一个学生,需要解决一个复杂的数学问题,比如计算两个州在地图上的面积差异... 阅读全文

    优惠 Snap推出新型三维重建方法GTR:从多视角图像中生成高质量的3D网格模型,其特别关注于几何形状和纹理细节的精细化

  • Snap推出新型三维重建方法GTR:从多视角图像中生成高质量的3D网格模型,其特别关注于几何形状和纹理细节的精细化
    AI
  • Snap推出新型三维重建方法GTR(Geometry and Texture Refinement),GTR旨在从多视角图像中生成高质量的3D网格模型,其特别关注于几何形状和纹理细节的精细化。例如,你是一名游戏开发者,需要将一些2D概念艺术转换为3D模型。使用GTR,你可以通过拍摄概念艺术的多角度照片,快速生成一个高质... 阅读全文

    优惠 ExtraNeRF:用于扩展神经辐射场(NeRF)的视图范围,特别是当只有少数输入视图可用时

  • ExtraNeRF:用于扩展神经辐射场(NeRF)的视图范围,特别是当只有少数输入视图可用时
    AI
  • 华盛顿大学、康奈尔大学、 Google Research和加州大学伯克利分校的研究人员推出ExtraNeRF,它用于扩展神经辐射场(Neural Radiance Fields, NeRF)的视图范围,特别是当只有少数输入视图可用时。NeRF是一种能够从一组图像重建场景并从新视点渲染场景的深度学习模型,但传统的NeRF... 阅读全文