人工智能

优惠 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性

  • 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性
    AI
  • 来自威尼斯福斯卡里大学、罗马第一大学和索尼 CSL的研究人员发布论文,探索使用潜在扩散模型(latent diffusion models)从脑电图(EEG)数据中重建自然主义音乐。脑电图是一种记录大脑活动的技术,而自然主义音乐指的是包含多种乐器、声音和效果的复杂音乐,这类音乐在和声和音色上都很丰富。 主要功能: 该研... 阅读全文

    优惠 新型文本到3D生成框架Dual3D:它能够在短短1分钟内生成高质量的3D资产

  • 新型文本到3D生成框架Dual3D:它能够在短短1分钟内生成高质量的3D资产
    AI
  • 来自厦门大学、香港中文大学和上海人工智能实验室的研究人员推出新型文本到3D生成框架Dual3D,它能够在短短1分钟内生成高质量的3D资产。这项技术的关键在于一个创新的双模式多视图潜在扩散模型,这个模型能够从文本描述中高效地创建出三维物体。Dual3D是一个强大的工具,它结合了先进的AI技术,使得从文本描述到3D模型的生... 阅读全文

    优惠 谷歌推出CAT3D:从任意数量的生成或真实图像中创建3D场景

  • 谷歌推出CAT3D:从任意数量的生成或真实图像中创建3D场景
    AI
  • 谷歌推出CAT3D,它可以从任意数量的生成或真实图像中创建3D场景。CAT3D是一个强大的工具,它通过模拟真实世界的3D捕捉过程,使得从2D图像到3D场景的转换变得快速而高效,极大地推动了3D内容创作的边界。例如,你是一名游戏设计师、电影特效师或者虚拟现实内容创作者,你需要将一个真实世界的场景转换成3D模型,这在过去通... 阅读全文

    优惠 TRANSIC:帮助机器人通过人类的在线指导来学习如何在现实世界中执行任务

  • TRANSIC:帮助机器人通过人类的在线指导来学习如何在现实世界中执行任务
    AI
  • 斯坦福大学的研究团队发布论文,这篇论文的主题是关于如何将模拟环境中学习到的机器人策略成功地转移到现实世界中,这在机器人学习领域被称为“仿真到现实(Sim-to-Real)”的转换。例如,你在一个视频游戏中练习驾驶赛车,然后你想要将你在游戏里学到的技能应用到真实世界中的驾驶。这听起来可能很简单,但现实情况要复杂得多,因为... 阅读全文

    优惠 Toon3D:将手绘的卡通和动漫图像转换成三维模型

  • Toon3D:将手绘的卡通和动漫图像转换成三维模型
    AI
  • Teton.ai和加州大学伯克利分校的研究团队推出新技术Toon3D,它能够将手绘的卡通和动漫图像转换成三维模型。这项技术特别适用于那些在创作过程中没有使用三维渲染引擎的卡通和动漫场景,因为这些场景的图像通常在不同的视角下会存在几何上的不一致性。开发者还提供了Toon3D Labeler和Toon3D Dataset,... 阅读全文

    优惠 Many-Shot ICL:多模态基础模型在多示例情境学习中的性能

  • Many-Shot ICL:多模态基础模型在多示例情境学习中的性能
    AI
  • 斯坦福大学的研究团队发布论文探索多模态基础模型在多示例情境学习(Many-Shot In-Context Learning,简称Many-Shot ICL)中的性能。多模态基础模型是指能够处理和理解多种类型数据(如文本、图像等)的大型AI模型。而多示例情境学习是指在模型的输入上下文中提供多个示例,以便模型能够在没有额外... 阅读全文

    优惠 用于训练大语言模型的工作流程RLHF:让这些模型更好地符合人类的价值观和偏好

  • 用于训练大语言模型的工作流程RLHF:让这些模型更好地符合人类的价值观和偏好
    AI
  • 来自Salesforce AI Research和伊利诺伊大学厄巴纳-香槟分校的研究人员推出一种名为在线迭代强化学习从人类反馈(Online Iterative Reinforcement Learning from Human Feedback,简称RLHF)的工作流程。这是一种用于训练大语言模型(Large Lan... 阅读全文

    优惠 微调方法LoRA在大语言模型(LLMs)中的应用

  • 微调方法LoRA在大语言模型(LLMs)中的应用
    AI
  • 这篇论文的主题是探讨一种名为LoRA(Low-Rank Adaptation,低秩适应)的微调方法在大语言模型(LLMs)中的应用。LoRA是一种参数高效的微调技术,它通过只训练选定权重矩阵的低秩扰动来节省内存。 主要功能: LoRA的主要功能是在保持大型语言模型原有功能的同时,对其进行微调以适应特定的任务或领域(如编... 阅读全文

    优惠 llama3.np: Llama 3 模型的纯 NumPy 实现

  • llama3.np: Llama 3 模型的纯 NumPy 实现
    AI
  • Meta公司最近发布的Llama 3模型在业界引起了广泛关注。这款模型以其庞大的规模和卓越的性能赢得了业界的赞赏。具体来说,它采用了24K GPU进行训练,使用了15T的训练数据,并处理了10M的指令数据,整个过程耗费了惊人的130万GPU小时。 值得注意的是,尽管性能强大,但Llama 3的模型结构并未发生根本性变化... 阅读全文

    优惠 screenshot-to-code:利用AI将屏幕截图、设计原型及Figma设计稿转化为干净、实用的代码

  • screenshot-to-code:利用AI将屏幕截图、设计原型及Figma设计稿转化为干净、实用的代码
    AI
  • screenshot-to-code是一款简易工具,利用AI将屏幕截图、设计原型及Figma设计稿转化为干净、实用的代码。现已支持GPT-4O模型! 支持的技术栈包括: HTML + Tailwind React + Tailwind Vue + Tailwind Bootstrap Ionic + Tailwind ... 阅读全文

    优惠 谷歌推出新型时间序列预测模型TimesFM

  • 谷歌推出新型时间序列预测模型TimesFM
    AI
  • 谷歌推出一种新型的时间序列预测模型TimesFM。时间序列预测是一种预测未来数据点的技术,它在很多领域都非常有用,比如在零售业预测未来的销售额,在金融业预测股票价格,在气象学中预测天气变化等。 主要功能: TimesFM模型的主要功能是能够对各种公共数据集进行零样本学习(zero-shot learning),即不需要... 阅读全文

    优惠 LanceDB:开源向量搜索引擎数据库

  • LanceDB:开源向量搜索引擎数据库
    AI
  • LanceDB 是一个开源的向量搜索引擎数据库,结合了持久化存储,极大地简化了向量数据的检索、筛选和管理。LanceDB 的核心是用 Rust 语言编写的,并且是基于 Lance —— 一个为高效机器学习工作负载设计的开源列式存储格式构建的。 LanceDB 的主要特点 生产级向量搜索:适用于生产环境的大规模向量搜索,... 阅读全文