AI绘画

优惠 昆仑推出新型图像生成模型DiT-MoE

  • 昆仑推出新型图像生成模型DiT-MoE
    AI
  • 昆仑推出新型图像生成模型DiT-MoE,这个模型的全称是“Diffusion Transformers with Mixture of Experts”。简单来说,它是一种能够生成高质量图像的人工智能系统。它通过模拟一个逐步去噪和降噪的过程,将随机噪声转化为目标数据分布,从而生成图像。例如,你有一个超级聪明的机器人,它... 阅读全文

    优惠 提升个性化图像美学评估的规模化能力

  • 提升个性化图像美学评估的规模化能力
    AI
  • 韩国科学技术院发布论文,论文的主题是关于如何提升个性化图像美学评估的规模化能力。简单来说,就是教会计算机如何根据个人的喜好来评估一张图片是否美观。这项技术可以想象成一个能够理解每个人审美偏好的智能助手。例如,你是一名摄影师,你希望从你拍摄的照片中挑选出最具视觉冲击力的作品。你可以上传一些你认为美观的照片给这个系统,系统... 阅读全文

    优惠 大型图像描述数据集PixelProse:包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述

  • 大型图像描述数据集PixelProse:包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述
    AI
  • 马里兰大学帕克分校的研究人员推出大型图像描述数据集PixelProse,PixelProse包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述。例如,一个艺术家想要了解他的画作在视觉上给人的感受,PixelProse可以帮助分析图像的美学属性并生成描述,这样艺术家就可以得到关于作品可能给观众带来的情感体验的... 阅读全文

    优惠 快手开放自研文生图大模型“可图”

  • 快手开放自研文生图大模型“可图”
    AI
  • 快手正式对外发布了其自主研发的文生图大模型“可图”,支持用户进行AI创作图像以及AI形象定制。这是快手首次将其自研的大模型向公众开放。用户可通过“可图”微信小程序和网页版使用。这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称,“可图”大模型的参数规模达十亿级,这些数据来自开源社区、快手内部构建和自研 ... 阅读全文

    优惠 Adobe Research推出一种使用文生图模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样

  • Adobe Research推出一种使用文生图模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样
    AI
  • Adobe Research推出一种使用文本到图像扩散模型进行高效概念驱动生成的方法,即个性化残差和基于局部注意力的引导采样。它通过训练一个预设的文本条件扩散模型,学习模型部分层的小秩残差(low-rank residuals),来实现高效的概念驱动生成。简单来说,就是教会一个计算机程序,如何根据用户输入的文字描述(比... 阅读全文

    优惠 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量

  • 新型低光照增强技术LighTDiff:专门用于改善手术内窥镜图像的质量
    AI
  • 来自澳大利亚悉尼大学电气工程学院、香港中文大学电子工程学系、香港中文大学深圳研究院、山东大学齐鲁医院的研究人员推出新型低光照增强技术LighTDiff,它专门用于改善手术内窥镜图像的质量。在进行微创手术时,内窥镜提供的图像质量对于医生来说是至关重要的,但在低光照条件下,图像往往难以提供足够的细节,影响手术的精确性和安全... 阅读全文

    优惠 Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画

  • Adobe Research推出LogoMotion:基于大语言模型自动为静态布局生成动画
    AI
  • Adobe Research推出LogoMotion,它是一个基于大语言模型(LLM)的方法,能够自动为静态布局生成动画。这个过程是内容感知的,意味着动画的生成会考虑到布局中的视觉内容和结构。LogoMotion通过两个阶段来实现:视觉上下文的程序合成和程序修复。LogoMotion展示了如何将大型语言模型应用于复杂的... 阅读全文

    优惠 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性

  • 通过使用先进的潜在扩散模型和ControlNet技术,从脑电图数据中解码音乐信息,为音乐生成和脑机接口领域提供了新的视角和可能性
    AI
  • 来自威尼斯福斯卡里大学、罗马第一大学和索尼 CSL的研究人员发布论文,探索使用潜在扩散模型(latent diffusion models)从脑电图(EEG)数据中重建自然主义音乐。脑电图是一种记录大脑活动的技术,而自然主义音乐指的是包含多种乐器、声音和效果的复杂音乐,这类音乐在和声和音色上都很丰富。 主要功能: 该研... 阅读全文

    优惠 华擎科技推出AI软件工具AI QuickSet ,轻松安装 Stable Diffusion,支持 OpenVINO

  • 华擎科技推出AI软件工具AI QuickSet ,轻松安装 Stable Diffusion,支持 OpenVINO
    AI
  • 华擎科技近期推出了专为英特尔锐炫 Arc A 系列显卡设计的 AI QuickSet 软件工具,这一举措进一步扩展了其在 AI 应用领域的软件支持。以下是关于这一更新的详细信息: AI QuickSet 软件工具简介 发布时间:去年底首次发布,最近更新支持英特尔 Arc A 系列显卡。 操作系统支持:最初支持 Wind... 阅读全文

    优惠 基于扩散的文生图模型的可扩展性

  • 基于扩散的文生图模型的可扩展性
    AI
  • 亚马逊AWS发布论文探讨了基于扩散的文本到图像生成(Text-to-Image, T2I)模型的可扩展性。扩散模型是一种通过逐步去噪来生成图像的深度学习技术。论文的主要目的是理解如何有效地扩展这些模型以提高性能,同时降低成本。 主要功能和特点: 模型和数据集的扩展性研究:论文通过大量实验研究了扩展模型和数据集对性能的影... 阅读全文

    优惠 潜在扩散模型扩展特性研究

  • 潜在扩散模型扩展特性研究
    AI
  • 来自谷歌和约翰霍普金斯大学的研究人员探讨了潜在扩散模型(Latent Diffusion Models,简称LDMs)的扩展特性,特别关注了它们在采样效率方面的表现。潜在扩散模型是一种用于生成图像的深度学习模型,可以通过文本描述来创建高质量的图像。尽管这类模型在图像合成、视频制作、音频生成等领域表现出色,但它们的一个主... 阅读全文

    优惠 一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目DiscordBot-EdgeGPT

  • 一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目DiscordBot-EdgeGPT
    AI
  • DiscordBot-EdgeGPT是一个可以在在Discord bot上使用Copilot和Bing Image Creator、DALLE-3的开源项目。... 阅读全文