优惠昆仑推出新型图像生成模型DiT-MoE

AI

推荐人：暴走AI 标签：DiT-MoE 昆仑 AI

9个月前 (07-17)AI

昆仑推出新型图像生成模型DiT-MoE，这个模型的全称是“Diffusion Transformers with Mixture of Experts”。简单来说，它是一种能够生成高质量图像的人工智能系统。它通过模拟一个逐步去噪和降噪的过程，将随机噪声转化为目标数据分布，从而生成图像。例如，你有一个超级聪明的机器人，它... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠提升个性化图像美学评估的规模化能力

AI

推荐人：暴走AI 标签：图像美学评估 AI

10个月前 (07-13)AI

韩国科学技术院发布论文，论文的主题是关于如何提升个性化图像美学评估的规模化能力。简单来说，就是教会计算机如何根据个人的喜好来评估一张图片是否美观。这项技术可以想象成一个能够理解每个人审美偏好的智能助手。例如，你是一名摄影师，你希望从你拍摄的照片中挑选出最具视觉冲击力的作品。你可以上传一些你认为美观的照片给这个系统，系统... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠大型图像描述数据集PixelProse：包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述

AI

推荐人：暴走AI 标签：PixelProse AI

10个月前 (06-18)AI

马里兰大学帕克分校的研究人员推出大型图像描述数据集PixelProse，PixelProse包含了超过1600万个由先进的视觉-语言模型自动生成的图像描述。例如，一个艺术家想要了解他的画作在视觉上给人的感受，PixelProse可以帮助分析图像的美学属性并生成描述，这样艺术家就可以得到关于作品可能给观众带来的情感体验的... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠快手开放自研文生图大模型“可图”

AI

推荐人：暴走AI 标签：可图快手 AI

11个月前 (05-31)AI

快手正式对外发布了其自主研发的文生图大模型“可图”，支持用户进行AI创作图像以及AI形象定制。这是快手首次将其自研的大模型向公众开放。用户可通过“可图”微信小程序和网页版使用。这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称，“可图”大模型的参数规模达十亿级，这些数据来自开源社区、快手内部构建和自研 ... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Adobe Research推出一种使用文生图模型进行高效概念驱动生成的方法，即个性化残差和基于局部注意力的引导采样

AI

推荐人：暴走AI 标签：个性化残差 AI

11个月前 (05-22)AI

Adobe Research推出一种使用文本到图像扩散模型进行高效概念驱动生成的方法，即个性化残差和基于局部注意力的引导采样。它通过训练一个预设的文本条件扩散模型，学习模型部分层的小秩残差（low-rank residuals），来实现高效的概念驱动生成。简单来说，就是教会一个计算机程序，如何根据用户输入的文字描述（比... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠新型低光照增强技术LighTDiff：专门用于改善手术内窥镜图像的质量

AI

推荐人：暴走AI 标签：LighTDiff AI

11个月前 (05-20)AI

来自澳大利亚悉尼大学电气工程学院、香港中文大学电子工程学系、香港中文大学深圳研究院、山东大学齐鲁医院的研究人员推出新型低光照增强技术LighTDiff，它专门用于改善手术内窥镜图像的质量。在进行微创手术时，内窥镜提供的图像质量对于医生来说是至关重要的，但在低光照条件下，图像往往难以提供足够的细节，影响手术的精确性和安全... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠 Adobe Research推出LogoMotion：基于大语言模型自动为静态布局生成动画

AI

推荐人：暴走AI 标签：Adobe LogoMotion AI

11个月前 (05-20)AI

Adobe Research推出LogoMotion，它是一个基于大语言模型（LLM）的方法，能够自动为静态布局生成动画。这个过程是内容感知的，意味着动画的生成会考虑到布局中的视觉内容和结构。LogoMotion通过两个阶段来实现：视觉上下文的程序合成和程序修复。LogoMotion展示了如何将大型语言模型应用于复杂的... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠通过使用先进的潜在扩散模型和ControlNet技术，从脑电图数据中解码音乐信息，为音乐生成和脑机接口领域提供了新的视角和可能性

AI

推荐人：暴走AI 标签：脑电图 AI

11个月前 (05-20)AI

来自威尼斯福斯卡里大学、罗马第一大学和索尼 CSL的研究人员发布论文，探索使用潜在扩散模型（latent diffusion models）从脑电图（EEG）数据中重建自然主义音乐。脑电图是一种记录大脑活动的技术，而自然主义音乐指的是包含多种乐器、声音和效果的复杂音乐，这类音乐在和声和音色上都很丰富。主要功能：该研... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠华擎科技推出AI软件工具AI QuickSet ，轻松安装 Stable Diffusion，支持 OpenVINO

AI

推荐人：暴走AI 标签：AI QuickSet OpenVINO Stable Diffusion 华擎科技 AI

12个月前 (05-10)AI

华擎科技近期推出了专为英特尔锐炫 Arc A 系列显卡设计的 AI QuickSet 软件工具，这一举措进一步扩展了其在 AI 应用领域的软件支持。以下是关于这一更新的详细信息： AI QuickSet 软件工具简介发布时间：去年底首次发布，最近更新支持英特尔 Arc A 系列显卡。操作系统支持：最初支持 Wind... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠基于扩散的文生图模型的可扩展性

AI

推荐人：暴走AI 标签：文生图模型 AI

1年前 (2024-04-04)AI

亚马逊AWS发布论文探讨了基于扩散的文本到图像生成（Text-to-Image, T2I）模型的可扩展性。扩散模型是一种通过逐步去噪来生成图像的深度学习技术。论文的主要目的是理解如何有效地扩展这些模型以提高性能，同时降低成本。主要功能和特点：模型和数据集的扩展性研究：论文通过大量实验研究了扩展模型和数据集对性能的影... 阅读全文

直达链接好 0 不好 0 已关闭评论

优惠潜在扩散模型扩展特性研究

AI

推荐人：暴走AI 标签：潜在扩散模型采样效率 AI

1年前 (2024-04-03)AI

来自谷歌和约翰霍普金斯大学的研究人员探讨了潜在扩散模型（Latent Diffusion Models，简称LDMs）的扩展特性，特别关注了它们在采样效率方面的表现。潜在扩散模型是一种用于生成图像的深度学习模型，可以通过文本描述来创建高质量的图像。尽管这类模型在图像合成、视频制作、音频生成等领域表现出色，但它们的一个主... 阅读全文

直达链接好 0 不好 0 已关闭评论