视觉-语言数据集

栏目分类

优惠视觉-语言数据集DOCCI：旨在提高文本到图像（T2I）和图像到文本（I2T）研究的质量和深度，通过提供详细的人类标注的英文描述来增强模型学习的能力

推荐人：暴走AI 标签：DOCCI 视觉-语言数据集 AI

12个月前 (05-02)AI

谷歌、普林斯顿大学和北卡罗来纳大学教堂山分校的研究人员推出新的视觉-语言数据集，名为“DOCCI”（Descriptions of Connected and Contrasting Images）。这个数据集旨在提高文本到图像（T2I）和图像到文本（I2T）研究的质量和深度，通过提供详细的人类标注的英文描述来增强模型... 阅读全文

直达链接好 0 不好 0 已关闭评论

推荐类别

栏目分类

开源软件

人工智能

电脑游戏

主机游戏

手机游戏

优惠 视觉-语言数据集DOCCI：旨在提高文本到图像（T2I）和图像到文本（I2T）研究的质量和深度，通过提供详细的人类标注的英文描述来增强模型学习的能力

优惠视觉-语言数据集DOCCI：旨在提高文本到图像（T2I）和图像到文本（I2T）研究的质量和深度，通过提供详细的人类标注的英文描述来增强模型学习的能力