标签:MonoFormer
AI
2个月前 (09-26)AI
百度 VIS 和悉尼科技大学的研究人员推出一种新型多模态方法,称为MonoFormer。这个方法的核心思想是使用单一的Transformer来处理两种不同的生成任务:基于自回归(autoregression)的离散文本生成和基于扩散(diffusion)的连续视觉生成。例如,你有一台机器,它可以读取一段文本然后创造出与... 阅读全文