DIAMOND

优惠 新型强化学习智能体DIAMOND:在一个基于扩散模型的世界模型中接受训练

  • 新型强化学习智能体DIAMOND:在一个基于扩散模型的世界模型中接受训练
    AI
  • 爱丁堡大学、微软研究院、日内瓦大学的研究人员推出新型强化学习(Reinforcement Learning, RL)智能体DIAMOND(DIffusion As a Model Of eNvironment Dreams),它在一个基于扩散模型的世界模型中接受训练。扩散模型是一种用于图像生成的先进方法,它通过学习逆向... 阅读全文