人工智能
优惠 日本NTT推出声音转换技术FastVoiceGrad
标签:FastVoiceGrad
AI
3个月前 (09-05)AI
日本NTT推出一种声音转换技术FastVoiceGrad,声音转换技术能够将一个人的声音转换成另一个人的声音,同时不改变语言内容。这项技术在多个领域都有潜在的应用价值,比如在语音合成、语音识别和娱乐产业中。例如,你正在制作一个有声读物应用,需要将文本自动转换成语音。使用FastVoiceGrad,你可以将任何文本读成听... 阅读全文
优惠 新型视频理解框架VideoLLaMB:专门设计来处理和理解长时间视频内容
标签:VideoLLaMB
AI
3个月前 (09-04)AI
北京通用人工智能研究院 (BIGAI)、美国加州大学圣克鲁斯分校计算机科学与工程系、北京大学王选计算机技术研究所和通用人工智能国家重点实验室的研究人员推出新型视频理解框架VideoLLaMB,这个框架专门设计来处理和理解长时间视频内容,它通过一种特别的方式来编码整个视频序列,同时保留历史视觉数据,以此来提高模型在各种任... 阅读全文
优惠 CrossViewDiff:用于卫星图像到街景图像合成的跨视角扩散模型
标签:CrossViewDiff
AI
3个月前 (09-02)AI
中山大学、上海人工智能实验室和商汤科技的研究人员推出一个名为CrossViewDiff的模型,它是一个用于卫星图像到街景图像合成的跨视角扩散模型。简单来说,这个模型能够将从高空卫星拍摄的图像转换成仿佛在地面上拍摄的街景图像。 项目主页:https://opendatalab.github.io/CrossViewDif... 阅读全文