当前位置：首页 > 优惠 >电脑软件>文章详情

阿里达摩院上线文本生成视频大模型：仅支持英文输入，已开放试玩

推荐人：暴走AI| 商城: 工具 | 2年前 (2023-03-22)| 分类：电脑软件 | 热度：367 ℃

已关闭评论

阿里达摩院上线文本生成视频大模型：仅支持英文输入，已开放试玩

工具

阿里达摩院已在 AI 模型社区“魔搭”ModelScope 上线了“文本生成视频大模型”。目前文本生成视频大模型，由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这 3 个子网络组成，整体模型参数约 17 亿，目前仅支持英文输入。扩散模型采用 Unet3D 结构，通过从纯高斯噪声视频中，迭代去噪的过程，实现视频生成的功能。官方介绍称，本模型适用范围较广，能基于任意英文文本描述进行推理，生成视频。

阿里达摩院上线文本生成视频大模型：仅支持英文输入，已开放试玩

模型已经在创空间和 huggingface 上线，可以直接体验，也可以参考该页面自行搭建。模型需要硬件配置大约是 16GB 内存和 16GB GPU 显存。在 ModelScope 框架下，通过调用简单的 Pipeline 即可使用当前模型，其中，输入需为字典格式，合法键值为 'text'，内容为一小段文本。该模型暂仅支持在 GPU 上进行推理。从试玩的结果来看，目前能生成的视频长度多在 2-4 秒，生成等候时间从 20 多秒到 1 分多钟不等。

阿里达摩院

声明： 猎游人每天为你带来最新的游戏和硬件打折情报，帮你精心挑选值得玩的游戏，让您的钱花的更值！本站信息大部分来自于网友爆料，如果您发现了优质的游戏或好的价格，不妨爆料给我们吧（谢绝任何商业爆料）！点此爆料

上一篇： 3D在线编辑器、3D普惠素材平台「堆友」，正版素材、全量免费商用

下一篇： Opera浏览器最新版（97.0.4719.26 ）更新：集成 ChatGPT 和 AI 总结功能

0条评论

暂时木有评论

猜你喜欢

查看更多商品

我要爆料我的收藏顶部

© Copyright2019-2024 | 版权所有：猎游人| 皖ICP备18025588号-1

快速登录