找回密码
 立即注册
查看: 502|回复: 0

『阿里达摩院 | 文本生成视频大模型』可以试玩,支持一下国产LLM

[复制链接]

22

主题

1

回帖

231

积分

积分
231
发表于 2023-4-5 10:45:55 | 显示全部楼层 |阅读模式
文本生成视频大模型-英文-通用领域  基于多阶段文本到视频生成扩散模型, 输入描述文本,返回符合文本描述的视频。仅支持英文输入。
模型由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成,整体模型参数约17亿。扩散模型采用Unet3D结构,通过从纯高斯噪声视频中,迭代去噪的过程,实现视频生成的功能。

试玩地址1  试玩地址2
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|club.free-ai.top

GMT+8, 2025-3-14 16:08

快速回复 返回顶部 返回列表