导航首页 »  AI 视频生成 »  VLOGGER
VLOGGER 站点域名:enriccorona.github.io 站点星级: 是否推荐:否 日浏览数:1 次 月浏览数:9 次 总浏览数:28 次 所属分类:AI 视频生成 百度权重: 移动权重: 搜狗权重: 移动权重: 头条权重: 360权重: 神马权重: 收录日期:2024-09-04 14:56:33 Whois查询 备案查询 综合查询 收录查询 百度权重
站点信息

描述:


VLOGGER是一种从单张人物输入图像生成文本和音频驱动的讲话人类视频的方法,它建立在最近生成扩散模型的成功基础上。我们的方法包括1)一个随机的人类到3D运动扩散模型,以及2)一个新颖的基于扩散的架构,通过时间和空间控制增强文本到图像模型。这种方法能够生成长度可变的高质量视频,并且通过对人类面部和身体的高级表达方式轻松可控。与以前的工作不同,我们的方法不需要为每个人训练,也不依赖于人脸检测和裁剪,生成完整的图像(而不仅仅是面部或嘴唇),并考虑到正确合成交流人类所需的广泛场景(例如可见的躯干或多样性主体身份)。