西安交通大学开源了人工智能SadTalker模型,通过从音频中学习生成3D运动系数,使用全新的3D面部渲染器来生成头部运动,可以实现图片+音频就能生成高质量的视频。内含多个踩坑的解决办法,值得玩一玩。
1、sadtalker安装
1.1 windows运行环境构建
1.2、Linux安装,推荐,我就是用的这个环境
Installing anaconda, python and git.
去下载:https://www.anaconda.com/download#downloads
安装