让照片开口讲话，让视频人物对口型_ffmpeg 对口型

作者：空白诗007 | 2024-08-16 20:14:07

踩

ffmpeg 对口型

代码地址：https://github.com/Rudrabha/Wav2Lip
我用的python版本是3.10

1. 安装ffmpeg
windows：https://www.gyan.dev/ffmpeg/builds/ffmpeg-git-full.7z解压后bin目录添加到环境变量。
Ubuntu：apt-get install ffmpeg
2. 安装依赖

 pip install -r requirements.txt
1

直接安装，使用cpu处理音视频文件，处理速度较慢
或者（有显卡的）删除requirements.txt里面的torch、torchvision，从https://pytorch.org/get-started/locally下载gpu版本
在这里插入图片描述

执行命令

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
1

3. 下载人脸切割处理模型

下载https://www.adrianbulat.com/downloads/python-fan/s3fd-619a316812.pth放入Wav2Lip-master\face_detection\detection\sfd目录并且重命名为s3fd.pth
在这里插入图片描述

4. 下载权重模型
点此下载权重文件放入项目根目录
在这里插入图片描述

5. 准备一张人物照片或者人物视频（人脸清晰），一个音频（视频）文件
在这里插入图片描述

python inference.py --checkpoint_path wav2lip_gan.pth --face video.mp4 --audio audio.mp3
1

结果在results文件夹中
在这里插入图片描述

6. 看效果
图片效果：

视频效果（视频经过其他处理）：

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/空白诗007/article/detail/989657