您现在的位置是:首页 >技术教程 >研究音转唇项目网站首页技术教程
研究音转唇项目
简介研究音转唇项目
https://github.com/Rudrabha/Wav2Lip
1. 下载代码
https://github.com/Rudrabha/Wav2Lip
2. 安装相应的包
docker 用paddlepaddle的包
pip install -r requirements.txt
3. 在filelists文件夹下建main文件夹,里面放经过syncnet处理后的video数据,处理成mp4文件
4. 训练
训练音唇同步
python color_syncnet_train.py --data_root ./preprocessed/filelistsmain --checkpoint_dir ./checkpoints/new --checkpoint_path
loss要收敛到约0.25
训练生成器
python hq_wav2lip_train.py --data_root ./preprocessed/filelistsmain --checkpoint_dir ./checkpoints/new --syncnet_checkpoint_path ./checkpoints/lipsync_expert.pth --checkpoint_path ./checkpoints/wav2lip_gan.pth --disc_checkpoint_path ./checkpoints/visual_quality_disc.pth
loss收敛到约0.2
4. 推断
python inference.py --checkpoint_path ./checkpoints/new/checkpoint_step000261000.pth --face ./work/video6.mp4 --audio ./work/video6.wav
Wav2Lip-GFPGAN/GFPGAN-master at main · ajay-sainy/Wav2Lip-GFPGAN · GitHub
风语者!平时喜欢研究各种技术,目前在从事后端开发工作,热爱生活、热爱工作。