赞
踩
前言:云端训练白嫖谷歌的显卡,本地推理需要有一张3GB显存及以上的N卡
这个地址可以白嫖谷歌,每天有免费的时常,足够(每天)训练一个模型。
笔记本地址:VITS-fast-finetuning.ipynb - Colaboratory (google.com)VITS-fast-finetuning.ipynb - Colaboratory (google.com)VITS-fast-finetuning.ipynb - Colaboratory (google.com)笔记本地址:
此过程大概需要等待几分钟
CJ是中日双语,CJE是中日英三语,根据自己的需要选择
我们用谷歌云盘导入素材,因为这种方法导入很快,如果用本地导入,上传速度慢
用一个文件夹装着你的语音素材(语音素材质量比数量重要),然后压缩这个文件夹,上传到谷歌云盘上
在云盘上点击新建,选择上传文件,上传训练素材
上传完成后,可以看到你上传的压缩包
回到笔记本页面,运行代码块,登录谷歌云盘
登录成功后,可以在左侧看到文件夹目录,根据以下路径可以看到刚刚上传的压缩包
在如图所示位置填写压缩包路径和压缩包名称,然后点击按钮运行代码块,开始上传
直接运行代码块,时间可以比较长,用于识别语音
中日双语模型可勾选,质量更佳;具体可以看绿字说明
复制一个用于装载训练模型的文件夹的路径,没有就创建一个
填入到代码块的这个地方,用于防止出现意外,训练中止又无法保存模型,填入后会边训练边保存节点模型,不用担心文件太多导致谷歌云盘容量不足,达到一定的阈值会自动帮你删除前面保存的模型
设置训练步数,100条短语音一般设置200~300步,不是越多越好,多了会造成过拟化,起到反作用。注意CONTINUE要保持勾选。然后运行代码块
等待训练完成,一般时间较长,可以在谷歌云盘下载训练节点中的模型测试
可选下载到本地、保存到谷歌云盘,如果在训练开始前在代码块里填入了装载模型的文件夹路径,这部可以不做,直接在谷歌云盘下载。
我们至少需要下载两个文件,一个 config.json 配置文件,一个或多个以 .pth 结尾的模型文件
至此,模型训练篇完结
运行项目,等待一会,它会自己打开浏览器。选择说话人,选择语言,点击右边的Generatel按钮开始转换
点击右边选项卡,可以录音,可以上传语音文件;选择说话人,点击转换即可
欢迎学习和交流!!!在这里提醒大家,声音也属于肖像权,具有法律效应,请勿商用,更不要用来做一些违法的事情!!!
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。