如何克隆别人的声音,声音能克隆吗
环境windows 10 64位
python 3.8
pytorch 1.7 cu101
工具
前言今天给大家介绍一个语音合成的工具,嘲鸟,仅仅使用5秒钟就可以模拟出你想要的声音,难能可贵的是,知更鸟还支持普通话。
安装首先安装ffmpeg,它是用来进行音视频处理的。从官网下载编译好的二进制文件http://ffmpeg.org/download.html,尽量下载较新的版本,并将其路径加入到系统环境变量中
嘲鸟工具创建一个全新的大蟒虚拟环境
conda create-npytorch 1.7 python=3.8 condaactivatepytorch 1.7接下来去下载嘲鸫源码,并安装相应依赖
git克隆https://github。com/babysor/mock bird。gitcd模拟鸟#安装地面动力装置版火炬和火炬视觉piinstalltorch==1。7 .1 Cu 101火炬视野==0。8 .2 Cu 101火炬音响==0。7 .2-f https://下载。py火炬。org/whl/torch _ stablehtml #安装其他依赖pipi安装要求。txt #这个库是用来进行噪音过滤的pipinstallwebrtcvad#如果是Linux操作系统操作系统的话,使用恰当的安装ffmpegsudoaptinstallffmpegportaudio 19-devpipiinstallpyaudio为了进行测试,还需要下载预训练模型
链接:https://潘。百度一下。com/s/1 NJ 3 gwzwwovh 6 qfpl 9 lsazw
提取码:nbmc
下载完成后,将已保存_模型文件夹放在源码目录下的合成器文件夹下
测试使用作者提供的预训练模型测试时,会报错
运行时错误:加载state _ dictforTacotron中的错误:sizemismatchforencoder。嵌入。重量:copyingaparamwithshapetroch .来自检查点的大小([70,512]),theshapeincurrentmodelistorch .大小([75,512])。这个错误需要修改源码文件合成器/utils/symbols.py,将
_ characters= abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz 1234567890!(),-. 改成
_ characters= abcdefghijklmnopqrstuvwxyzabcdefghijklmnopqrstuvwxyz 12340!(),-. 然后就可以开始进行测试了
pythondemo_toolbox.py
嘲鸫这里直接录音测试,点击记录,完成后点击玩可以播放编码器选择预训练、合成器选择史策,点击右上框的合成并编码,完成后就可以听到合成后的声音了
嘲鸫参考资料https://github.com/babysor/MockingBird
https://xugaoxiang.com/2019/12/08/anaconda/
https://github.com/babysor/MockingBird/issues/37