AI语音克隆是一项利用深度学习和人工智能技术,将一个人的声音采集、分析、建模、合成为一个新的声音,从而实现对该人声音的复制和克隆。利用AI语音克隆技术,你可以实现:克隆任何人的声音,包括名人、朋友、家人等,从而实现语音模仿、声音变换、语音合成等有趣的玩法,可以为智能语音助手和虚拟人物提供更加真实、自然的声音,从而提升交互体验和用户感知,将不同发音人的语音样本融合在一起,从而实现多发音人的语音合成,将个人的语音记录克隆备份,从而实现语音留声、语音回忆等功能,将一个人的语音转换为另一个人的语音,从而实现语音转换等功能。
听起来很高大上,其实操作起来也很简单,而且下面这个方法还是完全免费的。
首先,准备好自己的声音文件。可以在电脑或手机上录音。录音的时候,周围环境要安静,不能有噪声,也不要有其他背景声音。录制的音频不要太长,也不要太短,要在2秒~10秒之间。一段音频最好就只录制一段话。声音的情绪尽量稳定,以说话的语料为主,不要有『嗯』『啊』『哈』之类的语气词。可以提前准备好10句以上的话,然后照着念。声音录制好后,如果是mp3格式,需要通过格式工厂等格式转换软件将mp3格式转换成 Wav 格式 。
然后,打开百度飞浆的这个项目页面:【有手就行】使用你自己的声音做语音合成
点击运行一下
然后选择运行环境,注意必须使用32G以上的GPU环境
然后环境启动成功,点击进入
安装试验所需环境:下面红色圆框标注的那里有一个运行按钮,点击运行
接下来,一步步操作,先点击第一步的小三角形运行按钮
然后,打开点击左侧的文件按钮,然后会看到很多文件夹,打开work文件夹,然后打开data文件夹,点击上传按钮,把我们准备的录音文件上传到data文件夹里
然后在这里,把示例3最后三行代码前面的#删掉,删掉后会变成黑色字体,然后点击运行
接下来,就不需要做什么配置了,每个步骤点击运行。注意,要等前面一个步骤运行结束,然再点击下一个步骤。
模型训练成功后,点击打包压缩
数据模型压缩成功后,会在文件夹下面生成一个demo.zip文件,这就是训练成功的声音模型。利用这个模型,我们就可以将任何文本合成成自己的声音。
在“5.3.2在其它的坏境中使用微调后旳模型”这个步骤中,=这个语句括号里面,可以输入我们想生成的声音文本。
然后运行,点击三角形就可以听到AI克隆出的声音,点击右边三个小圆点,可以下载这个音频文件,点击即可。
不过,这样只能一条条的克隆自己的声音,想要批量的克隆,需要懂一些编程,自己进行配置。详细步骤见《【有手就行】使用自己的声音做语音合成(二)本地部署》这篇文章。