今天,给大家介绍一个算法。
AI 算法 5 秒钟,就能克隆你的声音,你信吗?
听听这段音频,猜猜看是 AI 合成音,还是真人录音?
答案是:AI 合成。
这个人的原始声音在这里:
你给这个 AI 克隆声音的算法打几分?
录制一段音频,就可以根据输入的文字,5s 即可自动生成对应的合成音。
突然有个大胆的想法,你说女朋友要是哪天突然不承认自己说过了某句话,我就给她造一份!
兄弟们,我做的对吗?
这个算法是基于比较著名的 Real Time Voice 实现的。
是最近开源的中文版。
论文的名字是:
from to Text-To-
简单介绍下:
算法分为三个模块:模块、模块、模块。
模块将说话人的声音转换成人声的数字编码( )
模块将文本转换成梅尔频谱(mel-)
模块将梅尔频谱(mel-)转换成(波形)
具体的算法原理,大家可以先看论文:
今天主要聊聊,这个算法怎么玩。
项目地址:
有深度学习基础的话,这个应该不难。
就是部署环境,分四步:
配置 开发环境
根据项目 .txt 安装第三方库依赖
下载权重文件
下载训练集,这个几十G,有点大
具体的配置方法,直接看这里:
ADME-CN.md
环境搭建搞定后,就可以运行代码了。
有两种模式可以启动,Web 模式和工具箱模式。
在项目根目录运行:
web.py
即可开启 Web ,打开地址 :8080 就能操作了。
这个界面比较简陋,建议使用工具箱模式。
.py -d 《》
就是下载好的数据集的地址。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...