ai声音克隆软件 so-vits-svc最强声音克隆拟声软件使用教程

默认分类1年前 (2024)发布 admin

3,047 0 0

ChatGPT国内版

文章目录

我们今天介绍一个软件是用来做声音克隆的，比如你可以将你的声音克隆下来，然后将一段任何其他人的录音转换成你的声音。

这个工具的全称是“ VITS Voice Fork”，简称为“so-vits-svc”。

我们今天网上看到的很多孙燕姿AI都是这种方法制作的。我用我自己的声音制作了一段“蜜雪冰城”主题曲，你可以听下像不像我的声音。

环境介绍

我这里列出我的软件安装环境，所有安装步骤都是在该环境中适用。

安装

安装这种工具都是比较麻烦的，而使用conda是简化你的安装过程的利器。

创建虚拟环境

使用conda创建一个虚拟环境，名称是so-vits-svc，名称是你自己任意指定的，创建虚拟环境的好处是环境之间是相互隔离的，

也就是说你这次会安装很多依赖库，这些依赖库不会影响到你其他项目的环境，很多时候版本和依赖库版本不同，

项目之间必须隔离开。

conda create --name so-vits-svc

激活环境：

conda activate so-vits-svc

安装依赖

首先使用下面的命令安装cuda，这是使用英伟达显卡必须的：

conda install -U torch torchaudio --index-url https://download.pytorch.org/whl/cu118

然后安装本软件：

conda install -U so-vits-svc-fork

以上步骤应该比较费时间，我很顺利没有报错。

训练

安装好了上面的软件以后，我们接下来就是要训练一个模型，

本例中，这个模型就是学习的我的声音，

这个模型可以将任意人的声音转换为我的声音。

ai声音克隆软件 so-vits-svc最强声音克隆拟声软件使用教程

我们需要按照下面的步骤整理数据和训练数据。

录音

因为我经常录课，所以我就是把我自己的课程视频转换为音频格式，

如果你没有现成的多媒体资源，你可以自己录制声音，

选择你自己喜欢的录音软件，录制至少十分钟的语音，

音质尽量要好，录制时间越多越好，我使用大概1小时的录音作为训练数据。

完成这个步骤，你将得到一个名字为“.mp3”的文件。

分割

因为训练数据需要的是10秒以内的音频，所以我们需要将上面得到的“.mp3”文件切割成短音频。

这里需要用到一个音频分割软件“”，这个软件可以自动的将音频切分为10秒左右。

安装方法是跟上面类似：

conda create --name audiosilicer python=3.11 # 创建一个虚拟环境命名为audiosilicer
git clone https://github.com/henrymaas/AudioSlicer.git # 将代码下载到本地的文件夹， 这个文件夹名字是AudioSlicer
cd AudioSlicer # 设置工作目录是 AudioSlicer
pip install -r requirements.txt # 安装依赖

这个时候在文件夹下面你可以看到有一个文件“.py”，打开这个文件，修改你的输入文件, 例如我的输入文件是“.mp3”：

1
2
3

# Change the arguments and the input file here
input_file = 'C:\Teste\recording.mp3'
output_dir = 'C:\Teste\'

然后你在命令行运行下面的命令：

1
2

conda activate audiosilicer
python AudioSeg.py

这样在你设置的输出文件夹’C:Teste‘下就可以看到切割好的文件。

训练目录结构

有了数据，下面就开始训练了，首先你要创建一个目录结构，例如我的工作目录是D:devso-vits-svc-fork,

然后在这个文件夹下面创建一个原始数据的文件夹，名字必须为””,

然后在””中创建文件夹为“me”，这是语音的名字，你可以任意命名，最后能代表语音的意义。

把所有切割好的文件复制到me文件夹。

采样

工作目录设置为D:devso-vits-svc-fork，

然后运行命令svc pre-，这个命令生成了一个文件夹，里面存放了采样数据，这是真正用于训练的数据。

ai声音克隆软件 so-vits-svc最强声音克隆拟声软件使用教程

配置文件

运行命令svc pre-，这样会生成一个配置文件，路径是D:devso-vits-svc-fork\44k.json，打开这个文件，

你需要重点关注的是，因为每个人的显卡可能不同， batch size决定的是一次训练多少个样本，如果设置的过大，会导致显卡内存溢出，

如果设置过小，训练时间会太长，我设置的是32，你根据自己的显卡大小决定这个参数。

其他配置参数我们会有单独的教程。

下载模型

运行命令svc pre-，下载模型。

训练

运行命令svc train -t，运行这个命令后就开始训练模型，我花费了2天时间训练完成一个比较满意的效果。

使用

模型训练完成以后，我们开始使用这个模型来生成自己的声音。因为我不会唱歌，但是大家都想听我唱歌。

所以我就用这个方法生成唱歌的声音。

分离人声

首先我下载了一个挖呀挖呀挖视频，因为全网都在唱，我想听听我唱出来是什么样子的。

然后我使用了软件 Vocal 软件，它可以将音乐和唱声分开，

并且支持视频，软件是免费的，地址在：

输入视频后，它生成了两个音频，一个是背景音乐，一个是唱声，我们需要用后者，这个文件名为 (1)_().wav。

转换生成

在命令行运行命令svcg，就会打开一个界面软件，这是so-vits-svc-fork提供的界面。

软件会自动搜索你训练好的模型，所以我没有设置模型的路径，它自动找到了：

你需要设置的就是输入文件，就是我们提取得到的人声文件 (1)_().wav,

然后点击“infer”按钮，就开始生成你的声音了，大概几秒的时间就可以得到转换好的声音。最后我们来听听效果吧：

总结

这个软件生成的拟声效果是惊艳的，很多人听了我”唱”的歌都认为很像。

所以我们可以深挖这个软件还能做什么，本篇教程的主要目的就是记录我的安装和使用过程，

如果大家对这个软件很感兴趣，我们可以出视频教程，然后再深入探讨一下各种配置方法和使用方法。

如果你有什么问题，请在下方留言。

# 默认分类 # 切割 # 录音 # 模型 # 视频 # 音频

© 版权声明

文章版权归作者所有，未经允许请勿转载。

广告也精彩

相关文章

chatgpt国内私有化部署私有化部署ChatGPT

admin

2,546 0

ai软件是做什么用的? ai主要用于设计什么

admin

1,049 0

ai去水印工具 ai短视频去水印

admin

2,546 0

ai里自由变换工具怎么用胜过ChatGPT却鲜为人知的AI工具

admin

2,549 0

chatgpt ai智能对话机器人收费挑战 Google 搜索？OpenAI 发布最强 AI 对话系统 ChatGPT

admin

3,550 0

智能ai自动剪辑软件 AI全自动剪辑软件pc破解版,AI全自动剪辑软件破解版下载

admin

5,038 0

暂无评论

暂无评论...

323AI导航网（323ai.com）—— 精选全球实用AIGC工具箱。 AI人工智能爱好者使用学习必备导航网站，收录了国内外5000+优质AI实用工具网址，一个专业、全面、实用的AIGC工具与AI资讯导航网站，我们聚焦于最新的AI文本、AI绘画、AI视频、ChatGPT、Stable-Diffusion、Midjourney等AI项目，帮助用户发现最前沿的AIGC项目，探索人工智能的无限可能。

友链申请免责声明广告合作关于我们

Copyright © 2025 323AI导航网陕ICP备2023007327号-3