[更新日期:2019年08月08日 。咨询邮件,请务必附件样例以及有问题脚本,出错提示等,否则不予回复]
SPPAS工具是由 Bigi( et – Aix-en- – )开发的。在网上提供免费下载及使用。这是一款目前比较流行的自动标注,音段对齐的工具,目前应用于法语、英语、汉语等都有不错的效果。虽然音段自动对齐的准确率并不完善,但是对于一般的语音研究者来说,能够自动产生出带有音段信息,并且边界相对整齐的Praat标注文件已经是大大提升了工作效率。所以推荐给进行语音研究,而且数据量规模很大的朋友。
有关于这个工具的详细说明,介绍,文档,由此相关的论文等信息请参阅官方网站:。在这里只是把使用的时候注意的一些地方写出来,以方便一些可能对插件包安装使用并不熟悉的同学。
首先是一些使用时的注意事项,请想使用软件的同学务必仔细看一下是否符合。
这其中对于如何把工具环境安装好,对于只有文科基础的同学不太容易操作,但是一旦安装好了,以后就可以直接使用了。
本文力求对每个环节都写的简单一些,让更多想使用这个工具的人能够很快的将工具配置好,节省自己的工作效率。
1. 安装
这部分主要就是大概翻译了一下官方网站上的这一部分。
环境下的安装:官方网站现在没有区分如何安装32位以及64位,这是因为现在的系统比如win7,win10是64位的很多,而32位的软件在64位的电脑上运行是没有问题的。所以官方网站只提供了一种,就是32位的安装,如果你的电脑系统是64位,同样也可以使用,我自己已经做过测试。没有问题。 的官方网站是:,下载页在:,请选择32位下载, x86 MSI 。上面已经说明过,不需要专门针对64位的机器下载64位,尤其对于初学者,32位可以将的bin目录增加到系统环境变量里,而64位有时候需要手工增加,如果你熟悉这个操作,可以选择64位安装,这里以32位为准。安装过程即和常规安装软件的过程类似,第一步使用默认方式就可以,即安装给该系统所有用户使用。
第二步,安装的路径,不建议目录太深,最好在常用盘,比如C盘或者D盘的根目录下,如图所示,在C盘根目录下的就可以,27表示是2.7版本,有其它开发需求的朋友可能也会安装.4以上版本,所以这里也要注意区分。
在这一步,给出了64位和32位安装的区别,左边是64位,右边是32位,右边有一个选项,可以将.exe设置到系统的环境变量里。
最后安装成功。
是辅助实现可视化界面的。可以根据前面安装选择32位或者64位:32位:64位: 安装过程如下,第一步直接点下一步就可以。
这一步也是选择接受协议 the 直接点下一步。
第三步很关键,这个路径一定要和前面目录保持一致,在本例中安装在C盘,则象下面这样,这样的路径才是正确的。site-表示作为一个 模块包,在里。
最后,这三个选项默认都选中,点击.
= 4.1)”>Click here to ( >= 4.1)这个组件不需要安装,直接解压到一个目录里打开这个目录,打开bin目录,找到.exe,注意因为本文下载的是 4.3.1版本,所以其实这个文件名称是-4.3.1.exe,即要把这个文件拷贝到C:\目录下,并且改名为:.exe注意:64位机器不需要找专门的这个版本,就使用和第(3)同样的方式操作就可以了,已经测试过,是成功了。
SPPAS工具的下载安装 下载新版本的SPPAS。下载后直接解压到磁盘根目录下,比如D盘下。D:sppas,目录级别不要太深。打开后,直接打开里面的sppas.bat,就可以运行了。
打开之后是这样的界面,注意里面需要设置结果文件为,现在软件默认的是xra文件。
2. 制作声音文件和文本 批量制作声音文件和文本文件
产生的文件内容如下,之所以使用这样的工具产生文本,主要是为了产生UTF-8格式的文本文件。
3. 导入SPPAS进行切分 经过上面的步骤,我们已经制作了批量的声音文件和文本文件,把这些文件放在同一个目录内:
然后打开SPPAS这个工具,点击Add files将声音文件添加到窗口里,同时,有同样文件名的txt也会被添加到窗口里,把这些文件通过使用ctrl或者shift键,全部选择,然后把右侧的几个对齐的选项选择,并且在语言里选择相应的语言,比如这里选择的是中文,cmn。
点击右下角的这个长的按钮,就是执行按钮,然后系统就会自动产生出来对齐音段的文件。一般情况下,会同时产生几个
我们只需要最终的结果-.文件。这就是最终的结果:可以看到,准确度并不高,但是省去了很多人工的添加边界,输入字符的过程。