ai 标注工具 免费AI数据标注工具-多功能语音音频标注软件

默认分类1年前 (2023)发布 admin
1,160 0
ChatGPT国内版

工欲善其事,必先利其器

标注工具是数据标注行业的基础,一款好用的标注工具是提升标注效率与产出高质量标注数据的关键。

常见的标注类型有:图片标注、语音标注、视频标注、2D框、语义分割、多边形分割、点标注、线标注、3D立方体标注…….

当然不同的标注项目类型,用到的标注工具也是不同的,今天呢,就给大家介绍一款非常好用的语音处理分析软件--Praat。不管是做语音识别的小伙伴还是做标注的小伙伴都可以学习一下,非常好用。

Praat语音学软件

Praat 语音学软件,原名Praat: doing by ,通常简称 Praat,是一款跨平台的多功能语音学专业软件,主要用于对数字化的语音信号进行分析、标注、处理及合成等实验,同时生成各种语图和文字报表。

该软件可以跨多个平台使用,在标、、 Linux、、、等不同的操作系统。它可以对语音信号进行采集、分析及标注,还可以对其进行滤波和转换。目前,Praat已经成为世界上实验语音学、语言学、语言调查、语言处理等相关领域的研究人员普遍使用的软件。如图所示是Prat语音数据标注窗口。

Praat可以做哪些事

1.频谱分析

2.基频分析

3.强度分析

4.共振峰分析

5.语音标注

6.语音参数调整和合成

7.提前语音数据

8.语音数据的统计分析

是不是非常牛?这篇文章主要是要介绍标注语音时的工具使用,所以呢这里只介绍第五个语音标注

ai 标注工具 免费AI数据标注工具-多功能语音音频标注软件

Praat语音学软件使用

· 导入语音文件

点击 praat —>open —> read from file —> 找到你打开的文件 —> 打开,文件被添加在了praat 中;

· 生成 文件

利用Praat进行语音数据标注生成的标注对象是一个后级名为“”的文件,它是一种“分段”文件,详细记录了语音的总时长、每一个标注层内所有标注区间的时长及标注内容等信息。

选中要转写的语音文件 —> – —> To … —>语音文件分层(三层)如下图—>点击 OK 生成 文件;

· 编辑语音和 文件

按Ctr同时选择wav和对应, —> 选择View & Edit开始标注

同时选中语音文件和 文件View & Edit;如图

·标注设置

在弹出的窗口中,选择File->,将Show IPA chart给去掉勾选,这样右边不会显示字符表

Praat标注技巧

·认识语图上的几个主要特征

ai 标注工具 免费AI数据标注工具-多功能语音音频标注软件

如果看不到基频线,共振峰线或者音强线,使用上菜单上的show pitch, show , show 即可

·播放音频

【1】按Tab键可以播放音频,Esc键取消

【2】或按下方的灰色时间段也可以播放音频

·标注分界线

·给边界区域添加文字

讲到这里也有人说了,全是英文版的,不好理解,标注起来可能会乱的,没关系,Praat也有汉化版,接下来我们就从标注方面看看汉化版的一个操作

利用Praat做语音标注

注:这里提示一下,软件会有很多快捷键,可以在使用的时候方便大家进行标注。

语音标注

以上就是Praat在数据标注过程中比较重要的应用及技巧,虽然Praat软件提供了一种语音数据标注的方法,但在标注多段落的长语音时仍存在很大局限性

另外,对于说话人角色、性别以及语音是否有效等属性,只能通过新建多个标注层来完成对语音的详细标注,这无疑大大降低了工作效率,总而言之,Praat软件可以实现语音数据标注的基本功能,但在处理复杂场景的语音数据标注任务时仍有不足,后面小编会继续给大家介绍其他的免费标注工具

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...