是一款上的开源字幕编辑软件,最新版中集成了vosk和两种语音识别引擎,使用者可以利用其中任意一种在本地为视频自动生成字幕。
1.下载软件
2.设置语言
3.语音识别
有两种方式可供使用,vosk速度较快,一个多小时的视频,本人的显卡只用十几分钟就跑完了,则比较慢,一个多小时的视频,跑两个多小时,large则要跑九个小时,但相对而言也更精准些。
4.模型下载
vosk的配置需求较小,模型无脑选大的就行了。的配置需求就比较高了,本人用跑,用了0.8g显存,跑large占用显存则飙升到了3g,但效果反而不如,会翻译出许多莫名其妙的东西。因而如果是平民玩家,想要速度就选vosk,想要准确就选,如果是土豪请随意。
5.字幕翻译
此软件自动翻译调用的是谷歌的免费api,如果是出错请用魔法,如果不会可以把字幕文件先保存,之后用文本文档打开,用网页翻译后再粘回去。
6.字幕保存
至于翻译效果,依然是ai的一贯尿性,好的地方特别好,差的地方特别差。因为这几个模型都是外国人开发的,翻译外语的时候鲁棒性特别强,比如说那几部片子,用跑一下,基本上就和真人翻译的差不多了。而日语片就不太行了,有的地方翻译的比较好,有的地方反而不如vosk,往往要把两种翻译结合起来才能看懂是什么意思,一般而言前半段男女主正常交流的时候大致能翻译明白,但是等后半段深入交流的时候,特别是一变音,翻译的就比较一塌糊涂了,可能是ai还不太能明白人类这是在从事什么行为。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...