今天要给大家介绍的软件是:33字幕。
这篇文章除了给大家介绍软件的功能特点,还会告诉大家如何在33字幕内集成本地模型,来实现免费给视频加字幕或生成文稿的能力。
语音转文本和制作字幕的软件这么多,为什么选择33字幕?
理由1: 不花钱就能用
由于语音识别需要消耗巨大的算力,所以很多语音转写或字幕软件,都是通过按音频时长来进行收费,收费便宜点的,也要在10元左右一小时。
而33字幕由于支持使用本机算力进行识别,因此可以免费提供给大家使用,当然我们也提供了体验更好的云端识别能力,当然这个就需要充值算力了。
有小伙伴可能会说,剪映也能免费识别字幕呀~
确实,在剪映里面直接生成字幕会更加方便。但是如果需要翻译文本,剪映就不支持了,而且剪映无法支持日语等小语种的识别,时长限制,编辑不方便等等~
理由2: 准确度超高
33字幕是基于Whisper模型进行打造的,它的识别准确度非常高,尤其是英语,更是接近真人的识别水平。
在很多测试用例中,我们发现它的表现甚至比很多商用的模型要更出色,我们的网站主页也有一些比较的测试案例,感兴趣的朋友可以自行看看。
当然,识别模型本身也有不少问题,比如有时候时间轴不准,出现幻句等。
针对模型出现的问题,我们也做了优化处理,尤其是 FasterWhisper 引擎,时间轴会更加准确。
理由3: 强大的编辑能力
大家知道,目前语音识别是不可能做到100%准确的。因此后期人工参与编辑是必不可少的,你会发现,有一个好用的字幕编辑器,才能让你真正实现事半功倍,这也是我们花了非常多力气的一部分。
对于机器识别可能会碰到的问题,总结一下大概有:
- 断句太长或不合理
- 时间轴不正确
- 出现错别字
对于断句不合理的问题,我们做了智能断句,你可以设置最大句长,33字幕会根据这个参数来优化每句的长度:
在优化之后,本地识别的时间轴问题基本得到了解决,但是也不能保证100%没有问题,这个时候,你依然可以通过波形图,来可视化微调时间轴:
另外,我们还提供了许多实用的小功能,来提升你的处理效率:
理由4: 独家台词搜索功能
如果你想构建一个台词搜索引擎,来方便搜索一些外语短语单词,或者用来剪辑台词对应的视频片段,那目前可能就只有33字幕这个选择了。
33字幕会默认按行解析和全文索引字幕内容,并且双语字幕和多语言。
相信这个功能对于视频创作者和外语老师们,将非常有用。
理由5: 更强的AI文本翻译
普通的字幕软件,一般只是集成了其中一家机器翻译接口提供商,然后前端通过字数来向收费。
而33字幕,则是直接集成了多家机器翻译平台,让用户可以自行填入自己申请的接口key,这样做可以让大家以最低的成本去使用机器翻译,如果使用量没有超过平台的限度,甚至可以永久免费去使用。
如果是通过自己的账号来使用翻译功能,没有中间商挣差价,33字幕也不会收取任何算力费用。
除此之外,我们还支持了目前领先的大语言模型来做翻译,OpenAI 的 ChatGPT 和 国内的智谱AI都做了支持:
并且,翻译的提示词也是完全开放的,让大家可以进一步去优化翻译效果:
理由6: 一站式压制字幕
通过33字幕,可以一站式为你的视频加上字幕,不管是打包软字幕还是硬字幕都是支持的。
并且还能设置和实时预览字幕的样式,不用切换到视频后期软件就能一键给视频加上字幕了。
如何使用本地识别?
33字幕是目前唯一一个同时集成了 Whisper.cpp 和 FasterWhisper 两种本地识别引擎的软件,这两个引擎的区别主要是:
Whisper.cpp同时支持在Apple M芯片和Nvidia Cuda平台上启用GPU加速处理,这样可以大大增加识别速度,而FasterWhisper目前只支持cuda加速,但是使用FasterWhisper能够获得更加准确的时间轴。
如果你是Mac设备,建议先试一下Whisper.cpp;如果有Nvidia显卡,建议首选FasterWhisper。
只要安装好本地模型,不管你要给多少音视频转文本或生成字幕,都不会产生算力费用,可以随心用了。
安装步骤也非常简单:只需要把模型文件放到相应的目录下就可以了,具体步骤可以参考网站上的教程引导。
http://docs.33subs.com/#/asr_local
除了上面提到的功能特点,33字幕还能进行AI总结、批量处理、按台词快速剪辑音频视频等强大的功能,具体欢迎去下载体验,篇幅有限,就不一一介绍了。