相信很多视频创作者都多少使用过剪映,它比PR等传统软件具备更多智能化的功能,这也让普通人更容易上手创作和剪辑视频,尤其它的自动字幕功能,识别准确度很棒,又是集成在软件里面,用起来真的就很难回去了,甚至不少人开始用这个软件,就是为了它的这个自动加字幕的功能。
提供云端字幕识别的成本不菲,即便是财大气粗的字节也终于扛不住了,在今年年中,剪映更新了版本,开始对这个功能进行收费了。
那么有没有一些效果不错,而且是免费的自动生成字幕软件呢?
答案是有的,随着AI技术的发展,有不少AI团队把自己花巨额成本研发的模型开源出来给大家免费使用,使得众多应用开发者有机会在它们的基础上去开发各类的应用,其中 OpenAI 的 Whisper 模型,就是一个出色的开源语音识别模型。
下面给大家介绍的这个软件就可以帮大家很方便在自己电脑上来运行 Whisper 模型。
软件主页:33字幕
它同时集成了Whisper.cpp和FasterWhisper两种实现。
推荐Mac电脑使用Whisper.cpp,如果支持Nvidia Cuda的,则可以考虑用FasterWhisper。
通过33字幕,你只要把模型文件安装到相关目录,就可以免费使用本地识别字幕功能了,包括 Large-V2 模型。
Large-V2的表现已经相当准确了,当然如果你想解锁全部模型,也仅需 ¥99 的年费,就可以无限制使用了。
除了字幕自动识别,软件完善的字幕处理功能,包括修改错别字,调整时间抽、字幕翻译等,机器识别很难100%正确,这些功能可以帮助你获得更加完美的字幕。
值得注意的是,尽管在自己电脑运行识别字幕模型的方案听起来很好,但是前提是要有一台性能比较出色的电脑,如果只能调用CPU,本地识别起来的速度可能会很慢。
比如你是Mac M系列芯片的电脑或者配置了Nvidia 显卡的Windows电脑,就非常推荐你把电脑的性能用起来,本地识别还可以得到更好的隐私保护。
类似支持Whisper的客户端软件还有 Buzz、MemoAI 等,都可以支持本地识别,但Buzz功能比较简陋,MemoAI的GPU加速会需要收费。33字幕默认自动开启GPU,处理字幕的功能也最完备。
建议大家都可以去试用对比看看,如果是制作字幕的场景,这里比较推荐33字幕。