欢迎光临龚老师的博客
分享知识,收获快乐

Buzz 免费开源语音识别工具,将录音或影片快速转为纯文字、字幕文件

内容纲要
Buzz 免费开源语音识别工具,将录音或影片快速转为纯文字、字幕文件
Copyright: lenetsnikolai / 123rf stock photos

如果要将录音、视频内容转为文字档案,以往要透过人工方式手动缮打逐字稿,不但很耗费时间,也可能会出现不少错误,现在透过人工智能 AI 技术可以使用机器进行声音辨识,几秒钟时间就能完成转换,对于制作影片字幕来说也会很有帮助,之前整理过「免费逐字稿软件:10 个将录音档、语音转文字工具推荐」 收录很多辨识工具,大部分可在有限制的情况下免费使用,其中 Vocol.ai 和雅婷逐字稿都是台湾公司,对中文内容甚至台语都有相当好的辨识效果。

 

本文要介绍「Buzz」是一个开放源代码工具,可以在用户的电脑上进行离线的语音识别、转录和翻译工作,背后的技术为 OpenAI 旗下 Whisper 技术,和之前介绍过的 MacWhisper、Whisper JAX 相同,利用麦克风输入声音并快速转换成纯文字(也能加上时间戳记),或是导入音频档、影片文件再使用预先选择的模型进行辨识转换,此外,还内建翻译功能,遇到外文时可以实时转录、翻译为中文或特定语言输出。

Buzz 支持 Mac、Windows 和 Linux 三大操作系统,可导入音频或视频文件、并将文本记录导出为 TXT、SRT 和 VTT 三种格式,支持的模型包括 Whisper、Whisper.cpp、Faster Whisper、兼容 Whisper 的 Hugging Face 模型和 OpenAI Whisper API 。

Buzz
https://chidiwilliams.github.io/buzz/docsGitHub

使用教学

开启 Buzz 的 GitHub 页面后点选「Releases」,从最新版本下方找到要下载的版本,提供 Windows、Mac 和 Linux 适用的安装程序。

Buzz

Windows 就照着一般安装方式执行安装,Mac 则是将 Buzz 拖曳到应用程序文件夹。

Buzz

如果要使用麦克风录音、收音,实时辨识并转换为文字稿,点击左上角「Record」录音按钮。

Buzz

默认使用的模型为 Whisper、数据库 Tiny,进行的方式是转录(transcribe)也就是将声音转为纯文字,若有需要将内容翻译成其他语言可在这里切换为「translate」,语言部分默认为自动侦测、选择要输入声音的设备后点选右上角录音就会开始转录、识别并转换为文字文件。

Buzz

第一次使用时Buzz会先下载语言模型相关档案,有些容量较大,会需要一段时间取得数据,这些数据就适用于稍后让软件可以识别语音内容,同时将它们转换为文字格式,Whisper技术能够识别超过100种语言,准确度高而且几乎没有使用限制。

Buzz

另一个转录方式是导入媒体档案,点击上方菜单后就会有「Import Media File」导入媒体档案,在这里可选择音频或影片,丢进去Buzz进行声音的辨识,将内容转换为文字或是字幕文件。

Buzz

在导入后一样能选择使用的语言模型、任务内容、语言,下方选择要导出的文件格式:TXT、SRT或VTT。

Buzz

点击执行后Buzz就会开始进行转录,完成后就能顺利取得文字文件,虽然结果不一定100%正确,但可以节省用户相当多的时间。

Buzz

赞(0)
未经允许不得转载:龚老师网络科技 » Buzz 免费开源语音识别工具,将录音或影片快速转为纯文字、字幕文件
分享到

登录

找回密码

注册