Buzz 免费开源语音识别工具，将录音或影片快速转为纯文字、字幕文件-龚老师网络科技

内容目录

如果要将录音、视频内容转为文字档案，以往要透过人工方式手动缮打逐字稿，不但很耗费时间，也可能会出现不少错误，现在透过人工智能 AI 技术可以使用机器进行声音辨识，几秒钟时间就能完成转换，对于制作影片字幕来说也会很有帮助，之前整理过「免费逐字稿软件：10 个将录音档、语音转文字工具推荐」收录很多辨识工具，大部分可在有限制的情况下免费使用，其中 Vocol.ai 和雅婷逐字稿都是台湾公司，对中文内容甚至台语都有相当好的辨识效果。

本文要介绍「Buzz」是一个开放源代码工具，可以在用户的电脑上进行离线的语音识别、转录和翻译工作，背后的技术为 OpenAI 旗下 Whisper 技术，和之前介绍过的 MacWhisper、Whisper JAX 相同，利用麦克风输入声音并快速转换成纯文字（也能加上时间戳记），或是导入音频档、影片文件再使用预先选择的模型进行辨识转换，此外，还内建翻译功能，遇到外文时可以实时转录、翻译为中文或特定语言输出。

Buzz 支持 Mac、Windows 和 Linux 三大操作系统，可导入音频或视频文件、并将文本记录导出为 TXT、SRT 和 VTT 三种格式，支持的模型包括 Whisper、Whisper.cpp、Faster Whisper、兼容 Whisper 的 Hugging Face 模型和 OpenAI Whisper API 。

Buzz
https://chidiwilliams.github.io/buzz/docs（GitHub）