没有字幕的视频怎么用PotPlayer识别字幕 实现语音转字幕功能
PotPlayer 241212 版本新增了使用 Whisper 从语音生成字幕的功能,即声音生成字幕,用PotPlayer播放视频可实现识别音视频中的人声,自动生成字幕的功能。没有字幕的外语电影不怕看不懂了。

Whisper 是OpenAI发布的语音识别模型,是目前最好的语音生成字幕工具之一,支持多达99种语言识别。现在的剪辑工具比如剪映、必剪都自带语音识别字幕功能,不过大部分都收费,且识别中文能力较强而其他语言不及Whisper。
右键点击PotPlayer “字幕 - 声音生成字幕 - 声音生成字幕”。


转换引擎
首选配置转换引擎,有多款版本可选。
Whisper.cpp CPU、Whisper.cpp BLAS适合没有独显的电脑;Whisper.cpp Vulkan、Whisper.CUDA、Whisper.Const-me适合4-6G独显的电脑;Whisper-Faster、Whisper-Faster-XXL(推荐)适合更高配置的电脑。

以Faster-Whisper-XXL为例,点击后面的“下载”按钮即开始下载。若下载失败可手动下载Faster-Whisper-XXL_r245.4_windows.7z,Whisper-Faster引擎则下载Whisper-Faster_r192.3_windows.zip。解压后将文件拷贝到PotPlayer安装路径的Engine文件夹下。

型号
型号选择large-v2或large-v3;如果使用的是NVIDIA显卡,可选择效果更好的large-v3-turbo。点击“下载”下载。

因国内访问huggingface.co需科学上网,没有条件的可手动下载faster-whisper-large-v2.zip、faster-whisper-large-v3.zip、faster-whisper-large-v3-turbo.zip。解压到PotPlayer安装目录下的Model文件夹下。

语言
选择视频的语言,或者auto,点击“开始”即开始识别。勾选 “尽可能将字幕保存在视频同目录中”,可将字幕保存到本地。
识别效果

搭配PotPlayer字幕翻译功能,还可将英文字幕转为中文,达到无字幕英文电影显示中文字幕效果。
PotPlayer 250625 版本新增了“启用VAD过滤器”功能,VAD (Voice Activity Detection) 是一种用于检测音频信号中是否包含人声(语音)的技术,其核心目标是区分语音段(Voice)和非语音段(静音、噪声、音乐等)。VAD 过滤器通常作为预处理步骤,用于优化语音识别、通话降噪、语音增强等任务。可酌情勾选。
PotPlayer 250909 版本新增了“声音生成字幕(实时)”功能,可边观看边生成字幕。
