視頻硬字幕提取,生成srt文件。無需申請第三方API,本地實現文本識別。基於深度學習的視頻字幕提取框架,包含字幕區域檢測、字幕內容提取。
Video-subtitle-extractor (vse) 是一款將視頻中的硬字幕提取為外掛字幕文件(srt格式)的軟件。 主要實現了以下功能:
- 提取視頻中的關鍵幀
- 檢測視頻幀中文本的所在位置
- 識別視頻幀中文本的內容
- 過濾非字幕區域的文本,去除水印(台標)文本
- 去除重複字幕行,生成srt字幕文件
- 支持視頻字幕批量提取
- 多語言:支持中文/英文、日語、韓語、繁體中文、法語、德語、俄語、西班牙語、葡萄牙語、意大利語字幕的提取
- 多模式:
- 快速 – 快速提取字幕但可能丟字幕(推薦)
- 精準 – 不丟字幕但速度較慢
使用說明:
- 視頻以及程序路徑請不要帶中文和空格,否則可能出現未知錯誤!!!
如:以下存放視頻和代碼的路徑都不行
D:\下載\vse\運行程序.exe(路徑含中文)
E:\study\kaoyan\sanshang youya.mp4 (路徑含空格)
- 直接下載壓縮包解壓運行,如果不能運行再按照下面的教程,嘗試源碼安裝conda環境運行
下載地址:
- Windows 單文件版本(雙擊直接運行,每次打開時會有一點慢,推薦小白使用): vse.exe
- Windows GPU版本: vse_windows_GPU.7z
- Windows CPU版本: vse_windows_CPU.zip
- MacOS CPU版本: vse_macOS_CPU.dmg
PS: 若無法下載,請前往 Release 下載
項目特色
- 採用本地進行OCR識別,無需設置調用任何API,不需要接入百度、阿里等在線OCR服務即可本地完成文本識別
- 支持GPU加速,GPU加速後可以獲得更高的準確率與更快的提取速度
- (CLI版本) 無需用戶手動設置字幕區域,項目通過文本檢測模型自動檢測字幕區域
- (GUI版本) 圖形化界面
演示
- GUI版:
由於動圖文件太大了,就不放上來了,想看的請打開源項目倉庫查看:
https://github.com/YaoFANGUK/video-subtitle-extractor
類似功能的軟件:
與vse不同的是,它不是根據視頻硬字幕來識別,而是通過視頻語音轉字幕,兩者功能互補,搭配使用非常強大;