tomyan112 發表於 2024-8-24 16:50:53

免費離線開源硬字幕提取工具(VideoSubFinder+RapidOCR/ABBYY) 有免費試用的在線免費硬字幕提取

本文最後由 tomyan112 於 2024-8-26 03:08 AM 編輯

三個大步驟:
1.將字幕從影片中截圖下來
2.將字幕圖片OCR為文字
3.校對編輯字幕文件


1. 先到這裡下載
https://sourceforge.net/projects/videosubfinder/

2. 解壓後,打開VideoSubFinderWXW.exe

file-->open video
拖曳影片欄中的水平線,縮小字幕的偵測區域。




(3)先點選Clear Folder,再點選Run Search,等待軟體自動辨識完成

(4)開啟Videosubfinder資料夾中的RGBImages資料夾

(5)點選OCR,再點選Create Cleared TxtImages

RapidOCR
https://github.com/SWHL/RapidVideOCR/releases

軟體以截圖的方式儲存字幕所在的區域。




第2步
https://github.com/SWHL/RapidVideOCR/releases
解壓後,打開RapidVideOCR.exe

介面各個部分介紹

影像目錄:指的是VideoSubFinder軟體產生的RGBImages或TXTImages目錄,必須是這兩個目錄之一
儲存路徑:辨識轉換後的結果,包括srt檔案和txt檔案
疊圖辨識:勾選後,會辨識速度變快。準確率可能差些
上述都填好之後,點選OK按鈕,即可開始辨識。

ABBYY


開啟ABBYY軟體

(1)工具-->OCR編輯

(2)文件--->開啟圖像

導入TXTImages資料夾中的圖片文件


等待文件自動讀取完成。

(3)文件處理完成後,點選文件-->另存為-->txt文件

將txt檔案儲存到TXTResults資料夾中

文件選項為為每個輸入文件建立一個單獨的文件。



3.返回videosubfinder軟體

點選Create sub From txt Results


至此,srt文件創建成功




字幕圖片的參數
點選Search右邊的Settings,出現設定介面,我們只關心左邊這塊能影響Search字幕圖的參數。



第一個參數‘Text Alignment’預設設定是‘Center’,必須點選設定成‘Any’。
其他眾多參數中,有一個參數至關重要,就是Use Filter Colors這項,default值是空的,其他參數可以不設,這個一定要設定上,特別是非純白字幕,例如黃色!如果不設置,有大幾率會漏字幕。
我們需要取色字幕文字的骨幹顏色(骨幹外則是字幕輪廓顏色,不要取偏了),然後將顏色值填入,將有助於VideoSubFinder判斷字幕出現和結束的時間,生成正確的時間軸信息,並防止丟時間軸。常見字幕顏色可能有白色的、黃色的,或是其他顏色,本例電影的字幕是白色。如果是多色字幕,可以依VSF要求取色多色填入。
具體的參數設置,可以參考Docs目錄下的readme_eng.txt,專業用戶精調參數可以提高Search字幕幀的準確率,從而減少丟時間軸(少字幕圖片,致命)和假時間軸(空白字幕圖片,影響不大)的情況,不過據筆者使用經驗,如果沒弄清楚參數意義和作用,隨意調整反而適得其反,普通用戶還不如不調的好。

在右邊介面先點一下Pixel Color

然後點選字幕白色文字中心骨幹取色,點不準可以多點幾下。

取到了顏色,就會顯示出來

本例將Lab: l:232 a:128 b:130 copy後雙擊填入Use Filter Coloers,一般做了這步就可以基本保證不會有時間軸丟失的情況,算是完成了Search的設定。


點選Search -> Clear Foders 清空RGBImages目錄,

然後點 OCR Search,程式開始掃描視訊文件,產生RGBImages。



有免費試用在線免費硬字幕提取
Subtitleextractor
時長2小時免費試用

上傳影片檔案

選字幕語言

識別完成後下載字幕文件





Brogg 發表於 2024-8-24 17:43:45

本文最後由 Brogg 於 2024-8-24 09:49 PM 編輯

有介面語言設置選項 簡體 英文 西班牙吧 介面能改字體 粗體 斜體
時間軸從頭拉到尾 選最長最高的台詞 四條線上下左右貼合台詞

清空 識別 依電腦效能決定你的作業時間
R9 5900X 32G 車頂上的玄天上帝02:09:49 跑了24分(台繁內嵌字幕)
2553張圖 12核心CPU占用60-80沒有調用到GPU(介面下面設置有CUDA加速CUDA下載)
編輯:設置開始時間-結束時間 / 幫助:使用說明文檔 資料夾Docs / readme_chn-可簡轉繁
==========================
第一次沒有拉下面水平線跑24分2553張圖
第二次下面水平線貼齊台詞底部跑16分46秒
圖片反而更多2985張
=====================================================
CPU-R9 5900X TXTImages資料夾生成二值化文本圖片1762張(這一步電腦卡死只能等跑完 先划手機吧)
GPU-RTX-3080-10G開啟CUDA-GPU加速TXTImages資料夾生成二值化文本圖片1779張12分10秒
=================================================
第2步網址打開RapidVideOCR.exe 0.0.7(選Windows下載)

1762張以RapidVideOCR.exe跑Create Cleared TxtImages圖片轉字幕38分30秒(簡體字)

2985張以RapidVideOCR.exe跑RGBImages圖片轉字幕11分27秒(簡體字)
=============================================
這個資料夾settings→chn-->locale-->右鍵開啟檔案記事本-Ctrl+A全選複製 簡轉繁 貼回去 儲存 介面變繁體
=================================================================
感謝樓主分享軟體


rogerkid815 發表於 2024-8-25 08:55:23

體感上RapidVideOCR的識別能力還滿精準的
感謝大大的分享!!!

不過,我發現有時候如果字串有跨語系的話,順序會跑掉
例如:Salamat po咖啡館>>>> 咖啡館Salamat po

用的時候要注意一下
頁: [1]
查看完整版本: 免費離線開源硬字幕提取工具(VideoSubFinder+RapidOCR/ABBYY) 有免費試用的在線免費硬字幕提取