查看: 1153|回覆: 2
收起左側

[教學] 免費離線開源硬字幕提取工具(VideoSubFinder+RapidOCR/ABBYY) 有免費試用的在線免費硬字幕提取

[複製連結]

發表於 2024-8-24 16:50:53 | 顯示全部樓層 |閱讀模式

馬上註冊,結交更多好友,享用更多功能,讓你輕鬆玩轉社區。

您需要 登錄 才可以下載或查看,沒有賬號?註冊

x
本文最後由 tomyan112 於 2024-8-26 03:08 AM 編輯

三個大步驟:
1.將字幕從影片中截圖下來
2.將字幕圖片OCR為文字
3.校對編輯字幕文件


1. 先到這裡下載
https://sourceforge.net/projects/videosubfinder/
Screenshot 2024-08-26 021642.png
2. 解壓後,打開VideoSubFinderWXW.exe

file-->open video
拖曳影片欄中的水平線,縮小字幕的偵測區域。
Screenshot 2024-08-26 0216422.png



(3)先點選Clear Folder,再點選Run Search,等待軟體自動辨識完成

(4)開啟Videosubfinder資料夾中的RGBImages資料夾

(5)點選OCR,再點選Create Cleared TxtImages
1504684-20210109141947186-1215512575.png
RapidOCR
https://github.com/SWHL/RapidVideOCR/releases

軟體以截圖的方式儲存字幕所在的區域。




第2步
https://github.com/SWHL/RapidVideOCR/releases
解壓後,打開RapidVideOCR.exe

介面各個部分介紹
Screenshot 2024-08-26 024531.png
影像目錄:指的是VideoSubFinder軟體產生的RGBImages或TXTImages目錄,必須是這兩個目錄之一
儲存路徑:辨識轉換後的結果,包括srt檔案和txt檔案
疊圖辨識:勾選後,會辨識速度變快。準確率可能差些
上述都填好之後,點選OK按鈕,即可開始辨識。

ABBYY


開啟ABBYY軟體

(1)工具-->OCR編輯

(2)文件--->開啟圖像
1504684-20210109142509327-438565483.png
導入TXTImages資料夾中的圖片文件


等待文件自動讀取完成。

(3)文件處理完成後,點選文件-->另存為-->txt文件
1504684-20210109142909184-907137224.png
將txt檔案儲存到TXTResults資料夾中

文件選項為為每個輸入文件建立一個單獨的文件。



3.返回videosubfinder軟體

點選Create sub From txt Results
1504684-20210109143201226-1697089772.png

至此,srt文件創建成功




字幕圖片的參數
點選Search右邊的Settings,出現設定介面,我們只關心左邊這塊能影響Search字幕圖的參數。
Screenshot 2024-08-26 022721115.png


第一個參數‘Text Alignment’預設設定是‘Center’,必須點選設定成‘Any’。
其他眾多參數中,有一個參數至關重要,就是Use Filter Colors這項,default值是空的,其他參數可以不設,這個一定要設定上,特別是非純白字幕,例如黃色!如果不設置,有大幾率會漏字幕。
我們需要取色字幕文字的骨幹顏色(骨幹外則是字幕輪廓顏色,不要取偏了),然後將顏色值填入,將有助於VideoSubFinder判斷字幕出現和結束的時間,生成正確的時間軸信息,並防止丟時間軸。常見字幕顏色可能有白色的、黃色的,或是其他顏色,本例電影的字幕是白色。如果是多色字幕,可以依VSF要求取色多色填入。
具體的參數設置,可以參考Docs目錄下的readme_eng.txt,專業用戶精調參數可以提高Search字幕幀的準確率,從而減少丟時間軸(少字幕圖片,致命)和假時間軸(空白字幕圖片,影響不大)的情況,不過據筆者使用經驗,如果沒弄清楚參數意義和作用,隨意調整反而適得其反,普通用戶還不如不調的好。

在右邊介面先點一下Pixel Color
pixelcolour.png
然後點選字幕白色文字中心骨幹取色,點不準可以多點幾下。
txtcolor.png
取到了顏色,就會顯示出來
Screenshot 2024-08-26 023154.png
本例將Lab: l:232 a:128 b:130 copy後雙擊填入Use Filter Coloers,一般做了這步就可以基本保證不會有時間軸丟失的情況,算是完成了Search的設定。
filter.png

點選Search -> Clear Foders 清空RGBImages目錄,

然後點 OCR Search,程式開始掃描視訊文件,產生RGBImages。
Screenshot 2024-08-26 023610.png


有免費試用在線免費硬字幕提取
Subtitleextractor
時長2小時免費試用
Screenshot 2024-08-26 024917.png
上傳影片檔案
Screenshot 2024-08-26 025023.png
選字幕語言
Screenshot 2024-08-26 025048.png
識別完成後下載字幕文件
Screenshot 2024-08-26 025127.png




評分

參與人數 8名聲 +95 精幣 +95 收起 理由
xman566 + 10 + 10 精品文章
ldt1025 + 10 + 10 精品文章
zenoyu + 15 + 15 精品文章
q033551296 + 15 + 15 熱心助人
XzCraftP + 10 + 10 精品文章
rogerkid815 + 10 + 10 熱心助人
osun + 10 + 10 熱心助人
zyshcnzyshcn + 15 + 15 熱心助人

查看全部評分


發表於 2024-8-24 17:43:45 | 顯示全部樓層
本文最後由 Brogg 於 2024-8-24 09:49 PM 編輯

有介面語言設置選項 簡體 英文 西班牙吧 介面能改字體 粗體 斜體
時間軸從頭拉到尾 選最長最高的台詞 四條線上下左右貼合台詞

清空 識別 依電腦效能決定你的作業時間
R9 5900X 32G 車頂上的玄天上帝02:09:49 跑了24分(台繁內嵌字幕)
2553張圖 12核心CPU占用60-80沒有調用到GPU(介面下面設置有CUDA加速CUDA下載)
編輯:設置開始時間-結束時間 / 幫助:使用說明文檔 資料夾Docs / readme_chn-可簡轉繁
==========================
第一次沒有拉下面水平線跑24分2553張圖
二次下面水平線貼齊台詞底部跑16分46秒
圖片反而更多2985張
=====================================================
CPU-R9 5900X TXTImages資料夾生成二值化文本圖片1762張(這一步電腦卡死只能等跑完 先划手機吧)
GPU-RTX-3080-10G開啟CUDA-GPU加速TXTImages資料夾生成二值化文本圖片1779張12分10秒
=================================================

第2步網址打開RapidVideOCR.exe 0.0.7(選Windows下載)

1762張以RapidVideOCR.exe跑Create Cleared TxtImages圖片轉字幕38分30秒(簡體字)

2985張以RapidVideOCR.exe跑RGBImages圖片轉字幕11分27秒(簡體字)
=============================================
這個資料夾settings→chn-->locale-->右鍵開啟檔案記事本-Ctrl+A全選複製 簡轉繁 貼回去 儲存 介面變繁體
=================================================================
感謝樓主分享軟體


未命名.png
螢幕擷取畫面 2024-08-24 174106.png

result.srt

102.7 KB, 下載次數: 6

TXTImages未校對簡體字幕

result.srt

150.55 KB, 下載次數: 6

RGBImages未校對簡體字幕

評分

參與人數 4名聲 +50 精幣 +50 收起 理由
q033551296 + 15 + 15 熱心助人
rogerkid815 + 10 + 10 熱心助人
osun + 10 + 10 熱心助人
zyshcnzyshcn + 15 + 15 熱心助人

查看全部評分

回覆

使用道具 舉報


發表於 2024-8-25 08:55:23 | 顯示全部樓層
體感上RapidVideOCR的識別能力還滿精準的
感謝大大的分享!!!

不過,我發現有時候如果字串有跨語系的話,順序會跑掉
例如:Salamat po咖啡館>>>> 咖啡館Salamat po

用的時候要注意一下

評分

參與人數 2名聲 +25 精幣 +25 收起 理由
Brogg + 10 + 10 熱心助人
zyshcnzyshcn + 15 + 15 熱心助人

查看全部評分

回覆

使用道具 舉報

您需要登錄後才可以回文 登入 | 註冊

本版積分規則

熱門推薦

StormAudio 全新 ADEC 進階解碼卡 —— 安裝與完整效能測試評測—AV NIRVANA
StormAudio 全新 ADEC 進
StormAudio 全新 ADEC 進階解碼卡:安裝流程與完整效能測試心得
絕對有感的杜比視界!Optoma UHR90DV丹爸影音實驗室體驗後感   - 這個價位!這般規格!這等畫質!實力足以挑戰業界巨人的投影機大衛王!
絕對有感的杜比視界!Opto
絕對有感的杜比視界!Optoma UHR90DV丹爸影音實驗室體驗後感 -
南臺灣藝文之都的B&W Nautilus鸚鵡螺/StormAudio風暴7.2.1.6多聲道視聽室開箱!
南臺灣藝文之都的B&W Naut
南臺灣藝文之都的B&W Nautilus鸚鵡螺/StormAudio風暴7.2.1.6多聲
StormAudio ISR Fusion 20:力量、精準與聽覺新典範—Thrillcat Cinema Lab
StormAudio ISR Fusion 20
StormAudio ISR Fusion 20:力量、精準與聽覺新典範—Thrillcat
Barefoot Sound Footprint03:最先進的錄音室監聽進化之作
Barefoot Sound Footprint
Barefoot Sound Footprint03:最先進的錄音室監聽進化之作—Swee

聯絡我們| 問題反映| 小黑屋| 手機版| Archiver|  本網站特別聘請 蔡家豪律師 為本站法律顧問

快速回覆 返回頂部 返回列表