使用 IdxSubOcr 將 DVD 字幕轉 srt
這邊找不到幾篇 IdxSubOcr 的教學,所以將我論壇上原創的教學貼過來,請大家多多指教。網路上有很多教學可以參考~但我還是依我自己的需求寫一篇教學~推薦使用 老馬 製作的軟體 IdxSubOcr 十分優秀,使用起來也很方便~
簡易說明
開啟 DVD 裡的 IFO 檔,轉出字幕檔 idx 與 sub,之後 OCR 圖文辨識字幕圖檔轉成 srt
1.讀取 IFO 轉 idx,sub 工具
VobSub
官網 https://www.videohelp.com/software/VobSub
下載點
Latest version 2.23 (December 11, 2002)
VobSub 2.23717KB
https://www.videohelp.com/download/VobSub_2.23.exe
VobSub 2.23 64-bit 1MBWin64
https://www.videohelp.com/download/VobSub_2.23_setup%2064bit.zip
2.將字幕圖檔 OCR 為 srt 純文字工具
老馬開發的軟體放在百度雲盤
使用 MODI(Microsoft Office Document Imaging) + IdxSubOcr 對於簡體與繁體中文推薦使用
VobSub + MODI + IdxSubOcr 我統一壓縮起來放在這裡
點我下載
檔案內容為
VobSub_2.23.exe
VobSub_2.23_setup 64bit.zip
Setup_MODI_OCR_Engine_From_Office2007SP3.exe
IdxSubOcr_eng.zip
接下來就是圖文操作說明囉~
第一步 使用 VobSub 開啟 IFO 轉出 idx,sub
解壓縮 VobSub_2.23_setup 64bit.zip 並點兩下安裝 setup 64bit.exe 完畢後,開啟 VobSub Configure
https://emupic.omega.idv.tw/cGPo8F+
程式畫面如下 按下 -> Open...
https://emupic.omega.idv.tw/rUUCfg+
檔案類型:請下拉選擇 *.ifo
搜尋位置:請選到 DVD 的 VIDEO_TS 資料夾內,選擇檔案最大的 IFO
這裡是 VTS_04_0.IFO 然後按下 開啟
https://emupic.omega.idv.tw/qeuAvl+
瀏覽資料夾 請選擇你的電腦至少還有剩餘 30MB 空間的資料夾即可 按下 確定
https://emupic.omega.idv.tw/oY00j7+
Select PGC 這裡有 中文與英文 字幕可以選,建議兩個都選起來後 按下 OK
https://emupic.omega.idv.tw/Zz2C83+
轉 idx,sub 完畢後的畫面如下,按下 OK 即可
https://emupic.omega.idv.tw/Ddqk7Q+
轉出來的 idx 內容為 Chinese 與 English 字幕的時間軸
sub 則為圖形字幕
https://emupic.omega.idv.tw/MCesOp+
用 VobSub 自帶的 Subresync 開啟 idx 檔,可以檢查字幕是否抽取成功如下圖
https://emupic.omega.idv.tw/IqdJJ3+
第二步 使用 MODI + IdxSubOcr 辨識字幕
安裝打包好的MODI OCR引擎,一鍵安裝。
Setup_MODI_OCR_Engine_From_Office2007SP3.exe
亂碼是簡體字請按下 I 會自動安裝,安裝完成按下 F 即可
https://emupic.omega.idv.tw/BIVXy9+
開啟 IdxSubOcr.exe 記得按下滑鼠右鍵 使用系統管理員執行,才能調用 MODI OCR 引擎來辨識字幕
Open Source 選擇我們這次轉出的 VTS_04_0.idx 按下開啟
https://emupic.omega.idv.tw/sUb6ni+
因為我們剛剛 中文與英文 字幕都有選,所以
1. Choose subtitle to deal with 有 00-Chinese 與 01-English 可以選擇
4. OCR Options 那的 OCR language 繁體中文與英文也會自動選取,有錯誤的話再重選就好
按下 OK
https://emupic.omega.idv.tw/ohX5dq+
給他一點時間辨識
https://emupic.omega.idv.tw/ilmYm4+
直到出現 File saved 就是辨識完成囉~按下確定
https://emupic.omega.idv.tw/rxT0B5+
使用系統管理員執行 IdxSubOcr.exe 才能如下得到 OCR 正確的結果喔
https://emupic.omega.idv.tw/jUbivN+
校對過的字幕前面會有一個勾勾圖示,按下 Save SRT File 按鈕,就可以儲存修正過的字幕
https://emupic.omega.idv.tw/08XXB1+
出現 File saved 代表儲存完畢,srt 檔為 Windows(CRLF) UTF-8-BOM 格式
https://emupic.omega.idv.tw/rxT0B5+
原始字幕如下
https://emupic.omega.idv.tw/HTtFO7+
外掛 srt 字幕如下
https://emupic.omega.idv.tw/HRTEjn+
進階使用 字幕合併
有些人比較喜歡中、英文字幕同時顯示,可以顯示成中上英下,也可以是英上中下。但一般的SRT文件都只有一種語言,如果要把兩種語言的SRT合併在一起,例如要把中、英兩種SRT合併成中上英下的SRT,可以按照下列步驟進行操作:
先把英文SRT拖拽到「多語言」界面,點擊「導出」按鈕,導出成文本文件。
把中文SRT拖拽到「多語言」界面。
不要勾選「導入覆蓋」選項。
把步驟1中導出的英文文本文件拖拽到「文本文件」框,然後點擊「導入」按鈕,把字幕合併到一起。
點擊「保存」按鈕保存合併後的字幕。
注意:
在導入時,是按照空行來切分文本文件中的字幕,所以請注意不要隨便更改導出的文本文件中的空行。
在字幕編輯框中,按PgDn、PgUp鍵可以翻到下一條、前一條字幕。
點擊「刷新」按鈕,相當於用當前SRT文件內容刷新列表(包括時間軸和文字),然後點擊了「導入」按鈕。
圖文教學如下
開啟 IdxSubOcr.exe 記得按下滑鼠右鍵 使用系統管理員執行,並按下 Multilingual 按鈕
https://emupic.omega.idv.tw/5jeA9R+
中文與英文字幕放在要合併的目錄裡備妥,原始已校對過的檔案請自行保留
https://emupic.omega.idv.tw/AEskB9+
開啟多語言界面後將英文 SRT VTS_04_0.eng.srt 拖曳到 SRT File: 欄位,按下 Export 輸出純文字檔 VTS_04_0.eng.txt
https://emupic.omega.idv.tw/TYRRcL+
可以看到文字檔沒有 srt 的格式只有純文字
https://emupic.omega.idv.tw/qGMUFh+
接下來把中文 SRT VTS_04_0.chn.srt 拖曳到 SRT File: 欄位,記得 Overlay 導入覆蓋的選項不要勾選
https://emupic.omega.idv.tw/M0k5Xt+
把剛剛導出的英文純文字檔 VTS_04_0.eng.txt 拖曳到 Text File: 欄位,記得 Overlay 導入覆蓋的選項不要勾選,按下 Import 就可以導入英文字幕如下圖
https://emupic.omega.idv.tw/YILicD+
按下確定 然後我們校對一下中文與英文字幕,有時候中文與英文的字幕會有一點不同,因為匯入的是英文的純文字檔不含時間訊息所以有錯的話就得重來~
校對完記得改一下 SRT File 的名稱免得中文字幕被覆蓋了~按下 Save 儲存中英文字幕
https://emupic.omega.idv.tw/GYOQO6+
出現 File saved 代表儲存完畢
https://emupic.omega.idv.tw/rxT0B5+
然後我們會有四個檔案,前三個是我們需要的~
中文字幕 VTS_04_0.chn.srt
中英字幕 VTS_04_0.cht+eng.srt
英文字幕 VTS_04_0.eng.srt
英文字檔 VTS_04_0.eng.txt
https://emupic.omega.idv.tw/uXjeXe+
https://emupic.omega.idv.tw/cCLStZ+
繁體 IdxSubOcr 說明文件請參閱
https://omega.idv.tw/kdb120/viewthread.php?threadid=4806#post17135
IdxSubOcr 識別錯誤率比較高
頁:
[1]