Caption.dll fix - 修正非日語環境下外字替換功能無效的問題
本文章最後由 clubaudition 於 2012-6-14 17:26 編輯基於Caption.dll ver 0,2,0,8,修正了非日區下外字替換功能無效的問題。
http://2sen.dip.jp/cgi-bin/dtvup/source/up0966.zip 目前已更新到Caption2Ass_PCR ver.0,3,0,3
什麼是外字替換功能?
TS中有極少數的特殊字符並非以文字形式,而是以「某種」形式存儲(因為我也沒深究,所以不知道是怎樣存儲的)。
Caption.dll遇到這樣的字符時,輸出一個md5值和一個以該md5值為文件名的gif圖形,圖上畫的就是這個特殊字符。
此時輸出的ASS中能找到類似於「[外:06CB56043B9C4006BCFBE07CC831FEAF]」的內容。
這個字符要靠用戶自己ocr,然後把md5值和字符值填寫進配置文件「UNICODE_cc_DRCS.ini」裡。
再次運行Caption2Ass抽取字幕時,就會讀取到配置文件的內容,把md5值替換為配置文件中對應的字符,輸出至ass中。
原版的Caption.dll裡,讀取ini配置文件時進行不當的轉碼,以致非日區環境下讀取配置文件失敗,外字替換功能無效。
這個問題到2ch上反饋過,不過被無視(反正非日語系統沒什麼人用 toka),於是只好自己動手了 -_,-
註:目前附件當中有幾個ini 組態設定,在繁體系統下顯示亂碼,這個問題已請教附件作者。
作者回覆:
預設只使用Unicode為前綴的幾個ini
而你說到的幾個亂碼的ini,那是S-JIS編碼的,所以繁體系統(準確來說是非日文系統)下打開查看會亂碼。
若執行Caption2ASS_PCR.exe時,使用-format taw的話,就會讀取到這幾個S-JIS編碼的ini,輸出S-JIS編碼的ASS文件。
echo off
cd /d %~dp0
Caption2Ass_PCR.exe -format taw "%~1"------------------------------------------------------------------------------------------------------------------------------------------
根據作者的說明,如此一來ini亂碼的問題就解決了,幾乎沒有人會把字幕輸出為taw,
輸出srt或ass時不會讀取到這幾個S-JIS編碼的ini,所以這問題自然不存在了。
@echo off
cd /d %~dp0
Caption2Ass.exe -format ass "%~1" 抽取字幕對於某些例如字幕組來說算蠻重要的一部分,有了字幕就省去聽譯的麻煩,錯誤也會比較少了
也有現成的時間軸,省去打軸的時間。
-以上供網友參考
本文轉載於NMM影音技術論壇
頁:
[1]