Subtitle Edit 字庫

pharaohchang · 發表於 2017-9-15 15:34:48

馬上註冊，結交更多好友，享用更多功能，讓你輕鬆玩轉社區。

您需要登錄才可以下載或查看，沒有賬號？註冊

x

因為字庫不斷累加上去，光檔案就150MB，開啟程式辨識SUP的時候，記憶體都衝到1G左右了。

我看到有其他高手是照字體分成不同字庫，不知道能否分享一下。

還有各位高手是怎麼知道SUP裡用的是什麼字體？？

比方說：Pirates of the Caribbean: Dead Men Tell No Tales (加勒比海盜神鬼奇航:死無對證)
before1012分享了cht-楷-細白字庫

wb2013 · 發表於 2017-9-16 06:25:33

比方說：Pirates of the Caribbean: Dead Men Tell No Tales (加勒比海盜神鬼奇航:死無對證)

我有試過字庫
不過無效啊
不知道問題出在哪

請問pharaohchang大用那字庫
可以辨識而不用再打字嗎？

pharaohchang · 發表於 2017-9-16 09:16:02

wb2013 發表於 2017-9-16 06:25
我有試過字庫
不過無效啊
不知道問題出在哪

cht-楷-細白是對應(加勒比海盜神鬼奇航:死無對證)要其他藍光字幕用一樣的字體才能辨識

把cht-楷-細白解壓縮放進Subtitle Edit 底下 VobSub 資料夾

選擇cht-楷-細白字體的字庫然後就可以開始OCR了

wb2013 · 發表於 2017-9-17 02:28:59

cht-楷-細白是對應(加勒比海盜神鬼奇航:死無對證)要其他藍光字幕用一樣的字體才能辨識

我自己疏忽
問題已解決
感謝

pharaohchang · 發表於 2017-9-17 17:22:49

有人知道＂天才的禮物＂用的字體是什麼嗎？？有其他藍光SUP跟這個是一樣的？？

before1012 · 發表於 2017-9-17 19:13:46

本文章最後由 before1012 於 2017-9-17 19:19 編輯

https://fontzone.net/font-details/kaiti
這個字體很像！

KaiTi.rar (6.07 MB, 下載次數: 446)

dreamhill · 發表於 2017-9-19 00:54:55

多個選擇的確是好，但好像SubToSrt 比較好用！

wb2013 · 發表於 2017-9-19 01:18:06

本文章最後由 wb2013 於 2017-9-19 01:41 編輯

但好像SubToSrt 比較好用！

720P以上解析度的字幕不能用啊

jimmy1817 · 發表於 2017-9-19 01:31:20

小弟我只有Netflix字庫

還有想請問有人有Big Little Lies S01（美麗心計第一季）

藍光第五集的字庫嗎?

擷取.JPG

不太確定是甚麼字體謝謝

before1012 · 發表於 2017-9-19 10:32:37

jimmy1817 發表於 2017-9-19 01:31
小弟我只有Netflix字庫

還有想請問有人有Big Little Lies S01（美麗心計第一季）

跟這個字型很像

STKaiti.zip (8.34 MB, 下載次數: 227)

wb2013 · 發表於 2018-1-17 14:05:57

本帖最後由 wb2013 於 2018-1-17 14:10 編輯

我實在非常不會判斷哪些字是哪些字型
尤其有一些字我看起來都差不多
但是用原有的字庫卻無法OCR
所以我的字庫大部分都用電影發行公司命名

把「華納-西方極樂園」壓縮檔解壓縮後的「華納-西方極樂園」資料夾
放進Subtitle Edit 底下 VobSub 資料夾

Subtitle Edit 字庫

華納-西方極樂園.rar (3.74 MB, 下載次數: 318)

-----------------------------------------------------------------------
若你知道是什麼字型
或是你高興命什麼名字
「華納-西方極樂園」資料夾這個名稱可以自己命名

Dunkirk.敦克爾克大行動.2017

http://www.hd.club.tw/thread-223657-1-1.html

電影本片的TW-SUP字型

卻是和福斯發行的Snatched.搶救千金.2017 的TW-SUP字型一樣

http://www.hd.club.tw/thread-221255-1-1.html

(感謝pharaohchang大分享字庫)

cory · 發表於 2018-7-21 20:44:26

前後已找兩版Subtitle Edit v3.5.6免安裝版，
並沒有 VobSub 資料夾，難道要舊版3.5.3或是安裝版才有嗎？
所以Netflex什麼的這些字庫要放哪？

ethan · 發表於 2019-6-27 00:02:46

本文最後由 ethan 於 2019-7-6 04:25 AM 編輯

cory 發表於 2018-7-21 08:44 PM
前後已找兩版Subtitle Edit v3.5.6免安裝版，
並沒有 VobSub 資料夾，難道要舊版3.5.3或是安裝版才有嗎？
...

前面所提的字庫是用在"使用圖像比較進行OCR"法的
這個功能在Subtitle Edit 3.5.3之後的版本被移除了，所以要3.5.3(包括)前的版本才能用上面的字庫
針對不同片商把字庫分類，OCR時會比較快
像這樣：
SubtitleEdit目錄>VobSub>標楷體>檔案
>NF>檔案

我剛開始OCR華納跟博偉的標楷體時，是用wb2013提供的11F西方極樂園字庫
之後增加了不少辨識數，包含港繁，基本上一部片需要輸入處十餘字左右，冷門字多時應該也不到20個字
另外再加上NF的黑體字庫，NF字庫完全都是從版上的sup檔從無到有建立起來的，辨識度有九成九以上
提供給有需要的會員，若是發現字庫中有輸入錯誤的字麻煩告知

華納標楷體.rar (8.22 MB, 下載次數: 97) 解壓縮後90.5mb

NETFLIX.rar (11.21 MB, 下載次數: 87) 解壓縮後133mb

06/30補充說明:
一般來說近幾年的迪士尼、漫威系列、J·K·羅琳作品、少數DC系列、博偉、華納BD，很多都是這字庫的標楷體(白色字)
但是偶爾版上少數sup中是同樣字體但卻是灰色字，遇到灰色字時字庫完全辨識不出來，必須重新新增輸入

對於想自行建立字庫的，最先推薦的就是上面的華納標楷體，之後若想再建其他的，推薦從環球黑體開始
環球所用的黑體與派拉蒙部分電影字體相同，片量也很可觀

ethan · 發表於 2019-7-18 05:32:07

本文最後由 ethan 於 2019-7-19 05:28 AM 編輯

原本是使用"使用圖像比較進行OCR"的華納標楷體字庫
前陣子看到Aray大在這帖所提到與Binary Image Compare法的差距
於是開始另外建立Binary的華納標楷體字庫後發現與圖像比較法間的差異

目前發現圖像比較法對於斜體字不太友善, 即使是輸入過字庫, 但會因為字體邊緣鄰字的邊角也被截入字庫而無法辨識
有時標記範圍時就是無法只標一個字, 遇到非白色字體時(有些sup是灰字或黃字)都必須再輸入
而這些問題在Binary法中都不是問題了, 斜體字鄰字的邊角都會被去背, 任何顏色的字都會直接反白而不用再輸入
但是我在建Binary字庫時發現, 辨識字體"些微差異性"的相容度, 似乎沒有之前我在建圖像比較法的字庫時來得好
個人推測是跟去背反白後的毛邊化有關(似乎字體的陰影效果也會反白)

以下大略提一下我在建兩種字庫時的大致順序
最大錯誤值都是設0.5%
圖像比較法: 3.5.3版本
如樓上所提是以wb2013的西方極樂園字庫做基底開始建立>怪獸與牠們的產地系列>漫威系列>迪士尼
>華納如沙贊, 男人的一半還是男人>神盾局特工
在上述的OCR過程中, 完全都沒碰到過字體無法辨識的情況

Binary Image Compare: 3.5.9FI版本
完全新建字庫>神盾局特工>無法辨識西方極樂園>漫威系列>無法辨識怪獸與牠們的產地系列
>華納無法辨識如沙贊, 男人的一半還是男人
許多之前在圖像比較法時能持續辨識輸入字庫的sup, 在Binary法時不少都無法辨識

附上目前的Binary華納標楷體字庫

華納標楷體.rar (878.01 KB, 下載次數: 30)

目前個人感覺除了針對斜體字跟有色字的辨識支援度, 以及辨識速度較快外, 似乎感覺不到其他的優異性?
想請問版上OCR經驗豐富的大神不吝提供意見與看法, 謝謝

tyzh279 · 發表於 2019-7-18 10:54:02

pharaohchang 發表於 2017-9-16 09:16 AM
cht-楷-細白是對應(加勒比海盜神鬼奇航:死無對證)要其他藍光字幕用一樣的字體才能辨識

把cht-楷-細白解 ...

为什么我的软件没有vobsub这个文件夹，是要自己创建吗，还是软件的问题

Fxe · 發表於 2019-7-19 18:17:00

tyzh279 發表於 2019-7-18 10:54 AM
为什么我的软件没有vobsub这个文件夹，是要自己创建吗，还是软件的问题

3.5.3版本才行，看你樓上。

tyzh279 · 發表於 2019-7-19 18:19:25

Fxe 發表於 2019-7-19 06:17 PM
3.5.3版本才行，看你樓上。

感谢提示

man125 · 發表於 2019-7-20 13:43:13

剛剛開始學習用SubtitleEdit ,用Binary Image Compare這方法OCR,同一個相同字都要每次輸入很煩

ETS · 發表於 2019-7-21 10:17:58

man125 發表於 2019-7-20 01:43 PM
剛剛開始學習用SubtitleEdit ,用Binary Image Compare這方法OCR,同一個相同字都要每次輸入很煩 ...

我設這樣你試試
至於圖像資料庫我是不分類的呵呵 [RAM不大的朋友可不要學]

man125 · 發表於 2019-7-21 10:50:00

ETS 發表於 2019-7-21 10:17 AM
我設這樣你試試
至於圖像資料庫我是不分類的呵呵 [RAM不大的朋友可不要學]

請問可否分享字庫

[求助] Subtitle Edit 字庫

馬上註冊，結交更多好友，享用更多功能，讓你輕鬆玩轉社區。

評分

瀏覽過的討論區

熱門推薦

聯絡我們| 問題反映| 小黑屋| 手機版| Archiver| 本網站特別聘請蔡家豪律師為本站法律顧問

[求助] Subtitle Edit 字庫

馬上註冊，結交更多好友，享用更多功能，讓你輕鬆玩轉社區。

評分

瀏覽過的討論區

熱門推薦

聯絡我們| 問題反映| 小黑屋| 手機版| Archiver| 本網站特別聘請 蔡家豪律師 為本站法律顧問

聯絡我們| 問題反映| 小黑屋| 手機版| Archiver| 本網站特別聘請蔡家豪律師為本站法律顧問