查看: 6074|回覆: 21
收起左側

[求助] Subtitle Edit 字庫

[複製連結]

發表於 2017-9-15 15:34:48 | 顯示全部樓層 |閱讀模式

馬上註冊,結交更多好友,享用更多功能,讓你輕鬆玩轉社區。

您需要 登錄 才可以下載或查看,沒有賬號?註冊

x
因為字庫不斷累加上去,光檔案就150MB,開啟程式辨識SUP的時候,記憶體都衝到1G左右了。

我看到有其他高手是照字體分成不同字庫,不知道能否分享一下。

還有各位高手是怎麼知道SUP裡用的是什麼字體??

比方說:Pirates of the Caribbean: Dead Men Tell No Tales (加勒比海盜 神鬼奇航:死無對證)
before1012分享了cht-楷-細白字庫

發表於 2017-9-16 06:25:33 | 顯示全部樓層
比方說:Pirates of the Caribbean: Dead Men Tell No Tales (加勒比海盜 神鬼奇航:死無對證)

我有試過字庫
不過無效啊
不知道問題出在哪

請問pharaohchang大用那字庫
可以辨識而不用再打字嗎?
回覆

使用道具 舉報


 樓主| 發表於 2017-9-16 09:16:02 | 顯示全部樓層
wb2013 發表於 2017-9-16 06:25
我有試過字庫
不過無效啊
不知道問題出在哪

cht-楷-細白是對應(加勒比海盜 神鬼奇航:死無對證)要其他藍光字幕用一樣的字體才能辨識

cht-楷-細白解壓縮放進Subtitle Edit 底下 VobSub 資料夾
4.jpg

選擇cht-楷-細白字體的字庫然後就可以開始OCR了
5.jpg
回覆

使用道具 舉報


發表於 2017-9-17 02:28:59 | 顯示全部樓層
cht-楷-細白是對應(加勒比海盜 神鬼奇航:死無對證)要其他藍光字幕用一樣的字體才能辨識

我自己疏忽
問題已解決
感謝
回覆

使用道具 舉報


 樓主| 發表於 2017-9-17 17:22:49 | 顯示全部樓層
有人知道"天才的禮物"用的字體是什麼嗎??有其他藍光SUP跟這個是一樣的??

Image17.png
Image18.png


回覆

使用道具 舉報


發表於 2017-9-17 19:13:46 | 顯示全部樓層
本文章最後由 before1012 於 2017-9-17 19:19 編輯

https://fontzone.net/font-details/kaiti
這個字體很像!

KaiTi.rar (6.07 MB, 下載次數: 439)
回覆

使用道具 舉報


發表於 2017-9-19 00:54:55 | 顯示全部樓層
多個選擇的確是好,但好像SubToSrt 比較好用!
回覆

使用道具 舉報


發表於 2017-9-19 01:18:06 | 顯示全部樓層
本文章最後由 wb2013 於 2017-9-19 01:41 編輯
但好像SubToSrt 比較好用!

720P以上解析度的字幕不能用啊
回覆

使用道具 舉報


發表於 2017-9-19 01:31:20 | 顯示全部樓層
小弟我只有Netflix字庫

還有想請問有人有Big Little Lies S01(美麗心計 第一季)

藍光第五集的字庫嗎?

擷取.JPG

不太確定是甚麼字體 謝謝

Netflix.zip

8.6 MB, 下載次數: 238

回覆

使用道具 舉報


發表於 2017-9-19 10:32:37 | 顯示全部樓層
jimmy1817 發表於 2017-9-19 01:31
小弟我只有Netflix字庫

還有想請問有人有Big Little Lies S01(美麗心計 第一季)

跟這個字型很像

擷取.JPG

STKaiti.zip (8.34 MB, 下載次數: 227)


回覆

使用道具 舉報


發表於 2018-1-17 14:05:57 | 顯示全部樓層
本帖最後由 wb2013 於 2018-1-17 14:10 編輯

我實在非常不會判斷哪些字是哪些字型
尤其有一些字我看起來都差不多
但是用原有的字庫卻無法OCR
所以我的字庫大部分都用電影發行公司命名

把「華納-西方極樂園」壓縮檔解壓縮後的「華納-西方極樂園」資料夾
放進Subtitle Edit 底下 VobSub 資料夾

Subtitle Edit 字庫
華納-西方極樂園.rar (3.74 MB, 下載次數: 317)

-----------------------------------------------------------------------
若你知道是什麼字型
或是你高興命什麼名字
「華納-西方極樂園」資料夾這個名稱可以自己命名

Dunkirk.敦克爾克大行動.2017

http://www.hd.club.tw/thread-223657-1-1.html

電影本片的TW-SUP字型

卻是和福斯發行的Snatched.搶救千金.2017 的TW-SUP字型一樣

http://www.hd.club.tw/thread-221255-1-1.html

(感謝pharaohchang大分享字庫)



回覆

使用道具 舉報


發表於 2018-7-21 20:44:26 | 顯示全部樓層
前後已找兩版Subtitle Edit v3.5.6免安裝版,
並沒有 VobSub 資料夾,難道要舊版3.5.3或是安裝版才有嗎?
所以Netflex什麼的這些字庫要放哪?
回覆

使用道具 舉報


發表於 2019-6-27 00:02:46 | 顯示全部樓層
本文最後由 ethan 於 2019-7-6 04:25 AM 編輯
cory 發表於 2018-7-21 08:44 PM
前後已找兩版Subtitle Edit v3.5.6免安裝版,
並沒有 VobSub 資料夾,難道要舊版3.5.3或是安裝版才有嗎?
...

前面所提的字庫是用在"使用圖像比較進行OCR"法的
這個功能在Subtitle Edit 3.5.3之後的版本被移除了,所以要3.5.3(包括)前的版本才能用上面的字庫
針對不同片商把字庫分類,OCR時會比較快
像這樣:
SubtitleEdit目錄>VobSub>標楷體>檔案
                                           >NF>檔案

我剛開始OCR華納跟博偉的標楷體時,是用wb2013提供的11F西方極樂園字庫
之後增加了不少辨識數,包含港繁,基本上一部片需要輸入處十餘字左右,冷門字多時應該也不到20個字
另外再加上NF的黑體字庫,NF字庫完全都是從版上的sup檔從無到有建立起來的,辨識度有九成九以上
提供給有需要的會員,若是發現字庫中有輸入錯誤的字麻煩告知
華納標楷體.rar (8.22 MB, 下載次數: 97) 解壓縮後90.5mb
NETFLIX.rar (11.21 MB, 下載次數: 87) 解壓縮後133mb

06/30補充說明:
一般來說近幾年的迪士尼、漫威系列、J·K·羅琳作品、少數DC系列、博偉、華納BD,很多都是這字庫的標楷體(白色字)
但是偶爾版上少數sup中是同樣字體但卻是灰色字,遇到灰色字時字庫完全辨識不出來,必須重新新增輸入

對於想自行建立字庫的,最先推薦的就是上面的華納標楷體,之後若想再建其他的,推薦從環球黑體開始
環球所用的黑體與派拉蒙部分電影字體相同,片量也很可觀

評分

參與人數 3名聲 +30 精幣 +30 收起 理由
KEIJIMUTOH + 10 + 10 熱心助人
bau921 + 10 + 10 熱心助人
cory + 10 + 10 熱心助人^^

查看全部評分

回覆

使用道具 舉報


發表於 2019-7-18 05:32:07 | 顯示全部樓層
本文最後由 ethan 於 2019-7-19 05:28 AM 編輯

原本是使用"使用圖像比較進行OCR"的華納標楷體字庫
前陣子看到Aray大在這帖所提到與Binary Image Compare法的差距
於是開始另外建立Binary的華納標楷體字庫後發現與圖像比較法間的差異

目前發現圖像比較法對於斜體字不太友善, 即使是輸入過字庫, 但會因為字體邊緣鄰字的邊角也被截入字庫而無法辨識
有時標記範圍時就是無法只標一個字, 遇到非白色字體時(有些sup是灰字或黃字)都必須再輸入
而這些問題在Binary法中都不是問題了, 斜體字鄰字的邊角都會被去背, 任何顏色的字都會直接反白而不用再輸入
但是我在建Binary字庫時發現, 辨識字體"些微差異性"的相容度, 似乎沒有之前我在建圖像比較法的字庫時來得好
個人推測是跟去背反白後的毛邊化有關(似乎字體的陰影效果也會反白)

以下大略提一下我在建兩種字庫時的大致順序
最大錯誤值都是設0.5%
圖像比較法: 3.5.3版本
如樓上所提是以wb2013的西方極樂園字庫做基底開始建立>怪獸與牠們的產地系列>漫威系列>迪士尼
>華納 如沙贊, 男人的一半還是男人>神盾局特工
在上述的OCR過程中, 完全都沒碰到過字體無法辨識的情況

Binary Image Compare: 3.5.9FI版本
完全新建字庫>神盾局特工>無法辨識西方極樂園>漫威系列>無法辨識怪獸與牠們的產地系列
>華納 無法辨識沙贊, 男人的一半還是男人
許多之前在圖像比較法時能持續辨識輸入字庫的sup, 在Binary法時不少都無法辨識

附上目前的Binary華納標楷體字庫
華納標楷體.rar (878.01 KB, 下載次數: 30)

目前個人感覺除了針對斜體字跟有色字的辨識支援度, 以及辨識速度較快外, 似乎感覺不到其他的優異性?
想請問版上OCR經驗豐富的大神不吝提供意見與看法, 謝謝



回覆

使用道具 舉報


發表於 2019-7-18 10:54:02 | 顯示全部樓層
pharaohchang 發表於 2017-9-16 09:16 AM
cht-楷-細白是對應(加勒比海盜 神鬼奇航:死無對證)要其他藍光字幕用一樣的字體才能辨識

把cht-楷-細白解 ...

为什么我的软件没有vobsub这个文件夹,是要自己创建吗,还是软件的问题
回覆

使用道具 舉報


發表於 2019-7-19 18:17:00 | 顯示全部樓層
tyzh279 發表於 2019-7-18 10:54 AM
为什么我的软件没有vobsub这个文件夹,是要自己创建吗,还是软件的问题

3.5.3版本才行,看你樓上。
回覆

使用道具 舉報


發表於 2019-7-19 18:19:25 | 顯示全部樓層
Fxe 發表於 2019-7-19 06:17 PM
3.5.3版本才行,看你樓上。

感谢提示
回覆

使用道具 舉報


發表於 2019-7-20 13:43:13 | 顯示全部樓層
剛剛開始學習用SubtitleEdit ,用Binary Image Compare這方法OCR,同一個相同字都要每次輸入很煩
回覆

使用道具 舉報


發表於 2019-7-21 10:17:58 | 顯示全部樓層
man125 發表於 2019-7-20 01:43 PM
剛剛開始學習用SubtitleEdit ,用Binary Image Compare這方法OCR,同一個相同字都要每次輸入很煩 ...

1563675224287.jpg
我設這樣 你試試
至於圖像資料庫 我是不分類的 呵呵 [RAM不大的朋友 可不要學]

回覆

使用道具 舉報


發表於 2019-7-21 10:50:00 | 顯示全部樓層
ETS 發表於 2019-7-21 10:17 AM
我設這樣 你試試
至於圖像資料庫 我是不分類的 呵呵 [RAM不大的朋友 可不要學]

請問可否分享字庫
回覆

使用道具 舉報

您需要登錄後才可以回文 登入 | 註冊

本版積分規則

熱門推薦

StormAudio 全新 ADEC 進階解碼卡 —— 安裝與完整效能測試評測—AV NIRVANA
StormAudio 全新 ADEC 進
StormAudio 全新 ADEC 進階解碼卡:安裝流程與完整效能測試心得
絕對有感的杜比視界!Optoma UHR90DV丹爸影音實驗室體驗後感   - 這個價位!這般規格!這等畫質!實力足以挑戰業界巨人的投影機大衛王!
絕對有感的杜比視界!Opto
絕對有感的杜比視界!Optoma UHR90DV丹爸影音實驗室體驗後感 -
南臺灣藝文之都的B&W Nautilus鸚鵡螺/StormAudio風暴7.2.1.6多聲道視聽室開箱!
南臺灣藝文之都的B&W Naut
南臺灣藝文之都的B&W Nautilus鸚鵡螺/StormAudio風暴7.2.1.6多聲
StormAudio ISR Fusion 20:力量、精準與聽覺新典範—Thrillcat Cinema Lab
StormAudio ISR Fusion 20
StormAudio ISR Fusion 20:力量、精準與聽覺新典範—Thrillcat
Barefoot Sound Footprint03:最先進的錄音室監聽進化之作
Barefoot Sound Footprint
Barefoot Sound Footprint03:最先進的錄音室監聽進化之作—Swee

聯絡我們| 問題反映| 小黑屋| 手機版| Archiver|  本網站特別聘請 蔡家豪律師 為本站法律顧問

快速回覆 返回頂部 返回列表