陳泰宇 發表於 2019-3-7 20:35:27

Fantastic Beasts: The Crimes of Grindelwald(怪獸與葛林戴華德的罪行)歐版藍光原盤中文字幕

台灣繁體中文沒有標示片名!參照港版如下:

00:07:20,106 --> 00:07:25,111
片名:怪獸與葛林戴華德的罪行


有請OCR高手造福網友!(我已經忘了要怎麼OCR了...真的老了)

台灣繁體中文


大陸簡體中文


香港繁體中文

陳泰宇 發表於 2019-3-7 21:26:33

本文最後由 陳泰宇 於 2019-3-7 09:46 PM 編輯

參考置頂 clubaudition 的OCR教學自行OCR(速度比以前記憶中的方法真的是非常快...),我知道有錯字,歡迎糾錯分享!

台灣繁體中文


錯字多的離譜......建議不要下載傷眼!

Blu-ray888 發表於 2019-3-7 22:43:00

其實萬年不變的置頂文也需要調整
該下架就要下架
https://www.hd.club.tw/thread-131330-1-1.html
https://www.hd.club.tw/thread-127180-1-1.html

該上架的卻不上架
https://www.hd.club.tw/thread-189125-1-1.html

ethan 發表於 2019-3-7 22:44:44

本文最後由 ethan 於 2019-3-7 11:28 PM 編輯

用wb2013在教學帖中提供的西方極樂園字庫華納標楷體OCR的
樓主你若無自己的字庫,要OCR華納標楷體就應該要用這個(11F)
https://www.hd.club.tw/forum.php ... =%E5%AD%97%E5%BA%AB
需要輸入的字不多
只有像反過來的逗點跟雙逗點的引號不知怎打,用了“取代

866這行的前後句都沒出現別的引號,不知是誤植還是漏了後面的引號,未作修改
01:26:43,199 --> 01:26:44,074
“別跑了

989
01:38:47,672 --> 01:38:50,175
“被殘忍放逐之子,傷心且絕望之女”

台繁


陳泰宇 發表於 2019-3-7 22:59:08

Blu-ray888 發表於 2019-3-7 10:43 PM
其實萬年不變的置頂文也需要調整
該下架就要下架
https://www.hd.club.tw/thread-131330-1-1.html


非常贊同 Blu-ray888 的看法,因為遵照 clubaudition 教學的方式所OCR下來的字幕錯別字實在多的難以入眼...!還是以往的方式,一個字一個字的方式比較可靠!

paulyip 發表於 2019-3-8 08:02:48

求香港繁體中文srt=崇拜=

zxxz 發表於 2019-3-8 09:17:41

ethan 發表於 2019-3-7 10:44 PM
用wb2013在教學帖中提供的西方極樂園字庫華納標楷體OCR的
樓主你若無自己的字庫,要OCR華納標楷體就應該要用 ...

414和415應調整為:

414
00:41:49,508 --> 00:41:52,836
-一切會像在紐約那樣,別擔心
-但奎妮說他是正氣師

415
00:41:52,844 --> 00:41:55,055
他是正氣師又如何?不用擔心

陳泰宇 發表於 2019-3-8 13:03:08

重新參考before1012前輩的 這篇教學 ,一個字一個字從0開始敲!因為我的顯示器是4K的,注音輸入法的字小的看起來非常非常吃力(年紀大也有差)!以致誤把〝查〞打成〝査〞,()弄成〈〉!也不知道如何回去修改???@豬豬@@豬豬@@豬豬@只好用後製...取代!





看字型有點像標楷體,所以我把這次的字庫存成標楷體,分享給需要的人參考(需要港版的可參考上面那篇教學自己OCR,應該不會打太多字吧)




成果已核對過,確定可直接對應4K UHD版無誤!如果有發現錯字再請不吝告知!


Aray 發表於 2019-3-8 14:12:56

本文最後由 Aray 於 2019-3-8 02:23 PM 編輯

陳泰宇 發表於 2019-3-8 01:03 PM
重新參考before1012前輩的 這篇教學 ,一個字一個字從0開始敲!因為我的顯示器是4K的,注音輸入法的字小的 ...

昨晚OCR了一份本打算週末享用
TW&HK字形都是DFKai-SB,Bold,68點,
CN是SimHei,Bold,68點


TW (純OCR, 未修正錯誤)
866
01:26:43,198 --> 01:26:44,074
‘別跑了‘ (字幕源錯誤, 多出個符號)

972
01:37:43,733 --> 01:37:48,237
但他的么子寇沃斯隨後出生   么->幺 (字幕源錯誤)





HK (純OCR, 未修正錯誤)
848,880,974拉雪兹 兹->茲(異體字)
1167
01:50:08,852 --> 01:50:13,023
他們濫殺女巫及巫師同袍   胞->袍?

Aray 發表於 2019-3-8 14:29:51

本文最後由 Aray 於 2019-3-8 03:05 PM 編輯

陳泰宇 發表於 2019-3-8 01:03 PM
重新參考before1012前輩的 這篇教學 ,一個字一個字從0開始敲!因為我的顯示器是4K的,注音輸入法的字小的 ...

你用的SE是老版本的, 用的還是老的OCR via Image Compare的模式, 識別率差, 效率低, 而且庫之間不能導入, 自從3.5.3版本後的SE已經放棄這種模式. 關於這個問題, 我還特意徵詢過軟件作者, 他說由於OCR via Image Compare存在很多不足, 而後來的Binaray Image Compare模式擴展了很多數據項, 所以無法實現新舊版本兼容, 也無法重用老版本的數據.

現在最新最準確的是新版的Binaray Image Compare模式, 效率高, 字符圖像識別率高哦, 而且這種模式支持不同庫之間導入.

所以, 你提供的這份標楷體庫, 只能用於這部電影的識別.

某種意義上說, Before1012的那篇文章也已經過時, 而且已不具備廣泛的延續性, 我想這也應該是他的文章未被置頂的緣故. 相反, #3F的Blu-ray888提到的另外兩篇的軟體和做法雖然也已過時, 做法還很笨, 但在沒有更好的替代辦法之前, 它們卻是最簡單粗暴有效的辦法. 像很多事情一樣, 最笨的辦法往往是最有效最有持續性的辦法, 個人理解.

我自己在網上找過很多種辦法來解決字幕OCR, 最終還是放棄, 目前認為仍然是最有效的辦法是:
1. VobSub, SubResync+SubRip+SubToSrt,
2. 視頻硬字OCR, esrXP+IdxSubOcr
3. Bluray,UHD SUP, Subtitle Edit

ethan 發表於 2019-3-8 14:48:23

Aray 發表於 2019-3-8 02:12 PM
昨晚OCR了一份本打算週末享用
TW&HK字形都是DFKai-SB,Bold,68點,
CN是SimHei,Bold,68點


你是說么子應該是幺子?
台灣是用么

henry3721 發表於 2019-3-8 15:03:41

本文最後由 henry3721 於 2019-3-8 03:05 PM 編輯

"港版繁中",首次自行OCR,已校對過了,真的很費勁,各位笑納並請指教。{:1_545:}{:1_547:}

Aray 發表於 2019-3-8 15:26:22

本文最後由 Aray 於 2019-3-8 03:28 PM 編輯

henry3721 發表於 2019-3-8 03:03 PM
"港版繁中",首次自行OCR,已校對過了,真的很費勁,各位笑納並請指教。 ...
對比了一下你我OCR的字幕,
1. 你的字幕好多句子中間也有空格, 說明OCR設置的空格值太小, 建議設置36~42 (英文不適用)

https://s2.ax1x.com/2019/03/08/kzBUl4.jpg


2. 標點字符不同, 很正常, 有人喜歡用中文半碼符號, 有人喜歡用全碼, 有人喜歡用英文


3.有幾處內容小不同

951
01:29:30,448 --> 01:29:32,325
是我哥要在6月6娶莉塔      (字幕源没有"日", 你增加了个"日"字, 应该你是对的)

979
01:32:37,093 --> 01:32:40,513
那些不是貓,是使役魔
一種幽靈家僕       (字幕源有"僕", 你少了个"僕"字)

1019
01:37:01,941 --> 01:37:04,027
在他嚥下最後一口氣前    (源为"嚥", 你是"吞")

陳泰宇 發表於 2019-3-8 17:39:55

Aray 發表於 2019-3-8 02:29 PM
你用的SE是老版本的, 用的還是老的OCR via Image Compare的模式, 識別率差, 效率低, 而且庫之間不能導入, ...

感謝您熱心分享,我之所以不想用新版是因為怕萬一動到設定,我又要重新找我喜歡的顏色...上次忘了是做哪個動作,我喜歡的字幕顏色跑掉了,害我又重新設定一次很麻煩!我電腦裡這個SE工具就有5個版本......




我昨晚與今天上午也花了相當多的時間在打這個字幕(脖子好痠),唯一值得安慰的,是這次我完全沒有動用到〝字典〞!水行俠還有一個字要查才知道那個字...哈哈哈

有好的方式真得很希望大家分享出來,造福大家需求與自己得到完美的字幕...相信這是大家最希望得到的!

man125 發表於 2019-3-8 17:50:48

本文最後由 man125 於 2019-3-8 06:03 PM 編輯

henry3721 發表於 2019-3-8 03:03 PM
"港版繁中",首次自行OCR,已校對過了,真的很費勁,各位笑納並請指教。 ...
已修改句子中間空格



victso 發表於 2019-3-8 21:41:10

陳泰宇 發表於 2019-3-8 01:03 PM
重新參考before1012前輩的 這篇教學 ,一個字一個字從0開始敲!因為我的顯示器是4K的,注音輸入法的字小的 ...

我都是習慣用 bdsup2sub 直接把sup字幕轉成sub字幕,再用 IdxSubOcr 識別,對照著逐條校對,也有看花眼漏掉的時候。

zeyaloz 發表於 2019-3-9 14:39:46

henry3721 發表於 2019-3-8 03:03 PM
"港版繁中",首次自行OCR,已校對過了,真的很費勁,各位笑納並請指教。 ...

感激!!!

victso 發表於 2019-3-10 07:08:50

OCR大陸簡體中文字幕,文字已校對,如還有錯誤,請指出,謝謝~~~
改動如下:
“-”後加空格,單空格變成雙空格

Song3 發表於 2019-3-14 16:43:32

victso 發表於 2019-3-10 07:08 AM
OCR大陸簡體中文字幕,文字已校對,如還有錯誤,請指出,謝謝~~~
改動如下:
“-”後加空格,單空格變成雙 ...

154224
又俘(邓)布利多
1018
法语 (建议加括号)请进

Aray 發表於 2019-12-10 20:14:46

victso 發表於 2019-3-10 07:08 AM
OCR大陸簡體中文字幕,文字已校對,如還有錯誤,請指出,謝謝~~~
改動如下:
“-”後加空格,單空格變成雙 ...

忒休斯    休->修 (多處)
1341 纽蒙迎德城堡    迎->迦
頁: [1]
查看完整版本: Fantastic Beasts: The Crimes of Grindelwald(怪獸與葛林戴華德的罪行)歐版藍光原盤中文字幕