樓主: Aray
收起左側

[教學] Subtitle Edit 進階使用技巧和心得

  [複製連結]

發表於 2023-3-18 17:21:33 | 顯示全部樓層
nenebear 發表於 2023-3-18 03:28 PM
subtitle edit有個取消空格功能 不知是否你要的.
試試..subtitle edit\編輯\取代\尋找內容(按一次空白鍵 ...

恐怕還是有些問題,會取消某些用空格代替逗號的句子,
以及有些分對話在同一行也會被連成一起
例如
18 170655.jpg
71018 136.jpg
回覆

使用道具 舉報


發表於 2023-4-9 23:23:42 | 顯示全部樓層
cory 發表於 2023-3-18 05:21 PM
恐怕還是有些問題,會取消某些用空格代替逗號的句子,
以及有些分對話在同一行也會被連成一起
例如

如果是在Subtitle Edit使用"Binary image compare" OCR的話,可試著將"像素數是空白"的值 設定高一些--例如:45. 有時可降低空格的出現!
回覆

使用道具 舉報


發表於 2023-4-15 10:03:04 | 顯示全部樓層
本文最後由 nenebear 於 2023-4-15 10:43 AM 編輯

請教先進們! 近日留意到 Stealer.The.Treasure.Keeper字幕內有部分
字幕行是個別的字行
041501.jpg
而視覺上是重疊的.
041503.jpg
041502.jpg

請問 視覺的字行重疊 可如何設定!
於此 先謝過

*******************

真是秀下限了!
自我解答 -- 調整時間軸(重疊)即可.  
回覆

使用道具 舉報


發表於 2023-8-9 20:33:04 | 顯示全部樓層
我都用簡轉繁
回覆

使用道具 舉報


發表於 2024-2-22 18:12:44 | 顯示全部樓層
Thanks for sharing this helpful tutorial.
回覆

使用道具 舉報


發表於 2024-4-4 20:50:06 | 顯示全部樓層
Subtitle Edit的波型圖不知用了甚麼黑科技, 把播放速度減到最慢, 例如30%, 播出來竟然可以保持原來的聲音頻率/音高

然後最近在另一台新電腦上用Subtitle Edit的波型圖, 同樣是減慢播放速度, 但這次的聲音頻率變低了, 女聲變成男聲, 男聲甚至變成聽不清楚在說甚麼

但兩台的Subtitle Edit版本是一樣的, 請問是甚麼影響了這個頻率?

11.png
回覆

使用道具 舉報


發表於 2024-7-18 23:42:18 | 顯示全部樓層
本文最後由 Brogg 於 2024-7-18 11:52 PM 編輯

請問我上識字網用圖片辨認字體
這三部電影都顯示是:超世紀粗標楷

蜘蛛人:返校日
蜘蛛人:離家日
蜘蛛人:無家日
都是使用站內大大分享的SUP
可是 返校日字庫OCR離家日不通用
返校日-離家日字庫分開OCR無家日也不通用

超世紀粗標楷

超世紀粗標楷
最大錯誤1.5.png
270.png

超世紀粗標楷-返校日.db

701.88 KB, 下載次數: 1

蜘蛛人:返校日

超世紀粗標楷(第二版)-離家日.db

704.87 KB, 下載次數: 1

蜘蛛人:離家日

回覆

使用道具 舉報


 樓主| 發表於 2024-7-22 12:29:07 | 顯示全部樓層
Brogg 發表於 2024-7-18 11:42 PM
請問我上識字網用圖片辨認字體
這三部電影都顯示是:超世紀粗標楷

首先, 官方一般不會隨意選擇或變更第三方字型, 所以截圖所用字型我認為是DFKai-SB(微軟華康標楷體), 而不會是超世紀粗標楷, 只是兩款字型非常相似

其次, 台繁字庫和簡中字庫肯定不通用, 主要是字庫中所訓練積累的字元數量決定的
回覆

使用道具 舉報


發表於 2024-7-22 13:57:21 | 顯示全部樓層
本文最後由 Brogg 於 2024-7-22 02:04 PM 編輯
Aray 發表於 2024-7-22 12:29 PM
首先, 官方一般不會隨意選擇或變更第三方字型, 所以截圖所用字型我認為是DFKai-SB(微軟華康標楷體), 而不 ...
最大錯誤1.5還是會有錯字
我現在是設定1.0
沒簡體 全部台繁 最後是三部電影分開建立三部字庫
站內有其他大大也是在有分享SUP的帖子 反應這三部辨識率有問題 三部不相容
蜘蛛人字體重複輸入率太多 三部電影三部字庫加起來2.3M 一部快800KB
=====================
另一個問題 現在Subtitle Edit 默認都是200
版本4.0.6開始建立字庫默認200
大大您的帖子內是提到270
我以"終極戰士團4K" 設定270 OCR明天過後
華康楷書體W5 270不相融 下調245-170相融


黑體270-蒼鷺與少年-無敵浩克2008-鋼鐵人1-2-美國隊長1(併入類似黑體) 雷神索爾1-變形金剛1-2-3


變形金剛4 (270類似黑體)不相容浩克-鋼鐵人1-2字庫
變形金剛5 + 大黃蜂 300-270-250不相容-下調245-200相容變形金剛4字庫
變形金剛:大黃蜂4K 下調170 相容變形金剛4-5字庫
變形金剛:萬獸崛起 放棄相融(類似黑體 "獨立一部"字庫) 不相容以上兩版字庫
變形金剛:萬獸崛起"4K" (不相容以上三版字庫暫時放棄建立)



數值都是下調
是否現在適合默認200
還是我照舊以270建立字庫

終極戰士團4K

終極戰士團4K

明天過後

明天過後
回覆

使用道具 舉報


發表於 2024-10-3 00:36:54 | 顯示全部樓層
嘗試了多種辦法,感覺google cloud vision api 還是萬用解
只可惜Google對OCR的API要求收費,免費版或試用版都會報錯
回覆

使用道具 舉報


發表於 2025-1-22 00:48:09 | 顯示全部樓層
本文最後由 thc0818 於 2025-1-22 09:42 PM 編輯

正在學習OCR字幕,對於字庫一知半解,如果可得到字庫,應該可以學習更多,應該可以提升技術
回覆

使用道具 舉報


發表於 2025-1-24 22:31:47 | 顯示全部樓層
本文最後由 麥香綠茶 於 2025-1-24 10:34 PM 編輯
thc0818 發表於 2025-1-22 12:48 AM
正在學習OCR字幕,對於字庫一知半解,如果可得到字庫,應該可以學習更多,應該可以提升技術 ...

OCR要非常有耐心
魔戒三部曲 台、港BD 1份
魔戒三部曲 台、港UHD 1份
(魔戒三部曲 BD、UHD分開建立字庫)
到我們為止、監聽、入魔 BD 1份
你要是能建立以上的電影三份字庫 我再繼續下一步吧
因為辨識率差 難度高 多部電影SUP使用這類字型
數值最大錯誤2.0 mage Pre-Proceeing默認200
Subtitle Edit  軟體版本4.0.10
原樓層編輯



回覆

使用道具 舉報


發表於 2025-2-16 18:46:14 | 顯示全部樓層
感謝兄台分享如數家珍的 subtitle edit 使用技術文件
初學者的我是有看沒有十分懂
在網路上找到 subtitle edit的下載安裝教學
可讓像我一樣初學使用者按部就班的安裝使用學習
因為安裝subtitle edit需要設定一些額外的細節設定
不像一般軟體下一步、下一步...就設定安裝完成
所以我把教學網址分享給像我一樣的初學者
希望有好的字幕工具輔助下
也能像各位前輩一樣做出好的字幕檔與大家分享

subtitle edit 下載官網
https://www.nikse.dk/subtitleedit

subtitle edit 安裝教學網址:
https://li.ntou.edu.tw/var/file/ ... btitleEdit_demo.mp4

回覆

使用道具 舉報


發表於 2025-3-3 12:16:45 | 顯示全部樓層
本文最後由 麥香綠茶 於 2025-3-28 07:58 AM 編輯

Subtitle Edit 有個模式Paddle OCR 軟體版本4.0.11 只能使用Beta免安裝版

正式安裝版本不能使用Paddle OCR模式
簡中&英文
繁體字
SUP、SUB都能使用Paddle OCR模式
Paddle OCR.png


Subtitle Edit 4.0.11 Beta 載點
Python、CUDA安裝
PIP安裝
https://www.vixual.net/blog/archives/115
https://www.vixual.net/blog/archives/156
https://github.com/spyder-ide/spyder/releases
想說這模式能不能建立字庫呢?輸出文檔再校對更改錯字

OCR後使用心得
勾選GPU比較快,微卡頓,不勾選我聽到風扇轉很大聲,而且很慢
精確度都有很大進步空間。

另分享一部六人行BD全十季字庫,數值0.0-預設200,十季已校對完
Binaray Imagc Compare 模式
此字庫太大了很卡,只能等看看後期軟體優化好一點,再重新啟用
SUP六人行 全十季.db (6.05 MB, 下載次數: 1)

小弟改用2.0了,可是英文大寫、小寫O、C、G、I、i數字 1 小寫 l
沒有累積到以上這些都會混用,中文字目前發現 材、村、己、已這四個字混用
想到一個偷吃步方法Subtitle Edit開文檔另外再開一個SUP COR檔雙開
文檔那邊Ctrl+F輸入會混用的字搜尋 另一邊OCR 錯誤率使用0.0特別累積多一點以上會混用的
略過讓紅框移動到以上那些
2.0是整體累積0.0是局部,這樣就不用打字打到死了
字庫編輯那可以查看你累積多少字量,這是0.0數字1的累積,自己去判斷要累積多少
字庫累積.png



回覆

使用道具 舉報


發表於 2025-3-8 16:07:15 | 顯示全部樓層
本文最後由 fkg 於 2025-3-8 04:18 PM 編輯
cory 發表於 2023-3-18 01:37 PM
請問有何方法將字幕英外文字串、阿拉伯數字前後空格一鍵刪除?

例如:

005000.164.png


是不是這樣的效果,在subtitle edit裡的多項替換使用正則表達式添加兩項
查找內容(\d) ([\u4e00-\u9fff])   替換內容$1$2
查找內容([\u4e00-\u9fff]) (\d)   替換內容$1$2


ps... 記得最後選項裡(正常、區分大小寫、正則表達式)裡選正則然後添加到規則組,因為平時看簡體所以subtitle edit界面是簡體,你如果使用繁體的或者英文可能大概意思差不多的選項吧
回覆

使用道具 舉報

您需要登錄後才可以回文 登入 | 註冊

本版積分規則

熱門推薦

絕對有感的杜比視界!Optoma UHR90DV丹爸影音實驗室體驗後感   - 這個價位!這般規格!這等畫質!實力足以挑戰業界巨人的投影機大衛王!
絕對有感的杜比視界!Opto
絕對有感的杜比視界!Optoma UHR90DV丹爸影音實驗室體驗後感 -
南臺灣藝文之都的B&W Nautilus鸚鵡螺/StormAudio風暴7.2.1.6多聲道視聽室開箱!
南臺灣藝文之都的B&W Naut
南臺灣藝文之都的B&W Nautilus鸚鵡螺/StormAudio風暴7.2.1.6多聲
StormAudio ISR Fusion 20:力量、精準與聽覺新典範—Thrillcat Cinema Lab
StormAudio ISR Fusion 20
StormAudio ISR Fusion 20:力量、精準與聽覺新典範—Thrillcat
Barefoot Sound Footprint03:最先進的錄音室監聽進化之作
Barefoot Sound Footprint
Barefoot Sound Footprint03:最先進的錄音室監聽進化之作—Swee
MadVR Experience Center 家庭劇院導覽:瘋狂的11.11.6 聲道的沉浸體驗
MadVR Experience Center
MadVR Experience Center 家庭劇院專訪:瘋狂的11.11.6 聲道的沉

聯絡我們| 問題反映| 小黑屋| 手機版| Archiver|  本網站特別聘請 蔡家豪律師 為本站法律顧問

快速回覆 返回頂部 返回列表