nenebear 發表於 2023-3-18 03:28 PM
subtitle edit有個取消空格功能 不知是否你要的.
試試..subtitle edit\編輯\取代\尋找內容(按一次空白鍵 ...
恐怕還是有些問題,會取消某些用空格代替逗號的句子,
以及有些分對話在同一行也會被連成一起
例如
cory 發表於 2023-3-18 05:21 PM
恐怕還是有些問題,會取消某些用空格代替逗號的句子,
以及有些分對話在同一行也會被連成一起
例如
如果是在Subtitle Edit使用"Binary image compare" OCR的話,可試著將"像素數是空白"的值 設定高一些--例如:45. 有時可降低空格的出現!
本文最後由 nenebear 於 2023-4-15 10:43 AM 編輯
請教先進們! 近日留意到 Stealer.The.Treasure.Keeper字幕內有部分
字幕行是個別的字行
而視覺上是重疊的.
請問 視覺的字行重疊 可如何設定!
於此 先謝過
*******************
真是秀下限了!
自我解答 -- 調整時間軸(重疊)即可.
我都用簡轉繁
Thanks for sharing this helpful tutorial.
Subtitle Edit的波型圖不知用了甚麼黑科技, 把播放速度減到最慢, 例如30%, 播出來竟然可以保持原來的聲音頻率/音高
然後最近在另一台新電腦上用Subtitle Edit的波型圖, 同樣是減慢播放速度, 但這次的聲音頻率變低了, 女聲變成男聲, 男聲甚至變成聽不清楚在說甚麼
但兩台的Subtitle Edit版本是一樣的, 請問是甚麼影響了這個頻率?
本文最後由 Brogg 於 2024-7-18 11:52 PM 編輯
請問我上識字網用圖片辨認字體
這三部電影都顯示是:超世紀粗標楷
蜘蛛人:返校日
蜘蛛人:離家日
蜘蛛人:無家日
都是使用站內大大分享的SUP
可是 返校日字庫OCR離家日不通用
返校日-離家日字庫分開OCR無家日也不通用
Brogg 發表於 2024-7-18 11:42 PM
請問我上識字網用圖片辨認字體
這三部電影都顯示是:超世紀粗標楷
首先, 官方一般不會隨意選擇或變更第三方字型, 所以截圖所用字型我認為是DFKai-SB(微軟華康標楷體), 而不會是超世紀粗標楷, 只是兩款字型非常相似
其次, 台繁字庫和簡中字庫肯定不通用, 主要是字庫中所訓練積累的字元數量決定的
本文最後由 Brogg 於 2024-7-22 02:04 PM 編輯
Aray 發表於 2024-7-22 12:29 PM
首先, 官方一般不會隨意選擇或變更第三方字型, 所以截圖所用字型我認為是DFKai-SB(微軟華康標楷體), 而不 ...最大錯誤1.5還是會有錯字
我現在是設定1.0
沒簡體 全部台繁 最後是三部電影分開建立三部字庫
站內有其他大大也是在有分享SUP的帖子 反應這三部辨識率有問題 三部不相容
蜘蛛人字體重複輸入率太多 三部電影三部字庫加起來2.3M 一部快800KB
=====================
另一個問題 現在Subtitle Edit 默認都是200
版本4.0.6開始建立字庫默認200
大大您的帖子內是提到270
我以"終極戰士團4K" 設定270 OCR明天過後
華康楷書體W5 270不相融 下調245-170相融
黑體270-蒼鷺與少年-無敵浩克2008-鋼鐵人1-2-美國隊長1(併入類似黑體) 雷神索爾1-變形金剛1-2-3
變形金剛4 (270類似黑體)不相容浩克-鋼鐵人1-2字庫
變形金剛5 + 大黃蜂 300-270-250不相容-下調245-200相容變形金剛4字庫
變形金剛:大黃蜂4K 下調170 相容變形金剛4-5字庫
變形金剛:萬獸崛起 放棄相融(類似黑體 "獨立一部"字庫) 不相容以上兩版字庫
變形金剛:萬獸崛起"4K" (不相容以上三版字庫暫時放棄建立)
數值都是下調
是否現在適合默認200
還是我照舊以270建立字庫
嘗試了多種辦法,感覺google cloud vision api 還是萬用解
只可惜Google對OCR的API要求收費,免費版或試用版都會報錯
本文最後由 thc0818 於 2025-1-22 09:42 PM 編輯
正在學習OCR字幕,對於字庫一知半解,如果可得到字庫,應該可以學習更多,應該可以提升技術
本文最後由 麥香綠茶 於 2025-1-24 10:34 PM 編輯
thc0818 發表於 2025-1-22 12:48 AM
正在學習OCR字幕,對於字庫一知半解,如果可得到字庫,應該可以學習更多,應該可以提升技術 ...
OCR要非常有耐心
魔戒三部曲 台、港BD 1份
魔戒三部曲 台、港UHD 1份
(魔戒三部曲 BD、UHD分開建立字庫)
到我們為止、監聽、入魔 BD 1份
你要是能建立以上的電影三份字庫 我再繼續下一步吧
因為辨識率差 難度高 多部電影SUP使用這類字型
數值最大錯誤2.0 mage Pre-Proceeing默認200
Subtitle Edit軟體版本4.0.10
原樓層編輯
感謝兄台分享如數家珍的 subtitle edit 使用技術文件
初學者的我是有看沒有十分懂
在網路上找到 subtitle edit的下載安裝教學
可讓像我一樣初學使用者按部就班的安裝使用學習
因為安裝subtitle edit需要設定一些額外的細節設定
不像一般軟體下一步、下一步...就設定安裝完成
所以我把教學網址分享給像我一樣的初學者
希望有好的字幕工具輔助下
也能像各位前輩一樣做出好的字幕檔與大家分享
subtitle edit 下載官網
https://www.nikse.dk/subtitleedit
subtitle edit 安裝教學網址:
https://li.ntou.edu.tw/var/file/29/1029/img/1560/SubtitleEdit_demo.mp4
本文最後由 麥香綠茶 於 2025-3-28 07:58 AM 編輯
Subtitle Edit 有個模式Paddle OCR 軟體版本4.0.11 只能使用Beta免安裝版
正式安裝版本不能使用Paddle OCR模式
簡中&英文
繁體字
SUP、SUB都能使用Paddle OCR模式
Subtitle Edit 4.0.11 Beta 載點
Python、CUDA安裝
PIP安裝
https://www.vixual.net/blog/archives/115
https://www.vixual.net/blog/archives/156
https://github.com/spyder-ide/spyder/releases
想說這模式能不能建立字庫呢?輸出文檔再校對更改錯字
OCR後使用心得
勾選GPU比較快,微卡頓,不勾選我聽到風扇轉很大聲,而且很慢
精確度都有很大進步空間。
另分享一部六人行BD全十季字庫,數值0.0-預設200,十季已校對完
Binaray Imagc Compare 模式
此字庫太大了很卡,只能等看看後期軟體優化好一點,再重新啟用
小弟改用2.0了,可是英文大寫、小寫O、C、G、I、i數字 1 小寫 l
沒有累積到以上這些都會混用,中文字目前發現 材、村、己、已這四個字混用
想到一個偷吃步方法Subtitle Edit開文檔另外再開一個SUP COR檔雙開
文檔那邊Ctrl+F輸入會混用的字搜尋 另一邊OCR 錯誤率使用0.0特別累積多一點以上會混用的
略過讓紅框移動到以上那些
2.0是整體累積0.0是局部,這樣就不用打字打到死了
字庫編輯那可以查看你累積多少字量,這是0.0數字1的累積,自己去判斷要累積多少
本文最後由 fkg 於 2025-3-8 04:18 PM 編輯
cory 發表於 2023-3-18 01:37 PM
請問有何方法將字幕英外文字串、阿拉伯數字前後空格一鍵刪除?
例如:
是不是這樣的效果,在subtitle edit裡的多項替換使用正則表達式添加兩項
查找內容(\d) ([\u4e00-\u9fff]) 替換內容$1$2
查找內容([\u4e00-\u9fff]) (\d) 替換內容$1$2
ps... 記得最後選項裡(正常、區分大小寫、正則表達式)裡選正則然後添加到規則組,因為平時看簡體所以subtitle edit界面是簡體,你如果使用繁體的或者英文可能大概意思差不多的選項吧