|
|
發表於 2019-7-22 15:32:24
|
顯示全部樓層
本文最後由 Aray 於 2019-7-22 04:51 PM 編輯
1、雙引號我是這麼處理的:
尋找內容: ("|「|〝|‘|"|')(.+?)("|」|〞|’|"|')
取代為:“$2”
作用: 將"、「、〝、‘、"、'轉換為中文半碼雙引號
問題:
1.這種寫法如果碰到多重引用時, 會出現邏輯錯誤, 例如: xxx“yyy‘xxx’”, 這種情況比較少, 可以通過人工辨別並修改
2.這種寫法僅適用於左右引號兩邊都在同一行, 如果左右引號出現在不同行的情況, 可使用下面介紹的方法
2、分別建立左右兩項雙引號處理並同時啓用選定
尋找內容: (「|〝|‘|"|')
取代為:“
尋找內容: (」|〞|’|"|')
取代為: ”
作用: 將「、〝、‘、"、'轉換為中文半碼雙引號
問題: 由於英文引號、HBO全碼中文雙引號左右兩邊都用同樣的符號, 不分左右, 因此有一定概率出錯, 需要與前面所提規則配合使用,最後再人工查找辨別
3、另外, 我們還經常碰到各種省略號的寫法, 我總結歸納了一下常見的幾種, 基本上適用於大部分情況:
尋找內容: (\. \. \.|\.\.\.\.\.\.|\.\.\.\.|\.\.\.|\.\.|...|···|……|,,,|--|┅|‥)
取代為: …
作用: 將各種省略號寫法統一為中文半碼三點省略號
4、再有, 經常碰到各種破折號(對話連接符)的寫法, 也總結歸納了一下常見的幾種, 基本上適用於大部分情況:
尋找內容: [—﹣-–]
取代為: -
作用: 將各種破折號寫法統一為英文半碼破折號
5、最後, 由於我個人非常不喜歡看那種占雙字位元的中文全碼拉丁字符, 所以通常習慣把所有中文全碼拉丁字符轉為英文半碼標準拉丁字符
附件為多重取代規則匯出檔, 解壓後可直接匯入, 這組規則基本等同於Aegisub Plugins的fullwidth-to-halfwidth.lua插件, 高效直觀, 並可根據個人偏好增刪完善
Full-Width Characters Groups.rar
(1.97 KB, 下載次數: 7)
|
評分
-
查看全部評分
|