Categories
All 杂文

這是 2020s,沒有 Traditional Chinese

為大廠做 Traditional Chinese 翻譯約莫快一年了,愈發能感覺到,Traditional Chinese,是何其尷尬的一個事物。

歸根結底,Traditional Chinese 本身要怎麽翻譯都能打上不少的口水戰,最常見自然是繁體中文,有很多人説該是正體中文,五年前我曾寫過一篇《繁體字使用的考究》,曾稚嫩地談及過此事。避繞紛爭,不知何時起,我開始直接稱呼其為傳統中文。

一個互聯網產品,要做傳統中文的 localization,其實連目標客群都很不清楚,只是莫名其妙地就默認了傳統中文是做給台灣用戶使用的,團隊其他人也都是台灣人。畢竟當今世界,傳統中文具有官方地位的國家地區只有三個:台灣、香港、澳門。

體量上,台灣人口遠高於港澳總和,第一考慮台灣人無可厚非。加上港澳口語實則為粵語,與官話有所區別,存在諸多特殊用例,傳統中文的目標客群,一般都不會針對港澳用戶。如果是特別重視港澳市場的產品,則會再專門做出 zh-HK,zh-MO 甚至 zh-yue 的語言分支。最原始的 zh-Hant,則成了實質的 zh-TW。

回過頭來,像我們這樣沒有細分區域,團隊又比較國際化,傳統中文的翻譯工作是滿尷尬的,我總是有些自己的想法,但不可能脫離一些已有的台灣譯法框架去實現。況且我深諳台灣社群,近年來支語警察盛行,導致有些詞和文法幾乎是刻意地去改動得跟簡體中文不同。

但是我也説過,團隊即使是以台灣用法主導,沒有一份最底層的指引,明確説這就是為台灣用戶設計。所以一些台灣人也在尋求建立 zh-TW 的版本,即是説他們也對現有的版本存在某些不滿吧。

跳脫工作之外,傳統中文究竟是什麽東西呢?它廣泛使用於中國大陸以外的所有華人群體中,變種太多。走進北美的華人街,當地居民還是熱衷於使用傳統中文,只是仍會把「乾炒牛河」錯寫成「幹炒牛河」,附庸風雅的大陸移民吧,真實原因不明。

在語言學愛好者社群中,有很多像我這樣雖然背景是共產中國出生,但使用傳統中文的人士。由於我們有一定知識基礎,反而用字嚴謹,老實説,有些字詞或文法,台灣人或者港澳人都不一定知道他們用錯了,但我們知道。這也是前文我提到,為何「我總是有些自己的想法」的原因,但終究寡不敵衆,這是一項團體工作。例如我最近想盡量避免西式中文的出現,尤其是濫用被字句,這種趨勢從我最近的文章中也可以觀察出來,但是想把此原則應用於工作就太難了。西式中文滲透得太深,説白了,這是 1949 年前就幾乎滲透完成的東西,沒有兩岸差異。以至於,西式中文並不能稱之為錯誤,只是一個私人的原則,於是要推廣到工作上就顯得舉步維艱。

我是共產中國出生,但使用傳統中文的人,力避共產中文或是「支語」,幾近演化成一種自我審查的行為。所以,也需求得更為純粹的語言環境。熟悉我的人應該知道,我都是用注音鍵入的傳統中文,若是用拼音輸入法的一鍵簡繁轉換,未免太滑稽。班上有個小時候就移民加拿大的台裔同學,就對我會用注音感到不可思議,也許在她看來,注音就是一項台灣專利。可注音明明是浙江人章太炎先生編創的「紐文」、「韻文」為藍本,最終由中華民國教育部制定、發佈的拼讀系統。哪怕是當今共產中國,具有官方地位的《新華字典》,即使從沒有一位老師教過那堆符號究竟是什麽,每個字旁也是有注音的。下圖是我攝於重慶三峽博物館的《注音符號講義》,出版者為四川注音符號促進會。四川?注音符號?原來這兩個詞還能放在一起,大概又反現代人的常識了吧。

無獨有偶,在我把玩 ChatGPT 時,也出現過極其類似的事件,於是我在 TG 頻道上寫過這麽一段感想:剛才讓 ChatGPT 用重慶話回答問題,既沒説對重慶話,又突然無端將我們一直持續交流的傳統中文文本變成了簡體字,可以想象在它的模型訓練中,即使收集了浩瀚網路的無數資訊,也從未出現一個以傳統中文為載體的重慶話數據集。不由得讓我想起兩年前給萌典提 issue 的事,手工部分唐鳳以 ROC 視角把詞條編纂得很好,但是英文部分偷了個懶用了其他 API,就離譜地變成了 PRC 視角。互聯網成型以來的幾十年,中國人(即簡中使用者)已經把大多數内容都洗了一遍了,全民煉丹,也不外乎拿這些「新鮮」數據煉罷了。於是乎,有了上述兩個故事,似乎重慶話和傳統中文,就是衝突的一對反義詞。但我仍然幸災樂禍,人類社會最複雜的東西就是政治,而我看到 AI 在其門外跌倒的醜樣,獨一無二的還是我嘛。

「四川」和「注音符號」放在一起反常識,「重慶話」和「傳統中文」亦是,甚至把不可一世的 AI 也能玩崩潰,不得苦笑一番遭到取代的日子可以推遲了,現階段的 AI 只是大量吞噬訓練集的模型,開創不了別樹一幟的行為。

意識形態的戰爭下,中文本就已遭簡體中文騎劫,在不為人知的角落裡,落下一些矛盾與衝突。一個外國人說要學中文,不可能拿得到傳統中文的教材,國際漢語教育,就是簡體中文騎劫的一個簡單例子。這些簡體教材,還無時無刻不輸出著 CCP 的意識形態。於是在為數不多還能提到 Traditional Chinese 的場景中,它指代的就是台灣中文。殊不知,夾縫中還存在我們這一批有獨特追求的人,卻是無力回天。

Traditional Chinese,到底是什麽呢?現在已經是 2023 年,有中國人,有台灣人,有怪胎,有老古董,但我確信唯獨沒有傳統。

Leave a Reply

Your email address will not be published. Required fields are marked *