人工智慧會取代人工翻譯嗎?
雖然 AI 語音翻譯已經應用到了不少生活、工作場景,但不得不說,AI 也許在國際象棋、自動駕駛、診斷癌症、射擊罰球和預測農作物產量等方面優於人類,但是當涉及到翻譯和口譯時,它還是沒法完全取代人類大腦。
其一,語言是主觀的。
人工智慧通常擅長做客觀現實的任務。無論是識別資料集中難以捉摸的訊號模式,還是導航複雜的路況,機器在面對決策制定的、明確的數學或物理規則時,都能發揮最佳作用。
相比之下,自然語言是由人類群體發明的,用於彼此交流的主觀結構 。它們有類似規則的行為(例如語法),但這些規則僅基於慣例,而不是客觀現實,並且它們存在隨機性、且在不斷髮展。
人類在識別腫瘤,或判斷信用風險上也許沒什麼優勢,但我們在自然語言上擁有“天然”的“最終權威”。此許可權反映在評估機器翻譯演算法的選擇度量標準中,機器翻譯越接近專業的人工翻譯,就越好。
人工翻譯不只是設定標準,它必然也是標準。
其二,大資料沒什麼幽默感。
任何翻譯都會告訴你笑話、雙關語和狡猾的暗示(以及細緻入微的文化參考),這也是克服語言障礙的最困難的部分。而且沒有它們,我們的表達質量就會變得更平庸。
從口譯員的角度來看,語音和肢體語言也直接告知說話者的意圖,因此人類在翻譯過程中,除了對語言文字資訊,還要對語音、語調及肢體語言等進行參考。這對人類來說具有挑戰性,目前對機器而言則是無法實現的。
據統計,從基於短語的機器翻譯到神經網路的轉變,已經取得了顯著的進步。但神經機器翻譯比前者更依賴於大量的訓練資料。由於可用的最大雙語資料集來自政府檔案和宗教文字的官方翻譯,因此這些演算法在幽默、文字播放和非語言表達方面的精通程度低得可憐。
但神經機器翻譯通常不僅不會承認其錯誤,還會試圖將這些錯誤歸因於「神經網路偏好流暢性」而不是準確性。對應的,目標語言中的觀眾可能不會知道已經發生了故障,而是將它歸因於原始文字本身(比如,文字詰屈難懂加重了翻譯的難度)。
至於 Siri、Alexa 等提供實時語音對話的 AI 系統,你對機器人的詼諧迴應,通常受限於一系列狹隘的環境和條件,是短期的、基於命令互動的,詞彙也是有限的。但大多數現場會議和商務討論都以自發,連續和高度依賴於語境的語言為特徵,這些特徵將 ASR 程式的錯誤率抬高。
計算機的確有可能發展出,擁有類似人類自然語言功能的那一天,屆時翻譯人員、文字撰稿人、編輯、電臺主持人等都可能被機器人取代。但那一天,比大多數人想象的還要遠。
語言工作總是部分藝術、部分科學的。因此語言相關職業對 AI 的入侵,也具備了比預設更大的防禦能力。
因此,我們的語言專業人員,應該將注意力集中在使用 AI / NLP 技術來提高勞動力效率、質量和降低成本、提高競爭力上。 計算機輔助翻譯工具已經在文字翻譯器中廣泛使用,也許同聲傳譯可以從語音識別和翻譯記憶技術的某些組合中同樣受益。至少在可預見的未來,這些工具將成為人類產出的補充,而不是替代。