特稿:機器翻譯革命強勢來襲
安徽黃山不少出租車司機經常拉“老外”,不會外文也能交流無礙;去年北京的全球機器智慧峰會上,各國大咖扎堆演講,現場卻不見同聲傳譯者;更多中國人海外遊,面對東京的日文選單不再一頭霧水,漫步在巴黎街頭也不再因不懂法語而慌張。
這一切都源於一項近年來不斷取得突破的技術——機器翻譯。
人工智慧推波助瀾
全球知名翻譯公司“一小時翻譯”執行長奧弗·紹尚日前警告說,未來1至3年內,基於神經網路翻譯技術的機器翻譯將會承擔價值400億美元翻譯市場上的近一半工作,預計會導致50萬名翻譯失業。
神經機器翻譯(NMT)自2014年在科學論文中首次被提及以來,已使機器翻譯領域出現翻天覆地的變化,它開始全面超越以統計模型為基礎的統計機器翻譯(SMT),快速成為線上翻譯系統的主流標配。
神經機器翻譯的“神經元”可以學習和收集資訊,模仿人類大腦的神經元建立聯絡。它克服了傳統方法將句子分割為不同片段進行翻譯的缺點,充分利用上下文資訊,對句子進行整體編碼和解碼,從而生成更為流暢的譯文。
市面上的神經機器翻譯系統越來越多,國內的阿里巴巴、騰訊、百度、 科大訊飛 (002230 , 診股 )、搜狗,國外的谷歌、臉書、微軟等都在佈局,這使相關技術發生“質變”。
如今,許多出租車司機都能用手機上的翻譯軟體,輕鬆和“老外”溝通。在不少國際會議上,機器翻譯乾脆直接扮演現場同聲傳譯角色。
語音識別技術發展對這場翻譯革命也功不可沒。語音識別包括遠場識別、噪音識別以及多輪互動,是人工智慧的重要切入點。
因此,這場機器翻譯技術革命,正是人工智慧革命夢想照進現實的重要一環。
應用場景日漸豐富
“兩年前,人工智慧的翻譯質量往好了說,也就是讓你能對文字的內容有個大致瞭解,專業翻譯寧願自己從頭開始翻,”“一小時翻譯”執行長紹尚說,“今天,通過神經機器翻譯,人們只要對機器翻譯內容進行少量修改,就能獲得人性化翻譯。”
機器翻譯應用量正呈加速增加態勢。臉書的使用者高達數十億,為了打破使用者之間的溝通瓶頸,該公司去年上線神經機器翻譯功能,機器翻譯的速度和水平均得到大幅提升。另據官方資訊顯示,機器翻譯在阿里巴巴內部可以每天翻譯出幾十億量級的產品資訊,每天的線上翻譯請求達到數億次。在電子郵件和網站頁面語言轉換方面,谷歌公司稱,其機器翻譯服務每天在全世界被使用超過10億次。
旅遊業對翻譯需求更加旺盛。有資料顯示,中國已成為世界第一大出境旅遊客源國。2017年中國公民出境旅遊突破1.3億人次,花費達1152.9億美元。解決語言溝通問題正成為越來越多中國出境遊客的迫切需求。
許多中國遊客藉助智慧翻譯軟體和機器,輕鬆搞定國外道路路牌、餐館選單和超市購物,甚至在旅途中認識外國朋友。各大技術企業也在爭奪這一巨大市場。
機器翻譯的應用場景正不斷豐富,越來越多的政府和企業網站需將內容“多語言化”;視訊網站可能需要藉助機器翻譯將視訊內容翻譯成多語言版本;就連人工翻譯服務供應商也會藉助機器翻譯來提升人工翻譯的效率。
人機翻譯相輔相成
人類翻譯,未來還有需求嗎?
人們發現,對於“夫妻肺片”等專有名詞以及唐詩宋詞,機器翻譯能力已有了長足進步,但面對“槓精”等網路熱詞以及新流行語的翻譯能力仍有待提高。
儘管在達沃斯年會等一些國際論壇上,智慧同傳翻譯應用越來越多,但在個別場合,機器翻譯也鬧過一些令人費解的“烏龍”。
這說明,人工智慧翻譯要充分考慮複雜性。一些會議現場語言多樣,話題專業性強,噪音干擾多,而且講話者的語言習慣和口音也各不相同,即使能從嘈雜的環境中提取主要音色,語義識別仍充滿挑戰。
專家認為,人工翻譯是一個“閱讀-內化-表達”的過程,人類讀到文字之後,會聯想到相關現實場景,然後給出另一種語言對這種場景的表達。但機器翻譯通常只是一個“解碼”過程,將原文看成被加密的譯文。這樣的過程缺乏現實體驗,談不上理解,自然難免出錯。
總體而言,人工翻譯與紙面翻譯供給能力有限,但翻譯水準專業、精準,至少目前依然不可缺少;日常交流溝通不需要特別高質量的同聲傳譯,機器翻譯在這方面市場前景巨大。
因此,人機應該成為一套耦合的系統,適合機器乾的,交給機器;適合人工做的,還是由人完成。不要因為機器翻譯的進步,就吆喝著大家都別學外語;也不要因為人工智慧翻譯的失誤,就否定其巨大作用。