「有道翻譯王2.0 Pro」面世,有道展示AI能力
9 月 6 日下午,網易有道在京舉辦『 2018 網易有道開放日暨智慧翻譯硬體二代釋出會』,介紹了有道的 AI 技術及在開放賦能方面所做的努力,並現場釋出了一款 AI 硬體新產品:有道翻譯王 2.0 Pro 。
有道翻譯王 2.0 Pro
此時,距離 2017 年 10 月有道第一代翻譯硬體「翻譯蛋」的面世已過去了將近一年,由網易總裁丁磊親自 命名 的「翻譯王」有何不同呢?
與第一代產品有道翻譯蛋相比,翻譯王增設了英日韓三大常用外語與中文的離線互譯功能,線上語音互譯的語言包也從 27 種拓展為 43 種,覆蓋 191 個國家和地區。同時,翻譯王結合了 OCR 識別技術,支援 7 種語言離線拍照翻譯、 21 種語言線上拍照翻譯,是目前市面上拍照翻譯支援語種最多的翻譯機。此外,翻譯王還添加了語音助手的功能。
近年來,翻譯市場愈來愈熱,從百度、有道、騰訊、搜狗等多家科技公司投入大量資金、精力做機器翻譯引擎,到科大訊飛、搜狗、有道等紛紛釋出智慧翻譯機,這個市場備受矚目。
翻譯 APP 那麼多,為什麼還要做翻譯硬體?
需求。 任何一個產品的出現必然是因為有這個市場需求。相比翻譯硬體,翻譯 APP 自然更加便攜,但這也有其劣勢,即使用流程繁瑣,對不熟悉智慧手機操作的人群不友好;使用者擔心使用手機翻譯可能洩露隱私;在拾音方面不夠專業。
盈利。 「 2016 年訊飛曉譯翻譯機賣了 7 萬臺,價格將近 3000 元。在如此高的售價下取得了可觀的出貨量,我們認為這或許是一個可以進入的市場,畢竟年出貨量在 10 萬臺以上的智慧硬體產品是不多的。」此前網易有道副總裁吳迎暉在接受機器之能的採訪時表示。截至 9 月 6 號釋出會當天,有道翻譯蛋的銷量超十萬臺。網易有道副總裁劉韌磊稱「翻譯機是有道補齊語言翻譯服務版圖的重要一環」。
技術
網易有道首席科學家介紹了有道的技術實力。有道的研究和應用圍繞自然語言處理和理解展開。
神經機器翻譯
2008 年有道推出機器翻譯服務,從當時流行的 SMT (統計機器翻譯)技術,到 2017 年 4 月網易有道和網易杭州研究院歷時兩年合力自主研發的「 神經網路翻譯」 (NMT) 技術正式上線,有道一直深耕機器翻譯領域。據介紹,有道在新聞領域測試集上的 BLEU 值評測結果優於兩個國際引擎。機器之心就有道的神經機器翻譯技術進行了採訪,得知有道的神經機器翻譯技術( YNMT )一開始採用的是 RNN 的 encoder-decoder 架構,現在使用的是 Transformer 架構,但是內部機制有所調整。有道首席科學家段亦濤舉例表示,有道在模型結構方面,把 multi-head attention 做了一些改變,加了 gating 的技術,從而提升原始模型的效能。有道 CEO 周楓表示資料來源很關鍵,有道的資料來源跟其他家有所不同,有道的資料量在行業中算是比較大的。據介紹,有道會持續積累語料,並進行加工和清理,同時在訓練過程中採用不一樣的方式來使用語料(至於 具體 什麼方式,有道方面暫未透露)。機器學習模型的效能不僅取決於模型本身,還取決於訓練次數和訓練方法。
基於 OCR 的影象翻譯方案
光學字元識別( OCR )應用非常廣泛,翻譯王即利用 OCR 技術實現拍照翻譯的功能。此外,在有道的其他產品中也有這項技術的身影,比如有道雲筆記的 OCR 文字識別功能。
有道的 OCR 技術支援多語種、多角度、橫豎斜混合識別,以及手寫識別。
語音識別、語音合成技術
有道的多語種語音識別、語音合成技術可以實現漢語、英語、日語、韓語、葡萄牙語的語音合成。此外,只需提供 10 分鐘的錄音,有道語音合成技術( TTS )就能模擬出原聲,合成效果與原聲真假難辨,令人眼前一亮。另外,有道 AI 的終端側離線技術也有重大進步,離線神經網路翻譯、離線語音識別和離線文字識別三大技術更是在此次推出的有道翻譯王 2.0 Pro 產品中率先應用,並通過智雲平臺同步開放給業內開發者。
隨後,有道 AI 團隊還分享了基於有道整體技術輸出平臺 —— 有道智雲的「 AI+ 三大行業解決方案」 ,以幫助教育、政企、硬體廠商三大行業解決痛點問題。
有道未來的研發方向是:
- 支援更多語言
- 更深入的自然語言理解
- 識別更多場景
- 深耕教育 +AI
網易高階副總裁、網易有道 CEO 周楓認為智慧硬體是網際網路面向消費新場景的裝置延伸,有道智雲則是面向合作伙伴的整合優化服務,強化這兩部分能夠使有道 AI 產品矩陣的佈局和擴充更為穩健。