從科大訊飛倒下的地方站起來：百度在機器同聲傳譯領域取得突破

百度科大訊飛 · 發表 2018-10-25 01:36:34

摘要：由於不同語言的語序不同，傳統機器翻譯至少會出現一個句子的延遲，因此同聲傳譯被看作是機器翻譯以及人工智慧自然語言處理的一個難以企及的聖盃，百度公司近日在這個領域取得了重大突破。本週三中國網際網路巨頭百度公司推出了首個擁有預判能力和可控延遲的機器同傳翻譯系統——STACL（Sim...

由於不同語言的語序不同，傳統機器翻譯至少會出現一個句子的延遲，因此同聲傳譯被看作是機器翻譯以及人工智慧自然語言處理的一個難以企及的聖盃，百度公司近日在這個領域取得了重大突破。

本週三中國網際網路巨頭百度公司推出了首個擁有預判能力和可控延遲的機器同傳翻譯系統——STACL（Simultaneous Translation with Anticipation and Controllable Latency）它是一個能夠進行高質量雙語同傳的自動系統，代表了自然語言處理方向的重大突破。（ ofollow,noindex" target="_blank">論文下載）

根據百度研究中心的部落格，百度釋出的人工智慧機器翻譯工具可以根據互譯語言之間的相似度設定1-5個詞的可控延遲，以接近人工同聲傳譯的速度和質量翻譯（上圖）。

在機器同傳領域，百度聯合語音技術、機器翻譯技術，從語音識別、翻譯質量、時延、融合領域知識等方面推出了“一攬子”解決方案。

在語音識別方面，區別於傳統的上下文相關建模技術，百度提出了上下文無關音素組合的中英文混合建模單元，包含1749個上下文無關中文音節和1868個上下文無關英文音節。該方法具有泛化效能好、對噪聲魯棒、中英文混合識別等特點。

在翻譯質量方面，提出了“語音容錯”的對抗訓練翻譯模型，根據語音識別模型常犯的錯誤，在訓練資料中有針對性的加入噪聲資料，使得模型在接受到錯誤的語音識別結果時，也能夠在譯文中糾正過來。比如，語音識別系統將“大堂”錯誤的識別為“大唐”，這一對噪聲詞將被自動收錄到訓練資料中，並將源語言句子“我們在酒店大堂見面吧”替換為“我們在酒店大唐見面吧”，而保持目標語言翻譯不變“Let’s meet at the lobby of the hotel”，同時將這兩個中文句子用於訓練，進而獲得具有更強的容錯能力模型。

百度研究中心的部落格指出，最好的同傳譯員的譯出率約 60% （大約 3 秒鐘的延遲），而百度的新同傳系統比傳統的整句翻譯少了 3.4 個 BLEU 點（BLEU 是通過比較機器翻譯結果和人工翻譯來衡量整句翻譯質量的標準評估指標）。在採用等待三詞模式（wait-3-words model，指英語翻譯比漢語語音落後三個漢字，約 1.5-2 秒的延遲）的漢英同傳中，翻譯質量的單一參考 BLEU 分數為 15.3 分，而傳統的整句（非同步）翻譯要高出 5 分左右。如果允許五個字（約 3 秒）的延遲，這種準確率差異會縮小到 3.4 分左右。

雖然機器同傳的理論譯出率能大大高於人類同傳，但是百度認為現在認定機器翻譯取代人工同傳為時尚早，未來很長一段時間我們都離不開人類同聲傳譯員，但是百度人工智慧同傳工具的出現，可以讓過去超高強度的同傳工作（同聲傳譯人員需要每20-30分鐘輪換，否者翻譯錯誤會快速增加）變得更輕鬆，更普及。

從科大訊飛倒下的地方站起來：百度在機器同聲傳譯領域取得突破

您可能也會喜歡…