搜狗獲全球口語翻譯大賽冠軍 多模型融合細節打磨成制勝法寶
【TechWeb】11月7日,在2018IWSLT(International Workshop on Spoken Language Translation)全球頂級口語機器翻譯評測大賽上,搜狗憑藉BLEU(BLEU是機器翻譯自動評價方法,其數值越大意味著越準確)值28.09的成績奪得冠軍,超過第二名1.6個BLEU。在如此重量級賽事中斬獲冠軍足以凸顯搜狗在口語機器翻譯領域的領先地位。
IWSLT作為全球最具影響力的口語機器翻譯評測比賽,今年是第15屆,共有10支隊伍參賽。除了全球領先的學校、科研機構,今年也有包括美國APPTEK、國內科大訊飛、阿里巴巴在內的“大廠”參賽。
TechWeb近日和搜狗參賽核心成員進行了近距離溝通,從中或許可以窺見搜狗機器翻譯能力快速突破的訣竅。
兩年兩項領域奪冠 成機器翻譯標杆
在機器翻譯領域,這已不是搜狗第一次獲得冠軍。
在去年的2017WMT(Workshop on Machine Translation)機器翻譯頂級評測大賽上,搜狗就獲得中英和英中翻譯雙向冠軍,其機器翻譯的準確率和速度受到業界矚目。
搜狗機器翻譯負責人王宇光介紹,本屆IWSLT2018評測比賽中,考評的是將英語演講語音翻譯成對應的德語文字,難度係數更高。
IWSLT2018大賽共分了2大賽道,其一是Baseline Model(基線模型賽道),這是業內最主流最實用的語音翻譯應用技術。另一賽道是End-to-End(端到端賽道),為本屆大賽新增設賽道。
baseline模型對應的語音翻譯方案,包含語音識別、機器翻譯兩大模組,採用多步流水線設計,即語音訊號先輸入語音識別系統得到源語言的識別文字,然後再將識別文字送入機器翻譯系統輸出目標語言的對應譯文。
End-to-End模型則是輸入語音,基於深度神經網路模型直接輸出譯文,並不會產生源語言的識別中間結果。
搜狗參加的是baseline模型賽道比拼,並最終奪得冠軍。
從比賽結果BLEU資料來看,搜狗的BLEU最高,達到28.09。第二名是科大訊飛BLEU26.47,相差1.6個BLEU。搜狗語音技術負責人陳偉表示,從BLEU上來看二者差距已經比較明顯,這種差距從使用者層面上已經是可感知程度。
新增賽道End-to-End模型賽道的最高BLEU僅為19.4,與baseline模型結果相差甚遠,End-to-End模型離能實際商用解決使用者翻譯需求還有很大差距。
多模型融合 細節打磨成制勝法寶
王宇光介紹,IWSLT201大賽,搜狗共投入近17人的團隊,耗時近3個月時間打磨整合聲學模型、機器翻譯、語音增強、語言模型、解碼器等領域技術能力。
搜狗語音技術負責人陳偉表示,“這次IWSLT評測資料體系是真實場景下的,而且又涉及到跨語言(英德)的現象,檢驗了我們能力,也證明我們在不同語種之間的遷移能力。”
陳偉介紹,在baseline模型的語音識別、機器翻譯兩大模組方面,從技術實驗上看,在語言識別上,目前搜狗和訊飛水平基本持平,在文字翻譯上搜狗做的更好。但是,他也強調“做好語音翻譯這件事,除了單拼語音識別、單拼翻譯以外,主要還是拼細節。”
在IWSLT201大賽競技中,陳偉透露,為了確保口語翻譯準確率更好,無論是語音識別還是機器翻譯,都採用了多個不同模型融合去做,包括不同的語料、時間點、資料、特徵等。每個模型優勢不同,多個模型做磨合,讓多個專家一起做決策,這樣能保證準確率有進一步的提升。僅語音識別方面,搜狗團隊就用了用包括TDNN、BiLSTM、Deep-CNN在內的多個模型融合。
語音識別場景往往存在很多問題,如演講者口語化現象、現場噪聲問題,翻譯方面有選詞、一詞多義問題。怎麼去應對這些問題,很多是在細節上打磨。除了把語音識別和機器翻譯做好,還需要解決語音翻譯結合部分的工作,如語音順順滑、斷句等等工作。
此外,搜狗已經向大眾推出了翻譯機、同傳等產品,搜狗同傳產品在網球公開賽、游泳世界盃等多場景下進行了實踐使用。這些來源於實際產品的經驗和使用者反饋,也幫助搜狗語音翻譯技術不斷迭代突破。目前在噪音相對小的情景下,搜狗語音識別準確率可達95%,以5分制評價,機器翻譯能維持在4分左右。在陳偉看來,這些都成為搜狗口語翻譯冠軍實力的註解。
加速語音翻譯技術商業化落地
基於搜狗語音翻譯實力,目前搜狗打造的同傳、旅行翻譯狗、錄音翻譯筆等產品已經落地多個場景,並不斷迭代升級。
搜狗同傳目前已支援過很多科技大會,具備了很強的科技屬性。現在開始嘗試在網球、游泳比賽、專業學術會議等領域做同傳適配,未來將向更多領域拓展。
陳偉表示,儘管語音翻譯技術已經有了突破性發展,但是和成熟的人工同傳相比還有很大差距。預計到2020年左右,機器同傳的水平可以達到一般水平速記的程度。目前搜狗同傳希望能夠更好地配合人、幫助人,並不是替代人。
此外,陳偉透露後續會有多款圍繞語音翻譯技術的硬體產品釋出,搜狗在語音合成技術方面近期也會有新的產品釋出。