人工智能

WMT 2019國際機器翻譯大賽:微軟亞洲研究院以8項第一成為冠軍

ainet.cn   2019年08月22日

  2019年4月,由國際計算語言學協(xié)會ACL舉辦的WMT 2019國際機器翻譯比賽的客觀評測結果揭曉,微軟亞洲研究院機器學習組在參加的11項機器翻譯任務中,有8項獲得了第一名,另外3項獲得第二名,憑借多維度的技術創(chuàng)新成為冠軍團隊。

  WMT是全球學術界公認的國際頂級機器翻譯比賽,自2006年至今,已經(jīng)成功舉辦14屆。每一次比賽都是全球各大高校、科技公司與學術機構展示各自機器翻譯實力的較量,更是見證機器翻譯技術持續(xù)進步的窗口。今年共有來自全球的50多支隊伍參加比賽,包括微軟、Facebook、百度、字節(jié)跳動、平安、日本情報通信研究機構等。

  大賽共設置了19項不同語言之間的翻譯任務,微軟亞洲研究院參加了11項, 其中8項翻譯任務榮獲第一,包括:德語-英語、德語-法語、法語-德語、中文-英語、英語-立陶宛語、英語-芬蘭語、俄語-英語、英語-德語。另外3項任務獲得第二,包括:立陶宛語-英語、芬蘭語-英語、英語-哈薩克語。結果顯示,此次大賽的亞軍團隊在3項任務中獲得了第一,季軍團隊則有兩項獲得第一,來自微軟亞洲研究院的神經(jīng)網(wǎng)絡機器翻譯算法的表現(xiàn)遙遙領先于其他參賽隊伍。

  (獲勝隊伍展示:橫向為源語種,縱向為目標語種)

  早在2018年3月,由微軟亞洲研究院與微軟雷德蒙研究院共同研發(fā)的機器翻譯系統(tǒng)便在通用新聞報道測試newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統(tǒng),用到的技術包括對偶學習、推敲網(wǎng)絡、聯(lián)合訓練和一致性規(guī)范等。

  在WMT 2019中,微軟亞洲研究院機器學習組再次將多個創(chuàng)新的算法運用在翻譯任務中,從學習機制、預訓練、網(wǎng)絡架構優(yōu)化、數(shù)據(jù)增強等方面大大提升了機器翻譯結果的質量。此次使用的創(chuàng)新算法包括:MADL(Multi-agent dual learning,多體對偶學習)、MASS(Masked sequence to sequence pre-training,屏蔽序列到序列的預訓練)、NAO(Automatic neural architecture optimization,自動神經(jīng)網(wǎng)絡架構優(yōu)化)、SCA(Soft contextual data augmentation,軟性上下文數(shù)據(jù)增強)。大部分算法已經(jīng)被機器學習領域的各個頂級會議收錄,其中,關于NAO的論文已被NIPS 2018收錄,關于MADL的論文已被ICLR 2019收錄,關于MASS的論文則被ICML 2019收錄。

  微軟亞洲研究院的研究員們在這次大賽的每項翻譯任務上采用了上述不同的技術,便已取得不俗的成績。未來,研究團隊計劃將這四個層面的創(chuàng)新技術整合,并且通過與產(chǎn)品部門的合作,將新技術盡快轉化到微軟翻譯產(chǎn)品中。

(轉載)

標簽:2019世界人工智能大會 微軟 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
ABB協(xié)作機器人,自動化從未如此簡單
優(yōu)傲機器人下載中心
億萬克
專題報道
聚力同行 · 新智“碳”索
聚力同行 · 新智“碳”索

“新華社-智能·零碳”項目策劃以“聚力同行·新智‘碳’索”為主題的新能源專題,主要圍繞光伏、儲能、鋰電、氫能、風能五大新... [更多]

2025中國國際機床展覽會
2025中國國際機床展覽會

4月21至26日,以“融合創(chuàng)新,數(shù)智未來”為主題的第十九屆中國國際機床展覽會在首都國際會展中心盛大舉辦。憑借場館的卓越服... [更多]

2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內外企業(yè)推進“雙碳”實踐的最新成果,鼓勵更多企業(yè)、科研機構、投資機構等廣泛... [更多]