siemens x
人工智能

WMT 2019國際機器翻譯大賽:微軟亞洲研究院以8項第一成為冠軍

2025China.cn   2019年08月22日

  2019年4月,由國際計算語言學協(xié)會ACL舉辦的WMT 2019國際機器翻譯比賽的客觀評測結果揭曉,微軟亞洲研究院機器學習組在參加的11項機器翻譯任務中,有8項獲得了第一名,另外3項獲得第二名,憑借多維度的技術創(chuàng)新成為冠軍團隊。

  WMT是全球學術界公認的國際頂級機器翻譯比賽,自2006年至今,已經(jīng)成功舉辦14屆。每一次比賽都是全球各大高校、科技公司與學術機構展示各自機器翻譯實力的較量,更是見證機器翻譯技術持續(xù)進步的窗口。今年共有來自全球的50多支隊伍參加比賽,包括微軟、Facebook、百度、字節(jié)跳動、平安、日本情報通信研究機構等。

  大賽共設置了19項不同語言之間的翻譯任務,微軟亞洲研究院參加了11項, 其中8項翻譯任務榮獲第一,包括:德語-英語、德語-法語、法語-德語、中文-英語、英語-立陶宛語、英語-芬蘭語、俄語-英語、英語-德語。另外3項任務獲得第二,包括:立陶宛語-英語、芬蘭語-英語、英語-哈薩克語。結果顯示,此次大賽的亞軍團隊在3項任務中獲得了第一,季軍團隊則有兩項獲得第一,來自微軟亞洲研究院的神經(jīng)網(wǎng)絡機器翻譯算法的表現(xiàn)遙遙領先于其他參賽隊伍。

  (獲勝隊伍展示:橫向為源語種,縱向為目標語種)

  早在2018年3月,由微軟亞洲研究院與微軟雷德蒙研究院共同研發(fā)的機器翻譯系統(tǒng)便在通用新聞報道測試newstest2017的中-英測試集上,達到了可與人工翻譯媲美的水平。這是首個在新聞報道的翻譯質量和準確率上可以比肩人工翻譯的翻譯系統(tǒng),用到的技術包括對偶學習、推敲網(wǎng)絡、聯(lián)合訓練和一致性規(guī)范等。

  在WMT 2019中,微軟亞洲研究院機器學習組再次將多個創(chuàng)新的算法運用在翻譯任務中,從學習機制、預訓練、網(wǎng)絡架構優(yōu)化、數(shù)據(jù)增強等方面大大提升了機器翻譯結果的質量。此次使用的創(chuàng)新算法包括:MADL(Multi-agent dual learning,多體對偶學習)、MASS(Masked sequence to sequence pre-training,屏蔽序列到序列的預訓練)、NAO(Automatic neural architecture optimization,自動神經(jīng)網(wǎng)絡架構優(yōu)化)、SCA(Soft contextual data augmentation,軟性上下文數(shù)據(jù)增強)。大部分算法已經(jīng)被機器學習領域的各個頂級會議收錄,其中,關于NAO的論文已被NIPS 2018收錄,關于MADL的論文已被ICLR 2019收錄,關于MASS的論文則被ICML 2019收錄。

  微軟亞洲研究院的研究員們在這次大賽的每項翻譯任務上采用了上述不同的技術,便已取得不俗的成績。未來,研究團隊計劃將這四個層面的創(chuàng)新技術整合,并且通過與產(chǎn)品部門的合作,將新技術盡快轉化到微軟翻譯產(chǎn)品中。

(轉載)

標簽:2019世界人工智能大會 微軟 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿易展覽會,本屆展覽會... [更多]