2019盤點(diǎn)：機(jī)器學(xué)習(xí)更親民，AI系統(tǒng)更精巧

ainet.cn 2020年01月06日

　　作為在計(jì)算機(jī)科學(xué)領(lǐng)域深耕21年的基礎(chǔ)與應(yīng)用研究機(jī)構(gòu)，微軟亞洲研究院始終致力于推動(dòng)計(jì)算機(jī)科學(xué)全領(lǐng)域的前沿發(fā)展，著眼于下一代革命性技術(shù)的創(chuàng)新與突破。

　　在即將過(guò)去的2019年，微軟亞洲研究院持續(xù)探索計(jì)算機(jī)科學(xué)的邊界，收獲了累累的科研碩果，在 ACL、EMNLP、NeurIPS、ICML、AAAI、IJCAI、CVPR、ICCV、SIGGRAPH、KDD、WWW、SIGCOMM、NSDI、MobiCom 等計(jì)算機(jī)科學(xué)國(guó)際頂級(jí)會(huì)議上共發(fā)表230余篇論文，全面覆蓋了機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺、圖形學(xué)、可視化、語(yǔ)音、數(shù)據(jù)挖掘、軟件工程、計(jì)算機(jī)系統(tǒng)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)與安全等領(lǐng)域。

　　站在2020年的入口，腳下交織著過(guò)去與未來(lái)的風(fēng)，我們對(duì)未來(lái)翹首以盼。在接下來(lái)的幾天，我們將從機(jī)器學(xué)習(xí)、系統(tǒng)、數(shù)據(jù)智能、語(yǔ)音與自然語(yǔ)言、計(jì)算機(jī)視覺與圖形學(xué)五大領(lǐng)域出發(fā)，盤點(diǎn)2019年值得注目的技術(shù)熱點(diǎn)，并展望各個(gè)領(lǐng)域的未來(lái)發(fā)展趨勢(shì)。

　　本文將與大家分享的是2019年機(jī)器學(xué)習(xí)和系統(tǒng)領(lǐng)域的突破與進(jìn)展，以及未來(lái)趨勢(shì)。如果說(shuō)機(jī)器學(xué)習(xí)可以算是 AI 的大腦，那么系統(tǒng)網(wǎng)絡(luò)就像 AI 的身體軀干。AI 的進(jìn)一步普及，需要對(duì)機(jī)器學(xué)習(xí)算法、模型、理論等進(jìn)行不斷地優(yōu)化和提煉，同時(shí)也需要能夠構(gòu)建出高效、穩(wěn)定、可信乃至“精巧”的 AI 系統(tǒng)，為 AI 應(yīng)用的真正落地做好諸多準(zhǔn)備。

　　AI 與 System，互生互長(zhǎng)

　　當(dāng)人們?yōu)闃?gòu)建 AI 應(yīng)用而尋找底層系統(tǒng)架構(gòu)時(shí)，常常會(huì)發(fā)現(xiàn)尋找或開發(fā)出一個(gè)高效、穩(wěn)定、可信的 AI 系統(tǒng)卻不是件易事。這種情況在如今 AI 和云計(jì)算相結(jié)合的趨勢(shì)下愈加明顯。AI 方案提供商們不可能再像早期實(shí)驗(yàn)室研究那樣，不計(jì)成本地追求性能，而且隨著支撐 AI 應(yīng)用的高性能計(jì)算節(jié)點(diǎn)的引入和大規(guī)模應(yīng)用，傳統(tǒng)系統(tǒng)架構(gòu)本身也制約了性能的提升。因此，腳踏實(shí)地地考慮性能、穩(wěn)定性、可擴(kuò)展性、性價(jià)比等多方面因素在 AI 應(yīng)用背景下的再平衡，設(shè)計(jì)和開發(fā)更加“精巧”的 AI 系統(tǒng)是未來(lái)的發(fā)展方向。同時(shí)，如何充分挖掘 AI 技術(shù)的潛力，來(lái)提升系統(tǒng)研究和設(shè)計(jì)本身也是一個(gè)重要課題。

System for AI：AI 落地需要更好的系統(tǒng)支撐

　　各類 AI 技術(shù)和應(yīng)用的不斷創(chuàng)新，讓計(jì)算機(jī)系統(tǒng)得以處理前所未見的大規(guī)模數(shù)據(jù)和應(yīng)付高度復(fù)雜的大型系統(tǒng)問(wèn)題，從模型訓(xùn)練到應(yīng)用推理，各個(gè)層面都對(duì)系統(tǒng)的構(gòu)建提出了嚴(yán)峻的考驗(yàn)。

　　在微軟亞洲研究院看來(lái)，要更好地支撐機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等 AI 算法的運(yùn)行，系統(tǒng)需要從硬件到軟件到網(wǎng)絡(luò)全面重構(gòu)。例如，神經(jīng)網(wǎng)絡(luò)的訓(xùn)練會(huì)涉及多種系統(tǒng)問(wèn)題，包括如何充分發(fā)揮 GPU 利用率、如何在以 GPU 為主的高性能計(jì)算集群中實(shí)施大數(shù)據(jù)量、高并行度的神經(jīng)網(wǎng)絡(luò)訓(xùn)練、如何避免大型集群訓(xùn)練時(shí)發(fā)生硬件故障等。近兩年來(lái)，微軟亞洲研究院在 OSDI 2018、USENIX ATC 2019、Eurosys 2019 等大會(huì)上發(fā)表了多篇論文，從三個(gè)方面對(duì)支撐 AI 的系統(tǒng)(System for AI)進(jìn)行了抽象和提升，包括針對(duì)深度學(xué)習(xí)提出了新的集群調(diào)度框架 Gandiva[1]，發(fā)布了第一個(gè)能夠支持大規(guī)模圖形神經(jīng)網(wǎng)絡(luò)訓(xùn)練的系統(tǒng)架構(gòu) NeuGraph[2]，以及針對(duì)大規(guī)模神經(jīng)網(wǎng)絡(luò)分布式訓(xùn)練的基于 RDMA 的網(wǎng)絡(luò)通信技術(shù)[3]。這一系列工作預(yù)示著 AI 系統(tǒng)的未來(lái)：只有從單個(gè)網(wǎng)絡(luò)的優(yōu)化到底層系統(tǒng)架構(gòu)的全棧式重構(gòu)，才能更好地支持現(xiàn)在及未來(lái)深度學(xué)習(xí)的工作負(fù)載。

　　與此同時(shí)，為支撐規(guī)模越來(lái)越大的分布式機(jī)器學(xué)習(xí)系統(tǒng)運(yùn)行，底層通信網(wǎng)絡(luò)平臺(tái)也需要跟隨 AI 的步伐不斷進(jìn)行創(chuàng)新，進(jìn)一步提高通信性能和效率。微軟亞洲研究院近年來(lái)關(guān)注于硬件網(wǎng)絡(luò)方面的研究，其基于可編程硬件的技術(shù)不僅有助于降低網(wǎng)絡(luò)延遲和 CPU 開銷、提高吞吐量、提升網(wǎng)絡(luò)速度，更有利于提升分布式機(jī)器學(xué)習(xí)系統(tǒng)的可擴(kuò)展性和效率。相關(guān)研究成果發(fā)表在了 NSDI 2018、NSDI 2019 和 SIGCOMM 2019 大會(huì)上[4-6]。

　　事實(shí)上，對(duì)于深度學(xué)習(xí)的系統(tǒng)研究目前還處于早期階段，很多研究成果集中在商業(yè)化的研究機(jī)構(gòu)，學(xué)術(shù)界由于缺乏企業(yè)級(jí)大規(guī)模系統(tǒng)支撐的研究和產(chǎn)品化混合訓(xùn)練的環(huán)境，難以進(jìn)行更深入的研究。為此，微軟亞洲研究院將多項(xiàng)系統(tǒng)相關(guān)的研究成果(OpenPAI、SPTAG、NNI等)開源。同時(shí)，為了培養(yǎng) AI 和系統(tǒng)這一研究方向的人才，微軟亞洲研究院通過(guò)系統(tǒng)教學(xué)工作組(MSRA System Teaching Workshop)平臺(tái)，與國(guó)內(nèi)高校一起設(shè)計(jì)新的教學(xué)課程。首期課程將圍繞人工智能和系統(tǒng)交叉領(lǐng)域的前沿方向展開，希望為學(xué)術(shù)界乃至產(chǎn)業(yè)界提供更多參考。所有這些工作都秉承了微軟亞洲研究院一直以來(lái)注重開放、合作的傳統(tǒng)，為未來(lái)的技術(shù)進(jìn)步和多元發(fā)展奠定了基礎(chǔ)，并促進(jìn)了領(lǐng)域研究的正循環(huán)。

系統(tǒng)如何設(shè)計(jì)才最優(yōu)?AI for System 來(lái)幫忙

　　為 AI 應(yīng)用打造更好的系統(tǒng)，是系統(tǒng)研究順其自然的演變結(jié)果。如同在單機(jī)時(shí)代，為 PC 打造操作系統(tǒng);在云時(shí)代，為云平臺(tái)打造分布式網(wǎng)絡(luò)、數(shù)據(jù)庫(kù);在 AI 時(shí)代，自然是進(jìn)一步提升系統(tǒng)的能力，以支撐 AI 的全方位應(yīng)用需求。

　　但 AI 時(shí)代的特別之處在于，AI 所具有的能力也可以反向?yàn)橄到y(tǒng)研究提供新的思路和方法，即反哺系統(tǒng)研究(AI for System)，讓研究員們可以利用 AI 手段去提升系統(tǒng)的設(shè)計(jì)、開發(fā)、維護(hù)等。尤其在系統(tǒng)復(fù)雜度呈幾何量級(jí)上升的今天，很多系統(tǒng)問(wèn)題已經(jīng)無(wú)法完全靠人的直覺和經(jīng)驗(yàn)去解決，而是需要進(jìn)行大量的數(shù)據(jù)分析來(lái)驅(qū)動(dòng)復(fù)雜系統(tǒng)的優(yōu)化。

　　一直以來(lái)，系統(tǒng)研究都有一個(gè)要解決的核心問(wèn)題：系統(tǒng)怎么設(shè)計(jì)才是最優(yōu)?如今，研究員們有了機(jī)器學(xué)習(xí)這個(gè)有力的工具，這個(gè)問(wèn)題的解決也比以往更加高效。過(guò)去一年，微軟亞洲研究院系統(tǒng)組的研究員在 ATC 2018 和 ATC 2019 大會(huì)上發(fā)表論文，提出了一種方法，通過(guò)自動(dòng)優(yōu)化系統(tǒng)并引入現(xiàn)實(shí)因素，讓機(jī)器學(xué)習(xí)在真實(shí)場(chǎng)景中發(fā)揮作用[7]，此外，研究員們還應(yīng)用機(jī)器學(xué)習(xí)技術(shù)于優(yōu)化系統(tǒng)運(yùn)行邏輯，讓系統(tǒng)變得更加智能化[8]。

　　微軟亞洲研究院系統(tǒng)組與微軟 Azure、必應(yīng)(Bing)、廣告等多個(gè)產(chǎn)品部門有著非常緊密的長(zhǎng)期合作，因此優(yōu)化問(wèn)題需要在為不同大規(guī)模系統(tǒng)服務(wù)的背景下展開。而在合作過(guò)程中，研究員們?cè)诳紤]，是否可以打造一個(gè)通用的 AI for System 框架，為成百上千個(gè)系統(tǒng)抽象出通用的平臺(tái)?；谶@個(gè) AI for System 平臺(tái)化的想法，微軟亞洲研究院系統(tǒng)組在今年的 SIGOPS Operating Systems Review[9]，提出了“系統(tǒng)”和“學(xué)習(xí)”為中心的協(xié)同設(shè)計(jì)，為構(gòu)建系統(tǒng)優(yōu)化提供了一個(gè)原則性的方法論。同時(shí)，在 NNI 這個(gè)開源項(xiàng)目下，給出了初步的為 AI for System 研究設(shè)計(jì)的示例代碼。

讓 AI 在邊緣計(jì)算上更好地運(yùn)行

　　隨著各種智能設(shè)備和新型應(yīng)用的不斷涌現(xiàn)，計(jì)算模式正從集中式的云計(jì)算向分布式的邊緣計(jì)算轉(zhuǎn)變。一方面是大量的智能設(shè)備(智能監(jiān)控?cái)z像頭、自動(dòng)駕駛汽車等)產(chǎn)生了海量的數(shù)據(jù)，很難把所有數(shù)據(jù)都上傳到云端進(jìn)行處理。另一方面是新的應(yīng)用和場(chǎng)景需要在本地進(jìn)行數(shù)據(jù)處理。比如人們?cè)絹?lái)越關(guān)注隱私，不愿意把個(gè)人數(shù)據(jù)上傳;自動(dòng)駕駛、工廠流水線控制等，出于實(shí)時(shí)性和可靠性的要求，需要在本地進(jìn)行計(jì)算等等。另外，隨著 AI 算法的不斷成熟，人們開始設(shè)計(jì)各種專用的 AI 處理器，不僅功能強(qiáng)大，而且功耗低，價(jià)格便宜，使得在終端設(shè)備上運(yùn)行各種 AI 任務(wù)成為了可能。

　　在邊緣計(jì)算時(shí)代，如何利用 AI 賦能于各種邊緣設(shè)備和應(yīng)用，讓 AI 更好地為人們的工作和生活服務(wù)，就成為了一個(gè)重要的研究課題。這需要結(jié)合 AI 和系統(tǒng)兩個(gè)方面，讓 AI 在邊緣計(jì)算上更好地運(yùn)行。微軟亞洲研究院系統(tǒng)組的研究員們?cè)谌绾瓮ㄟ^(guò)模型-軟件-硬件的協(xié)同設(shè)計(jì)對(duì)模型推理進(jìn)行加速、如何保護(hù)用戶的隱私和模型數(shù)據(jù)的安全、如何讓分布在不同地方的設(shè)備聯(lián)合起來(lái)，相互協(xié)作從新獲取的數(shù)據(jù)中不斷學(xué)習(xí)等方面進(jìn)行了研究;并在 MobiCom 2018/2019、AAAI 2019、CVPR 2019 等多個(gè)頂會(huì)上發(fā)表了相關(guān)研究成果[10-13]。

安全是智能技術(shù)的核心要素

　　如今，AI 技術(shù)正在給人類的工作和生活帶來(lái)顛覆性的變革，因此，微軟認(rèn)為企業(yè)與組織必須制定并采取明確的原則，以構(gòu)建可信賴的 AI。在微軟，包括科研在內(nèi)的所有 AI 領(lǐng)域的相關(guān)工作都必須遵循以下六大原則：公平、可靠和安全、隱私、包容、透明、責(zé)任。其中，可靠和安全也是在整個(gè)計(jì)算機(jī)領(lǐng)域都備受重視的研究方向。除了智能化、跨領(lǐng)域和開源以外，可靠和安全也是系統(tǒng)研究未來(lái)發(fā)展的一大趨勢(shì)。

　　一個(gè)頗有顛覆性的熱點(diǎn)是對(duì)業(yè)界二、三十年來(lái)所默認(rèn)的硬件安全的再認(rèn)識(shí)：比如 CPU 的“指令預(yù)執(zhí)行”優(yōu)化可以泄露信息(Meltdown & Spectre 攻擊)，電容的頻繁充放電足以導(dǎo)致相鄰內(nèi)存數(shù)據(jù)的改變(Rowhammer 攻擊)。因此大家對(duì)于安全也越發(fā)謹(jǐn)慎，安全意識(shí)和思維方式也有所轉(zhuǎn)變：以前如果不知道不安全，往往就默認(rèn)為是安全的;但現(xiàn)在，大家傾向于只有能夠證明是安全的，才是真正的安全。這種意識(shí)的轉(zhuǎn)變使得計(jì)算機(jī)領(lǐng)域中一些最根本的價(jià)值受到了進(jìn)一步重視，比如邏輯、可計(jì)算性、復(fù)雜性等。而微軟亞洲研究院也一直持續(xù)關(guān)注相關(guān)領(lǐng)域的研究，研究范圍涉及多方計(jì)算、區(qū)塊鏈、聯(lián)邦學(xué)習(xí)、零知識(shí)證明等方向。在安全方向上，研究員在 Micro 2018 和 USENIX Security 2018 均有成果發(fā)表[14-15]。

　　未來(lái)的計(jì)算能力將隱形于我們周圍，計(jì)算支持的智能將無(wú)處不在。只有不斷的創(chuàng)新，才能保證各種技術(shù)無(wú)縫、穩(wěn)定、安全、高效、持續(xù)地協(xié)同進(jìn)行，而這就是未來(lái)計(jì)算與智能系統(tǒng)領(lǐng)域發(fā)展需要不斷突破的方向。

　　機(jī)器學(xué)習(xí)愈親民，AI 愈實(shí)用

　　過(guò)去幾年，以機(jī)器學(xué)習(xí)為代表的人工智能取得了突破性的進(jìn)展，2019年這些勝利的果實(shí)又得到了進(jìn)一步的鞏固，并穩(wěn)定地向前發(fā)展。機(jī)器學(xué)習(xí)理論體系已經(jīng)日趨成熟，機(jī)器學(xué)習(xí)模型、算法也已在一些真實(shí)業(yè)務(wù)場(chǎng)景中嶄露頭角，甚至開始在物流、金融等行業(yè)的關(guān)鍵系統(tǒng)中發(fā)揮作用。

　　然而 AI 應(yīng)用的進(jìn)一步普及，需要對(duì)機(jī)器學(xué)習(xí)算法、模型、理論等進(jìn)行不斷地優(yōu)化和提煉，現(xiàn)階段的機(jī)器學(xué)習(xí)研究和開拓也正是遵循這一發(fā)展脈絡(luò)不斷前行，為 AI 應(yīng)用的落地做好更多的準(zhǔn)備，如簡(jiǎn)化訓(xùn)練方式、提升模型速度、深度理解機(jī)器學(xué)習(xí)等，這些著力點(diǎn)都是為了讓機(jī)器學(xué)習(xí)更加普適，促進(jìn) AI 向?qū)嵱眯?、通用型演進(jìn)。

讓機(jī)器學(xué)習(xí)拿來(lái)即用

● 從監(jiān)督數(shù)據(jù)學(xué)習(xí)到無(wú)標(biāo)注數(shù)據(jù)學(xué)習(xí)

　　深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中最具影響力的一項(xiàng)技術(shù)，研究者眾多，但其突破更多的是在從監(jiān)督數(shù)據(jù)進(jìn)行學(xué)習(xí)方面，而這種方法的樣本數(shù)量少，并不能發(fā)揮神經(jīng)網(wǎng)絡(luò)大容量的優(yōu)勢(shì)。2019年開始，包括 Pre-training(預(yù)訓(xùn)練)、對(duì)偶學(xué)習(xí)、遷移學(xué)習(xí)等方法的無(wú)標(biāo)注數(shù)據(jù)學(xué)習(xí)成為熱點(diǎn)。

　　Pre-training 以 BERT 為代表，之后陸續(xù)出現(xiàn)了 Xlnet、RoBERTa、T5 等預(yù)訓(xùn)練模型。針對(duì) Pre-training 的研究，微軟亞洲研究院的 MASS、UniLM、VLBERT[16-18] 等預(yù)訓(xùn)練模型都超越了 BERT，進(jìn)而將 Pre-training 研究推向了新的高度;而且這些預(yù)訓(xùn)練方法不僅在很多公開數(shù)據(jù)集中面取得了重大突破，也在實(shí)際的商業(yè)產(chǎn)品中得到了廣泛應(yīng)用。

　　在無(wú)標(biāo)注數(shù)據(jù)方面，微軟亞洲研究院在三年前便提出了對(duì)偶學(xué)習(xí)，它主要是利用兩個(gè)機(jī)器學(xué)習(xí)任務(wù)之間的結(jié)構(gòu)對(duì)偶屬性，從無(wú)監(jiān)督數(shù)據(jù)獲得反饋信號(hào)進(jìn)行學(xué)習(xí)。在2019年的 ICML 上，對(duì)偶學(xué)習(xí)被應(yīng)用到了語(yǔ)音識(shí)別和語(yǔ)音合成中，進(jìn)一步驗(yàn)證了這一學(xué)習(xí)范式可以從很少量的標(biāo)注數(shù)據(jù)中學(xué)到好的語(yǔ)音合成模型[19]。今年，微軟亞洲研究院基于對(duì)偶學(xué)習(xí)，又提出了多智能體對(duì)偶學(xué)習(xí)[20]，并在2019國(guó)際機(jī)器翻譯大賽(WMT 2019)上獲取8項(xiàng)冠軍。

　　WMT 2019國(guó)際機(jī)器翻譯大賽結(jié)果

●更快的模型和算法，實(shí)際應(yīng)用才可能落地

　　深度學(xué)習(xí)使用的訓(xùn)練數(shù)據(jù)越多，模型就越大，從而模型訓(xùn)練時(shí)間、支持其運(yùn)行的計(jì)算資源，以及實(shí)際使用中的模型推理時(shí)間也越來(lái)越長(zhǎng)。因此，加快模型和算法的訓(xùn)練、推理速度，才能讓模型在實(shí)際中更快、更好地應(yīng)用。

　　對(duì)此，微軟亞洲研究院提出了快速的語(yǔ)音合成算法FastSpeech[21]，其中的非自回歸深度模型能夠把 mel spectrum 的生成速度提速270倍，同時(shí)端到端的語(yǔ)音生成速度提速40倍。FastSpeech 算法對(duì)商業(yè)化的語(yǔ)音合成產(chǎn)品提速降費(fèi)非常有效。

實(shí)際應(yīng)用前的演練——強(qiáng)化學(xué)習(xí)用在復(fù)雜游戲中

　　圍繞著機(jī)器學(xué)習(xí)的另一個(gè)熱門方向“強(qiáng)化學(xué)習(xí)”的探索，近年來(lái)一直側(cè)重于較小的游戲如 Mojoco，或者是相對(duì)簡(jiǎn)單的視頻游戲如 Atari 的研究，但今年，如何將深度學(xué)習(xí)用于解決更復(fù)雜游戲里的問(wèn)題，吸引了大量的注意力，例如針對(duì)星際爭(zhēng)霸設(shè)計(jì)的 AlphaStar，其挑戰(zhàn)就是如何從非完全信息中進(jìn)行學(xué)習(xí)，如何處理多人博弈以及更大的動(dòng)作空間。

　　微軟亞洲研究院針對(duì)麻將設(shè)計(jì)的 AI 系統(tǒng) Suphx，其在技術(shù)上的主要挑戰(zhàn)是：如何處理超大的隱藏信息空間以及非常強(qiáng)的隨機(jī)性。為了應(yīng)對(duì)這些挑戰(zhàn)，Suphx 基于深度強(qiáng)化學(xué)習(xí)，提出了近似常熵探索機(jī)制和先知教練來(lái)加強(qiáng)訓(xùn)練，并在打牌時(shí)實(shí)時(shí)進(jìn)行策略適應(yīng)。微軟亞洲研究院認(rèn)為，多人麻將中的復(fù)雜策略和帶有隨機(jī)性的博弈過(guò)程更貼近人類的真實(shí)生活，AI 在其中的突破將更能應(yīng)用于實(shí)際環(huán)境中。

機(jī)器學(xué)習(xí)進(jìn)入傳統(tǒng)行業(yè)：物流、金融……

　　深度學(xué)習(xí)的發(fā)展給許多傳統(tǒng)領(lǐng)域問(wèn)題的解決提供了全新的思路，微軟亞洲研究院的一些機(jī)器學(xué)習(xí)模型和算法成果，已經(jīng)與物流、金融等業(yè)務(wù)場(chǎng)景進(jìn)行深度結(jié)合，并取得了不錯(cuò)的效果。

　　在物流領(lǐng)域的資源調(diào)度方面，微軟亞洲研究院通過(guò)與東方海外航運(yùn)合作，探索出了針對(duì)資源調(diào)度的一套全新解決方法：競(jìng)合多智能體強(qiáng)化學(xué)習(xí)。相比于傳統(tǒng)運(yùn)籌學(xué)方法在全局上求解優(yōu)化，競(jìng)合多智能體強(qiáng)化學(xué)習(xí)把每一個(gè)港口和船只建模成智能體，對(duì)原來(lái)的復(fù)雜問(wèn)題分而治之，以去中心化的方式進(jìn)行求解，通過(guò)協(xié)調(diào)智能體之間的利益分配與轉(zhuǎn)移，來(lái)促進(jìn)智能體之間的合作，同時(shí)協(xié)調(diào)他們之間的競(jìng)爭(zhēng)，最終起到全局優(yōu)化的目的。該方法預(yù)計(jì)可以大幅提升業(yè)務(wù)效率并節(jié)省運(yùn)營(yíng)成本。實(shí)際上，大到全球范圍的航運(yùn)，小到城市內(nèi)的快遞業(yè)務(wù)，人工智能的算法已經(jīng)越來(lái)越多地被應(yīng)用到物流行業(yè)中的供需預(yù)測(cè)、資源調(diào)度、路徑優(yōu)化、供需評(píng)價(jià)等任務(wù)中。

　　在金融領(lǐng)域的量化投資方面，微軟亞洲研究院與華夏基金合作研究，聚焦“AI+指數(shù)增強(qiáng)”，通過(guò)探索兩項(xiàng)核心人工智能技術(shù)——時(shí)空卷積神經(jīng)網(wǎng)絡(luò)和時(shí)變注意力模型，自動(dòng)構(gòu)建有價(jià)值的投資因子，并實(shí)現(xiàn)了動(dòng)態(tài)的因子非線性復(fù)合。這種“AI+指數(shù)增強(qiáng)”的方法可以挖掘出與傳統(tǒng)投資方法低相關(guān)性的投資組合，幫助金融企業(yè)實(shí)現(xiàn)差異化競(jìng)爭(zhēng)。未來(lái)，人工智能算法在證券、銀行、保險(xiǎn)等行業(yè)還將發(fā)揮出更大的潛能。

更好地理解機(jī)器學(xué)習(xí)“黑盒”

　　深度學(xué)習(xí)在實(shí)踐中“大展身手”的同時(shí)，研究人員也非常期待能深入理解它。比如深度神經(jīng)網(wǎng)絡(luò)的優(yōu)化目標(biāo)是非凸的，理論上很難保證找到最優(yōu)點(diǎn)，但是實(shí)際上隨機(jī)梯度下降總會(huì)找到不錯(cuò)的解;再比如神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)和訓(xùn)練有很多竅門，像跳層連接、注意力機(jī)制、批歸一化、學(xué)習(xí)率階梯指數(shù)下降等。為什么這些竅門會(huì)起作用?如何設(shè)計(jì)出新的或者更好的“竅門”?

　　今年在這些問(wèn)題的理解上學(xué)術(shù)界有了很多進(jìn)展，其中平均場(chǎng)理論、神經(jīng)切線核、過(guò)參數(shù)化、學(xué)習(xí)率階梯指數(shù)下降等研究備受關(guān)注。不過(guò)，當(dāng)前的分析方法跟實(shí)際的深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練還有一定距離，而更具挑戰(zhàn)的是，如何真正理解這些并設(shè)計(jì)出新網(wǎng)絡(luò)、新算法來(lái)提高性能。

　　基于對(duì)深度神經(jīng)網(wǎng)絡(luò)路徑空間的分析，微軟亞洲研究院提出 G-SGD[22], 使得在優(yōu)化 ReLU 網(wǎng)絡(luò)時(shí)避免了在權(quán)重空間進(jìn)行神經(jīng)網(wǎng)絡(luò)優(yōu)化的冗余性問(wèn)題，并基于對(duì)跳層連接的穩(wěn)定性分析，提出了 tau-ResNet[23]，對(duì)殘差塊中的參數(shù)分支輸出縮小 1/sqrt(L)，從而在非常深的網(wǎng)絡(luò)中保持前傳和后傳的穩(wěn)定性，實(shí)際效果一致，且優(yōu)于原始 ResNet。

　　另外，基于有跳層連接的網(wǎng)絡(luò)與一階常微分方程的對(duì)應(yīng)，以及對(duì)注意力機(jī)制的分析，微軟亞洲研究院的研究員們提出了馬卡龍網(wǎng)絡(luò)[24]，來(lái)改進(jìn)像 Transformer 這種帶有注意力機(jī)制的網(wǎng)絡(luò)，在 NLP 項(xiàng)目上取得了一致超越 Transformer 的性能。相關(guān)研究已經(jīng)在今年的 ICLR 和 NeurIPS workshops 上發(fā)表、展示。

未來(lái)，知其然、更知其所以然

　　未來(lái)，對(duì)于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等人工智能技術(shù)的研究，我們不僅要知其然，更要知其所以然，讓 AI 在可控的、安全的范圍內(nèi)發(fā)揮最大價(jià)值。因此，對(duì) AI 的可解釋性、因果分析、魯棒性、隱私保護(hù)的研究，將會(huì)是研究人員的長(zhǎng)期奮戰(zhàn)目標(biāo)。

　　機(jī)器學(xué)習(xí)算法在多領(lǐng)域、多場(chǎng)景中的應(yīng)用，使模型和算法的可解釋性愈發(fā)受到重視，在追求算法或模型的高準(zhǔn)確度時(shí)，我們更希望知道 AI 為什么做出這種決策或預(yù)測(cè)。與可解釋性相關(guān)的，還有因果分析，我們理解問(wèn)題后，不僅希望做出預(yù)測(cè)、決策，還想了解中間的因果關(guān)系，例如了解導(dǎo)致某種疾病的原因就可以更好的避免這種疾病，因果分析可以讓我們更好地理解世界，甚至實(shí)現(xiàn)強(qiáng)人工智能。

　　另外，在一些與安全高度相關(guān)的應(yīng)用場(chǎng)合，如安防中的人臉識(shí)別、醫(yī)療應(yīng)用、無(wú)人駕駛的決策算法等，算法和模型的魯棒性尤為關(guān)鍵;同時(shí)，面對(duì)日益嚴(yán)峻的隱私保護(hù)挑戰(zhàn)，如何在使用機(jī)器學(xué)習(xí)技術(shù)時(shí)保護(hù)隱私或者加強(qiáng)隱私保護(hù)，也是未來(lái)一個(gè)非常重要的課題。

（轉(zhuǎn)載）

標(biāo)簽：AI系統(tǒng)

我要反饋

今天，微軟亞洲研究院第二十一屆“二十一世紀(jì)的計(jì)算”國(guó)際學(xué)術(shù)研討會(huì)在上海隆重舉行。本屆大會(huì)以“AIforAll”為主題，包括圖靈獎(jiǎng)獲得者在內(nèi)的多位國(guó)際計(jì)算機(jī)科學(xué)與人工智能領(lǐng)域的專家... [詳情]

2020年01月06日 2019世界人工智能大會(huì) 微軟

2019WAIC精彩回放 | 牛津大學(xué)計(jì)算機(jī)系主任：上海是智慧城市的最佳“試驗(yàn)田”

上海正在成為AI發(fā)展的高地，這不僅表現(xiàn)在企業(yè)不斷涌現(xiàn)出新的研發(fā)成果，同時(shí)也體現(xiàn)在上海城市發(fā)展治理的不斷進(jìn)步中。在上海世界人工智能大會(huì)期間，一場(chǎng)中科院主辦的AI科技沙龍上，有“... [詳情]

2020年01月06日 2019WAIC

圖靈獎(jiǎng)得主Bengio：深度學(xué)習(xí)不會(huì)被取代，我想讓AI會(huì)推理、計(jì)劃和想象

在1990年代那個(gè)漫長(zhǎng)而寒冷的AI寒冬期，大多數(shù)人認(rèn)為神經(jīng)網(wǎng)絡(luò)是一條研究的死胡同，YoshuaBengio等研究者卻仍堅(jiān)持不懈地進(jìn)行著該領(lǐng)域的研究。最終他們的努力開花結(jié)果。由于對(duì)深度學(xué)習(xí)做... [詳情]

2020年01月06日 AI