人工智能誕生以來的60多年間,理論范式的演講一直引領(lǐng)著人工智能的發(fā)展方向。今天,在2020世界人工智能大會云端峰會的會場上,中國第一位、也是目前唯一一位圖靈獎獲得者、中國科學(xué)院院士姚期智為我們展望了未來人工智能的理論發(fā)展和新方向。
中國第一位圖靈獎獲得者、中國科學(xué)院院士姚期智
下文為主題演講全文:
尊敬的李強書記、尊敬的各位嘉賓、女士們、先生們,各位早上好!我非常高興今年能夠來參加“世界人工智能大會”,我也感謝組織方邀請我來參加這樣一個會議,給我有這樣一個機會能跟大家交流,我今天要討論的話題是“人工智能理論新的方向”。
如果我們看周圍的話,不管在任何地方,比如說在大會堂當(dāng)中,我們會看到一些在AI領(lǐng)域新進展以及它的應(yīng)用的新進展。但與此同時,我們也要記住,所有的這些光環(huán),包括今天看到的這些耀眼的應(yīng)用,它們其實是來自于一些基礎(chǔ)的科學(xué),而基礎(chǔ)科學(xué)是很多年前就打下的在基礎(chǔ)理論方面的基礎(chǔ)。所以對我們來講,我們一定要讓這些理論方面的研究,這些新的理論不斷地發(fā)展,我們應(yīng)該在創(chuàng)新的新的理論方面有新的突破,特別是在AI這塊。所以在今天,我要跟大家來講一講的是舉一些例子,講一些我的想法,就是在AI理論這一塊有什么樣新的進展,特別是最近很多人關(guān)注的一些新的進展。
另外,我也希望最后,我可以說服大家三點,一個就是理論是很重要的,如果你看一下AI現(xiàn)在面臨的挑戰(zhàn)、我們面臨的這些問題的話,我們可以說可以通過理論來分析這樣一些挑戰(zhàn),這樣我們能夠更清楚地知道我們到底面臨的是一些怎么樣的挑戰(zhàn),而這樣一種澄清也可以讓我們或者說至少給我們一些啟迪和啟示,到哪里去找解決方案。第二點就是人工智能,也就是AI,它絕對是一個跨學(xué)科的行業(yè)。比如說我會給大家舉一些例子,我們獲得的一些巨大的成果,在AI方面的一些巨大的成果往往是因為一些看似完全不搭界的學(xué)科之間的合作,這肯定也需要幾十年的努力,因為沒有我們其他學(xué)科的一些科學(xué)家取得的研究成果的話,那么在AI這一塊,我們是不可能取得這么快的一個發(fā)展。第三點就是我希望通過我的這些例子告訴大家一些非常有意思的新的方向,是非常值得去探索的。
講了這些前言之后,那我就開始吧。
跟大家來講一講,這個是我想給大家講的三個例子。第一個是可能剛才李彥宏先生也講到的就是深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò),這是現(xiàn)在很多AI應(yīng)用的基礎(chǔ),所以我要給大家講的是一些理論性的問題,就是機器學(xué)習(xí)的這些專家也是非常感興趣的,就是和拓撲學(xué)之間的聯(lián)系,這是數(shù)學(xué)非常有意思的分支。第二個例子就是關(guān)于AI人工智能和關(guān)于隱私的一些擔(dān)憂之間的關(guān)系,其實也就是密碼學(xué),這是AI的一個非常全新的領(lǐng)域。第三個是很多人也非常感興趣的一點,但是也是充滿爭議的一個話題,那就是可控的超級人工,就是所謂的Super AI,因為人們比較關(guān)心的是AI快速的進展可能會帶來一個對于人類社會的威脅。
首先,我來講講第一點,深度學(xué)習(xí)獲得了成功,其實很多人是沒有預(yù)計到的,因為它是很多年以來都沒有什么進展,可以說是靜止的,直到突然之間到達了一個點就是幾個要素集合在一起之后,使得我們看到深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)有這么巨大的應(yīng)用和影響。但是為什么神經(jīng)網(wǎng)絡(luò)這么的成功呢?它仍然是很多人覺得是一個迷失,不知道為什么,很多人都在去想、都在去追究神經(jīng)網(wǎng)絡(luò)的力量到底來自于哪里。因為如果你能夠理解神經(jīng)網(wǎng)絡(luò)的成功的話,那么也許你就會知道如何來改善神經(jīng)網(wǎng)絡(luò),并且取得下一個的突破。
我們來看一個簡單的例子,就是神經(jīng)網(wǎng)絡(luò)能做什么。比如說,我們看到圖片數(shù)據(jù),這是一個波動的數(shù)據(jù),比如說你要有一個算法來看這樣一個氣候的形勢,來分析這樣一個氣候形勢,然后來分析它到底是一個暴風(fēng)呢,還是一個正常的現(xiàn)象。一個比較標準的方法或者說電子工程師去看待它的一個視角呢,這么多年以來就是你會看一張圖,把它看作是一個二維或者是三維的一個表現(xiàn),然后希望從中找到范式,然后去看一下這張圖或者說一個風(fēng)暴的特點是什么。但是在深度學(xué)習(xí)當(dāng)中或者說在最近的一些機器學(xué)習(xí)當(dāng)中,人們怎么來看待這張圖呢?他可能是從一個更高層次的角度,整張圖應(yīng)該被認為是一個高維度的點、一個高維的數(shù)據(jù)。比如說看貓的圖片,如果是貓的圖片的話,它可能是包括幾百萬個象素,所以它可以被代表成一個一百萬維的一個點,所以這其實現(xiàn)在就是AI的一個標準的機器學(xué)習(xí)的方式,我們?nèi)绾蝸矸治鲆粋€內(nèi)容,比如說給到一個數(shù)據(jù)是一個點,但是它是一個極高維度的一個點,然后我們?nèi)シ治鲞@個點是不是屬于一個數(shù)據(jù)集,那么這個數(shù)據(jù)集就是叫貓的圖像。所以抽象來講,我們可以看一下所有的貓的圖片,它是一百萬維度的一個子集,沒有人知道在高維度當(dāng)中的數(shù)據(jù)集是什么樣的情況,可能我們對于低維度的數(shù)據(jù)是有一個感覺的,但是其實是有非常多的洞見。但是我們的任務(wù)就是盡管不知道數(shù)據(jù)集是什么樣的形狀,但是我們?nèi)绾蝸碓O(shè)計一個算法來做出一個很好的判斷呢,所以一個核心的在神經(jīng)網(wǎng)絡(luò),這樣一個計算網(wǎng)絡(luò)當(dāng)中的核心問題就是神經(jīng)網(wǎng)絡(luò)要達到多大的大小和深度,然后可以來區(qū)分一個貓的圖片和一個其他非貓的圖片。在高維度的情況下,數(shù)學(xué)家是一直在關(guān)注這個高維度的數(shù)據(jù)集,而且關(guān)注了很多年,所以一個自然的問題就是如果我們?nèi)チ私馍窠?jīng)網(wǎng)絡(luò)它能做什么,那么我們想要知道什么樣的數(shù)據(jù)集是神經(jīng)網(wǎng)絡(luò)比較容易去識別的,以及什么樣的數(shù)據(jù)集是我們不能夠用神經(jīng)網(wǎng)絡(luò)來解決這樣一個問題的。結(jié)果就是在過去十年當(dāng)中,在做神經(jīng)網(wǎng)絡(luò)的這些專家,他們開始這樣子一個思考,事實上我們也看到一些在這些的結(jié)果出來,就是把一些很好的數(shù)學(xué)和神經(jīng)網(wǎng)絡(luò)的能力聯(lián)系起來,然后來做計算。
我給大家解釋一下什么意思,一個非常重要的概念,在拓撲學(xué)當(dāng)中非常重要的概念是應(yīng)用在高維度的子集就是貝蒂數(shù),貝蒂數(shù)是一個數(shù)列,最低的是b0,它就等于一個子集當(dāng)中不相關(guān)的元素數(shù),而bi是什么意思呢?你可以把它認為是它代表著在子集當(dāng)中有多少個洞,比如說你有一個平面上的圓圈,b0=1就是一個元素,bi也=1,在中間是一個洞,你可以這樣來看待。下面更復(fù)雜的案例,我們看一個環(huán)面,就是像一個圈圈餅一樣,它的表面bi也就是一維洞的數(shù)量等于2,因為有兩個不同類型的圓圈,而每一個圓圈就代表著一個洞,在表面上有一個洞。如果說這些數(shù)字集合在一個數(shù)列就稱為總的貝蒂數(shù),這個貝蒂數(shù)從數(shù)學(xué)的角度來講,你看到它的話就是告訴你一個數(shù)據(jù)集在高維度的領(lǐng)域有多大的復(fù)雜性,這就會讓我們可以去猜測,在過去十年,我們其實一直在考慮這個問題就是如果一個數(shù)據(jù)集是非常復(fù)雜的,那么對于神經(jīng)網(wǎng)絡(luò)來講,它就更難去識別它。事實上這種靈感或者說這種感覺是對的,通過一些經(jīng)典的拓撲學(xué)的理論,然后再加上一些洞見,也就是理論計算科學(xué)家的一些洞見,在十幾年以來,我們是可以證明這樣一種理論的,所以這也是給了我們一個證據(jù),我剛才講的這一點,就是當(dāng)你想要去解決一個AI問題的話,有意思的人工智能的問題的話,你不妨從另外一個學(xué)科的角度去考慮這個問題,這個案例當(dāng)中講的就是拓撲學(xué),在拓撲學(xué)方面的一些概念、一些技術(shù)、一些復(fù)雜度的理論就可以讓我們獲得一種新的在AI方面的理論,這如果只是看AI是不可能的,因為可能花了一百年的時間,這個數(shù)學(xué)家才達到了我剛才講的這些拓撲學(xué)的理論。
我們再講第二個例子,關(guān)于隱私的保護。之前的這個案例,我是先講了AI就是人工智能的面臨問題,然后它可以跟其他的學(xué)科進行合作,然后來解決AI的問題。但是在第二個案例當(dāng)中,我首先先講另外一個學(xué)科,這個就是密碼學(xué)。我本人對密碼學(xué)是非常感興趣的,特別是所謂的多方計算MPC,這個東西其實也是存在了很多年,而且它背后基本的理念是這樣的,你要做什么呢?假定說你有很多不同的當(dāng)事方,每個方面都有一些數(shù)據(jù),但是你需要所有各方的數(shù)據(jù)集合在一起之后才能夠去挖掘,比如說通過AI來挖掘或者說去找到一些重要的成果或者結(jié)果,但是所有當(dāng)事方所擁有的數(shù)據(jù)是秘密的數(shù)據(jù),而且是非常有價值的,他不希望來揭露自己的秘密給到其他的第三方知道,我們是不是可以做這件事情呢?是不是可以讓人與人之間的傳播和溝通來獲得計算的結(jié)果,但是你不知道,也不需要去揭秘說這個數(shù)據(jù)是屬于誰的或者揭秘這個數(shù)據(jù),你是不是可以把委托給這群人以外的第三方再去做計算,然后給你結(jié)果就可以了,所以這是一個非常重要,也是非常隱私的信息,你知道你肯定是沒有辦法把它,你是不信任別人的,你不信任別人說使用你的數(shù)據(jù),我們是不是可以通過密碼或者說多方密碼的一個做法來實現(xiàn)這個結(jié)果呢?其實是可以的,可以通過密碼學(xué)來實現(xiàn)這個目標。很顯然,這樣的技術(shù)是有各種各樣的應(yīng)用。
還有就是這種類型的技術(shù),密碼學(xué)的技術(shù)很早就已經(jīng)開發(fā)出來了,在當(dāng)時其實這個應(yīng)用是非常少的,但是在那么多年之后,我們說這個成本大大地下降,而且技術(shù)也使得我們現(xiàn)在確實是可以做。
舉個例子來講,這是一個非常簡單的例子,不同的制藥公司他們是一起希望共同來做一個新藥的開發(fā),但每一個制藥公司都有一點自己的機密信息,這個現(xiàn)在就可以做了,其實有一篇論文就是可以來這樣做的。
最后一點,我覺得真的蠻有意思的,因為很多人就擔(dān)心說是不是會出現(xiàn)所謂的叫超級人工智能就是Super AI,當(dāng)然我們也不知道超級人工智能會不會出現(xiàn),但是伯克利大學(xué)的教授去年有本書,這個書當(dāng)中講了一個非常有意思的概念,盡管我們不知道超級AI會不會來,但是我們最好是做好準備,所以他就提出了一些很好的方法論或者說方法,來用一種非常具體的方法來做好準備,這個所做的方法就是用我們的概率理論和用博弈論的理論。
我要告訴大家一個基本的概念就是現(xiàn)在的應(yīng)用,它是來自于過去的理論研究。比如說,這是一個基本的科學(xué)的原則,我們現(xiàn)在做的理論研究總會在原來的某一天可以讓我們獲得巨大的進步,就好像剛才李彥宏先生所講到的。
這就是我的分享,謝謝!
(轉(zhuǎn)載)