siemens x
人工智能

7nm后,AI芯片三大架構,誰與爭鋒

2025China.cn   2019年08月12日

  2018年被稱為AI元年,在這一年,谷歌公布了第三代人工智能芯片TPU,專門對自家TensorFlow進行了優(yōu)化,這塊芯片比傳統(tǒng)CPU運算快30倍,能效比高出200倍,如此驚艷表現讓大量AI公司著手規(guī)劃自己的芯片,AI技術的芯片化成為了當前AI產業(yè)發(fā)展的一種世界級現象。

  除了谷歌,AWS,微軟,蘋果,百度等世界IT巨頭,依圖,地平線,寒武紀等本土AI獨角獸也在積極研發(fā)自己的AI芯片。新近AI創(chuàng)業(yè)公司大多選擇以算法的芯片化作為市場的切入點。AI產業(yè)也正處在從算法輸出走向芯片研發(fā)的轉型過程中。

  目前主流的芯片架構主要分為GPU、FPGA、ASIC等技術流派,代表玩家分別為英偉達,谷歌、賽靈思。

GPU

  GPU其實就是我們平時用到的顯卡芯片,每塊顯卡當中都會有一塊GPU協同電腦的CPU來進行圖形加速運算,與CPU相比GPU擁有更多的算數邏輯單元ALU,這可以很方便地執(zhí)行AI這種相對小型化的零散型任務,GPU擁有更多算數邏輯單元,可以形成數量可觀的任務流水線,將運算進行并行處理。

  談到GPU就不得不提及計算機圖形顯示領域的巨人英偉達,英偉達在人工智能領域起步很早,積累扎實,從2007年以后通用計算需求下降,CPU市場企穩(wěn),在游戲市場的推動下GPU的性能和帶寬不斷提升,DNN的需求也在這一時間顯現,英偉達的GPU恰好滿足了當時AI市場需求,從此以后AI便成為了英偉達投資的一個重要市場。

  英偉達在算力和開發(fā)環(huán)境方面一直處于業(yè)界領先地位,2018年英偉達上市了最新的Volta架構GPU,算力高達960 Tensor TFLOPS,其基于C語言的CUDA編程環(huán)境擁有廣泛的開發(fā)者基礎。與AWS的合作,讓開發(fā)者能夠在云端執(zhí)行深度學習運算,不需要額外購買GPU設備。

  無處不在的安裝基礎讓英偉達在用戶生態(tài)和采購成本方面上占絕有對優(yōu)勢,很多初創(chuàng)公司以及院校研究機構都會選擇英偉達GPU作為主要平臺切入市場,這也使得英偉達生態(tài)擴張很快,市場占有率不斷走強,根據最新公布的數字,英偉達在AI芯片市場占有率已經達到了50%,絕對的NO.1

  雖然GPU運算能力很強但缺點也不少,比如在訓練型運算如ADAS等應用上表現出色,占絕對支配地位,但對于推理類運算相對FPGA較弱,此外由于內部是采用的是公版架構設計,所以GPU的晶體管數量非常龐大,要比ASIC高出十倍,這樣最直接的問題就是堆料嚴重,導致成本高和功耗巨大,這也是英偉達GPU被詬病最多的地方。市場目前對于這些缺點還算比較能容忍,客戶現階段最關心的還是算力,畢竟節(jié)約AI訓練時間更加關鍵。英偉達目前也擁有自己的ASIC產品Xaier專門用于ADAS,這是一款車規(guī)級的產品,雖然已經實現了量產,但規(guī)模小,價格偏貴,主要面向與L5級自動駕駛高端市場。

TPU (ASIC)

  ASIC全稱 Application Specific Integrated Circuits專用集成電路,這種架構可以被理解為專門為某一項算法定制的芯片,這樣的產品優(yōu)點非常突出,比如由于其依據特定算法設計,不像GPU那樣堆料,容易控制硬件成本,功耗自然也低,但缺點也很突出,由于沒有重構能力,一旦算法發(fā)生迭代,其優(yōu)化的效果就會失效,比如此前的比特大陸ASIC礦機,挖礦機制更新后性能就會變差,設備只能進行重新設計。

  TPU Tensor processing unit就是ASIC類型芯片的代表,財力雄厚的谷歌不僅在軟件算法上投資發(fā)力,也在定制自己的AI芯片,TPU同時也是Alpha Go的大腦。其實谷歌最早采用的也是英偉達的GPU,但后期出于多種考慮開始轉向研發(fā)自家芯片,這也導致了英偉達轉向與AWS進行深度合作。谷歌的商業(yè)模式一直非常具有創(chuàng)意,在AI上也是一樣,雖然開放了底層架構TensorFlow,但在芯片業(yè)務上,選擇了只租不賣,對比英偉達的芯片出售模式,谷歌似乎規(guī)劃更長遠,希望開發(fā)一套通用平臺直接服務最終用戶,當然這樣的商業(yè)模式最后能不能成功暫且不論,單單是開發(fā)ASIC就非常具有戰(zhàn)略意義,相比FPGA和GPU,ASIC無論是在功耗還是堆料成本上都要節(jié)約得多,計算效率也要高出很多。但谷歌這枚TPU從嚴格的意義上講是擁有少部分可重構能力的,所以應該算是FPGA與ASIC之間的芯片,但隨著谷歌算法不斷的升級和完善,這部分重構能力很可能會被谷歌抹掉,將其設計成為完全獨立的ASIC芯片。值得注意的是,依圖也借鑒了谷歌這種商業(yè)模式,開發(fā)自研芯片,而且只供自己的服務器使用,不對外出售,亞馬遜的AWS也可能是出于對功耗的顧慮,近期也在轉向自家ASIC的研究。

FPGA

  FPGA全稱Field Programmable Gate Array,現場可編程邏輯門陣列,可以被理解為一種半成品的ASIC,擁有極其優(yōu)秀的可重構能力,其硬件加速性能比DSP更加優(yōu)秀,擁有類似GPU那樣多的小單元來將任務流水線并行處理掉,在推理運算方面明顯優(yōu)于GPU。

  FPGA 的主要玩家是賽靈思,很多AI初創(chuàng)公司都選擇賽靈思平臺作為市場切入工具,如深鑒科技(已被賽靈思收購),這樣的趨勢下也進一步擴大了FPGA的市場占有率,讓賽靈思成為了能夠和英偉達分庭抗禮的另外一個生態(tài)陣營,其老對手Altera被英特爾收購后,在AIOT領域明顯發(fā)力不足,在AI市場上的競爭基本不足為慮。

  FPGA很好的解決了現階段AI開發(fā)者面臨的問題,在大多數初創(chuàng)公司都還處在尋找應用場景的階段,FPGA給算法的迭代提供了一個比較節(jié)約的選擇。利用FPGA的可重構能力,開發(fā)者可以多次改變項目的特征,實現芯片的復用。使用FPGA雖然能夠省掉了流片成本,但相對來說還是較貴,而且由于其追求可重構的能力,在設計上就沒能達到極致優(yōu)化,功耗比ASIC要高出不少,且技術難度較大,高級開發(fā)人員較少,項目成本較高,在訓練型計算中表現中低于GPU。

  就像GPU一樣,雖然FPGA有不少缺點,但也沒辦法擋住其火爆的趨勢,大量AI公司選擇FPGA來進行算法的開發(fā)驗證以及芯片的前期定制,甚至蘋果這種大公司也將FPGA嵌入到自家A12芯片中,提供AI能力。

類腦芯片

  類腦芯片完全擺脫了傳統(tǒng)的馮諾依曼結構,把內存和CPU以及通訊元件集成在一起,DSP作為神經元,內存作為突觸。這樣設計的好處是,每個單元完全獨立工作,根據任務量調配單元使用,運算能力驚人且功耗極低。其代表芯片是IBM的TrueNorth和Intel Loihi 。

  TrueNorth,可以幾厘米空間里,集成4096個內核、100萬個DSP和2.56億個內存突觸,能耗只有不到70毫瓦。而Loihi 擁有13萬個硅“神經元”,復雜程度幾乎等同老鼠的大腦。目前兩款芯片還都停留在概念階段,沒有投放市場。

  作為CPU時代的芯片巨頭,Intel其實一直在布局AI市場,先后收購了Altera,Mobileye ,Nervana,Movidius等與AI相關的公司,但似乎聲音上遠不如谷歌和英偉達。當然就目前情況來看,Intel似乎也并不是很上心。

未來誰將勝利

  一方面是在AI訓練市場占有絕對領導地位,另一方面自動駕駛技術尚未成熟,市場反哺還需時日,英偉達面臨的挑戰(zhàn)是在未來持續(xù)保持GPU對FPGA和ASIC算力上的優(yōu)勢,但由于摩爾定律已經失效,7nm后制程升級越來越困難,英偉達若想繼續(xù)保持算力的優(yōu)勢只能不斷的堆料將產品做大,但“功耗”依舊是擺在面前的問題,顯然云端市場并不買賬這樣的堆料方式,紛紛轉向開發(fā)自己的ASIC,而終端市場則被靈活的FPGA切掉了不少份額。

  國內的許多創(chuàng)業(yè)公司初期平臺都會選擇FPGA,這種芯片是公司業(yè)務從初創(chuàng)到成型的過渡中非常理想的一種選擇,深鑒,寒武紀,地平線,比特大陸都先后使用過FPGA,商湯等視覺安防AI公司也會用到GPU+FPGA的方案,但當業(yè)務發(fā)展到一定程度后,也都會逐步轉向ASIC,如近期依圖發(fā)布的“求索”,未來AI芯片一定會更加定制化,這也確實是提高AI運行效率,降低成本的一個最有效的途徑。

  此外,由于云端市場門檻相對較高,且大廠完全把持,創(chuàng)業(yè)公司的主要機會將集中在邊緣端,這時低功耗,面向場景開發(fā)的AI芯片將是未來主流發(fā)展方向,或者說全行業(yè)面臨著一場AI升級,很多傳統(tǒng)企業(yè)會借助多年在行業(yè)積累的優(yōu)勢切入進AI市場,而這時ASIC應該會有更多大展拳腳的機會。

  當然從場景開發(fā)到業(yè)務的成型是一個漫長過程,目前行業(yè)還處在大量企業(yè)和人才的涌入階段,這些企業(yè)在前期初創(chuàng)時基本都離不開英賽兩大廠的產品,所以在很長時間里它們都不會缺乏生意。

標簽:2019世界人工智能大會 AI芯片 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿易展覽會,本屆展覽會... [更多]