siemens x
智能駕駛

特斯拉推出搭載NVIDIA A100 GPU頂尖自動駕駛汽車訓(xùn)練超級計算機

2025China.cn   2021年06月25日
        在本周的CVPR(國際計算機視覺與模式識別會議)上,汽車制造商特斯拉的AI高級總監(jiān)Andrej Karpathy公布了公司內(nèi)部用于訓(xùn)練Autopilot與自動駕駛深度神經(jīng)網(wǎng)絡(luò)的超級計算機。這個集群使用了720個節(jié)點的8個NVIDIA A100 Tensor Core GPU(共5760個GPU),實現(xiàn)了1.8 exaflops級別的超強性能。
        Karpathy表示:“這是一臺性能卓越的超級計算機,以FLOPS計,它大概可以在全球超級計算機中排到第5位”。
        通過將汽車行業(yè)前所未有的算力作為其研發(fā)周期的核心,特斯拉讓其自動駕駛汽車工程師能夠使用前沿技術(shù)來高效完成工作。
        NVIDIA A100 GPU為全球最強的數(shù)據(jù)中心提供各種尺度的加速。A100 GPU基于NVIDIA Ampere架構(gòu)打造,其性能比上一代產(chǎn)品高出20倍,并且可以劃分成7個GPU實例,動態(tài)地適配不同的需求。
        使用100多萬輛在路上行駛的Tesla汽車(的數(shù)據(jù))來持續(xù)優(yōu)化和迭代新功能,是Tesla自動駕駛的垂直整合之道,而GPU集群在其中扮演了重要角色。
從汽車到數(shù)據(jù)中心
        特斯拉的數(shù)據(jù)循環(huán)始于汽車?!坝白幽J健痹诓粚嶋H控制車輛的情況下,悄無聲息地執(zhí)行著感知和預(yù)測深度神經(jīng)網(wǎng)絡(luò)(DNN)。
任何錯誤預(yù)測、誤識別都會被記錄下來。隨后,這些實例會被特斯拉工程師所用,來創(chuàng)建/擴(kuò)充一個包含多種復(fù)雜場景的訓(xùn)練數(shù)據(jù)集,以完善DNN。
當(dāng)前已經(jīng)收集了100萬個以每秒36幀的速度記錄的10秒片段,總數(shù)據(jù)量高達(dá)1.5PB。在數(shù)據(jù)中心,DNN基于這些場景被反復(fù)訓(xùn)練直到性能可接受。最后,DNN被發(fā)送回車內(nèi),并開始下一輪(數(shù)據(jù))循環(huán)。
        Karpathy表示,以這種方式在如此大量的數(shù)據(jù)上訓(xùn)練DNN需要龐大的計算能力,特斯拉為此建立并部署了內(nèi)置高性能A100 GPU的最新一代超級計算機。
連續(xù)迭代
        除了全方位的訓(xùn)練之外,特斯拉的超級計算機還為自動駕駛汽車工程師提供了在開發(fā)過程中進(jìn)行實驗和迭代所需的性能。
        Karpathy表示,特斯拉目前部署的DNN結(jié)構(gòu)可以讓一個由20名工程師組成的團(tuán)隊同時在一個網(wǎng)絡(luò)上工作,通過隔離不同功能來實現(xiàn)并行開發(fā)。
這些DNN運行訓(xùn)練數(shù)據(jù)集的速度會比之前快速迭代時還更快。
        Karpathy表示:“計算機視覺是我們一切工作的基礎(chǔ),并且也是實現(xiàn)Autopilot的關(guān)鍵。為此,我們必須訓(xùn)練一個龐大的神經(jīng)網(wǎng)絡(luò)并進(jìn)行大量實驗。這也是我們在算力方面投入大量資金的原因?!?nbsp;

(轉(zhuǎn)載)

標(biāo)簽:特斯拉 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道