物聯(lián)網(wǎng)

RISC-V HPC內(nèi)核從5nm遷移到4nm,1個月還是2天?

ainet.cn   2024年01月31日

5nm及以下的芯片是推動當(dāng)今高端消費(fèi)產(chǎn)品和數(shù)據(jù)中心技術(shù)的強(qiáng)大引擎。隨著消費(fèi)設(shè)備越做越小、功能越來越強(qiáng)大,芯片的復(fù)雜性也在急劇增加。與此同時,半導(dǎo)體行業(yè)正面臨技術(shù)人才短缺的困境。因此,半導(dǎo)體公司想要盡快滿足市場需求所面臨的壓力是巨大的。

在提高效率和生產(chǎn)力方面,人工智能(AI)是破題關(guān)鍵。AI在協(xié)助開發(fā)者優(yōu)化設(shè)計以滿足嚴(yán)苛的PPA目標(biāo)方面相當(dāng)成功。全球算力需求持續(xù)超出摩爾定律預(yù)測的增長速度,半導(dǎo)體公司亟需探尋如何有效地利用仍然可行的大規(guī)模設(shè)計,并將設(shè)計遷移到具有可用產(chǎn)能的相似制程上,同時充分發(fā)揮新制程的潛在性能和低功耗特性。

此類設(shè)計遷移項目通常作為全新項目來實施,需要的時間和開發(fā)資源與原項目相當(dāng)。投入到項目中的時間和工作量會影響產(chǎn)品的上市時間和成本,進(jìn)而影響此類產(chǎn)品和業(yè)務(wù)部署的可行性。 但AI可以讓芯片設(shè)計遷移工作變得更加精簡、更具成本效益。

2020年,新思科技推出DSO.ai。這項技術(shù)已被主流半導(dǎo)體公司用來更大限度地提高設(shè)計效率。最新一代的DSO.ai包括新的AI內(nèi)核引擎,可將周轉(zhuǎn)時間(TAT)縮短一半,并將設(shè)計質(zhì)量(QoR)提升多達(dá)20%。

自DSO.ai推出以來,其AI引擎不斷學(xué)習(xí),并將所學(xué)的知識應(yīng)用于初始設(shè)計優(yōu)化和衍生設(shè)計等多個方面。在找尋滿足目標(biāo)規(guī)格的最佳優(yōu)化策略時,AI引擎不是“冷”啟動,而是“熱”啟動。下一代DSO.ai可以將這種學(xué)習(xí)提升到一個新的水平,并將“熱”啟動功能應(yīng)用于衍生制程以實現(xiàn)設(shè)計遷移。

我們先來看一個制程遷移的案例:RISC-V高性能計算(HPC)內(nèi)核從5nm遷移到4nm的實際運(yùn)用情況。

此案例研究中的5nm RISC-V HPC內(nèi)核為單個“大內(nèi)核”,擁有500,000個面向數(shù)據(jù)中心應(yīng)用的實例。5nm設(shè)計的原始目標(biāo)規(guī)格包括性能至少達(dá)到1.95GHz,而功耗不超過30mW,并且內(nèi)核面積被指定為426um x 255um。新思科技Fusion Compiler RTL-to-GDSII實現(xiàn)解決方案采用開箱即用的RISC-V參考流程,能夠滿足面積和功耗要求,但性能有些許欠缺,僅為1.75Ghz??s小這一性能差距預(yù)計需要兩名專業(yè)開發(fā)者一個月的努力。

▲ RISC-V HPC 5nm設(shè)計的基線優(yōu)化結(jié)果

讓我們先了解一下設(shè)計空間優(yōu)化技術(shù)是如何從“冷啟動”開始應(yīng)用以達(dá)到優(yōu)化目標(biāo)的。在此示例中,我們允許該解決方案優(yōu)化總共25個排列組合,包括來自RISC-V HPC工具箱的排列組合,以及時序、合法化引擎和功耗策略??紤]到排列組合的變化,理論上的搜索空間達(dá)到了1億的規(guī)模,也就是說,這個規(guī)模的搜索空間需要1億個Fusion Compiler作業(yè)才能實現(xiàn)覆蓋。然而,通過調(diào)用一個DSO.ai AI驅(qū)動的優(yōu)化主機(jī),我們能夠?qū)⑺璧腇usion Compiler作業(yè)數(shù)量減少到在3次迭代中并行運(yùn)行僅30個作業(yè)。該解決方案無需人工干預(yù),兩天內(nèi)即可完成任務(wù)。于是,在指定的面積參數(shù)范圍內(nèi),不僅可以滿足1.95GHz的目標(biāo)性能規(guī)格,而且功耗(27.9mW)優(yōu)于預(yù)期。

▲ 在5nm RISC-V HPC內(nèi)核上使用新思科技DSO.ai的優(yōu)化結(jié)果

現(xiàn)在,我們來看一看如何應(yīng)用從5nm“冷”啟動中學(xué)到的知識,在“熱”啟動場景中將設(shè)計遷移到4nm。從5nm到4nm,尺寸需要縮小10%,以滿足404um x 242um的面積要求。性能目標(biāo)從1.95GHz提高到2.1GHz,同時功耗要求保持在30mW。排列組合變化的數(shù)量保持不變,因此搜索空間的規(guī)模仍為1億。通過使用5nm設(shè)計中的訓(xùn)練數(shù)據(jù)庫,計算配置從3次迭代中并行運(yùn)行30個Fusion Compiler作業(yè)減少到單次迭代中運(yùn)行15個Fusion Compiler作業(yè),作業(yè)數(shù)量減少到了“冷”啟動的六分之一。在無需人工干預(yù)的情況下,該解決方案能夠在一天內(nèi)完成任務(wù)。最終結(jié)果是在縮小的目標(biāo)面積內(nèi),性能大幅提升至2.15GHz,功耗降至29.4mW。

▲ 使用新思科技DSO.ai時的設(shè)計遷移結(jié)果

在這個市場窗口緊縮、設(shè)計日益復(fù)雜、技術(shù)人才短缺的時代,開發(fā)團(tuán)隊能夠借助人工智能將設(shè)計高效遷移到更小尺寸,進(jìn)而充分利用經(jīng)驗證的設(shè)計并更大限度地提高生產(chǎn)力。

(來源:新思科技)

標(biāo)簽:新思科技 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
ABB協(xié)作機(jī)器人,自動化從未如此簡單
優(yōu)傲機(jī)器人下載中心
2024全景工博會
專題報道
2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實踐的最新成果,鼓勵更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

中國國際進(jìn)口博覽會
中國國際進(jìn)口博覽會

11月5日至10日,第七屆中國國際進(jìn)口博覽會在國家會展中心(上海)舉行。152個國家、地區(qū)和國際組織,近3500家參展企... [更多]

2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]