siemens x
物聯(lián)網(wǎng)

可視化的片上網(wǎng)絡(luò)(NoC)性能分析

2025China.cn   2021年11月11日

  1. 概述

  Achronix 最新基于臺積電(TSMC)的7nm FinFET工藝的Speedster7t FPGA器件包含了革命性的新型二維片上網(wǎng)絡(luò)(2D NoC)。2D NoC如同在FPGA可編程邏輯結(jié)構(gòu)上運(yùn)行的高速公路網(wǎng)絡(luò)一樣,為FPGA外部高速接口和內(nèi)部可編程邏輯的數(shù)據(jù)傳輸提供了超高帶寬。

  如圖1所示。

圖1 Speedster 7t FPGA結(jié)構(gòu)圖

  2. 2D NoC給Speedster 7t FPGA帶來的優(yōu)勢

  日益增長的數(shù)據(jù)加速需求對硬件平臺提出了越來越高的要求,F(xiàn)PGA作為一種可編程可定制化的高性能硬件發(fā)揮著越來越重要的作用。 近年來高端FPGA用了越來越多的Hard IP去提升FPGA外圍的數(shù)據(jù)傳輸帶寬以及存儲器帶寬。但是在邏輯陣列密度不斷提升的同時(shí),通信性能的提升并沒有那么明顯,所以FPGA內(nèi)部數(shù)據(jù)的交換越來越成為數(shù)據(jù)傳輸?shù)钠款i。

  Achronix將此挑戰(zhàn)視為一個(gè)開發(fā)全新架構(gòu)的機(jī)會,以消除傳統(tǒng)FPGA的設(shè)計(jì)挑戰(zhàn)并提高系統(tǒng)性能。Achronix的解決方案是在傳統(tǒng)FPGA布線結(jié)構(gòu)之上,創(chuàng)新地使用了革命性的二維(2D)高速片上網(wǎng)絡(luò)(NoC)。Speedster7t NoC連接到所有片上高速接口:400G以太網(wǎng)、PCIe Gen5、GDDR6和DDR4 / 5的多個(gè)端口。

  3. 2D NoC的性能

  Speedster 7t FPGA上的二維片上網(wǎng)絡(luò)(2D NoC)不是由可編程邏輯搭建,而是固化的ASIC邏輯實(shí)現(xiàn),固定運(yùn)行頻率為2GHz,NoC使用一系列高速的行和列網(wǎng)絡(luò)通路在整個(gè)FPGA內(nèi)部分發(fā)數(shù)據(jù),從而在整個(gè)FPGA結(jié)構(gòu)中以水平和垂直方式分發(fā)數(shù)據(jù)流量。NoC中的每一行或每一列都有兩個(gè)256位的、單向的、行業(yè)標(biāo)準(zhǔn)的AXI通道,可以在每個(gè)方向上以512 Gbps(256bit x 2GHz)的傳輸帶寬運(yùn)行??値捀哌_(dá)27Tbps。

圖2 Speedster 7t FPGA NoC 和 接入點(diǎn)NAP

  在Speedster 7t的二維片上網(wǎng)絡(luò)中,每個(gè)交叉節(jié)點(diǎn)都有兩個(gè)網(wǎng)絡(luò)接入點(diǎn)(NAP),如圖2所示,一個(gè)是master,一個(gè)是slave。整個(gè)器件總共有160個(gè)這樣的接入點(diǎn),這樣可以保證無論邏輯放置在器件的任何地方,工具都能找到最近的NAP,使之走上二維片上網(wǎng)絡(luò)。數(shù)據(jù)在二維片上網(wǎng)絡(luò)上傳輸也會有延遲,數(shù)據(jù)沒經(jīng)過一個(gè)網(wǎng)格的長度,延時(shí)會增加2~3個(gè)時(shí)鐘周期,也就是1~1.5ns(時(shí)鐘固定為2GHz,所以一個(gè)周期為0.5ns)。

  由此可見,二維片上網(wǎng)絡(luò)給高端FPGA帶了巨大的性能優(yōu)勢,但是如何高效的利用這種優(yōu)勢給自己的應(yīng)用帶來實(shí)質(zhì)性的性能提升至關(guān)重要。

  4. 如何更高效地規(guī)劃2D NoC的性能—可視化的NoC性能分析

  Achronix在新版ACE工具中提供一個(gè)可視化的NoC性能分析工具,只用導(dǎo)入simulation的log文件就可以直觀的看到在不同的時(shí)間片,NoC上面的帶寬占用情況,以便于設(shè)計(jì)者能更好地規(guī)劃NAP的位置,均衡NoC的帶寬利用,使其工作地更為高效。

  工具使用起來非常簡單,在ACE工具中點(diǎn)擊圖標(biāo),就可以進(jìn)入NoC Performance View的頁面,在這個(gè)頁面中點(diǎn)擊Browse,導(dǎo)入仿真的log文件。

圖3 導(dǎo)入仿真log文件

  在NoC Performance View頁面的右邊有一個(gè)選項(xiàng)列表,可以顯示不同條件下NoC占用情況。第一個(gè)選項(xiàng)是選擇顯示的協(xié)議,F(xiàn)lit還是AXI。第二個(gè)選項(xiàng)是選擇顯示哪種AXI Type。第三個(gè)選項(xiàng)是選擇顯示模式,Throughput模式還是Blockage模式。

圖4 NoC Performance View選項(xiàng)

  在Throughput模式下,綠色代表高吞吐量,淺藍(lán)色代表中等吞吐量,深藍(lán)色代表低吞吐量,如圖5所示。

圖5 NoC Performance View的throughput模式

  在Blockage模式下,紅色代表擁塞程度最高,黃色代表擁塞程度中等,綠色代表擁塞程度低。如圖6所示。

圖5 NoC Performance View的Blockage模式

  在圖中用鼠標(biāo)懸停在有顏色的部分,在懸浮的窗口中會顯示圖中對應(yīng)的具體的log文件中的信息,包括時(shí)間點(diǎn)以及哪條會話。

圖6 鼠標(biāo)懸浮顯示

  所以通過NoC Performance View的工具,我們可以很直觀的看到二維片上網(wǎng)絡(luò)的使用情況,哪里利用率比較高,哪里利用率比較低,根據(jù)這個(gè)工具我們可以更容易的為邏輯指定更適合接入點(diǎn)NAP去接入到而且片上網(wǎng)絡(luò),從而使二維片上網(wǎng)絡(luò)更高效的運(yùn)行。

  后面我們會繼續(xù)深入了解Speedster 7t FPGA各種特性,并且會用一些例子來說明如何更高效的利用這些特性,敬請期待。 如需更多信息或者有任何疑問您可以通過Achronix公眾號里聯(lián)系方式聯(lián)系我們,也可訪問Achronix公司官方網(wǎng)站 http://www.achronix.com

  參考文獻(xiàn):

  Achronix網(wǎng)站:www.achronix.com

  使用帶有片上高速網(wǎng)絡(luò)的FPGA的八大好處(WP020)

  作者:Achronix高級應(yīng)用工程師 黃侖

(轉(zhuǎn)載)

標(biāo)簽:Achronix 我要反饋 
2024世界人工智能大會專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會
專題報(bào)道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時(shí)間7月4日-6日,展覽時(shí)間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]