siemens x
人工智能

更開放,更懂AI,新華三發(fā)布多元異構(gòu)算力平臺

2025China.cn   2024年05月09日

生成式AI應(yīng)用的不斷發(fā)展,使全社會對算力尤其是異構(gòu)計(jì)算資源的需求達(dá)到新高度。作為新質(zhì)生產(chǎn)力的重要動力引擎,算力資源的開放性和安全性直接關(guān)系到數(shù)字經(jīng)濟(jì)的穩(wěn)定和發(fā)展。近日,紫光股份旗下新華三集團(tuán)發(fā)布全新多元異構(gòu)算力平臺H3C UniServer R5330 G7和H3C UniServer R5500 G7,以多元異構(gòu)、開放包容、靈活高效等多重優(yōu)勢,提供高性能、高可靠的多元算力,為不同AI負(fù)載提供強(qiáng)勁算力支撐,為數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展提供堅(jiān)實(shí)后盾。

智能算力旗艦 H3C UniServer R5500 G7

為AI而生 先進(jìn)模塊化設(shè)計(jì)打造極致算力

“百模大戰(zhàn)”熱潮下,大模型的訓(xùn)練及推理過程均需要強(qiáng)大的算力作為支撐。H3C UniServer R5500 G7是專為AI大模型訓(xùn)練而設(shè)計(jì)的智能算力旗艦新品,支持千億級參數(shù)規(guī)模的大模型訓(xùn)練。產(chǎn)品采用系統(tǒng)解耦的先進(jìn)模塊化設(shè)計(jì),兼容最新OCP OAI開放硬件標(biāo)準(zhǔn),實(shí)現(xiàn)算力開放和可進(jìn)化;通過搭載2顆最新處理器以及新一代OAM 8-GPU模組,為AI大模型訓(xùn)練提供旗艦級算力與互聯(lián)帶寬,加速AGI時代到來。

算力旗艦,助力AI大模型訓(xùn)練:

● 支持超過15種、千億級參數(shù)主流大模型訓(xùn)練,覆蓋AIGC、計(jì)算機(jī)視覺、自然語言處理和大數(shù)據(jù)分析等多種AI應(yīng)用場景。

● 采用先進(jìn)模塊化設(shè)計(jì),用戶可靈活選擇GPU計(jì)算模塊,提高系統(tǒng)的可擴(kuò)展性和可維護(hù)性,節(jié)省成本。

● GPU模組算力可提升200%,Llama2-70B增量預(yù)訓(xùn)練僅需15天。

生態(tài)兼容,AI業(yè)務(wù)平滑遷移:

● 主流開源大模型一鍵遷移,客戶模型零代碼改動。

● CUDA底層原生兼容,算子庫兼容可達(dá)95%以上。

● 適配國內(nèi)外主流深度學(xué)習(xí)框架,原生適配國產(chǎn)飛槳深度學(xué)習(xí)框架。

可靠高效,算力管理智能靈活:

● CPU、GPU模組、BMC芯片等核心部件支持國產(chǎn)化,供應(yīng)可靠。

● 結(jié)合傲飛算力平臺,可實(shí)現(xiàn)萬卡集群算力統(tǒng)一調(diào)度,算力高效使用。

● 算力資源統(tǒng)一管理、監(jiān)控、告警,智能靈活。

自主算力引擎H3C UniServer R5330 G7

直面異構(gòu)算力 卓越性能助力AGI時代

隨著多元異構(gòu)算力的廣泛應(yīng)用,伴隨而來的諸多挑戰(zhàn)也逐漸浮現(xiàn)。由于不同廠商硬件存在計(jì)算架構(gòu)、緩存資源、互聯(lián)方式等差異,極大限制了算力資源的充分使用和靈活調(diào)度。新華三集團(tuán)發(fā)布的自主算力引擎產(chǎn)品——H3C UniServer R5330 G7,搭載2顆最新處理器+GPU異構(gòu)算力,可有效解決異構(gòu)算力部署的技術(shù)難題;CUDA算子庫支持95%以上,讓底層適配更加高效便捷,實(shí)現(xiàn)生態(tài)無縫遷移;開放包容,異構(gòu)賦能,為不同AI負(fù)載提供強(qiáng)勁算力支撐。

訓(xùn)推一體,AI開發(fā)新范式:

● 對比上一代GPU,大模型訓(xùn)練場景下的AI算力提升超過30%,顯存容量提升100%。

●大模型推理場景僅需單臺8-GPU便可支持在100用戶同時訪問情況下達(dá)到15 token/s,提供更快的服務(wù)響應(yīng)速度。

●支持多元GPU異構(gòu)算力大模型混合部署,更具靈活性,為用戶提供更多選擇。

生態(tài)開放,AI業(yè)務(wù)快速部署:

●CUDA算子庫支持95%以上,用戶代碼零改動。

●支持200種以上主流AI模型,軟件棧兼容國內(nèi)外主流生態(tài),支持原生社區(qū)分布式訓(xùn)練方案。

●覆蓋通用計(jì)算、FFT(快速傅里葉變換)等多種計(jì)算模式。

異構(gòu)賦能,實(shí)現(xiàn)智能算力調(diào)度:

●結(jié)合傲飛算力平臺,可實(shí)現(xiàn)萬卡集群算力統(tǒng)一調(diào)度。

●提供模型訓(xùn)練、微調(diào)、評估、推理全流程服務(wù)。

●支持AI算力資源統(tǒng)一管理、監(jiān)控、告警,讓運(yùn)維更智能、更靈活。

算力已成為數(shù)字經(jīng)濟(jì)時代的關(guān)鍵生產(chǎn)要素。未來,新華三集團(tuán)將繼續(xù)秉持“精耕務(wù)實(shí),為時代賦智慧”的理念,加速算力平臺的智能再進(jìn)化,為百行百業(yè)的數(shù)智變革夯實(shí)算力底座,推動新質(zhì)生產(chǎn)力蓬勃發(fā)展。

(來源:新華三)

標(biāo)簽:新華三 多元異構(gòu)算力平臺 我要反饋 
2024世界人工智能大會專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會
專題報(bào)道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會,本屆展覽會... [更多]