siemens x
人工智能

IBM 重磅發(fā)布全新 Telum 處理器,依托新一代 IBM Z 大型主機加速 AI 應用

2025China.cn   2024年09月03日

● 新一代 IBM Telum II 處理器和 IBM Spyre 加速器可解鎖更多企業(yè)級 AI 能力,包括大語言模型和生成式 AI

● 先進的 I/O 技術實現(xiàn)并簡化可擴展的 I/O 子系統(tǒng),進一步降低能耗和數(shù)據(jù)中心占地面積

近日,IBM(紐約證券交易所:IBM) 在 Hot Chips 2024 大會上公布了即將推出的 IBM Telum® II 處理器和 IBM Spyre™ 加速器的架構細節(jié)。這些新技術旨在大幅擴展下一代 IBM Z 大型主機系統(tǒng)的處理能力,通過新的 AI 集成方法,加速企業(yè)對傳統(tǒng) AI 模型和大語言 AI 模型的協(xié)同使用。

隨著基于大語言模型的 AI 項目從概念驗證階段進入生產階段,企業(yè)對高能效、高安全性和高度可擴展解決方案的需求日益迫切。摩根士丹利最近發(fā)布的一份研究報告預測,在未來幾年,生成式 AI 的電力需求將以每年 75% 的速度激增,其 2026年的能耗或將與西班牙 2022年的全年能耗相當。許多 IBM 客戶表示,支持適當規(guī)模的基礎模型和針對 AI 工作負載的混合架構越來越重要。

此次 IBM 發(fā)布的主要創(chuàng)新技術包括:

● IBM Telum II 處理器:這一全新芯片將搭載于下一代 IBM Z 系列主機,與第一代 Telum 芯片相比,其頻率和內存容量均有提升,高速緩存提升 40%;集成 AI 加速器內核和數(shù)據(jù)處理單元 (DPU) 的性能也得到改善。IBM Telum II 處理器將支持大語言模型驅動的企業(yè)計算解決方案,滿足金融等行業(yè)的復雜交易需求。

● IO 加速單元:Telum II 處理器芯片上的全新數(shù)據(jù)處理單元 (DPU) 旨在加速大型主機上用于聯(lián)網和數(shù)據(jù)存儲的復雜 IO 協(xié)議,可簡化系統(tǒng)操作,提高關鍵組件性能。

● IBM Spyre 加速器:可提供額外的 AI 計算能力,與 Telum II 處理器相得益彰。Telum II 和 Spyre 芯片共同構成了一個可擴展的架構,可支持AI集成建模方法,即將多個機器學習或深度學習的 AI 模型與基于編碼器的大語言模型相結合。通過利用每個模型架構的優(yōu)勢,AI 集成的方法可以生成比單個模型更準確、更穩(wěn)健的結果。Spyre 加速器芯片在 Hot Chips 2024 大會期間進行了預覽,并將作為 Telum II 處理器的附加選件提供。每個加速器芯片均與 IBM 研究院合作開發(fā),通過一個 75瓦 PCIe 適配器連接。與其他 PCIe 卡一樣,Spyre 加速器可根據(jù)客戶需求進行擴展。

IBM 主機和 LinuxONE 產品管理副總裁 Tina Tarquinio 表示:“得益于 IBM 強大的多代并行的開發(fā)路線圖,我們得以在保持技術領先的同時,滿足企業(yè)不斷升級的 AI 需求。Telum II 處理器和 Spyre 加速器旨在提供安全、節(jié)能、高性能的企業(yè)計算解決方案。這些多年研發(fā)的創(chuàng)新成果將被引入下一代 IBM Z 平臺,幫助客戶大規(guī)模利用大語言模型和生成式 AI 技術。”

Telum II 處理器和 IBM Spyre 加速器將由 IBM的長期合作伙伴三星晶圓代工(Samsung Foundry)生產,采用其高性能、高能效的 5納米工藝節(jié)點。二者將共同支持企業(yè)的先進 AI 用例,釋放業(yè)務價值,從而創(chuàng)造新的競爭優(yōu)勢。利用 AI 集成的方法,客戶可以更快、更準確地獲得預測結果。適用的生成式 AI 用例包括:

● 保險理賠欺詐檢測:通過 AI 集成方法將大語言模型與傳統(tǒng)神經網絡相結合,以提高性能和準確性,增強對保險理賠欺詐的檢測。

● 反洗錢高級監(jiān)測:對可疑金融活動進行高級檢測,支持遵守監(jiān)管要求并降低金融犯罪風險。

● AI 助手:加速應用生命周期、知識和專業(yè)技能的傳授、代碼解釋和轉換等。

規(guī)格和性能指標:

● Telum II 處理器:配備八個運行頻率達 5.5GHz 的高性能內核,每個內核配備 36MB 二級高速緩存,片上高速緩存容量增加 40%(總容量達 360MB)。每個處理器抽屜的虛擬 L4 高速緩存為 2.88GB,相比上一代增加 40%。集成的 AI 加速器可實現(xiàn)低延遲、高吞吐量的交易中 AI 推理,例如增強金融交易期間的欺詐檢測,并且每塊芯片的計算能力是上一代的四倍。

Telum II 芯片中集成了最新的 I/O 加速單元 DPU。在設計上,其 I/O 密度提高 50%,可大幅提高數(shù)據(jù)處理能力,進一步提高 IBM Z 的整體效率和可擴展性,使其成為處理大規(guī)模 AI 工作負載和數(shù)據(jù)密集型應用的不二之選。

● Spyre 加速器:這是一款專為復雜 AI 模型和生成式 AI 用例提供可擴展功能的企業(yè)級加速器。它有高達 1TB 的內存,可在普通 IO 抽屜的八塊卡上串聯(lián)工作,以支持大型主機的整體 AI 工作負載,同時每塊卡的功耗不超過 75W。每塊芯片由 32個計算內核組成,支持 int4、int8、fp8 和 fp16 數(shù)據(jù)類型,適用于低延遲和高吞吐量的 AI 應用。

產品時間表

作為 IBM 下一代 IBM Z 和 IBM LinuxONE 平臺的中央處理器,Telum II 處理器預計在 2025年向 IBM Z 和 LinuxONE 客戶提供。IBM Spyre 加速器仍在技術預覽階段,預計也將于 2025年推出。

(來源:IBM中國)

標簽:IBM 我要反饋 
2024世界人工智能大會專題
即刻點擊并下載ABB資料,好禮贏不停~
優(yōu)傲機器人下載中心
西克
2024全景工博會
專題報道
2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質領航”為全新主題。 [更多]

2024世界人工智能大會
2024世界人工智能大會

WAIC 2024將于7月在上海舉行,論壇時間7月4日-6日,展覽時間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會專題
2024漢諾威工業(yè)博覽會專題

2024 漢諾威工業(yè)博覽會將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿易展覽會,本屆展覽會... [更多]