siemens x
智慧城市

IBM 謝東:您的基礎(chǔ)設(shè)施準(zhǔn)備好迎接 AI了嗎?

2025China.cn   2024年07月17日

日前,第二十六屆中國北京國際科技產(chǎn)業(yè)博覽會(huì)在北京國家會(huì)議中心成功舉辦。IBM 副總裁、大中華區(qū)首席技術(shù)官謝東先生應(yīng)邀出席,并針對(duì)“企業(yè)人工智能的基礎(chǔ)設(shè)施”的重要性、以及企業(yè)如何規(guī)劃、建立人工智能時(shí)代的基礎(chǔ)設(shè)施,提出了切實(shí)可行的觀點(diǎn)和建議。以下是他的演講內(nèi)容節(jié)選:

IBM 全球副總裁、IBM 大中華區(qū)首席技術(shù)官 謝東(圖片來源:第二十六屆中國北京國際科技產(chǎn)業(yè)博覽會(huì))

大家好,我今天給大家分享的題目跟人工智能相關(guān),就是“企業(yè)人工智能的基礎(chǔ)設(shè)施”。談到人工智能的時(shí)候,經(jīng)常會(huì)聽到談大模型、談應(yīng)用,我想從另外一個(gè)切入點(diǎn)來談,就是基礎(chǔ)設(shè)施。

人類歷史上,每一次工業(yè)革命的背后,基礎(chǔ)設(shè)施都起著極大的促進(jìn)作用。蒸汽時(shí)代鐵路連接起來,電力時(shí)代電網(wǎng)把社會(huì)、家庭聯(lián)系起來,互聯(lián)網(wǎng)更不用說,數(shù)字化以后人與人之間互聯(lián)互通起來?;ヂ?lián)網(wǎng)時(shí)代基礎(chǔ)設(shè)施是什么?是數(shù)據(jù)中心、是互聯(lián)網(wǎng)、是各種移動(dòng)互聯(lián)等等。

對(duì)于 IT、對(duì)于整個(gè)人工智能,基礎(chǔ)設(shè)施也是非常重要的。談到 AI 的基礎(chǔ)設(shè)施,第一個(gè)想到的是算力,其實(shí)還有更多方面。當(dāng)企業(yè)建立自己的人工智能時(shí),會(huì)依托很多基礎(chǔ)的大模型,把生成式人工智能能力跟企業(yè)自身數(shù)據(jù)緊緊綁定,創(chuàng)造出新的洞察,并且把這些生成式人工智能的能力跟企業(yè)流程緊密結(jié)合,從而轉(zhuǎn)化為更大的生產(chǎn)力,企業(yè)才能在競爭中,處于有利的先導(dǎo)地位。

企業(yè)建立人工智能基礎(chǔ)設(shè)施時(shí),會(huì)涉及到哪些需求和挑戰(zhàn)?

這個(gè)挑戰(zhàn)來自于大模型參數(shù),至少這兩年大模型參數(shù)是以前百倍的增長,數(shù)據(jù)量也更多了,至少 10倍以上。不僅驅(qū)動(dòng)這些人工智能應(yīng)用時(shí)要有很多數(shù)據(jù),并且過程中產(chǎn)生生成式人工智能,生成了很多數(shù)據(jù),這些數(shù)據(jù)都是需要來處理的。再有,由于現(xiàn)在人工智能特別是生成式人工智能帶來很多交互上的應(yīng)用,對(duì)吞吐量有極大需求,至少有 7倍接近 10倍的增長。有了這么多性能上的需求,由于模型大、數(shù)據(jù)多,甚至很多時(shí)候數(shù)據(jù)是分布式的,導(dǎo)致在應(yīng)用中,很多情況下直接造成了技能急劇下降,再一個(gè)是能耗太大,還有安全威脅,都是企業(yè)部署人工智能時(shí)需要考慮的因素。

企業(yè)知道基礎(chǔ)設(shè)施很重要,如何來規(guī)劃?

首先考慮 GPU 資源到底怎么來分配,算力如何。我們知道它很大,是自己構(gòu)建算力資源還是利用公有云或者算力服務(wù)來服務(wù),這是需要考慮的。

第二,企業(yè)實(shí)施肯定是分步的,一開始一兩個(gè)應(yīng)用,后面可能很多應(yīng)用,不止需要一個(gè)大模型,還需要很多小模型配合應(yīng)用,應(yīng)用時(shí)需要很靈活、更有彈性的部署。

第三,存儲(chǔ)。對(duì)于企業(yè)來說有很多不同節(jié)點(diǎn)、不同形式的數(shù)據(jù),并且使用過程中也生成了很多數(shù)據(jù),這時(shí)候數(shù)據(jù)需要一個(gè)動(dòng)態(tài)存儲(chǔ)方案,需要使用靈活,具有經(jīng)濟(jì)效益。

第四,安全考慮,使用過程中關(guān)鍵數(shù)據(jù)需要保護(hù),也需要跟其他應(yīng)用隔離,甚至還需要一些安全加密等等。這些都是資源上的考慮。

通常構(gòu)建強(qiáng)大的 AI 基礎(chǔ)設(shè)施需要六個(gè)步驟:

一是定義預(yù)算和目標(biāo)。企業(yè)運(yùn)用人工智能是有目標(biāo)的,這個(gè)目標(biāo)簡單說是為業(yè)務(wù)增長服務(wù),不是用的時(shí)候要建一個(gè)多大模型,而是直接把 AI 能力更好地用到企業(yè)業(yè)務(wù)中去,解決企業(yè)的問題,定直接目標(biāo),根據(jù)預(yù)算進(jìn)行基礎(chǔ)設(shè)施規(guī)劃。

二是選擇合適的硬件和軟件。比如整個(gè)硬件加速平臺(tái)怎么選擇,數(shù)據(jù)平臺(tái)、AI 平臺(tái)如何部署等等。

三是尋找合適的網(wǎng)絡(luò)解決方案。這是在企業(yè)部署中容易被忽視的問題,光考慮到算力、考慮到數(shù)據(jù),沒有及時(shí)的部署合適的網(wǎng)絡(luò),有的甚至出現(xiàn)了由于網(wǎng)絡(luò)脫節(jié)導(dǎo)致整個(gè)系統(tǒng)性能跟不上要求。

四是決定使用云端還是本地解決方案部署。兩種方案各有利弊。云上有更好的伸縮性,需要的時(shí)候獲得很大算力和很大存儲(chǔ),彈性管理。很多企業(yè)需要本地方案是什么原因?是出于安全考慮和研發(fā)過程中靈活應(yīng)用的考慮。

五是建立合規(guī)措施。不管是數(shù)據(jù)、模型選擇還是部署,要符合合規(guī)監(jiān)管要求。

六是實(shí)施和維護(hù)你的解決方案,需要蠻大運(yùn)維工作支持,才能更好地支持企業(yè)人工智能的應(yīng)用,以及長期可持續(xù)的應(yīng)用發(fā)展。

這是 IBM 設(shè)計(jì)企業(yè)人工智能基礎(chǔ)架構(gòu)時(shí)的一些理念(下圖)。第一是混合環(huán)境。所謂混合環(huán)境是和混合云技術(shù)相結(jié)合,使得你在部署的時(shí)候,既可以跟本地處理方案整合,也可以跟云端方案相整合,靈活的部署資源。二是可擴(kuò)展,IBM 跟紅帽技術(shù)相結(jié)合,建立在 OpenShift 上,使得這些方案、這些應(yīng)用在本地也好、私有云也好、公有云也好,可以靈活地遷移。三是高性能,這些是企業(yè)的應(yīng)用,無論是面向個(gè)人消費(fèi)者,還有面向企業(yè)客戶,對(duì)響應(yīng)和可靠性,都有著嚴(yán)格的、更高的要求,我們這里有更多的設(shè)計(jì)。四是可信,更強(qiáng)調(diào)可靠性,保證整個(gè)設(shè)施的可靠性以及維護(hù)管理上的安全可靠。

建設(shè)基礎(chǔ)設(shè)施絕不是一刀切,要根據(jù)企業(yè)不同任務(wù)和需求來進(jìn)行部署。舉例而言,我們?cè)谥鳈C(jī)也好、Power 服務(wù)器也好,它們服務(wù)的很多都是企業(yè)的核心應(yīng)用,這些核心應(yīng)用都是處理一些高頻交易、高性能計(jì)算等,對(duì) AI 的應(yīng)用具有很高的要求。第一是吞吐量極其大,要實(shí)時(shí)響應(yīng),同時(shí)要數(shù)據(jù)安全,很多場合是不允許數(shù)據(jù)脫離開主機(jī)運(yùn)行環(huán)境的,這時(shí)候把我們嵌入式的加速器換入到服務(wù)器中,使得它能夠更好地適應(yīng)這樣的需求。再有是存儲(chǔ),存儲(chǔ)在 AI 環(huán)境下也有不同需求,其中最典型的一點(diǎn)是如何把數(shù)據(jù)最快、最及時(shí)的推到 GPU 上,我們知道 GPU 是很貴的,一定不能讓它閑置,就要制定很快、很節(jié)能、很有效的方案?,F(xiàn)在很多互聯(lián)網(wǎng)大廠用 IBM 這些高效存儲(chǔ)方案,來支持它的大模型應(yīng)用。

光有硬件平臺(tái)也不全夠,IBM 還提供 watsonx 平臺(tái),跟整個(gè)基礎(chǔ)架構(gòu)互相配合。watsonx 是 IBM 在整個(gè)企業(yè)方案里面的基礎(chǔ)平臺(tái),有三個(gè)部分:全面支持企業(yè)打造 AI 平臺(tái),包括 watsonx.ai,進(jìn)行模型訓(xùn)練、驗(yàn)證、調(diào)優(yōu)和部署等等,整個(gè) AI 模型全周期管理。再有是數(shù)據(jù),watsonx.data 就是來負(fù)責(zé)整個(gè)企業(yè)中數(shù)據(jù)的管理、部署、優(yōu)化等;很多治理方面的工作,由 watsonx.governance 來保證,有了這樣一個(gè)平臺(tái)的支持,就使得在 AI 模型也好,數(shù)據(jù)也好,治理方面也好,都可以在我們基礎(chǔ)架構(gòu)的支持下互相緊密的配合,支持企業(yè)在人工智能方面有一個(gè)長期健康發(fā)展的依托。

IBM 通過技術(shù)、產(chǎn)品和方案全方位為企業(yè)用戶打造 AI 基礎(chǔ)設(shè)施和方案。在人工智能時(shí)代,一定需要好的基礎(chǔ)設(shè)施進(jìn)行支持,IBM 在這里有很多技術(shù)戰(zhàn)略服務(wù),愿意和很多客戶一起深度合作,共同推動(dòng)人工智能長期健康發(fā)展,謝謝大家。

(來源:IBM中國)

標(biāo)簽:IBM 基礎(chǔ)設(shè)施 我要反饋 
2024世界人工智能大會(huì)專題
即刻點(diǎn)擊并下載ABB資料,好禮贏不停~
優(yōu)傲機(jī)器人下載中心
西克
2024全景工博會(huì)
專題報(bào)道
2024 工博會(huì) | 直播探館 · 全景解讀
2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國工博會(huì)于9月24日至28日在國家會(huì)展中心(上海)舉行,展會(huì)以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]

2024世界人工智能大會(huì)
2024世界人工智能大會(huì)

WAIC 2024將于7月在上海舉行,論壇時(shí)間7月4日-6日,展覽時(shí)間7月4日-7日。WAIC 2024將圍繞“以共商促... [更多]

2024漢諾威工業(yè)博覽會(huì)專題
2024漢諾威工業(yè)博覽會(huì)專題

2024 漢諾威工業(yè)博覽會(huì)將于4月22 - 26日在德國漢諾威展覽中心舉行。作為全球首屈一指的工業(yè)貿(mào)易展覽會(huì),本屆展覽會(huì)... [更多]