云計算

云計算數(shù)據(jù)中心智能運維全棧觀察的基礎——帶內(nèi)遙測技術淺析

ainet.cn   2021年11月22日

  隨著數(shù)字化轉型企業(yè)對云計算基礎架構依賴程度的提高,融合了大數(shù)據(jù)和人工智能最新發(fā)展的智能運維(AIOps)逐漸成為提高基礎架構服務質(zhì)量的關鍵[1]。Gartner 在 AIOps 的研究報告[2]中指出,AIOps 平臺應由觀察(Observe)、處理(Engage)和行動(Act)三個部分結合大數(shù)據(jù)和機器學習組成一個閉環(huán)結構,而觀察是觸發(fā)整個閉環(huán)反饋的基礎和關鍵,沒有高質(zhì)量的全棧觀察,就缺乏人工智能所需的大數(shù)據(jù)源,因而也無法形成智能化的處理和相應的主動運維行為。但在性能飛速提升的數(shù)據(jù)中心,數(shù)據(jù)平面觀察是一直以來的難點。為網(wǎng)絡設備制定硬件可編程語言標準的開源組織 P4(p4.org)對帶內(nèi)網(wǎng)絡的遙測(In-band Network Telemetry,INT)定義了三種類型的技術思路 —— eMbed Data(MD),eMbed instruct(X)ions(MX)和 INT eXport Data(XD)—— 基本涵蓋了主流的 INT 技術實現(xiàn)方式[3]。

  從當前業(yè)內(nèi)云數(shù)據(jù)中心交換設備對這幾種思路的商業(yè)化實現(xiàn)上看,INT MD 功能全面但對資源和處理性能要求高,商用化多實現(xiàn)在 9.6T-25.6Tbps 級別的單芯片系統(tǒng)上;INT MX 相對輕量化,但功能有限,對系統(tǒng)功能整合度要求高,多實現(xiàn)在廠商特定功能集內(nèi);IN TXD 做到了功能和開銷的相對平衡,成本和實用性更有優(yōu)勢,但對芯片設計的門檻要求更高。采用不同權衡策略的商業(yè)化產(chǎn)品功能差異較大,需要不同企業(yè)在 AIOps 設計時根據(jù)需求詳細考查。從未來發(fā)展上看,通用企業(yè)數(shù)據(jù)中心會偏重將帶內(nèi)遙測通過 XD 方式實現(xiàn),同時用 MX 做進一步功能補充;而運營商和互聯(lián)網(wǎng)企業(yè)在升級到 100/200G 接入或普遍引入智能網(wǎng)卡之后,會重點考慮 MD 功能。當然工程上的實現(xiàn)并不絕對,不同解決方案會走向某種模式為主、其他模式補充的混合形態(tài),以追求性能、功能與代價的最優(yōu)平衡[4]。

  參考文獻

  [1]魏航,劉軍.構建數(shù)字化轉型企業(yè)以用戶體驗為中心的 IT 架構[J].數(shù)碼世界,2020(05).

  [2]Pankaj Prasad,Padraig Byrne.Market Guide for AIOps Platforms[R].Gartner,2021

  [3]P4.In-band Network Telemetry (INT) Dataplane Specification[EB/OL].https://p4.org, 2020-02-14

  [4]魏航.數(shù)據(jù)中心網(wǎng)絡智能運維的帶內(nèi)遙測技術[J].數(shù)字通信世界,2021(09).

(轉載)

標簽:思科 我要反饋 
優(yōu)傲機器人下載中心
億萬克
專題報道
聚力同行 · 新智“碳”索
聚力同行 · 新智“碳”索

“新華社-智能·零碳”項目策劃以“聚力同行·新智‘碳’索”為主題的新能源專題,主要圍繞光伏、儲能、鋰電、氫能、風能五大新... [更多]

2025中國國際機床展覽會
2025中國國際機床展覽會

4月21至26日,以“融合創(chuàng)新,數(shù)智未來”為主題的第十九屆中國國際機床展覽會在首都國際會展中心盛大舉辦。憑借場館的卓越服... [更多]

2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進“雙碳”實踐的最新成果,鼓勵更多企業(yè)、科研機構、投資機構等廣泛... [更多]