大數(shù)據(jù)

英特爾第四代至強(qiáng)? 可擴(kuò)展處理器助TiDB開(kāi)源分布式數(shù)據(jù)庫(kù)實(shí)現(xiàn)優(yōu)化

ainet.cn   2024年11月25日

“作為一款PingCAP自主研發(fā)、面向全球用戶(hù)的開(kāi)源數(shù)據(jù)庫(kù),TiDB走在了技術(shù)的前沿。得益于第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器卓越的代際性能提升,以及其搭載的多種硬件加速器,我們進(jìn)一步提升了TiDB的性能表現(xiàn)。我們將繼續(xù)堅(jiān)持開(kāi)源的創(chuàng)新理念,將TiDB打造成一個(gè)領(lǐng)先的數(shù)據(jù)庫(kù)產(chǎn)品。”—— PingCAP聯(lián)合創(chuàng)始人兼CTO黃東旭

挑戰(zhàn)

部署新一代分布式數(shù)據(jù)庫(kù)已經(jīng)成為用戶(hù)釋放數(shù)據(jù)價(jià)值、推動(dòng)數(shù)字化轉(zhuǎn)型的重要方式,但隨著數(shù)據(jù)的快速增長(zhǎng)以及上層負(fù)載的日益復(fù)雜化,數(shù)據(jù)庫(kù)的應(yīng)用面臨著以下挑戰(zhàn):

● 如何釋放CPU性能:在金融、電子商務(wù)、互聯(lián)網(wǎng)、游戲等行業(yè)用戶(hù)的數(shù)據(jù)庫(kù)部署實(shí)踐中,常常需要通過(guò)高性能的數(shù)據(jù)庫(kù)服務(wù),滿(mǎn)足高讀寫(xiě)等場(chǎng)景的應(yīng)用需求,以提升應(yīng)用體驗(yàn),由此導(dǎo)致用戶(hù)對(duì)數(shù)據(jù)庫(kù)性能的要求與日俱增。長(zhǎng)期實(shí)踐已證實(shí),CPU性能是制約數(shù)據(jù)庫(kù)性能提升的重要瓶頸。

● 如何平衡存儲(chǔ)空間與性能:海量數(shù)據(jù)存儲(chǔ)與處理需求意味著大量存儲(chǔ)空間占用,這會(huì)帶來(lái)相應(yīng)的存儲(chǔ)成本壓力。而通過(guò)提升數(shù)據(jù)壓縮率等方式,有助于節(jié)約數(shù)據(jù)庫(kù)系統(tǒng)的存儲(chǔ)空間占用,降低成本壓力,但數(shù)據(jù)壓縮也可能導(dǎo)致性能開(kāi)銷(xiāo)的增長(zhǎng),需要在壓縮率與性能方面實(shí)現(xiàn)更佳的平衡。

● 如何優(yōu)化投資回報(bào):在現(xiàn)代化的數(shù)據(jù)中心內(nèi),激增的數(shù)據(jù)帶來(lái)了數(shù)據(jù)庫(kù)方面不斷增長(zhǎng)的投資需求,用戶(hù)希望能夠提升數(shù)據(jù)庫(kù)的性能密度,通過(guò)軟件優(yōu)化等方式更好地激發(fā)硬件潛能,從而提升在數(shù)據(jù)庫(kù)領(lǐng)域的投資回報(bào)。

解決方案概述

作為數(shù)字化體系的關(guān)鍵組成部分,數(shù)據(jù)庫(kù)連接著應(yīng)用與數(shù)據(jù),對(duì)于數(shù)據(jù)價(jià)值的挖掘有著至關(guān)重要的意義。隨著數(shù)字化轉(zhuǎn)型的深入,數(shù)據(jù)庫(kù)需要處理的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)出現(xiàn)了快速增長(zhǎng),用戶(hù)對(duì)于數(shù)據(jù)庫(kù)的性能、擴(kuò)展性、服務(wù)質(zhì)量提出了更高的要求,這驅(qū)動(dòng)著數(shù)據(jù)庫(kù)技術(shù)融合發(fā)展,云原生和多云的需求進(jìn)一步增強(qiáng),數(shù)據(jù)庫(kù)與大數(shù)據(jù)的深度融合應(yīng)用,以及存算分離也成為發(fā)展的主流。

PingCAP推出了TiDB開(kāi)源分布式數(shù)據(jù)庫(kù),以幫助行業(yè)客戶(hù)應(yīng)對(duì)數(shù)字化轉(zhuǎn)型所帶來(lái)的挑戰(zhàn)。為了進(jìn)一步提升數(shù)據(jù)庫(kù)性能并節(jié)省存儲(chǔ)空間,PingCAP測(cè)試了TiDB在第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器平臺(tái)上的性能,依托處理器的代際性能提升,數(shù)據(jù)庫(kù)的讀性能與讀寫(xiě)性能分別達(dá)到基準(zhǔn)配置的1.62倍與1.43倍1 。此外,TiDB還可以利用第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器集成的英特爾® In-Memory Analytics Accelerator(英特爾® IAA),在不影響性能的前提下,提升了數(shù)據(jù)壓縮率,節(jié)約了大量的存儲(chǔ)空間。

TiDB開(kāi)源分布式數(shù)據(jù)庫(kù)

TiDB是PingCAP公司自主設(shè)計(jì)、研發(fā)的開(kāi)源分布式數(shù)據(jù)庫(kù),是一款同時(shí)支持在線(xiàn)事務(wù)處理與在線(xiàn)分析處理(Hybrid Transactional and Analytical Processing,HTAP)的融合型分布式數(shù)據(jù)庫(kù)產(chǎn)品,具備水平擴(kuò)容或者縮容、金融級(jí)高可用、實(shí)時(shí)HTAP、云原生、兼容MySQL協(xié)議和MySQL生態(tài)等核心特性。TiDB為用戶(hù)提供一棧式聯(lián)機(jī)事務(wù)處理過(guò)程(OLTP)、聯(lián)機(jī)分析處理(OLAP)和HTAP解決方案,適用于高可用、強(qiáng)一致、數(shù)據(jù)規(guī)模較大等應(yīng)用場(chǎng)景。

圖1. TiDB開(kāi)源分布式數(shù)據(jù)庫(kù)產(chǎn)品架構(gòu)與數(shù)據(jù)生態(tài)

TiDB開(kāi)源分布式數(shù)據(jù)庫(kù)采用云原生架構(gòu),兼容MySQL,能夠有效減少遷移工作量。數(shù)據(jù)庫(kù)同時(shí)具備交易處理與數(shù)據(jù)分析能力,在多模態(tài)可擴(kuò)展性和性能方面表現(xiàn)卓越。TiDB可提供以下優(yōu)勢(shì):

● 一鍵水平擴(kuò)容或者縮容

得益于TiDB存儲(chǔ)計(jì)算分離的架構(gòu)設(shè)計(jì),可按需對(duì)計(jì)算、存儲(chǔ)分別進(jìn)行在線(xiàn)擴(kuò)容或者縮容,整個(gè)過(guò)程對(duì)應(yīng)用運(yùn)維人員透明。

● 金融級(jí)高可用

數(shù)據(jù)采用多副本存儲(chǔ),數(shù)據(jù)副本通過(guò)Multi-Raft協(xié)議同步事務(wù)日志,多數(shù)派寫(xiě)入成功事務(wù)才能提交,確保數(shù)據(jù)強(qiáng)一致性且少數(shù)副本發(fā)生故障時(shí)不影響數(shù)據(jù)的可用性。可按需配置副本地理位置、副本數(shù)量等策略滿(mǎn)足不同容災(zāi)級(jí)別的要求。

● 實(shí)時(shí)HTAP

提供行存儲(chǔ)引擎TiKV、列存儲(chǔ)引擎TiFlash兩款存儲(chǔ)引擎,TiFlash通過(guò)Multi-Raft Learner協(xié)議實(shí)時(shí)從TiKV復(fù)制數(shù)據(jù),確保行存儲(chǔ)引擎TiKV和列存儲(chǔ)引擎TiFlash之間的數(shù)據(jù)強(qiáng)一致。TiKV、TiFlash可按需部署在不同的機(jī)器,解決混合負(fù)載資源隔離的問(wèn)題。

● 云原生的分布式數(shù)據(jù)庫(kù)

為云設(shè)計(jì)的分布式數(shù)據(jù)庫(kù),通過(guò)TiDB Operator可在公有云、私有云、混合云中實(shí)現(xiàn)部署工具化、自動(dòng)化,依托公有云提供開(kāi)箱即用的TiDB Cloud服務(wù)(DBaas)。

● 兼容MySQL協(xié)議和MySQL生態(tài)

兼容MySQL協(xié)議、MysQL常用的功能、MysQL生態(tài),應(yīng)用無(wú)需或者修改少量代碼即可從MySQL遷移到TiDB,提供豐富的數(shù)據(jù)遷移工具幫助應(yīng)用便捷完成數(shù)據(jù)遷移。

采用第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器優(yōu)化性能并提升數(shù)據(jù)壓縮率

對(duì)于現(xiàn)代化的數(shù)據(jù)庫(kù)系統(tǒng),CPU已經(jīng)成為數(shù)據(jù)庫(kù)整體性能的關(guān)鍵影響因素。為了從CPU的迭代中獲益,TiDB開(kāi)源分布式數(shù)據(jù)庫(kù)適配了第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器。

第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器通過(guò)創(chuàng)新架構(gòu)增加了每個(gè)時(shí)鐘周期的指令,每個(gè)插槽多達(dá)60個(gè)核心,支持8通道DDR5內(nèi)存,有效提升了內(nèi)存帶寬與速度,并通過(guò)PCIe 5.0(80個(gè)通道)實(shí)現(xiàn)了更高的PCIe帶寬提升。第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器提供了現(xiàn)代性能和安全性,可根據(jù)用戶(hù)的業(yè)務(wù)需求進(jìn)行擴(kuò)展。借助內(nèi)置的加速器,用戶(hù)可以在AI、分析、云和微服務(wù)、網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、存儲(chǔ)等類(lèi)型的工作負(fù)載中獲得優(yōu)化的性能。通過(guò)與強(qiáng)大的生態(tài)系統(tǒng)相結(jié)合,第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器能夠幫助用戶(hù)構(gòu)建更加高效、安全的基礎(chǔ)設(shè)施。

圖2. 第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器為數(shù)據(jù)中心提供多種優(yōu)勢(shì)

對(duì)于數(shù)據(jù)庫(kù)應(yīng)用而言,第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器提供了更多的內(nèi)核,以及更多的Sub-NUMA Clustering(SNC)節(jié)點(diǎn),使得數(shù)據(jù)庫(kù)系統(tǒng)能夠?qū)崿F(xiàn)明顯的代際性能提升。

在OLTP場(chǎng)景中,為了驗(yàn)證CPU升級(jí)帶來(lái)的性能提升,PingCAP進(jìn)行了測(cè)試,驗(yàn)證了在Sysbench基準(zhǔn)測(cè)試中,英特爾® 至強(qiáng)® 鉑金 8380/8480+ 處理器的只讀、讀寫(xiě)性能差異。測(cè)試數(shù)據(jù)如圖3、圖4所示,基于英特爾® 至強(qiáng)® 鉑金 8480+ 處理器的TiDB在Sysbench只讀測(cè)試中性能達(dá)到基準(zhǔn)配置的1.62倍,在Sysbench讀寫(xiě)測(cè)試中性能達(dá)到后者的1.43倍6 。

表1. 測(cè)試配置

圖3. 只讀測(cè)試性能

圖4. 讀寫(xiě)測(cè)試性能

在OLAP場(chǎng)景中,PingCAP還希望能夠提升TiDB的海量數(shù)據(jù)壓縮存儲(chǔ)能力,從而減少存儲(chǔ)數(shù)據(jù)所需的空間,降低相應(yīng)的成本投入。為此,TiDB采用了第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器集成的英特爾® IAA加速器。

英特爾® IAA是一款硬件加速器,結(jié)合分析原始函數(shù),能夠提供出色的吞吐量壓縮和解壓縮性能。英特爾® IAA主要針對(duì)大數(shù)據(jù)和內(nèi)存分析數(shù)據(jù)庫(kù)等應(yīng)用程序,以及內(nèi)存頁(yè)壓縮等應(yīng)用程序透明用途,能夠在分析查詢(xún)處理期間過(guò)濾數(shù)據(jù)。英特爾® IAA支持零壓縮等輕量級(jí)壓縮方案以及霍夫曼編碼和Deflate等較重的壓縮算法。對(duì)于Deflate格式,它支持對(duì)壓縮流進(jìn)行索引,以實(shí)現(xiàn)高效的隨機(jī)訪(fǎng)問(wèn)。

圖5. 英特爾® IAA加速流程

PingCAP對(duì)比了在不同處理器配置下,英特爾® IAA以及LZ4無(wú)損壓縮算法的壓縮率差異。測(cè)試數(shù)據(jù)如圖6所示,采用英特爾® IAA替代LZ4之后,TiDB壓縮率達(dá)到LZ4壓縮算法的1.4倍,主要針對(duì)列存儲(chǔ)引擎TiFlash的使用場(chǎng)景,能夠大幅節(jié)省存儲(chǔ)空間7 。

圖6. 不同處理器與壓縮算法下的壓縮率

此外,PingCAP還測(cè)試了在不同的處理器與壓縮算法的組合下,數(shù)據(jù)庫(kù)的性能差異。測(cè)試數(shù)據(jù)如圖7所示,在采用英特爾® IAA替代LZ4進(jìn)行壓縮之后,數(shù)據(jù)庫(kù)的性能不僅沒(méi)有降低,還實(shí)現(xiàn)了一定的提升。

圖7. 不同處理器與壓縮算法下的性能差異

收益

在將CPU升級(jí)為第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器之后,TiDB開(kāi)源分布式數(shù)據(jù)庫(kù)提升了性能,節(jié)約了存儲(chǔ)空間,為客戶(hù)帶來(lái)了以下收益:

● 數(shù)據(jù)庫(kù)的只讀和讀寫(xiě)性能分別達(dá)到基準(zhǔn)配置的1.62倍和1.43倍,結(jié)合TiDB自身的性能優(yōu)勢(shì),能夠幫助客戶(hù)加速數(shù)據(jù)處理與分析效率,應(yīng)對(duì)大規(guī)模數(shù)據(jù)帶來(lái)的沖擊8 。

● 英特爾® IAA壓縮算法的壓縮率達(dá)到傳統(tǒng)壓縮算法的1.4倍,為用戶(hù)節(jié)省了大量的硬盤(pán)空間,降低成本;結(jié)合CPU的迭代,性能提升可達(dá)到原配置的1.56倍,有助于客戶(hù)化解數(shù)據(jù)壓縮所帶來(lái)的性能困擾9 。

● 結(jié)合軟硬件創(chuàng)新,TiDB能夠有效提高數(shù)據(jù)庫(kù)系統(tǒng)的性能/成本比,幫助用戶(hù)節(jié)省在數(shù)據(jù)庫(kù)上的投資。

展望

移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等技術(shù)的快速發(fā)展推動(dòng)了數(shù)據(jù)的爆發(fā)式增長(zhǎng),要求企業(yè)數(shù)據(jù)庫(kù)必須能應(yīng)對(duì)海量數(shù)據(jù)和對(duì)瞬間的超大網(wǎng)絡(luò)請(qǐng)求,迫使傳統(tǒng)的IT架構(gòu)必須提升其靈活性、可靠性、流動(dòng)性、安全性?;诘谒拇⑻貭?reg; 至強(qiáng)® 可擴(kuò)展處理器TiDB具備高并發(fā)、高可用、熱分表等特性,并可同時(shí)處理交易類(lèi)業(yè)務(wù)和分析類(lèi)業(yè)務(wù),有望為企業(yè)的數(shù)字化轉(zhuǎn)型進(jìn)程注入充沛的動(dòng)力。

PingCAP與英特爾的合作驗(yàn)證了第四代英特爾® 至強(qiáng)® 可擴(kuò)展處理器在加速數(shù)據(jù)庫(kù)負(fù)載方面的卓越潛力。除了當(dāng)前的合作成果之外,雙方還將進(jìn)一步加速軟硬件融合領(lǐng)域的合作,為用戶(hù)提供安全可靠、海量數(shù)據(jù)超高性能支持、彈性擴(kuò)展能力、HTAP混合負(fù)載、資源靈活管控和共享等數(shù)據(jù)庫(kù)能力支撐,構(gòu)建基于創(chuàng)新技術(shù)的基礎(chǔ)設(shè)施。

(來(lái)源:英特爾中國(guó))

標(biāo)簽:英特爾 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書(shū)下載
ABB協(xié)作機(jī)器人,自動(dòng)化從未如此簡(jiǎn)單
優(yōu)傲機(jī)器人下載中心
2024全景工博會(huì)
專(zhuān)題報(bào)道
2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國(guó)內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果,鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

中國(guó)國(guó)際進(jìn)口博覽會(huì)
中國(guó)國(guó)際進(jìn)口博覽會(huì)

11月5日至10日,第七屆中國(guó)國(guó)際進(jìn)口博覽會(huì)在國(guó)家會(huì)展中心(上海)舉行。152個(gè)國(guó)家、地區(qū)和國(guó)際組織,近3500家參展企... [更多]

2024 工博會(huì) | 直播探館 · 全景解讀
2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國(guó)工博會(huì)于9月24日至28日在國(guó)家會(huì)展中心(上海)舉行,展會(huì)以“工業(yè)聚能 新質(zhì)領(lǐng)航”為全新主題。 [更多]