大模型時(shí)代的AI之變與開發(fā)之根

ainet.cn 2021年09月29日

　　自2018年谷歌發(fā)布Bert以來，預(yù)訓(xùn)練大模型以強(qiáng)大的算法效果，席卷了NLP為代表的各大AI榜單與測試數(shù)據(jù)集。隨著產(chǎn)學(xué)研各界的深入研究，大模型在AI產(chǎn)學(xué)研各界的地位得到不斷加強(qiáng)。到2021年，我們可以看到各大學(xué)術(shù)機(jī)構(gòu)、科技企業(yè)都在打造自己的大模型，并且將其能力邊界、技術(shù)路徑進(jìn)行了極大拓展。

　　有人認(rèn)為，AI大模型的到來讓這項(xiàng)技術(shù)完成了從實(shí)驗(yàn)室到工業(yè)化集成的轉(zhuǎn)變。如果說過去的AI開發(fā)需要手工作坊模式的調(diào)參、調(diào)優(yōu)、數(shù)據(jù)積累，那么大模型則預(yù)先集成了海量數(shù)據(jù)的訓(xùn)練效果，企業(yè)與科研用戶拿到手中就是一個(gè)“智力”強(qiáng)大、效果客觀的完成品。于是極大程度節(jié)省了重復(fù)開發(fā)成本，降低了開發(fā)門檻。

　　大模型的價(jià)值涌現(xiàn)出來，下一個(gè)問題隨之誕生：打造大模型需要人工智能算力、網(wǎng)絡(luò)、框架等一系列條件形成有效支撐，才能讓大模型真正“大”起來。大模型能夠持續(xù)發(fā)展的前提，是必須打造強(qiáng)壯的AI根技術(shù)，在框架、算力等層面滿足大模型的“建造”需求。

　　不久之前，中科院自動(dòng)化所發(fā)布了全球首個(gè)三模態(tài)大模型——紫東.太初。

　　而這項(xiàng)技術(shù)成果的背后，是中科院自動(dòng)化所與華為攜手，利用全場景AI框架MindSpore對(duì)大模型開發(fā)進(jìn)行了一系列支撐。9月25日，在華為全聯(lián)接2021上，MindSpore中文名“昇思”發(fā)布，同時(shí)推出昇思1.5版本。這一版本強(qiáng)化全場景能力、原生支持大模型，并新增AI科學(xué)計(jì)算新范式，發(fā)布電磁仿真套件和分子模擬套件，促進(jìn)AI應(yīng)用于科學(xué)計(jì)算領(lǐng)域。

　　我們就借此機(jī)會(huì)，聊聊大模型如何從昇思1.5中汲取營養(yǎng);持續(xù)打造大模型，需要開發(fā)框架帶來怎樣的根技術(shù)支持。

　　時(shí)代的召喚：

　　大模型推動(dòng)AI之變

　　預(yù)訓(xùn)練大模型發(fā)展到今天，已經(jīng)經(jīng)歷了三年多的時(shí)間。期間最具“出圈”效應(yīng)的大模型，可能就要屬2020年OpenAI發(fā)布的NLP大模型GPT-3。

　　GPT-3首次實(shí)現(xiàn)了千億級(jí)數(shù)據(jù)參數(shù)，除了傳統(tǒng)的NLP能力之外，還可以算術(shù)、編程、寫小說、寫論文摘要，一時(shí)之間成為輿論熱點(diǎn)。GPT-3的出現(xiàn)，讓各界看到了大模型的潛力，也讓中國開發(fā)自己的大模型成為了“時(shí)代的召喚”。

　　從產(chǎn)業(yè)價(jià)值上看，預(yù)訓(xùn)練大模型帶來了一系列可能性，讓產(chǎn)學(xué)研各界看到了由弱人工智能走向強(qiáng)人工智能;由重復(fù)開發(fā)、手工作坊式人工智能，走向工業(yè)化、集成化智能的全新路徑?？梢哉f，大模型是近兩年AI持續(xù)變革的核心動(dòng)力，也是AI走入千行百業(yè)、各學(xué)科領(lǐng)域的關(guān)鍵支柱。

　　于是我們可以看到，中國的科技企業(yè)、學(xué)術(shù)科研機(jī)構(gòu)紛紛開始加碼大模型，并且在不同路徑上進(jìn)行探索和嘗試。比如說，Bert和GPT都是NLP領(lǐng)域的大模型，缺乏對(duì)圖形圖像數(shù)據(jù)與多模態(tài)數(shù)據(jù)的處理能力。因此，多模態(tài)大模型成為了重要的研究方向。集成語音、文本、圖像、視頻等各個(gè)模態(tài)信息的處理模式，也更加貼近人類感知，具有更高的社會(huì)價(jià)值。

　　對(duì)于產(chǎn)學(xué)各界來說，數(shù)據(jù)量大、訓(xùn)練效果好、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)緊湊，同時(shí)又容易獲取的預(yù)訓(xùn)練大模型，都是未來學(xué)術(shù)研究、AI開發(fā)、產(chǎn)業(yè)升級(jí)的基礎(chǔ)和關(guān)鍵。大模型將很有可能改變AI的研究范式，成為不同領(lǐng)域的共性基礎(chǔ)平臺(tái)。

　　中科院自動(dòng)化所就瞄準(zhǔn)這一方向，成功構(gòu)建了視覺-文本-語音三模態(tài)預(yù)訓(xùn)練模型——紫東.太初。而在其背后，華為提供的昇思1.5框架的能力，成為了打造大模型的利劍。

　　駛向多模態(tài)：

　　紫東.太初的獨(dú)特價(jià)值

　　破混沌，開新局，紫東.太初這個(gè)極具魄力與東方文化質(zhì)感的名字屬于全球首個(gè)三模態(tài)大模型(OPT-Omni-Perception pre Trainer)。它能夠?qū)崿F(xiàn)圖文音語義的統(tǒng)一表達(dá)，將視覺、文本、語音三種模態(tài)統(tǒng)一起來，實(shí)現(xiàn)以文搜圖，以圖生音等跨模特理解與生成能力，這標(biāo)志著預(yù)訓(xùn)練模型工作獲得突破性進(jìn)展。

　　目前階段，產(chǎn)學(xué)研界最多的大模型就是NLP大模型，其次是CV大模型。而多模態(tài)大模型作為新生事物，基本也考慮的是兩個(gè)模態(tài)之間的協(xié)同轉(zhuǎn)化。比如圖像與文本、視頻與文本，并且能力更多是集中在生成或理解中的一項(xiàng)，很少能夠兼顧。

　　紫東.太初為了解決這些問題，提出了視覺-文本-語音三模態(tài)預(yù)訓(xùn)練模型。通過將視覺、文本、語音不同模態(tài)數(shù)據(jù)各自編碼器，映射到統(tǒng)一語義空間，然后通過多頭自注意力機(jī)制(Multi-head Self-attention)學(xué)習(xí)模態(tài)之間的語義關(guān)聯(lián)以及特征對(duì)齊，形成多模態(tài)統(tǒng)一知識(shí)表示，再利用編碼后的多模態(tài)特征，最終通過解碼器分別生成文本、圖像和語音。經(jīng)過這樣的對(duì)齊與轉(zhuǎn)化，大模型可以更加關(guān)注圖-文-音三模態(tài)數(shù)據(jù)之間的關(guān)聯(lián)特性以及跨模態(tài)轉(zhuǎn)換問題，對(duì)更廣泛、更多樣的下游任務(wù)提供模型基礎(chǔ)支撐。最終，多模態(tài)大模型不僅可以實(shí)現(xiàn)跨模態(tài)理解，還能完成跨模態(tài)生成，極大程度提升了學(xué)習(xí)框架的靈活性，有效降低了多模態(tài)數(shù)據(jù)的收集與清洗成本。

　　由于三模態(tài)大模型非常接近人類的信息處理方式，其對(duì)信息數(shù)據(jù)有非常好的協(xié)同掌握能力，因此可以非常廣泛地應(yīng)用于產(chǎn)學(xué)各領(lǐng)域，孵化出更多新應(yīng)用。紫東.太初目前已經(jīng)具備全球領(lǐng)先的圖文音跨模態(tài)理解與生成能力，可輕松完成智能問答、圖片生成、視頻理解與等任務(wù)，這些能力將在工業(yè)質(zhì)檢、影視創(chuàng)作、互聯(lián)網(wǎng)推薦、智能駕駛等領(lǐng)域廣泛應(yīng)用。

　　而面向產(chǎn)業(yè)上游看，我們會(huì)發(fā)現(xiàn)紫東.太初的打造，得益于昇騰AI的產(chǎn)業(yè)底座。尤其是昇思對(duì)大模型的原生支持，讓大模型具備了快速開發(fā)、精準(zhǔn)訓(xùn)練的“開發(fā)之根”。

　　根強(qiáng)則AI強(qiáng)：

　　昇思支持大模型時(shí)代到來

　　在MindSpore 全新升級(jí)的1.5版本中，我們不僅見到了全新的中文名——昇思，更重要的是見到了昇思新版本對(duì)科學(xué)研究、AI基礎(chǔ)開發(fā)的全新適配能力，展現(xiàn)了昇騰AI產(chǎn)業(yè)對(duì)新銳產(chǎn)學(xué)動(dòng)向的洞察和滿足。

　　在科研工作中，AI開發(fā)經(jīng)常是一件成本巨大、容錯(cuò)率極低的工作。算力、數(shù)據(jù)、基礎(chǔ)模型和開發(fā)套件都會(huì)成為科研工作中的AI開發(fā)難題。面對(duì)這些問題，昇思1.5不僅極大提升了對(duì)大模型的適配能力，還強(qiáng)化升級(jí)了科學(xué)計(jì)算引擎，全面加強(qiáng)了對(duì)學(xué)術(shù)界、工業(yè)界的AI開發(fā)支持。

　　在大模型支持方面，昇思1.5版本實(shí)現(xiàn)了原生支持大模型，能夠在業(yè)界率先支持全自動(dòng)并行AI處理。在大模型訓(xùn)練中，可以同時(shí)使用數(shù)據(jù)并行、算子級(jí)模型并行、Pipeline 模型并行、優(yōu)化器模型并行、異構(gòu)并行、重計(jì)算、高效內(nèi)存復(fù)用多維度、全種類的分布式并行策略;并且原創(chuàng)集群拓?fù)涓兄亩嗑S度自動(dòng)混合并行，實(shí)現(xiàn)超大模型自動(dòng)切分，顯著提升集群加速能力;新的 DNN分布式并行編程范式，可以實(shí)現(xiàn)低代碼算法切換，大幅節(jié)省開發(fā)時(shí)間。

　　面對(duì)結(jié)構(gòu)復(fù)雜、訓(xùn)練開銷巨大、訓(xùn)練時(shí)間漫長的多模態(tài)大模型，新的昇思特性可以極大提升訓(xùn)練加速能力，同時(shí)減少系統(tǒng)性能優(yōu)化代價(jià)，降低代碼開發(fā)工作力，從而綜合性地減少調(diào)試與訓(xùn)練周期。

　　在這樣的框架能力升級(jí)中，會(huì)有更多創(chuàng)新性強(qiáng)、訓(xùn)練數(shù)據(jù)規(guī)模大的預(yù)訓(xùn)練大模型在昇思的支撐下發(fā)展起來。昇思自然也就名副其實(shí)成為了大模型的“根技術(shù)”。

　　目前，基于昇思訓(xùn)練的大模型除了已經(jīng)發(fā)布的全球首個(gè)中文預(yù)訓(xùn)練大模型鵬程.盤古、全球首個(gè)三模型預(yù)訓(xùn)練大模型紫東.太初，還有即將發(fā)布的智能遙感大模型、語音大模型等等，可以說昇思框架對(duì)大模型支持的能力是業(yè)界首屈一指的。

　　與此同時(shí)，昇思1.5還新增了對(duì)外開放機(jī)制等諸多新特性，尤其注重在科研創(chuàng)新和應(yīng)用領(lǐng)域的支持。通過多尺度混合計(jì)算和高階混合微分兩大關(guān)鍵創(chuàng)新，將原有的 AI 計(jì)算引擎升級(jí)為 AI 與科學(xué)計(jì)算的統(tǒng)一引擎，實(shí)現(xiàn)融合的統(tǒng)一加速。在此基礎(chǔ)上，未來昇思將面向 8 大科學(xué)計(jì)算場景推出 MindScience 系列套件。科學(xué)計(jì)算套件包含業(yè)界領(lǐng)先的數(shù)據(jù)集、基礎(chǔ)模型、預(yù)置高精度模型和前后處理工具，可以加速科學(xué)行業(yè)應(yīng)用開發(fā)。

　　昇思將持續(xù)加強(qiáng)對(duì)科研領(lǐng)域AI開發(fā)的支持，尤其是為大模型這種“國之重器”的訓(xùn)練底座。同時(shí)，昇騰社區(qū)和昇思MindSpore社區(qū)也會(huì)加強(qiáng)對(duì)大模型開源開放的支持。目前，昇思社區(qū)下載量已經(jīng)突破60萬，社區(qū)貢獻(xiàn)者超過3500人。昇思正在與產(chǎn)學(xué)研各界一同推進(jìn)開源開放，讓大模型真正成為科學(xué)之基、產(chǎn)業(yè)之本。

　　預(yù)訓(xùn)練大模型正在推動(dòng)一場AI新變革。而在關(guān)注這場變革之前，我們更應(yīng)該關(guān)注根技術(shù)、根平臺(tái)的打造與建設(shè)。

　　堅(jiān)實(shí)的產(chǎn)業(yè)基礎(chǔ)之上，才能產(chǎn)學(xué)各界萬花盛放。AI大模型之變，應(yīng)該有強(qiáng)壯的根。

　　文章來源：風(fēng)辭遠(yuǎn) 腦極體

（轉(zhuǎn)載）

標(biāo)簽：人工智能

我要反饋

01、引言中小企業(yè)作為數(shù)量最大、最具活力的企業(yè)群體，是我國實(shí)體經(jīng)濟(jì)的重要基礎(chǔ)。根據(jù)第四次全國經(jīng)濟(jì)普查的數(shù)據(jù)顯示，中小企業(yè)具有“五六七八九”的典型特征，貢獻(xiàn)了50%以上的稅收、6... [詳情]

2021年09月29日數(shù)字化轉(zhuǎn)型

工信部等八部門發(fā)文：將推動(dòng)10家物聯(lián)網(wǎng)企業(yè)成長為產(chǎn)值過百億的龍頭企業(yè)

近日，工業(yè)和信息化部、中央網(wǎng)絡(luò)安全和信息化委員會(huì)辦公室、科技部、生態(tài)環(huán)境部、住房和城鄉(xiāng)建設(shè)部、農(nóng)業(yè)農(nóng)村部、國家衛(wèi)生健康委員會(huì)、國家能源局等八部門近日聯(lián)合印發(fā)《物聯(lián)網(wǎng)新型基... [詳情]

2021年09月29日物聯(lián)網(wǎng)

華為智能巡檢解決方案，助力電力系統(tǒng)高效運(yùn)營

[中國，深圳，2021年9月28日]9月28日，在華為全聯(lián)接2021期間，以”智能巡檢，讓電力系統(tǒng)運(yùn)營更簡單”為主題的華為全球電力峰會(huì)順利召開。華為在峰會(huì)上分享了面向電力行業(yè)的多種場景的... [詳情]

2021年09月29日華為智能巡檢解決方案

資訊熱點(diǎn)

華為入選領(lǐng)導(dǎo)者象限!Gartner?數(shù)據(jù)中心網(wǎng)絡(luò)交換機(jī)魔力象限正式發(fā)布華為與國家電投集團(tuán)簽署深化戰(zhàn)略合作協(xié)議 2025電博會(huì)亮點(diǎn)搶先看：億萬克將攜最新AI服務(wù)器登場西門子收購 Dotmatics，將 AI 驅(qū)動(dòng)的工業(yè)軟件版圖擴(kuò)展至生命科學(xué)領(lǐng)域國產(chǎn)算力，自主可控，億萬克R322H7+ 服務(wù)器發(fā)布! 貴州電網(wǎng)有限責(zé)任公司與華為技術(shù)有限公司簽署深化戰(zhàn)略合作協(xié)議智能協(xié)同，全球共贏——從2025德國漢諾威工業(yè)博覽會(huì)節(jié)卡展臺(tái)看全球產(chǎn)業(yè)鏈共振中國智造對(duì)話歐洲工業(yè)！珞石攜七大創(chuàng)新方案亮相德國HANNOVER MESSE漢諾威工業(yè)博覽會(huì) 商湯科技成功舉辦“智匯商湯·清朗領(lǐng)航”開放日活動(dòng)

專題報(bào)道

2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果，鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

中國國際進(jìn)口博覽會(huì)

11月5日至10日，第七屆中國國際進(jìn)口博覽會(huì)在國家會(huì)展中心（上海）舉行。152個(gè)國家、地區(qū)和國際組織，近3500家參展企... [更多]

2024 工博會(huì) | 直播探館 · 全景解讀

第二十四屆中國工博會(huì)于9月24日至28日在國家會(huì)展中心(上海)舉行，展會(huì)以“工業(yè)聚能新質(zhì)領(lǐng)航”為全新主題。 [更多]

視頻

/resupload/guangzhi/AS00012420/1735897073649_1.jpg

申克助力華漁新材料碳纖維電驅(qū)轉(zhuǎn)子研發(fā)與量產(chǎn) 雄克TANDEM3-BWA自動(dòng)化夾爪更換及工件搬運(yùn) 施耐德電氣亮相2025漢諾威工業(yè)展，展現(xiàn)“創(chuàng)新”硬核實(shí)力山崎馬扎克宣傳視頻（3分鐘）陽光電源最嚴(yán)苛、最真實(shí)、最大膽！大規(guī)模燃燒實(shí)證全過程首次公開！尋訪“光伏家”：從精打細(xì)算到全家享“伏” 陶氏公司與Carbice的熱管理“創(chuàng)新之緣”