商湯大裝置“解題”人形機(jī)器人，一段式端到端開啟具身智能的奇點(diǎn)時(shí)刻

ainet.cn 2024年09月23日

大模型與具身智能的融合，正在將人形機(jī)器人推向AI發(fā)展的新浪潮。

作為國內(nèi)AI基礎(chǔ)設(shè)施服務(wù)的領(lǐng)導(dǎo)者，商湯大裝置將為推動(dòng)人形機(jī)器人的技術(shù)創(chuàng)新與應(yīng)用，提供領(lǐng)先的算力、模型和數(shù)據(jù)處理能力支撐。

在本周舉辦的第二屆中國具身智能與人形機(jī)器人創(chuàng)新發(fā)展大會(huì)上，商湯科技大裝置事業(yè)群生態(tài)總監(jiān)劉遠(yuǎn)輝分享了商湯在AI和自動(dòng)駕駛領(lǐng)域的創(chuàng)新實(shí)踐對(duì)于具身智能、人形機(jī)器人的借鑒價(jià)值。他指出，AI基礎(chǔ)設(shè)施將是驅(qū)動(dòng)人形機(jī)器人端到端發(fā)展的新引擎。

一段式端到端AI系統(tǒng)

開啟人形機(jī)器人通往AGI之路

過去十年間，AI技術(shù)已在多個(gè)垂直領(lǐng)域突破了工業(yè)紅線，成功與各行業(yè)的實(shí)際應(yīng)用場(chǎng)景融合，但其發(fā)展仍面臨諸多挑戰(zhàn)。

比如，各行各業(yè)中的長(zhǎng)尾場(chǎng)景眾多，但需求規(guī)模小，而大規(guī)模的研發(fā)投入又會(huì)導(dǎo)致投資回報(bào)率降低。此外，行業(yè)中的AI模型種類眾多，但單一模型能夠解決的問題仍十分有限。

機(jī)器人的發(fā)展也呈現(xiàn)近似趨勢(shì)。大多數(shù)機(jī)器人產(chǎn)品僅局限于執(zhí)行單一、特定的任務(wù)，缺乏足夠的通用性和泛化能力，成為廣泛普及與應(yīng)用的一大障礙。

商湯在端到端自動(dòng)駕駛大模型方面的創(chuàng)新研發(fā)實(shí)踐，為具身智能、人形機(jī)器人的突破提出了可以借鑒的新路徑。

傳統(tǒng)的自動(dòng)駕駛系統(tǒng)由多個(gè)感知小模型和規(guī)則定義的規(guī)控系統(tǒng)組成。在2022年底，商湯及其聯(lián)合實(shí)驗(yàn)室提出了行業(yè)首個(gè)感知決策一體化自動(dòng)駕駛通用模型UniAD，將感知、決策、規(guī)劃等模塊都整合到一個(gè)全棧Transformer端到端模型中。

UniAD作為“一段式”端到端的代表，相較于業(yè)內(nèi)其他將感知和規(guī)控分為兩個(gè)模型的“兩段式”端到端方案，能夠?qū)崿F(xiàn)感知信息的無損傳遞，擁有更好的復(fù)雜場(chǎng)景理解、泛化能力和解決corner case的能力。

“一段式”端到端系統(tǒng)完全由數(shù)據(jù)驅(qū)動(dòng)，其能力將隨著訓(xùn)練數(shù)據(jù)量的增加而實(shí)現(xiàn)躍遷，讓自動(dòng)駕駛系統(tǒng)和人形機(jī)器人擁有更通用、更泛化的復(fù)雜場(chǎng)景理解能力，有望創(chuàng)造自動(dòng)駕駛和具身智能發(fā)展的“ChatGPT時(shí)刻”，開啟自動(dòng)駕駛和人形機(jī)器人通往AGI之路。

而“一段式”端到端系統(tǒng)的訓(xùn)練，需要更高算力、全新數(shù)據(jù)生產(chǎn)管線、世界模型等作為平臺(tái)支撐，帶來了對(duì)人工智能基礎(chǔ)設(shè)施需求的激增。

商湯大裝置+日日新大模型體系

為具身智能打造新一代AI基礎(chǔ)設(shè)施

商湯對(duì)人工智能基礎(chǔ)設(shè)施的定義，源于AI發(fā)展的三要素：算力、算法和數(shù)據(jù)。

充足的算力資源儲(chǔ)備，強(qiáng)大的基模型、AI平臺(tái)軟件和數(shù)據(jù)能力優(yōu)勢(shì)，以及面向場(chǎng)景生態(tài)的AI專家服務(wù)體系，是AI基礎(chǔ)設(shè)施成功的關(guān)鍵要素。

在算力層面，商湯大裝置運(yùn)營總算力規(guī)模已突破20,000 PetaFLOPS，同時(shí)也在積極“云、邊、端”協(xié)同的算力布局，以更高的算力利用率，為人形機(jī)器人的應(yīng)用提供更高推理性價(jià)比。

根據(jù)IDC發(fā)布報(bào)告《中國智算服務(wù)市場(chǎng)(2023下半年)跟蹤》，商湯科技在中國云計(jì)算基礎(chǔ)設(shè)施廠商中脫穎而出，與火山引擎、阿里巴巴共同躋身2023年下半年中國GenAI IaaS服務(wù)廠商TOP 3，以顯著的市場(chǎng)份額優(yōu)勢(shì)位居GenAI IaaS領(lǐng)域的第一梯隊(duì)。

在算法層面，商湯的“日日新”大模型體系在尺度定律下快速迭代。最新的“日日新5.5”在語言能力、多模態(tài)能力已全面對(duì)標(biāo)GPT-4 Turbo和GPT-4o，可賦能人形機(jī)器人的“眼力”和“腦力”。

作為國內(nèi)首個(gè)具備流式原生多模態(tài)交互能力的大模型，“日日新5o”實(shí)現(xiàn)了語音、視頻和語言模型的原生融合，響應(yīng)延遲達(dá)到560ms，能夠滿足人形機(jī)器人實(shí)時(shí)的流式多模態(tài)AI交互能力需求。

同時(shí)，商湯端到端AGI大模型，讓機(jī)器人能夠像人一樣理解復(fù)雜的現(xiàn)實(shí)世界，提升各種環(huán)境下的交互和決策能力。比如，在自動(dòng)駕駛場(chǎng)景中，該模型可以讓車輛平穩(wěn)通過路障限寬路段，勝任傳統(tǒng)規(guī)則系統(tǒng)無法應(yīng)對(duì)的場(chǎng)景。

具身智能發(fā)展的關(guān)鍵，正是多模態(tài)大模型能力與人形機(jī)器人的有效結(jié)合。

在數(shù)據(jù)層面，通過虛實(shí)結(jié)合的方式進(jìn)行數(shù)據(jù)生成，可以解決人形機(jī)器人開發(fā)廣泛存在的數(shù)據(jù)匱乏乃至標(biāo)準(zhǔn)不統(tǒng)一等難題。

對(duì)此，商湯正與行業(yè)伙伴聯(lián)合開發(fā)仿真模擬方案，通過商湯大模型和新型AI基礎(chǔ)設(shè)施加速仿真場(chǎng)景生成，提升開發(fā)效率。此外，商湯大裝置緊密聯(lián)動(dòng)機(jī)器人產(chǎn)業(yè)上下游軟件及硬件合作伙伴，如人形機(jī)器人國創(chuàng)中心、松應(yīng)科技、北京銀河通用機(jī)器人等，發(fā)揮商湯在算力及算法層的優(yōu)勢(shì)，共同探索具身智能行業(yè)應(yīng)用與實(shí)踐，助推人形機(jī)器人產(chǎn)業(yè)新一輪升級(jí)。

在人形機(jī)器人的浪潮下，商湯將堅(jiān)定基礎(chǔ)設(shè)施的行業(yè)定位，基于商湯大裝置和日日新大模型體系，提供算力、數(shù)據(jù)、模型能力的全棧支持，加速人形機(jī)器人的一體化定制化研發(fā)和落地，構(gòu)建機(jī)器人智能體的全新行業(yè)生態(tài)。

（來源：商湯科技）

標(biāo)簽：商湯科技

我要反饋

8月21日，IDC發(fā)布報(bào)告《中國大模型平臺(tái)市場(chǎng)份額，2023：大模型元年——初局》，根據(jù)2023年數(shù)據(jù)顯示，商湯科技以16%市場(chǎng)份額占據(jù)前二位置。在生成式AI爆發(fā)的關(guān)鍵節(jié)點(diǎn)，商湯率... [詳情]

2024年09月23日商湯科技

商湯與海通證券聯(lián)手打造金融行業(yè)生成式AI技術(shù)應(yīng)用創(chuàng)新標(biāo)桿

8月28日，在弗若斯特沙利文(Frost&Sullivan，簡(jiǎn)稱“沙利文”)主辦的第十八屆中國增長(zhǎng)、科創(chuàng)與領(lǐng)導(dǎo)力峰會(huì)暨第三屆新投資大會(huì)上，沙利文聯(lián)合頭豹研究院發(fā)布《2024年中國生... [詳情]

2024年09月23日商湯科技

商湯大裝置加碼“算電一體化協(xié)同”，推理性能提升4倍

隨著大模型對(duì)算力需求的劇增，“算電一體化協(xié)同”勢(shì)在必行!去年12月，國家發(fā)改委等部門聯(lián)合印發(fā)《深入實(shí)施“東數(shù)西算”工程加快構(gòu)建全國一體化算力網(wǎng)的實(shí)施意見》... [詳情]

2024年09月23日商湯科技

資訊熱點(diǎn)

寧德時(shí)代攜手馬士基，推動(dòng)港口行業(yè)加速脫碳四度蟬聯(lián)！華為分布式存儲(chǔ)榮膺2025年Gartner?“客戶之選” 西門子斬獲 2024 IDC PLM 和 CAD 領(lǐng)域 SaaS 客戶滿意度大獎(jiǎng) 仙工智能創(chuàng)始人趙越：從技術(shù)想象到產(chǎn)業(yè)現(xiàn)實(shí)，具身智能的商業(yè)落點(diǎn) SNEC | “眼腳手”多維協(xié)同，?？禉C(jī)器人邀您共赴光伏盛會(huì) 陶氏公司攜創(chuàng)新有機(jī)硅解決方案亮相EAC 2025，賦能汽車智能化未來 SRT手部智能康復(fù)系統(tǒng)入選《新質(zhì)生產(chǎn)力案例集》第八屆綠色工廠廠務(wù)大會(huì)圓滿落幕，臺(tái)達(dá)引領(lǐng)制造業(yè)綠色轉(zhuǎn)型新征程寧德時(shí)代攜手東風(fēng)日產(chǎn)，推動(dòng)全域超充等前沿技術(shù)應(yīng)用

專題報(bào)道

聚力同行 · 新智“碳”索

“新華社-智能·零碳”項(xiàng)目策劃以“聚力同行·新智‘碳’索”為主題的新能源專題，主要圍繞光伏、儲(chǔ)能、鋰電、氫能、風(fēng)能五大新... [更多]

2025中國國際機(jī)床展覽會(huì)

4月21至26日，以“融合創(chuàng)新，數(shù)智未來”為主題的第十九屆中國國際機(jī)床展覽會(huì)在首都國際會(huì)展中心盛大舉辦。憑借場(chǎng)館的卓越服... [更多]

2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果，鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]

視頻

/resupload/guangzhi/AS00012420/1735897073649_1.jpg

欣旺達(dá)跨界玩說唱：當(dāng)創(chuàng)新技術(shù)遇上硬核Rap 武漢市中心醫(yī)院：以數(shù)字“小切片”，守護(hù)民生“大健康” 我與SABIC：材賦新能駛向理想【與昱能，共向往】十五周年零碳案例系列預(yù)告片伊頓Bussmann：百年品牌以創(chuàng)新驅(qū)動(dòng)發(fā)展 WHAT’S NEW 蔡司軟件新功能發(fā)布會(huì)南京站活動(dòng)回顧億緯鋰能攜手深向重卡以創(chuàng)新科技助力新能源運(yùn)力升級(jí)