工業(yè)機(jī)器人

全球四大機(jī)器人訓(xùn)練場(chǎng)揭秘:誰在引領(lǐng)人形機(jī)器人革命?

ainet.cn   2025年03月04日

近期,世界首個(gè)異構(gòu)人形機(jī)器人訓(xùn)練場(chǎng)在上海啟用,首期已部署來自智元、傅利葉、開普勒等機(jī)器人公司的超百臺(tái)異構(gòu)機(jī)器人,引發(fā)世界范圍對(duì)于機(jī)器人訓(xùn)練場(chǎng)這種新模式的廣泛討論。

由于當(dāng)前人形機(jī)器人方案路線并未統(tǒng)一,不同廠家的機(jī)器人,其形態(tài)、功能、技術(shù)架構(gòu)、應(yīng)用場(chǎng)景都存在差異,而且缺乏足夠的訓(xùn)練數(shù)據(jù),目前業(yè)界常用的做法是,人形機(jī)器人想要落地場(chǎng)景,就必須和企業(yè)合作開發(fā),部署產(chǎn)品實(shí)際進(jìn)行工序測(cè)試、驗(yàn)證,積累數(shù)據(jù)并優(yōu)化,如果工廠換一家人形機(jī)器人企業(yè)合作,這種流程可能就需要重來。

因?yàn)闄C(jī)器人廠商的數(shù)據(jù)也不同,這就使得人形機(jī)器人的訓(xùn)練數(shù)據(jù),往往來自不同的領(lǐng)域、模式和機(jī)器人硬件,很難實(shí)現(xiàn)統(tǒng)一并遷移使用。簡(jiǎn)單任務(wù)如物體特征明顯的抓取或安裝特定形狀零件,大概需要2-3 萬條數(shù)據(jù),如果是工業(yè)上較復(fù)雜的應(yīng)用,可能需要達(dá)到 10萬級(jí)的數(shù)據(jù)量。例如,人形機(jī)器人在咖啡店接咖啡并遞回桌面,簡(jiǎn)單動(dòng)作可能1萬條數(shù)據(jù),但如果要識(shí)別多種咖啡模型,可能需要5萬條數(shù)據(jù):彎腰拿咖啡可能需要幾萬條數(shù)據(jù),直拿轉(zhuǎn)身可能幾千條數(shù)據(jù)就夠:若只是簡(jiǎn)單的抓取動(dòng)作且結(jié)構(gòu)識(shí)別簡(jiǎn)單,上千條數(shù)據(jù)即可。但問題在于各家廠商每次進(jìn)入一個(gè)新工廠、新場(chǎng)景,都需要重復(fù)造輪子采集數(shù)據(jù),這有點(diǎn)像是此前工業(yè)機(jī)器人集成商所做的工作。

2017年就有學(xué)者根據(jù)沃爾夫斯堡大眾工廠采用不同品牌機(jī)器人的場(chǎng)景案例,提出異構(gòu)機(jī)器人訓(xùn)練工廠的構(gòu)想。核心思想就是,由于機(jī)器人具有不同的形態(tài)或傳感器設(shè)備,異質(zhì)性數(shù)據(jù)導(dǎo)致不同品牌的機(jī)器人訓(xùn)練模型不能直接重復(fù)使用,但是否可以建立一種嫁接在機(jī)器人控制系統(tǒng)上的架構(gòu),將來自許多來源的大量異構(gòu)數(shù)據(jù)組合成一個(gè)系統(tǒng),讓機(jī)器人只需經(jīng)過“工廠”預(yù)訓(xùn)練,這種遷移學(xué)習(xí)方法就能教任何機(jī)器人執(zhí)行各種各樣的任務(wù),讓機(jī)器人快速掌握技能并部署到產(chǎn)線。

機(jī)器人訓(xùn)練工廠的理念有點(diǎn)類似汽車試驗(yàn)場(chǎng),把不同廠家的異構(gòu)機(jī)器人放在同一空間運(yùn)行,一方面能夠測(cè)試各家人形機(jī)器人產(chǎn)品在動(dòng)力、速度、能耗等多種性能,另一方面類似GPT-4等大型語(yǔ)言模型的訓(xùn)練方法,嘗試基于異構(gòu)機(jī)器人實(shí)現(xiàn)數(shù)據(jù)的規(guī)?;占蜕a(chǎn),從而將來自不同公司產(chǎn)品、不同模式的數(shù)據(jù)對(duì)齊,形成生成式AI模型可以處理的共享“語(yǔ)言”,并建立一種基礎(chǔ)通用技能模型,減少異構(gòu)協(xié)同的幻覺,建立機(jī)器人深度學(xué)習(xí)場(chǎng)景技能的元標(biāo)準(zhǔn),將機(jī)器人先置技能快速遷移復(fù)用,提升能力泛化性。

▍韓國(guó)NAVER機(jī)器人訓(xùn)練場(chǎng)

機(jī)器人集訓(xùn)地并不算是新鮮事物,實(shí)際難在調(diào)用大量資源。例如韓國(guó)的“谷歌”NAVER公司2022年就在京畿城南市的第二辦公樓嘗試打造機(jī)器人訓(xùn)練場(chǎng),這個(gè)被命名為“1784機(jī)器人親和建筑”的場(chǎng)地,旨在一個(gè)獨(dú)立空間里讓各類機(jī)器人運(yùn)行,從而創(chuàng)造協(xié)同效應(yīng),并嘗試融合新技術(shù)。

由于從異構(gòu)數(shù)據(jù)中訓(xùn)練用于不同任務(wù)的通用機(jī)器人策略是一項(xiàng)重大挑戰(zhàn),整個(gè)構(gòu)筑內(nèi)部采用第5代(5G)移動(dòng)通信特化網(wǎng),以Naver Cloud環(huán)境為基礎(chǔ),通過云計(jì)算終端控制NAVER LABS公司的多個(gè)機(jī)器人產(chǎn)品,例如配送服務(wù)機(jī)器人Rookie、清潔機(jī)器人、雙臂人形機(jī)器人Ambidex等,該建筑預(yù)計(jì)共使用了超過316項(xiàng)專利技術(shù),有超過60個(gè)服務(wù)機(jī)器人,還有1個(gè)機(jī)器人技能訓(xùn)練場(chǎng)。

這棟大樓中融合了多個(gè)韓國(guó)財(cái)團(tuán)的智慧成果。例如由三星物產(chǎn)建造了這座大樓,三星電子為5G系統(tǒng)提供了主要設(shè)備并集成?,F(xiàn)代電梯的子公司Hyundai Movex開發(fā)了機(jī)器人專用電梯,LG Energy Solution為機(jī)器人提供電池和充電系統(tǒng),Naver建構(gòu)了xDM平臺(tái),并將其位于世宗的第二個(gè)數(shù)據(jù)中心用作機(jī)器人和自動(dòng)駕駛技術(shù)的試驗(yàn)臺(tái)。NAVER還是陪同韓國(guó)國(guó)土交通大臣元熙龍出訪沙特阿拉伯的公司之一,韓國(guó)一直尋求參與中東國(guó)家大規(guī)模的NEOM智慧城市項(xiàng)目。

▍美國(guó)PI公司訓(xùn)練場(chǎng)

Physical intelligence(Pi)的第一個(gè)原型通用機(jī)器人策略π0其實(shí)就是在迄今為止最大的機(jī)器人交互數(shù)據(jù)集上進(jìn)行訓(xùn)練的,但不用于在固定場(chǎng)所建立固定的數(shù)據(jù)訓(xùn)練模式,Pi主要與蒙特利爾大學(xué)、華盛頓大學(xué)、韓國(guó)科學(xué)技術(shù)研究院等全球近20個(gè)研究院、企業(yè)達(dá)成合作。這種松散的聯(lián)盟下,雖然實(shí)驗(yàn)環(huán)境遍布世界各地,但Pi對(duì)其開放一部分代碼庫(kù),讓不同的研究院在不同的機(jī)器人系統(tǒng)上可以直接將π0衍生模型連接,部署并調(diào)試運(yùn)行,然后進(jìn)行不同的任務(wù)。

基于從互聯(lián)網(wǎng)規(guī)模的預(yù)訓(xùn)練中繼承了語(yǔ)義知識(shí)和視覺理解,Pi以較小的30億參數(shù)VLM作為起點(diǎn),而后在多個(gè)不同的機(jī)器人上收集大量多樣化靈巧任務(wù)數(shù)據(jù)集,最后Pi將大規(guī)模多任務(wù)和多機(jī)器人數(shù)據(jù)收集與新的網(wǎng)絡(luò)架構(gòu)相結(jié)合,嘗試將其整理成一個(gè)完整的訓(xùn)練組合,并在大型多樣化數(shù)據(jù)集上繼續(xù)訓(xùn)練π0。

部分情況下,Pi還會(huì)發(fā)布固定挑戰(zhàn)任務(wù),讓合作伙伴基于不同的機(jī)器人主體,對(duì)模型進(jìn)行微調(diào)以完成,而后將合作伙伴的數(shù)據(jù)整合到預(yù)先訓(xùn)練的模型中,繼續(xù)訓(xùn)練并提供更適用于其特定平臺(tái)的模型,從而形成一種良性的循環(huán)。

Pi的這種方式證明了,企業(yè)基于互聯(lián)網(wǎng)規(guī)模預(yù)訓(xùn)練的語(yǔ)義理解,整合來自許多不同任務(wù)和機(jī)器人平臺(tái)的數(shù)據(jù)集,有望構(gòu)建一種通用模型,并在機(jī)器人上實(shí)現(xiàn)前所未有的靈活性和物理能力,使機(jī)器人“泛化”出燒飯疊衣、裝配修理、保潔照護(hù)等樣樣在行的復(fù)合能力。

▍特斯拉訓(xùn)練場(chǎng)

作為一個(gè)跨國(guó)科技集團(tuán),按照CEO馬斯克的想法,特斯拉的整個(gè)制造工廠本質(zhì)上已經(jīng)成為其人形機(jī)器人Optimus的訓(xùn)練場(chǎng),目前其已經(jīng)在自有汽車和儲(chǔ)能工廠引入一些人形機(jī)器人來執(zhí)行任務(wù)并持續(xù)訓(xùn)練。馬斯克預(yù)計(jì),2025年Optimus將量產(chǎn)數(shù)千至1萬臺(tái),初期Optimus會(huì)去做一些最容易應(yīng)用的場(chǎng)景,比如為車身生產(chǎn)線裝料、金屬搬運(yùn)等任務(wù),最終實(shí)現(xiàn)改進(jìn)循環(huán)。

此前在工廠中,Optimus的端到端神經(jīng)網(wǎng)絡(luò)經(jīng)過訓(xùn)練,已經(jīng)在部分產(chǎn)線上崗,例如對(duì)特斯拉工廠的電池單元進(jìn)行準(zhǔn)確分裝,拾取從傳送帶上傳遞下來的電芯,并將它們精確地放入托盤中。在這個(gè)訓(xùn)練過程中,Optimus在機(jī)器人的FSD上以端對(duì)端的方式實(shí)時(shí)運(yùn)行,直接生成關(guān)節(jié)控制序列,而后依靠2D攝像頭、手部觸覺和力傳感器微調(diào),并實(shí)現(xiàn)持續(xù)訓(xùn)練。

在特斯拉看來,人形機(jī)器人的第一個(gè)用例可能是在工業(yè)環(huán)境中,那里的全球正面臨人力資源枯竭、成本高昂且供應(yīng)不足的問題。在這些環(huán)境中,人形機(jī)器人將得到磨煉和優(yōu)化,同時(shí)還能完成生產(chǎn)性工作,創(chuàng)造收入或削減成本。同樣,這是特斯拉比競(jìng)爭(zhēng)對(duì)手擁有巨大優(yōu)勢(shì)的領(lǐng)域。特斯拉擁有多家非常大的工廠,可以在這些工廠部署 Optimus,而無需與外部合作伙伴達(dá)成復(fù)雜的協(xié)議。

特斯拉也有自己的人類數(shù)據(jù)收集農(nóng)場(chǎng),其招募了數(shù)十名員工,利用動(dòng)作捕捉技術(shù)幫助訓(xùn)練其人形機(jī)器人Optimus。特斯拉為這項(xiàng)工作提供了三個(gè)不同的班次:早上8點(diǎn)到下午4點(diǎn)30分、下午4點(diǎn)到凌晨12點(diǎn)30分,以及凌晨12點(diǎn)到早上8點(diǎn)30分。工作者需要每天行走超過七個(gè)小時(shí),同時(shí)攜帶重達(dá)30磅的貨物,并長(zhǎng)時(shí)間佩戴VR頭盔。職責(zé)包括上傳收集的數(shù)據(jù)、根據(jù)觀察起草報(bào)告以及偶爾解決問題。特斯拉是全球首批如此大規(guī)模地并在廣泛的通用任務(wù)中實(shí)施動(dòng)捕技術(shù)的企業(yè)。

因?yàn)樘厮估腛ptimus機(jī)器人是全新定制和組裝集成的新產(chǎn)品,這種自研自產(chǎn)機(jī)器人并在自家工廠作業(yè)訓(xùn)練優(yōu)化的方式也有諸多優(yōu)勢(shì),例如能夠隨著公司不斷改進(jìn)和完善技術(shù),Optimus人形機(jī)器人的每個(gè)單元都能更快迭代,并驗(yàn)證軟硬件可靠性以及快速落地。

國(guó)地中心人形機(jī)器人訓(xùn)練場(chǎng)

中國(guó)的人形機(jī)器人訓(xùn)練場(chǎng)由國(guó)家地方共建人形機(jī)器人創(chuàng)新中心搭建,占地面積約5000平方米,首次對(duì)人形機(jī)器人大數(shù)據(jù)、大智算、大實(shí)訓(xùn)場(chǎng)、大模型進(jìn)行一體化規(guī)劃,通過與海爾、海信、康佳、延鋒汽車等下游應(yīng)用企業(yè)合作構(gòu)建了冰箱、電視、汽車裝配等訓(xùn)練科目場(chǎng)景,并通過遙操作+動(dòng)捕等4種不同數(shù)據(jù)采集手段,旨在彌合機(jī)器人協(xié)作任務(wù)中自然語(yǔ)言命令和物理基礎(chǔ)之間的差距,快速通過人形機(jī)器人收集大量高質(zhì)量數(shù)據(jù),構(gòu)建規(guī)模領(lǐng)先的異構(gòu)具身智能數(shù)據(jù)集,持續(xù)訓(xùn)練和優(yōu)化算法,形成更有效的基礎(chǔ)通用模型。

國(guó)地中心人形機(jī)器人訓(xùn)練場(chǎng)能實(shí)現(xiàn)單臺(tái)機(jī)器人每日采集軌跡數(shù)據(jù)500條以上,受訓(xùn)機(jī)器人能夠完成涉及桌面整理、物品分揀、設(shè)備操作在內(nèi)的多類型任務(wù),平均執(zhí)行成功率達(dá)到90%以上,今年有望沉淀下1000萬條數(shù)據(jù),從而形成業(yè)內(nèi)規(guī)模領(lǐng)先的異構(gòu)人形機(jī)器人數(shù)據(jù)集,成為支撐機(jī)器人基礎(chǔ)模型進(jìn)化的高質(zhì)量語(yǔ)料,最終解決數(shù)據(jù)缺乏統(tǒng)一標(biāo)準(zhǔn)和規(guī)范、無法跨平臺(tái)跨行業(yè)遷移和復(fù)用等問題。

據(jù)悉,訓(xùn)練場(chǎng)一期建設(shè)重點(diǎn)圍繞四大目標(biāo)展開:一是構(gòu)建可重構(gòu)場(chǎng)景和異構(gòu)機(jī)器人,涵蓋智能制造、民生服務(wù)和特種應(yīng)用三大領(lǐng)域的超過10個(gè)場(chǎng)景,可遷移的超100款異構(gòu)人形機(jī)器人集合;二是搭建異構(gòu)集群采訓(xùn)推開源框架,推出國(guó)內(nèi)領(lǐng)先的真實(shí)與生成式動(dòng)作開源數(shù)據(jù)集,訓(xùn)練通用技能模型,形成通用技能庫(kù)和知識(shí)遷移部署能力;三是具身智能操作及任務(wù)調(diào)度,發(fā)布完整的“智能操作系統(tǒng)-技能庫(kù)-任務(wù)編排”應(yīng)用系統(tǒng),完成“人形數(shù)據(jù)管控平臺(tái)-5G通信基礎(chǔ)設(shè)施平臺(tái)”建設(shè),在數(shù)據(jù)網(wǎng)聯(lián)方面完成可靠穩(wěn)定的“傳輸-顯示-調(diào)度”工作;四是開源共享和貢獻(xiàn)機(jī)制,基于訓(xùn)練場(chǎng)打造OpenLoong四級(jí)開源會(huì)員模式,推動(dòng)訓(xùn)練數(shù)據(jù)集的開源共享,并與全球?qū)嶒?yàn)室和企業(yè)合作,共同促進(jìn)人形機(jī)器人技術(shù)創(chuàng)新發(fā)展。

人形機(jī)器人是真正的大國(guó)工程,其產(chǎn)業(yè)鏈更長(zhǎng),人形機(jī)器人訓(xùn)練基地的構(gòu)建無疑難度頗高,需要人才和資源的高度集中。國(guó)地中心人形機(jī)器人訓(xùn)練場(chǎng)代表了一種人形機(jī)器人數(shù)據(jù)采集的規(guī)模效應(yīng)和獨(dú)特發(fā)展模式,有望加快中國(guó)人形機(jī)器人行業(yè)走向大規(guī)模量產(chǎn)與應(yīng)用之路。預(yù)計(jì)今年年中,國(guó)地中心將發(fā)布人形機(jī)器人通用數(shù)據(jù)集、標(biāo)準(zhǔn)體系和重點(diǎn)應(yīng)用等成果,并面向高校、實(shí)驗(yàn)室等推動(dòng)部分訓(xùn)練數(shù)據(jù)集的開源共享。

(來源: 機(jī)器人大講堂)

標(biāo)簽:傅利葉 開普勒 工業(yè)機(jī)器人 我要反饋 
優(yōu)傲機(jī)器人下載中心
億萬克
專題報(bào)道
聚力同行 · 新智“碳”索
聚力同行 · 新智“碳”索

“新華社-智能·零碳”項(xiàng)目策劃以“聚力同行·新智‘碳’索”為主題的新能源專題,主要圍繞光伏、儲(chǔ)能、鋰電、氫能、風(fēng)能五大新... [更多]

2025中國(guó)國(guó)際機(jī)床展覽會(huì)
2025中國(guó)國(guó)際機(jī)床展覽會(huì)

4月21至26日,以“融合創(chuàng)新,數(shù)智未來”為主題的第十九屆中國(guó)國(guó)際機(jī)床展覽會(huì)在首都國(guó)際會(huì)展中心盛大舉辦。憑借場(chǎng)館的卓越服... [更多]

2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國(guó)內(nèi)外企業(yè)推進(jìn)“雙碳”實(shí)踐的最新成果,鼓勵(lì)更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]