工業(yè)機器人

全球四大機器人訓練場揭秘:誰在引領人形機器人革命?

ainet.cn   2025年03月04日

近期,世界首個異構(gòu)人形機器人訓練場在上海啟用,首期已部署來自智元、傅利葉、開普勒等機器人公司的超百臺異構(gòu)機器人,引發(fā)世界范圍對于機器人訓練場這種新模式的廣泛討論。

由于當前人形機器人方案路線并未統(tǒng)一,不同廠家的機器人,其形態(tài)、功能、技術架構(gòu)、應用場景都存在差異,而且缺乏足夠的訓練數(shù)據(jù),目前業(yè)界常用的做法是,人形機器人想要落地場景,就必須和企業(yè)合作開發(fā),部署產(chǎn)品實際進行工序測試、驗證,積累數(shù)據(jù)并優(yōu)化,如果工廠換一家人形機器人企業(yè)合作,這種流程可能就需要重來。

因為機器人廠商的數(shù)據(jù)也不同,這就使得人形機器人的訓練數(shù)據(jù),往往來自不同的領域、模式和機器人硬件,很難實現(xiàn)統(tǒng)一并遷移使用。簡單任務如物體特征明顯的抓取或安裝特定形狀零件,大概需要2-3 萬條數(shù)據(jù),如果是工業(yè)上較復雜的應用,可能需要達到 10萬級的數(shù)據(jù)量。例如,人形機器人在咖啡店接咖啡并遞回桌面,簡單動作可能1萬條數(shù)據(jù),但如果要識別多種咖啡模型,可能需要5萬條數(shù)據(jù):彎腰拿咖啡可能需要幾萬條數(shù)據(jù),直拿轉(zhuǎn)身可能幾千條數(shù)據(jù)就夠:若只是簡單的抓取動作且結(jié)構(gòu)識別簡單,上千條數(shù)據(jù)即可。但問題在于各家廠商每次進入一個新工廠、新場景,都需要重復造輪子采集數(shù)據(jù),這有點像是此前工業(yè)機器人集成商所做的工作。

2017年就有學者根據(jù)沃爾夫斯堡大眾工廠采用不同品牌機器人的場景案例,提出異構(gòu)機器人訓練工廠的構(gòu)想。核心思想就是,由于機器人具有不同的形態(tài)或傳感器設備,異質(zhì)性數(shù)據(jù)導致不同品牌的機器人訓練模型不能直接重復使用,但是否可以建立一種嫁接在機器人控制系統(tǒng)上的架構(gòu),將來自許多來源的大量異構(gòu)數(shù)據(jù)組合成一個系統(tǒng),讓機器人只需經(jīng)過“工廠”預訓練,這種遷移學習方法就能教任何機器人執(zhí)行各種各樣的任務,讓機器人快速掌握技能并部署到產(chǎn)線。

機器人訓練工廠的理念有點類似汽車試驗場,把不同廠家的異構(gòu)機器人放在同一空間運行,一方面能夠測試各家人形機器人產(chǎn)品在動力、速度、能耗等多種性能,另一方面類似GPT-4等大型語言模型的訓練方法,嘗試基于異構(gòu)機器人實現(xiàn)數(shù)據(jù)的規(guī)?;占蜕a(chǎn),從而將來自不同公司產(chǎn)品、不同模式的數(shù)據(jù)對齊,形成生成式AI模型可以處理的共享“語言”,并建立一種基礎通用技能模型,減少異構(gòu)協(xié)同的幻覺,建立機器人深度學習場景技能的元標準,將機器人先置技能快速遷移復用,提升能力泛化性。

▍韓國NAVER機器人訓練場

機器人集訓地并不算是新鮮事物,實際難在調(diào)用大量資源。例如韓國的“谷歌”NAVER公司2022年就在京畿城南市的第二辦公樓嘗試打造機器人訓練場,這個被命名為“1784機器人親和建筑”的場地,旨在一個獨立空間里讓各類機器人運行,從而創(chuàng)造協(xié)同效應,并嘗試融合新技術。

由于從異構(gòu)數(shù)據(jù)中訓練用于不同任務的通用機器人策略是一項重大挑戰(zhàn),整個構(gòu)筑內(nèi)部采用第5代(5G)移動通信特化網(wǎng),以Naver Cloud環(huán)境為基礎,通過云計算終端控制NAVER LABS公司的多個機器人產(chǎn)品,例如配送服務機器人Rookie、清潔機器人、雙臂人形機器人Ambidex等,該建筑預計共使用了超過316項專利技術,有超過60個服務機器人,還有1個機器人技能訓練場。

這棟大樓中融合了多個韓國財團的智慧成果。例如由三星物產(chǎn)建造了這座大樓,三星電子為5G系統(tǒng)提供了主要設備并集成?,F(xiàn)代電梯的子公司Hyundai Movex開發(fā)了機器人專用電梯,LG Energy Solution為機器人提供電池和充電系統(tǒng),Naver建構(gòu)了xDM平臺,并將其位于世宗的第二個數(shù)據(jù)中心用作機器人和自動駕駛技術的試驗臺。NAVER還是陪同韓國國土交通大臣元熙龍出訪沙特阿拉伯的公司之一,韓國一直尋求參與中東國家大規(guī)模的NEOM智慧城市項目。

▍美國PI公司訓練場

Physical intelligence(Pi)的第一個原型通用機器人策略π0其實就是在迄今為止最大的機器人交互數(shù)據(jù)集上進行訓練的,但不用于在固定場所建立固定的數(shù)據(jù)訓練模式,Pi主要與蒙特利爾大學、華盛頓大學、韓國科學技術研究院等全球近20個研究院、企業(yè)達成合作。這種松散的聯(lián)盟下,雖然實驗環(huán)境遍布世界各地,但Pi對其開放一部分代碼庫,讓不同的研究院在不同的機器人系統(tǒng)上可以直接將π0衍生模型連接,部署并調(diào)試運行,然后進行不同的任務。

基于從互聯(lián)網(wǎng)規(guī)模的預訓練中繼承了語義知識和視覺理解,Pi以較小的30億參數(shù)VLM作為起點,而后在多個不同的機器人上收集大量多樣化靈巧任務數(shù)據(jù)集,最后Pi將大規(guī)模多任務和多機器人數(shù)據(jù)收集與新的網(wǎng)絡架構(gòu)相結(jié)合,嘗試將其整理成一個完整的訓練組合,并在大型多樣化數(shù)據(jù)集上繼續(xù)訓練π0。

部分情況下,Pi還會發(fā)布固定挑戰(zhàn)任務,讓合作伙伴基于不同的機器人主體,對模型進行微調(diào)以完成,而后將合作伙伴的數(shù)據(jù)整合到預先訓練的模型中,繼續(xù)訓練并提供更適用于其特定平臺的模型,從而形成一種良性的循環(huán)。

Pi的這種方式證明了,企業(yè)基于互聯(lián)網(wǎng)規(guī)模預訓練的語義理解,整合來自許多不同任務和機器人平臺的數(shù)據(jù)集,有望構(gòu)建一種通用模型,并在機器人上實現(xiàn)前所未有的靈活性和物理能力,使機器人“泛化”出燒飯疊衣、裝配修理、保潔照護等樣樣在行的復合能力。

▍特斯拉訓練場

作為一個跨國科技集團,按照CEO馬斯克的想法,特斯拉的整個制造工廠本質(zhì)上已經(jīng)成為其人形機器人Optimus的訓練場,目前其已經(jīng)在自有汽車和儲能工廠引入一些人形機器人來執(zhí)行任務并持續(xù)訓練。馬斯克預計,2025年Optimus將量產(chǎn)數(shù)千至1萬臺,初期Optimus會去做一些最容易應用的場景,比如為車身生產(chǎn)線裝料、金屬搬運等任務,最終實現(xiàn)改進循環(huán)。

此前在工廠中,Optimus的端到端神經(jīng)網(wǎng)絡經(jīng)過訓練,已經(jīng)在部分產(chǎn)線上崗,例如對特斯拉工廠的電池單元進行準確分裝,拾取從傳送帶上傳遞下來的電芯,并將它們精確地放入托盤中。在這個訓練過程中,Optimus在機器人的FSD上以端對端的方式實時運行,直接生成關節(jié)控制序列,而后依靠2D攝像頭、手部觸覺和力傳感器微調(diào),并實現(xiàn)持續(xù)訓練。

在特斯拉看來,人形機器人的第一個用例可能是在工業(yè)環(huán)境中,那里的全球正面臨人力資源枯竭、成本高昂且供應不足的問題。在這些環(huán)境中,人形機器人將得到磨煉和優(yōu)化,同時還能完成生產(chǎn)性工作,創(chuàng)造收入或削減成本。同樣,這是特斯拉比競爭對手擁有巨大優(yōu)勢的領域。特斯拉擁有多家非常大的工廠,可以在這些工廠部署 Optimus,而無需與外部合作伙伴達成復雜的協(xié)議。

特斯拉也有自己的人類數(shù)據(jù)收集農(nóng)場,其招募了數(shù)十名員工,利用動作捕捉技術幫助訓練其人形機器人Optimus。特斯拉為這項工作提供了三個不同的班次:早上8點到下午4點30分、下午4點到凌晨12點30分,以及凌晨12點到早上8點30分。工作者需要每天行走超過七個小時,同時攜帶重達30磅的貨物,并長時間佩戴VR頭盔。職責包括上傳收集的數(shù)據(jù)、根據(jù)觀察起草報告以及偶爾解決問題。特斯拉是全球首批如此大規(guī)模地并在廣泛的通用任務中實施動捕技術的企業(yè)。

因為特斯拉的Optimus機器人是全新定制和組裝集成的新產(chǎn)品,這種自研自產(chǎn)機器人并在自家工廠作業(yè)訓練優(yōu)化的方式也有諸多優(yōu)勢,例如能夠隨著公司不斷改進和完善技術,Optimus人形機器人的每個單元都能更快迭代,并驗證軟硬件可靠性以及快速落地。

國地中心人形機器人訓練場

中國的人形機器人訓練場由國家地方共建人形機器人創(chuàng)新中心搭建,占地面積約5000平方米,首次對人形機器人大數(shù)據(jù)、大智算、大實訓場、大模型進行一體化規(guī)劃,通過與海爾、海信、康佳、延鋒汽車等下游應用企業(yè)合作構(gòu)建了冰箱、電視、汽車裝配等訓練科目場景,并通過遙操作+動捕等4種不同數(shù)據(jù)采集手段,旨在彌合機器人協(xié)作任務中自然語言命令和物理基礎之間的差距,快速通過人形機器人收集大量高質(zhì)量數(shù)據(jù),構(gòu)建規(guī)模領先的異構(gòu)具身智能數(shù)據(jù)集,持續(xù)訓練和優(yōu)化算法,形成更有效的基礎通用模型。

國地中心人形機器人訓練場能實現(xiàn)單臺機器人每日采集軌跡數(shù)據(jù)500條以上,受訓機器人能夠完成涉及桌面整理、物品分揀、設備操作在內(nèi)的多類型任務,平均執(zhí)行成功率達到90%以上,今年有望沉淀下1000萬條數(shù)據(jù),從而形成業(yè)內(nèi)規(guī)模領先的異構(gòu)人形機器人數(shù)據(jù)集,成為支撐機器人基礎模型進化的高質(zhì)量語料,最終解決數(shù)據(jù)缺乏統(tǒng)一標準和規(guī)范、無法跨平臺跨行業(yè)遷移和復用等問題。

據(jù)悉,訓練場一期建設重點圍繞四大目標展開:一是構(gòu)建可重構(gòu)場景和異構(gòu)機器人,涵蓋智能制造、民生服務和特種應用三大領域的超過10個場景,可遷移的超100款異構(gòu)人形機器人集合;二是搭建異構(gòu)集群采訓推開源框架,推出國內(nèi)領先的真實與生成式動作開源數(shù)據(jù)集,訓練通用技能模型,形成通用技能庫和知識遷移部署能力;三是具身智能操作及任務調(diào)度,發(fā)布完整的“智能操作系統(tǒng)-技能庫-任務編排”應用系統(tǒng),完成“人形數(shù)據(jù)管控平臺-5G通信基礎設施平臺”建設,在數(shù)據(jù)網(wǎng)聯(lián)方面完成可靠穩(wěn)定的“傳輸-顯示-調(diào)度”工作;四是開源共享和貢獻機制,基于訓練場打造OpenLoong四級開源會員模式,推動訓練數(shù)據(jù)集的開源共享,并與全球?qū)嶒炇液推髽I(yè)合作,共同促進人形機器人技術創(chuàng)新發(fā)展。

人形機器人是真正的大國工程,其產(chǎn)業(yè)鏈更長,人形機器人訓練基地的構(gòu)建無疑難度頗高,需要人才和資源的高度集中。國地中心人形機器人訓練場代表了一種人形機器人數(shù)據(jù)采集的規(guī)模效應和獨特發(fā)展模式,有望加快中國人形機器人行業(yè)走向大規(guī)模量產(chǎn)與應用之路。預計今年年中,國地中心將發(fā)布人形機器人通用數(shù)據(jù)集、標準體系和重點應用等成果,并面向高校、實驗室等推動部分訓練數(shù)據(jù)集的開源共享。

(來源: 機器人大講堂)

標簽:傅利葉 開普勒 工業(yè)機器人 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
ABB協(xié)作機器人,自動化從未如此簡單
優(yōu)傲機器人下載中心
2024全景工博會
專題報道
2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進“雙碳”實踐的最新成果,鼓勵更多企業(yè)、科研機構(gòu)、投資機構(gòu)等廣泛... [更多]

中國國際進口博覽會
中國國際進口博覽會

11月5日至10日,第七屆中國國際進口博覽會在國家會展中心(上海)舉行。152個國家、地區(qū)和國際組織,近3500家參展企... [更多]

2024 工博會 | 直播探館 · 全景解讀
2024 工博會 | 直播探館 · 全景解讀

第二十四屆中國工博會于9月24日至28日在國家會展中心(上海)舉行,展會以“工業(yè)聚能 新質(zhì)領航”為全新主題。 [更多]