2026-04-17 11:56:24
據(jù)京東方面稱,未來將構(gòu)建全球規(guī)模最大的具身智能數(shù)據(jù)采集中心,在兩年內(nèi)積累1000萬小時(shí)人類真實(shí)場(chǎng)景視頻數(shù)據(jù)。
每經(jīng)記者|王郁彪 每經(jīng)編輯|楊軍
機(jī)器人真正想要走向產(chǎn)業(yè)化,用于決策核心的“大腦”能力的突破才是關(guān)鍵,這已是行業(yè)共識(shí)。然而“大腦”的訓(xùn)練需要燒掉海量數(shù)據(jù)燃料。具身智能數(shù)據(jù)基建戰(zhàn),京東先吹響號(hào)角。
4月16日,京東具身智能數(shù)據(jù)中心的神秘面紗終于揭開?!睹咳战?jīng)濟(jì)新聞》記者注意到,京東率先公布2000小時(shí)人類實(shí)操視頻具身智能數(shù)據(jù)集。同時(shí)發(fā)布自研超高清采集終端JoyEgoCam、具身大模型JoyAI-RA以及具身智能數(shù)據(jù)交易平臺(tái)。
同日,由智元機(jī)器人孵化的具身智能數(shù)據(jù)公司覓蜂科技正式亮相。覓蜂科技官網(wǎng)的“數(shù)據(jù)市場(chǎng)”板塊已上架467個(gè)具身智能訓(xùn)練數(shù)據(jù)。其預(yù)計(jì)今年數(shù)據(jù)采集規(guī)模有望達(dá)到千萬小時(shí)。
2026年人形機(jī)器人半程馬拉松開賽在即,今年,300多臺(tái)機(jī)器人、上百支隊(duì)伍將同場(chǎng)競(jìng)技。馬拉松比賽檢驗(yàn)的是機(jī)器人負(fù)責(zé)運(yùn)動(dòng)、控制的“小腦”,具身智能公司百花齊放的今天,“小腦”能力的突破對(duì)絕大多數(shù)頭部公司來說,可能已經(jīng)算不上難題。
而機(jī)器人想要走進(jìn)千家萬戶以及產(chǎn)業(yè)側(cè),負(fù)責(zé)感知、決策和執(zhí)行的“大腦”必須高度發(fā)達(dá)。這需要海量、真實(shí)的物理世界數(shù)據(jù)。數(shù)據(jù)從哪來?如何采集和訓(xùn)練?不同機(jī)器人本體數(shù)據(jù)如何互通復(fù)用?大廈落成,需要從造“磚”開始。

圖片來源:企業(yè)供圖
覓蜂科技董事長(zhǎng)兼CEO(首席執(zhí)行官)、智元機(jī)器人合伙人姚卯青公開表示,訓(xùn)練類似ChatGPT-5級(jí)別的系統(tǒng)所需語料達(dá)百億小時(shí)量級(jí),而具身智能可用數(shù)據(jù)僅在50萬小時(shí)量級(jí),規(guī)模差距懸殊,還存在標(biāo)準(zhǔn)缺失、質(zhì)量不一、供需錯(cuò)配等問題。
與大語言模型相比,具身智能的數(shù)據(jù)積累無疑還處于早期階段?!睹咳战?jīng)濟(jì)新聞》記者從京東方面了解到,其認(rèn)為具身智能要達(dá)到真正可用,至少需要1000萬小時(shí)級(jí)別的真實(shí)場(chǎng)景交互數(shù)據(jù)。然而,當(dāng)前行業(yè)數(shù)據(jù)規(guī)模僅約100萬小時(shí),數(shù)據(jù)缺口高達(dá)10倍。
融資規(guī)模不斷被刷新,量產(chǎn)步伐全面提速,市場(chǎng)規(guī)模水漲船高,一年比一年熱鬧的具身智能賽道,深陷“數(shù)據(jù)荒漠”困境,背后必然有很多不可控因素。
京東方面告訴《每日經(jīng)濟(jì)新聞》記者,首先是數(shù)據(jù)稀缺,真實(shí)場(chǎng)景交互數(shù)據(jù)獲取困難,成本高昂。傳統(tǒng)物理AI數(shù)據(jù)采集方式通常需要定制化機(jī)械臂、專用傳感器、固定工位等,設(shè)備成本高昂、部署周期長(zhǎng)。其次是泛化不足,模型難以適應(yīng)不同環(huán)境和任務(wù)場(chǎng)景。最后是不同機(jī)器人本體數(shù)據(jù)無法互通復(fù)用,形成了“數(shù)據(jù)孤島”。
因此,具身智能數(shù)據(jù)鏈路的第一步是數(shù)據(jù)采集。最底層是硬件層,包括頭戴設(shè)備、數(shù)據(jù)采集手套、機(jī)器人本體等“身體部件”。
記者注意到,京東云發(fā)布了自研的可穿戴式超高清采集終端JoyEgoCam。其配備4K高清攝像頭,支持60幀幀率與130度超廣角拍攝,可實(shí)現(xiàn)毫秒級(jí)動(dòng)作細(xì)節(jié)捕捉。在精準(zhǔn)度方面,重投影誤差小于0.2像素。
此外,覓蜂科技也推出了MEgo系列無本體數(shù)據(jù)采集硬件,包含采集夾爪、頭戴式采集設(shè)備等。設(shè)備具備超300度全景感知與亞毫秒級(jí)數(shù)據(jù)同步能力。
通過可穿戴設(shè)備,普通人也可以在工廠、物流、零售、醫(yī)療以及家庭等環(huán)境中完成數(shù)據(jù)采集,從而降低數(shù)據(jù)采集門檻,拓展采集場(chǎng)景。
京東此前發(fā)動(dòng)數(shù)十萬人參與數(shù)據(jù)采集,包括內(nèi)部超過10萬名各類職業(yè)員工,以及外部最多50萬各行業(yè)人員,其中在宿遷就將發(fā)動(dòng)超10萬市民參與。記者還注意到,京東率先在平臺(tái)公布了2000小時(shí)人類實(shí)操視頻具身智能數(shù)據(jù)集。
據(jù)京東方面稱,未來將構(gòu)建全球規(guī)模最大的具身智能數(shù)據(jù)采集中心,在兩年內(nèi)積累1000萬小時(shí)人類真實(shí)場(chǎng)景視頻數(shù)據(jù)。
數(shù)據(jù)采集完成后,這些數(shù)據(jù)如何真正融入機(jī)器人的“大腦”?京東具身智能相關(guān)負(fù)責(zé)人告訴《每日經(jīng)濟(jì)新聞》記者,底層硬件設(shè)備完成物理世界真實(shí)數(shù)據(jù)采集后,需要被送至“工具層”,可以理解為用一個(gè)“工具箱”進(jìn)行數(shù)據(jù)處理、模型訓(xùn)練以及仿真評(píng)測(cè)等。
“再往上就是模型層,也就是所謂的‘大腦’,包含VLA模型(視覺—語言—?jiǎng)幼髂P停LN模型(視覺—語言導(dǎo)航)、世界模型等核心能力。最頂層就是應(yīng)用層,就是這些技術(shù)最終落地的場(chǎng)景,比如家政服務(wù)、物流配送、醫(yī)療輔助、零售服務(wù)、工業(yè)制造等?!痹撠?fù)責(zé)人透露。
記者了解到,京東為此上線了具身數(shù)據(jù)服務(wù)平臺(tái)和京東云JoyBuilder模型開發(fā)平臺(tái)。
去年京東在具身智能領(lǐng)域罕見地完成了“六連投”,比起絕大部分互聯(lián)網(wǎng)大廠的純財(cái)務(wù)投資,京東幾乎是自家業(yè)務(wù)、全場(chǎng)景關(guān)聯(lián)具身智能賽道。具身智能數(shù)據(jù)中心是整個(gè)京東具身智能戰(zhàn)略的一環(huán)。

圖片來源:企業(yè)供圖
機(jī)器人半馬開賽之前,4月15日,京東宣布正式推出“機(jī)器人救護(hù)車”,為人形機(jī)器人、四足機(jī)器人、AI陪伴機(jī)器人等提供維修保養(yǎng)服務(wù),涵蓋基礎(chǔ)維修、故障診斷、換電補(bǔ)能、設(shè)備回收等全場(chǎng)景需求。目前,京東“機(jī)器人救護(hù)車”已率先服務(wù)北京地區(qū),未來3年,機(jī)器人上門維修服務(wù)還將拓展至全國超50個(gè)核心城市。
此外,京東還宣布,加速機(jī)器人行業(yè)商業(yè)化和場(chǎng)景落地,目標(biāo)在2026年助推機(jī)器人品牌累計(jì)銷售規(guī)模突破百億元、產(chǎn)品上市周期縮短20%,為此會(huì)打通線上App、線下門店、Joybuy海外平臺(tái)等全渠道銷售網(wǎng)絡(luò)。
機(jī)器人如何在物流、家庭、工業(yè)等真實(shí)土壤中真正“活”起來?這仍是一個(gè)需要無數(shù)機(jī)器人本體公司、具身智能數(shù)據(jù)公司深入思考并為之傾盡所有的問題和過程。這場(chǎng)具身智能基建戰(zhàn)沒有終局,誰先鋪好路、燒足數(shù)據(jù)燃料,誰就更有可能在機(jī)器人“大腦”時(shí)代的競(jìng)速中,占據(jù)下一個(gè)10年的制高點(diǎn)。
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP