京東宣布建成全球規模最大、場景最全的具身智能數據采集中心,這一消息猶如投入平靜湖面的巨石,在機器人賽道激起層層漣漪。在當前模型架構逐漸穩定、算力門檻相對清晰的背景下,高質量的物理交互數據成為機器人能否在各行業廣泛應用的關鍵因素,京東此舉無疑是在這場數據爭奪戰中投下重磅砝碼。
京東發起這場數據采集“人海戰”,源于其龐大且復雜的自營實體供應鏈。與純軟件互聯網公司不同,京東本身就是一個與物理世界深度互動的龐大體系,具身智能的成熟對其未來履約成本和運營效率影響巨大。北京亦莊的機器人產業生態與京東的布局深度契合,亦莊集聚了300余家機器人相關企業,產業鏈規模超百億元,開放40余個真實應用場景,京東作為扎根此地的“鏈主”企業,此前已發布機器人產業加速計劃。此次建設數據采集中心,是在補齊產業鏈中缺失的數據環節,與亦莊的硬件優勢形成互補,試圖構建從數據到硬件的商業閉環。
這場數據采集行動規模空前,涵蓋內部超10萬員工、外部最多50萬各行業人員,僅在宿遷就動員超10萬市民。采集場景覆蓋物流、工業、零售等多個領域,實際操作中可能借助京東現有的數字化管理網絡,讓一線員工佩戴帶有視覺甚至力覺傳感器的可穿戴設備作業。然而,如此大規模的人員調度面臨諸多挑戰。從員工角度看,他們無形中成為機器人的“數據老師”,而機器人未來可能替代部分人力勞動,因此如何設計合理的薪酬激勵和利益分配機制,避免員工抵觸,是京東需要解決的問題。目前,具體實施情況尚未傳達至員工層面,部分京東員工表示尚未聽聞此事,若有相應報酬,會視個人情況決定是否參與。
在數據合規方面,此次行動也面臨考驗。以快遞場景為例,倉儲流水線相對標準化,但快遞配送涉及千家萬戶,零售場景包含大量消費者面部特征與隱私習慣。在數據合規要求日益嚴格的當下,數十萬人采集的非結構化數據,其脫敏、清洗的合規成本可能極高。
具身智能發展面臨諸多困境,其中數據問題是核心。1988年,機器人學家漢斯?莫拉維克指出,讓計算機在智力測試或下棋中達到成人水平相對容易,但讓其擁有一歲嬰兒的感知和運動能力卻極其困難,這一現象在當今具身智能領域主要體現在數據匱乏上。大模型的成功得益于互聯網三十年積累的高質量文本語料,但物理世界缺乏這樣的“現成資源”,具身智能要實現縮放定律,面臨巨大的數據障礙。
目前行業獲取數據的方式存在明顯分化與瓶頸。多數初創公司依賴仿真環境,如英偉達的Isaac Sim或MuJoCo等物理引擎,讓機器人在虛擬世界強化學習。這種方式成本低、速度快,且無需擔心硬件損壞。然而,“Sim-to-Real(仿真到現實)”存在局限性,物理世界的復雜性,如線纜柔性形變、衣服非剛性拉扯等微觀物理法則,目前的物理引擎難以完美模擬,導致仿真中表現完美的模型在真機上出現動作失真。因此,許多企業轉向真實世界獲取數據,如斯坦福的Mobile ALOHA、Figure AI、宇樹、智元等頭部企業,采用遙操作方式,由人類操控機器人記錄數據,這是目前公認質量最高的數據獲取方式。
但數據采集還存在投入產出比不符合經濟效益的問題。單臺全尺寸人形機器人硬件成本高昂,遙操作采集數據不僅硬件折舊費高,還需支付專業操作員人力成本。據行業測算,單條高質量復雜交互任務數據的采集和清洗成本可能高達數百美元,且失敗率高,這種作坊式數據采集模式無法滿足具身智能通用化所需的海量參數規模。為降低成本,谷歌等巨頭發起Open X-Embodiment等開源數據集計劃,國內也有企業開源百萬級真機數據集。
機器人硬件本體的碎片化也給數據采集帶來工程難題。不同類型、不同廠家的人形機器人,其關節自由度、電機扭矩、傳感器布局和重心結構差異巨大,一臺機械臂訓練出的高質量抓取數據無法直接用于其他機器人,導致現有開源數據成為孤島,難以形成規模效應。
在此背景下,具身智能賽道的商業競爭邏輯發生改變,擁有真實落地場景的企業具備持續獲取廉價、高質量閉環數據的優勢。特斯拉依托超級工廠,讓Optimus在真實電池分揀流水線試錯;京東則借助物流網絡、產業工人和實體零售體系打造數據流水線,將供應鏈壁壘轉化為數據壁壘。相比之下,沒有自有場景的機器人初創公司面臨困境,有的虧本向高校和科研機構兜售硬件換取數據,有的花重金租賃場地或雇傭數據服務商定制數據。京東的入局使具身智能行業進入拼資金、場景和人力調度的重資產競爭階段,掌握真實物理世界交互入口的巨頭正在構建通往AGI的網絡。
面對京東計劃“兩年內積累超1000萬小時真實場景數據”,業內人士保持冷靜審視。在具身智能領域,數據的質量和模態遠比時長重要。當前行業缺乏包含精確物理反饋的“狀態 - 動作對”數據,宿遷市民逛超市或快遞員送貨產生的海量視覺數據,對訓練機器人世界模型有價值,但對訓練控制策略作用有限。有機器人行業人士認為,京東此舉類似流程外包的BPO生意,提供人員和場地。人類物理抓取時伴隨的復雜觸覺、力覺和空間坐標微調,普通可穿戴設備難以捕捉,若京東人力僅貢獻視頻,后期轉化為機器人可執行動作的損耗率將極高。另有國內頭部機器人企業負責人指出,行業缺乏統一的數據集定義標準,京東采集的人類動作數據難以重定向映射到不同構型機器人本體上,若缺乏統一標準,這些數據可能僅能用于京東自研機器人,難以推動全行業發展。因此,京東首年規劃特別強調“100萬小時的機器人本體數據采集”,行業真正發展方向是結合人類泛化視頻預訓練、機器人本體高質量數據微調和強化學習自我探索。
京東建設具身智能數據采集中心,為國內企業應對機器人產業數據短缺提供了新思路,通過實體場景與大規模人力結合積累數據。但要實現機器人“智能涌現”,僅靠數據規模堆砌遠遠不夠,還需保障數據高維度與高質量、建立統一數據標準以及妥善處理規模化采集中的隱私與合規問題,這些都是企業和行業在邁向商業化階段必須解決的問題。






















