在人工智能技術迅猛發展的當下,具身智能成為行業關注的焦點。隨著世界模型概念引發新一輪技術熱潮,適配具身智能的大模型研發路徑成為關鍵議題。強化學習與模仿學習之爭、端到端架構與模塊化設計的選擇、仿真訓練與真機實踐的側重,各類技術路線在行業中持續引發討論。原力靈機聯合創始人周而進在近期訪談中提出,行業需回歸技術本質,其團隊通過構建原生機器人模型DM0,探索出一條差異化發展路徑。
周而進將具身智能的核心目標定義為構建分層智能系統。該系統由三層架構組成:頂層規劃系統負責任務分解與全局決策,中層指令系統生成基礎動作指令,底層執行系統則通過傳感器融合與電機控制實現精準操作。這種設計源于團隊對通用場景的深度思考——未來機器人需具備處理復雜動態環境的能力,如自主完成更換垃圾桶、擦拭桌面、補充飲水等多樣化任務。為實現這一目標,模型必須突破單一場景限制,在硬件適配、傳感器融合、任務拆解等維度實現全面泛化。
在硬件通用性方面,原力靈機提出"可組裝式機器人"理念。針對物流行業不同場景需求,團隊研發的模型需兼容多種機械臂構型:重載場景配置粗壯型機械臂,精細操作場景則采用桌面雙臂靈巧手。這種設計要求模型具備跨硬件平臺的學習能力,即使更換傳感器或執行機構,仍能保持核心功能穩定。周而進強調,真正的通用模型應像人類神經系統般靈活,當某條手臂缺失或新增觸覺模塊時,系統能自動調整控制策略而不影響整體性能。
數據策略成為突破泛化瓶頸的關鍵。團隊采用"仿真+真機"的混合訓練模式:在室內導航、剛性物體抓取等基礎任務中充分利用仿真數據,而在疊衣服、液體搬運等精細操作領域堅持真機采集。通過部署多維度傳感器陣列,模型可同步獲取視覺、觸覺、力控等數據流。周而進特別指出,當前行業存在過度依賴視覺數據的傾向,而真實場景中觸覺反饋往往決定操作成敗。團隊正在開發支持嗅覺傳感的數據采集系統,未來計劃將氣味識別納入環境感知維度。
針對模型參數量爭議,原力靈機發布的DM0模型以2.4億參數規模引發關注。周而進解釋,參數規模與實際能力不存在必然關聯,團隊通過優化訓練機制使模型在真實場景中達到60毫秒級響應速度。這種"小而精"的設計理念源于對具身智能本質的理解:與語言模型不同,機器人模型需要持續與物理世界交互,參數膨脹反而可能降低實時性。DM0的開源策略旨在推動行業建立原生模型開發標準,避免陷入對通用大模型的簡單改造。
商業化路徑選擇體現團隊務實態度。盡管終極目標是全場景通用機器人,原力靈機仍優先切入工業物流領域。周而進認為,該場景同時具備標準化流程與動態變化要素,是驗證模型泛化能力的理想試驗場。在皮帶分揀、多品類打包等任務中,團隊開發了"漸進式兜底"方案:初期通過人工輔助與遠程操控確保系統穩定性,隨著模型能力提升逐步減少人工干預。這種滾動開發模式使客戶能早期見證技術價值,同時為模型迭代提供真實場景數據。
面對硬件性能是否制約發展的質疑,周而進指出當前瓶頸主要在于模型架構而非硬件指標。他以春晚機器人表演為例說明:當算法能實現復雜動作編排時,硬件的扭矩、精度等參數已滿足基本需求。團隊更關注散熱、功耗等工程化問題,這些要素直接影響機器人持續作業能力。在訓練機制創新方面,原力靈機正探索將世界模型與VLA架構深度融合,使模型既能預測動作后果,又能規劃干預策略,這種雙向建模方式被視為突破閉環控制難題的關鍵。






















