在2025甲子引力年終盛典的具身智能技術專場圓桌對話中,行業專家們圍繞具身智能的發展路徑、技術挑戰與商業化前景展開了深入探討。伯牙智能創始人兼CEO劉欣擔任主持人,與原力無限資深研究科學家陳佳玉、極佳科技聯合創始人兼首席科學家朱政、千尋智能聯席首席科學家解浚源、星源智聯合創始人何嘉偉共同剖析了這一領域的核心議題。
關于具身智能的“ChatGPT時刻”,嘉賓們認為其特征可能體現在技術突破與場景落地的雙重共振。陳佳玉提出,這一時刻需滿足三個階段:從單場景單任務穩定執行,到單場景多任務穩定執行,最終實現多場景多任務通用化。朱政強調,智能化水平是當前最大瓶頸,盡管通用性已顯著提升,但與專用模型相比仍存在差距。解浚源則指出,需通過開放場景中的泛化體力勞動展示破圈效應,例如機器人自主完成疊衣服等任務。何嘉偉補充道,零樣本學習能力是關鍵,即解決未訓練任務的泛化問題。
技術路線選擇方面,世界模型與VLA(視覺語言動作模型)的爭議成為焦點。朱政解釋,世界模型通過生成合成數據降低真機采集成本,并支持強化學習訓練,最終可能演進為融合狀態預測與動作決策的WA模型(World-Action Model)。陳佳玉認為,軟硬解耦并非完全分離:大腦層級應聚焦泛化知識,而運控算法需針對硬件適配。何嘉偉分享了星源智的實踐,其通過大小腦分層模式實現跨本體泛化——大腦負責空間感知與任務規劃,小腦處理硬件相關操作,結合2D3D融合與世界模型技術突破3D空間理解瓶頸。
數據獲取難題的解決路徑引發討論。解浚源預測,隨著數據采集流程標準化,到2026年底頭部企業將積累百萬小時級真實數據,屆時算力成本將超過數據成本。朱政指出,自動駕駛與具身智能在數據與模型層面存在共性,例如均需海量數據支撐,且模型架構向VLA收斂。但他強調,具身智能對物理交互的要求更高,需處理剛體、流體等復雜動態場景。
商業化場景優先級方面,嘉賓普遍看好商業服務領域。陳佳玉分析,工業場景對效率要求嚴苛,家庭場景存在安全與成本挑戰,而商業服務場景(如酒店清潔、餐飲服務)對安全性與效率容忍度較高,更易形成閉環。何嘉偉透露,星源智已與物流企業合作開發具身裝卸技術,通過部署通用大腦模型實現卡車貨物裝卸自動化。解浚源補充,工業場景雖技術可行,但面臨場景碎片化與數據采集難題,短期難以規模化。
面對資本熱潮,嘉賓們強調技術沉淀的重要性。陳佳玉建議,企業應選擇細分賽道深度耕耘,避免盲目追隨技術潮流。朱政透露,極佳科技堅持“先提升智能化水平,再拓展場景”的策略,拒絕過早商業化導致技術稀釋。解浚源批評低水平重復的Demo展示現象,強調需聚焦Scaling Law驗證,通過數據與模型規模的指數級增長推動技術突破。何嘉偉則認為,Demo展示與產品化可并行,具身大腦的進化能直接賦能下游落地。
在團隊建設層面,跨學科協作成為共識。陳佳玉介紹,原力無限團隊分為本體、數據與算法三部分,算法團隊以學術背景為主,探索前沿技術。朱政表示,極佳科技研發人員占比80%,融合計算機視覺與機器人背景,通過統一目標打通世界模型到本體的技術鏈路。解浚源強調務實態度,認為優秀人才可來自各行業,早期需依靠標桿成果吸引后續資源。何嘉偉補充,星源智依托智源研究院與北京大學的技術積累,同時重視工程化能力,在嵌入式開發與算法部署方面持續投入。





















