具身智能的ChatGPT時刻何時到來？行業大咖共探技術突破與商業落地新路徑

發布時間：2025-12-26 17:04 來源：快訊作者：沈如風

在2025甲子引力年終盛典的具身智能技術專場圓桌對話中，行業專家們圍繞具身智能的發展路徑、技術挑戰與商業化前景展開了深入探討。伯牙智能創始人兼CEO劉欣擔任主持人，與原力無限資深研究科學家陳佳玉、極佳科技聯合創始人兼首席科學家朱政、千尋智能聯席首席科學家解浚源、星源智聯合創始人何嘉偉共同剖析了這一領域的核心議題。

關于具身智能的“ChatGPT時刻”，嘉賓們認為其特征可能體現在技術突破與場景落地的雙重共振。陳佳玉提出，這一時刻需滿足三個階段：從單場景單任務穩定執行，到單場景多任務穩定執行，最終實現多場景多任務通用化。朱政強調，智能化水平是當前最大瓶頸，盡管通用性已顯著提升，但與專用模型相比仍存在差距。解浚源則指出，需通過開放場景中的泛化體力勞動展示破圈效應，例如機器人自主完成疊衣服等任務。何嘉偉補充道，零樣本學習能力是關鍵，即解決未訓練任務的泛化問題。

技術路線選擇方面，世界模型與VLA（視覺語言動作模型）的爭議成為焦點。朱政解釋，世界模型通過生成合成數據降低真機采集成本，并支持強化學習訓練，最終可能演進為融合狀態預測與動作決策的WA模型（World-Action Model）。陳佳玉認為，軟硬解耦并非完全分離：大腦層級應聚焦泛化知識，而運控算法需針對硬件適配。何嘉偉分享了星源智的實踐，其通過大小腦分層模式實現跨本體泛化——大腦負責空間感知與任務規劃，小腦處理硬件相關操作，結合2D3D融合與世界模型技術突破3D空間理解瓶頸。

數據獲取難題的解決路徑引發討論。解浚源預測，隨著數據采集流程標準化，到2026年底頭部企業將積累百萬小時級真實數據，屆時算力成本將超過數據成本。朱政指出，自動駕駛與具身智能在數據與模型層面存在共性，例如均需海量數據支撐，且模型架構向VLA收斂。但他強調，具身智能對物理交互的要求更高，需處理剛體、流體等復雜動態場景。

商業化場景優先級方面，嘉賓普遍看好商業服務領域。陳佳玉分析，工業場景對效率要求嚴苛，家庭場景存在安全與成本挑戰，而商業服務場景（如酒店清潔、餐飲服務）對安全性與效率容忍度較高，更易形成閉環。何嘉偉透露，星源智已與物流企業合作開發具身裝卸技術，通過部署通用大腦模型實現卡車貨物裝卸自動化。解浚源補充，工業場景雖技術可行，但面臨場景碎片化與數據采集難題，短期難以規模化。

面對資本熱潮，嘉賓們強調技術沉淀的重要性。陳佳玉建議，企業應選擇細分賽道深度耕耘，避免盲目追隨技術潮流。朱政透露，極佳科技堅持“先提升智能化水平，再拓展場景”的策略，拒絕過早商業化導致技術稀釋。解浚源批評低水平重復的Demo展示現象，強調需聚焦Scaling Law驗證，通過數據與模型規模的指數級增長推動技術突破。何嘉偉則認為，Demo展示與產品化可并行，具身大腦的進化能直接賦能下游落地。

在團隊建設層面，跨學科協作成為共識。陳佳玉介紹，原力無限團隊分為本體、數據與算法三部分，算法團隊以學術背景為主，探索前沿技術。朱政表示，極佳科技研發人員占比80%，融合計算機視覺與機器人背景，通過統一目標打通世界模型到本體的技術鏈路。解浚源強調務實態度，認為優秀人才可來自各行業，早期需依靠標桿成果吸引后續資源。何嘉偉補充，星源智依托智源研究院與北京大學的技術積累，同時重視工程化能力，在嵌入式開發與算法部署方面持續投入。

更多>同類內容