智元機器人近日宣布推出一項名為Act2Goal的創新操作算法,為機器人領域帶來全新突破。該算法突破傳統機器人機械執行指令的模式,賦予機器人“以終為始”的智能思維,使其能夠自主規劃達成目標的路徑。
Act2Goal的核心創新在于引入“目標條件世界模型”,將視覺推理與動作控制整合為端到端架構。這一設計使機器人不再局限于“看一步走一步”的簡單模式,而是具備構建從現狀到目標的完整因果鏈條的能力。實驗表明,在面對陌生環境和物體時,該算法展現出驚人的零樣本泛化能力,僅需數分鐘在線自我磨練,復雜任務的成功率即可從30%提升至90%。
該算法通過多尺度時域哈希(MSTH)機制實現精細操作與全局規劃的平衡。系統將任務過程分解為短時精細段和長時粗粒段:前者以高頻采樣確保機械臂動作精度,后者通過自適應采樣實現全局路徑規劃。這種設計有效防止了誤差累積和目標偏離,使機器人在長時序操作中既能保持局部動作精確性,又能確保整體目標方向一致性。
離線模仿學習階段,系統通過大規模數據訓練微調預訓練模型,生成多視角、多尺度的視覺軌跡。動作生成模塊與世界模型聯合訓練,形成從視覺感知到動作生成的完整閉環。這種訓練方式使機器人能夠根據當前狀態和目標狀態預測未來軌跡,并生成可執行動作,為復雜任務提供穩定支撐。
針對真實環境中的未知挑戰,Act2Goal設計了在線自我提升機制。通過回顧性經驗重放技術,機器人自動收集執行過程中的狀態、動作和結果數據,并將軌跡重新標注為新目標示例存入緩沖區。系統僅更新新增的LoRA層參數,保持基礎模型凍結,這種輕量化微調方式使機器人能快速適應新任務,在未見過的環境中保持穩定操作。
部署Act2Goal的G01機器人在多項域外任務中表現優異,包括繪制未見過的圖案等復雜操作。該算法通過顯式建模目標演化過程,為機器人操作提供了全新范式,其“先理解世界變化再決策行動”的思路,為開發更通用、可靠的機器人系統奠定了重要基礎。




















