螞蟻集團旗下靈波科技近日宣布,其自主研發的世界模型LingBot-World正式面向全球開發者開源。這是繼空間感知模型LingBot-Depth和具身大模型LingBot-VLA之后,靈波科技在具身智能領域推出的第三款核心開源模型,標志著螞蟻集團在通用人工智能(AGI)戰略中完成了從虛擬數字空間到物理感知能力的關鍵跨越。
據技術團隊介紹,LingBot-World在視頻生成質量、動態場景還原度、長時序穩定性等核心指標上已達到國際領先水平,可與谷歌最新發布的Genie 3模型相媲美。該模型通過構建高保真、強交互的數字仿真環境,為具身智能訓練、自動駕駛算法驗證以及游戲開發等領域提供了突破性解決方案。特別是在處理復雜動態場景時,其生成的虛擬環境能夠實時響應物理規則變化,支持多智能體協同交互。
針對視頻生成領域長期存在的"長時漂移"難題,靈波科技研發團隊創新性地采用多階段訓練架構與并行計算優化技術。通過動態記憶機制和時空一致性約束算法,LingBot-World成功將連續無損生成時長提升至近10分鐘,較傳統模型提升300%以上。這一突破使得機器人操作訓練、自動駕駛決策系統開發等需要長序列交互的場景獲得更可靠的仿真環境支持。
開源社區已同步開放LingBot-World的完整模型權重與推理代碼庫,開發者可基于PyTorch框架快速部署。該模型支持多模態輸入接口,能夠兼容視覺、語言、傳感器等多種數據類型,為跨領域應用開發提供靈活基礎。靈波科技表示,后續將持續優化模型在極端場景下的適應能力,并計劃推出行業定制化版本。
業內專家指出,螞蟻集團通過"基礎模型-通用應用-實體交互"的三層技術架構,正在構建完整的AGI技術生態。此次開源的世界模型不僅填補了國內在高端數字仿真領域的空白,其開放的研發模式更將加速具身智能技術的產業化進程,為智能制造、智慧城市等戰略性新興產業提供關鍵技術支撐。























