巨人財經 - 專業科技行業財經媒體

Project Genie:推開物理現實模擬大門 未來游戲與AI訓練或迎新變革

   發布時間:2026-01-30 18:30 作者:王婷

當人們還在討論AI能否生成逼真視頻時,Google悄然推出了一項名為Project Genie的實驗性項目——一個允許用戶實時創建并交互的虛擬世界生成器。這項技術突破了傳統AI僅能處理文本或靜態圖像的局限,通過整合圖像生成、語言理解和物理模擬三大模塊,構建出可動態響應人類操作的沉浸式環境。

項目負責人將其運作機制類比為人類夢境:系統通過Nano Banana Pro模塊生成視覺畫面,Gemini模型解析語言指令,而核心的Genie 3物理引擎則確保虛擬環境遵循現實規律。與依賴物理公式的傳統模擬不同,該引擎通過分析數百萬段物體運動視頻,自主掌握了重力、慣性等基礎物理特性。這種"觀察學習"模式使其能模擬從沙漠行走到外星球駕駛等多樣化場景。

在Google AI團隊發布的演示視頻中,產品宣傳委員Josh Woodward展示了完整操作流程:他將個人照片轉化為復古游戲角色,輸入"牛仔在沙漠探索"的指令后,系統立即生成可交互的3D環境。用戶通過鍵盤方向鍵移動時,系統會實時預測地形變化并生成新畫面,整個過程如同操控開放世界游戲,但所有場景均由AI即時生成而非預先設計。

這項技術面臨顯著的技術挑戰。為控制計算成本,當前版本將單次體驗限制在60秒內——開發團隊解釋稱,更長時間會導致畫面邏輯斷裂,出現物體懸浮或運動軌跡異常等情況。早期測試者反饋,外星球駕駛場景存在約0.5秒的操作延遲,自定義指令響應率約為70%,但已能保留角色動作邏輯,例如從沙漠切換到賽博城市時,牛仔的奔跑姿勢會自動適配新環境。

相較于娛樂應用,Project Genie更被寄予突破AI發展瓶頸的厚望。隨著互聯網高質量文本數據趨于枯竭,具身智能(Embodied AI)成為新焦點——機器人無法通過閱讀掌握洗碗技能,必須通過實際操作積累經驗。Genie 3的物理引擎可生成數十億個虛擬訓練場,讓AI代理在模擬廚房、倉庫等環境中反復試錯,這種合成數據生成方式將大幅降低機器人訓練成本。

教育領域已浮現具體應用場景。開發團隊設想,歷史教師可通過指令生成18世紀巴黎街道,讓學生"親歷"法國大革命;心理治療師能創建可控的恐懼環境,幫助患者逐步脫敏。盡管當前版本存在畫質粗糙、無法多人聯機等缺陷,但測試者@yrzhe_top仍評價:"雖然只實現了承諾的七成,但這種創造世界的自由度已足夠震撼。"

值得關注的是,螞蟻集團同期開源的LingBot-VA模型也展現出類似思路。該模型在生成畫面時同步推演動作序列,使機器人能像人類一樣"邊思考邊操作",在疊衣物、拆快遞等家務任務中表現出色。這些進展表明,AI正從處理信息向模擬現實邁進,而Project Genie的物理引擎或許會成為這場變革的關鍵基礎設施。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新