京東探索研究院近日宣布,其自主研發的圖像編輯模型JoyAI-Image-Edit正式面向全球開發者開源。該模型突破傳統平面圖像處理局限,首次將三維空間智能深度融入技術框架,實現了從二維修圖到三維空間重塑的跨越式升級。開發者可免費獲取完整推理代碼,直接用于商業應用開發。
技術團隊通過構建空間位置關系、多視角一致性、相機感知等六大核心模塊,使模型具備精準的空間推理能力。實驗室數據顯示,在物體位移精度和空間一致性等關鍵指標上,該模型已達到國際領先水平。其創新性的三維坐標變換算法,可實現像素級幾何結構控制,為復雜場景編輯提供技術保障。
該模型三大核心功能尤其引人注目:其一,視角變換功能支持通過自然語言指令調整相機參數,在保持場景幾何完整性的同時生成新視角圖像;其二,空間漫游功能可連續生成邏輯連貫的多視角序列,模擬三維空間移動效果;其三,物體空間關系操控能在維持場景整體結構的前提下,對指定物體進行位移、旋轉等操作,并自動優化遮擋關系與光影效果。
在通用編輯能力方面,模型兼容15類主流圖像處理需求,涵蓋物體增刪改、風格遷移、細節優化等高頻操作。通過空間智能與通用編輯的深度融合,該技術可同時處理復雜場景中的多個編輯任務,顯著提升內容創作效率。
目前,該技術已在電商內容生產、創意設計、智能圖像處理等領域展開應用測試。特別是在具身智能視覺感知領域,其提供的三維空間理解能力為機器人環境建模、自主導航等技術的研發奠定了重要基礎。行業分析師指出,這項開源技術將推動AI圖像處理向空間智能化方向加速演進。






















