巨人財經 - 專業科技行業財經媒體

螞蟻靈波開源2.7T RGB-D數據集,為空間感知等領域提供真實數據支撐

   發布時間:2026-04-01 00:12 作者:孫雅

螞蟻靈波科技近日宣布,正式開源其大規模RGB-D深度數據集LingBot-Depth-Dataset,為具身智能、空間感知和三維視覺等領域的研究與應用注入新動力。該數據集總規模達2.71TB,包含300萬對高質量樣本,其中200萬對來自真實場景采集,100萬對通過渲染生成,覆蓋6款主流深度相機,成為當前開源社區中規模最大的真實場景RGB-D數據集。

長期以來,公開深度數據集普遍面臨規模有限、真實場景覆蓋不足、硬件設備單一等挑戰。許多數據集以合成數據為主,與真實傳感器在噪聲、空洞和材質表現上存在顯著差異,導致相關模型在真實環境中的應用效果受限。LingBot-Depth-Dataset的發布,有效填補了這一領域的數據空白,為行業提供了大規模、高質量的真實場景數據支撐。

該數據集的每條樣本均包含RGB圖像、傳感器原始深度圖和真值深度圖,可直接用于深度估計與深度補全任務的訓練和評估。數據覆蓋Orbbec 335、335L以及Intel RealSense D405、D415、D435、D455等6款主流深度相機,有助于提升模型在不同設備和場景下的訓練、適配與評估能力。這種多設備、多場景的覆蓋,為相關技術在實際應用中的泛化性提供了重要保障。

螞蟻靈波此前開源的高精度空間感知模型LingBot-Depth,正是基于該數據集訓練而成。實驗表明,相比業界主流方法PromptDA與PriorDA,LingBot-Depth在室內場景中的深度預測誤差降低超過70%,在稀疏深度補全等任務中的誤差降低約47%。搭載該模型的市售深度相機,無需硬件升級即可在透明玻璃、反光鏡面、逆光等復雜場景下輸出更完整、更平滑、邊緣更清晰的深度圖,部分場景表現甚至超越業界頂級工業級深度相機。

對于高校和科研機構而言,LingBot-Depth-Dataset的開源不僅降低了數據采集與標注的門檻,也為相關技術從研究驗證走向真實應用提供了有力支持。隨著機器人和具身智能技術加快進入實際場景,大規模、高質量、以真實采集為主體的空間感知數據集,正成為推動行業持續進步的重要基礎設施。此次開源有望加速相關技術的落地應用,為智能設備在復雜環境中的感知能力提升奠定基礎。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新