靈初智能CEO王啟斌：專注數據基建，為通用具身智能鋪就低成本之路

發布時間：2026-03-12 21:39 來源：快訊作者：李娜

近日，具身智能領域迎來一筆重磅融資——靈初智能宣布完成天使輪及Pre-A輪共計20億元融資，投資方陣容堪稱豪華，既有國開金融、國中資本、央視融媒體產業投資基金等國家級“國家隊”資本，也有上海國資徐匯資本、梁溪科創產業二期母基金（博華資本管理）、錫創投等地方國資，還有眾多知名產業資本和市場化基金參與其中，多家老股東更是實現超額跟投，華興資本擔任長期財務顧問。本輪融資資金將主要用于加速靈初智能在物流場景的規模化落地以及數據采集體系建設。

靈初智能由前云跡科技、京東算法團隊核心成員創立，自成立之初便不走尋常路。在行業普遍聚焦核心零部件、移動底盤甚至急于打造完整雙足人形機器人時，靈初智能卻將目光瞄準了“操作”，尤其是通用靈巧操作。公司創始人王啟斌指出，從2015年前后配送機器人興起，行業就始終未能攻克“手”上的操作難題。

在王啟斌看來，具身智能正處于“冷啟動”關鍵階段，而高質量、低成本的人類操作數據是破局關鍵。他以特斯拉的FSD（全自動駕駛）模式為例，特斯拉因Model 3在2017年發售后迅速實現百萬臺年銷量，底層數據回流讓FSD快速迭代。但具身智能面臨的數據難題更為棘手，缺乏數據導致模型無法泛化，機器人無法大規模部署，進而無法獲取低成本真實世界數據，而仿真數據又存在較大差距，無法直接用于訓練泛化模型。基于此，靈初智能將第一個戰場選在了數據基建，而非雙足運動或關節模組性能競賽。

在數據采集方面，靈初智能有著獨特思路。去年，UC Berkeley提出的UMI（Universal Manipulation Interface）范式引發全球關注，其核心是用低成本的人持夾爪采集數據，但這種方式采集的數據并非人類數據，無法泛化到五指靈巧手上。靈初智能則回歸“人本”，推出“靈初數據采集引擎”。這并非簡單的數據手套，而是一個集成視覺（多視角）、觸覺（壓阻/電容）、21個關節角信息的復雜系統。該方案先學習人類操作底層邏輯，再通過“重定向”技術將人類操作意圖映射到不同結構、自由度的機器人本體上，使模型能適應多種硬件形態，不被特定機械構型鎖定。

這一方案的成本優勢十分明顯。據透露，其數據采集設備的硬件投入成本僅為真機遙操作方案的十分之一。今年3月后，還將推出便攜式版本，進一步降低數據采集成本，未來甚至計劃通過“眾包”模式，讓普通人在工作和生活中佩戴手套采集數據，實現去中心化數據回流。王啟斌強調，成本只是保證數據大規模擴展，把高信噪比數據訓進模型才是靈初的核心競爭力。

在商業化落地場景選擇上，靈初智能聚焦物流場景，且切口極為具體，如衣服供包、入箱揀選、分撥墻等。王啟斌認為，物流場景遠比簡單的“抓取 - 放置”（Pick and Place）復雜。以商超補貨為例，要把一箱東西拆開，拿出物品放到容器里，推到貨架，放上去并理貨，往掛鉤上掛東西、開冰箱門補飲品、拿出過期物品等，是十幾個動作的序列。實際場景中，物品形態千差萬別，對機器人的感知、規劃和操作精度要求極高，涉及視覺識別、柔性抓取、軌跡規劃、力控等綜合性挑戰。目前，靈初智能在衣服供包場景的節拍已達到800 UPH（Units Per Hour），達到國內最高水平，并已進入客戶現場陪產階段。

面對外界對“模型碎片化”和“場景泛化邊界”的擔憂，靈初智能技術負責人Viktor詳細拆解了公司的完整技術管線。他將技術管線類比為大語言模型訓練過程：首先是預訓練，利用數據手套大規模采集長程、多任務的人類操作數據，培養“知識面廣但不夠精專”的“中學生”；接著是后訓練，在選定落地的真機上進行少量（約100小時級）遙操作數據采集，讓模型適配特定機型“身體”結構；然后是真機強化，通過強化學習提升任務成功率和節拍；最后是端側推理與糾錯，在真實部署中遇到無法自動恢復的極端情況，由人工介入糾錯，數據回流到模型迭代。預訓練數據決定泛化能力廣度，后訓練與強化數據決定具體場景性能高度，這種分層數據體系與模型迭代路徑確保公司既不失通用性，又能落地。

對于具身智能整體發展階段，靈初智能認為這是一個長達十年的長周期賽道，目前處于Gartner曲線早期。硬件百花齊放的第一波浪潮已過，當前正迎來數據浪潮。靈初智能目標明確，到2026年將真實世界人類操作數據規模提升至百萬小時級別，并基于此訓練出高度泛化的預訓練模型。同時，公司將圍繞數據采集設備銷售、數據資產變現以及場景解決方案交付，建立多元化商業模式。在行業聚焦人形機器人外在形態與雙足運動時，靈初智能回歸數據源頭，致力于降低“教機器人操作”成本，或許在通往通用具身智能的路上，這將成為其制勝關鍵。

更多>同類內容