巨人財經 - 專業科技行業財經媒體

“龍蝦”攪動大模型江湖:新邏輯涌現,推理時代加速狂奔

   發布時間:2026-03-28 13:51 作者:鐘景軒

在中關村國際創新中心,一場聚焦大模型行業變革的討論吸引了眾多目光。此次論壇匯聚了月之暗面創始人楊植麟、智譜CEO張鵬、無問芯穹創始人夏立雪、小米MiMo負責人羅福莉以及香港大學助理教授黃超等業內核心人物,他們圍繞近期行業熱點“OpenClaw”展開了深入探討。

過去一個月,OpenClaw成為行業焦點,它幾乎重塑了大模型的調用格局。智譜、Kimi以及小米MiMo等多家模型廠商都從中受益。3月下旬,在全球最大的模型API聚合平臺OpenRouter上,一款名為Hunter Alpha的模型調用量迅速登頂,隨后小米確認該模型正是MiMo - V2 - Pro。OpenClaw帶來的影響遠不止調用量的增長,它讓行業清晰地看到大模型進入實際應用階段后,技術與商業邏輯正發生深刻改變。

在討論中,模型承擔“完整任務鏈路”成為重要話題。過去,用戶向大模型提問,大模型僅作答,任務鏈路斷裂。如今,OpenClaw將模型引入任務執行環節,用戶給出目標,系統負責拆解、嘗試、修正和交付。張鵬將其比作“腳手架”,普通人可借此調用頂級模型完成完整任務,用戶與模型的關系從“提問—回答”轉變為“目標—執行—迭代”。這一轉變改變了評價方式,單輪回答不再重要,復雜任務能否穩定收斂成為關鍵,模型被置于交付結果的語境中,系統規劃、調度和試錯消耗時間,也堆疊了能力。

Token的變化也備受關注。夏立雪提到,公司Token用量從1月底開始每兩周翻一倍,在Agent場景下,單個任務的Token消耗是傳統問答的10倍甚至100倍。過去,大模型對話問答時代,Token消耗量低,普通用戶免費就能使用AI。但OpenClaw出現后,Token用量呈指數增長成為新共識,其消耗量遠高于傳統對話。不過,Token不再只是成本指標,它對應規劃、執行、調用工具的全過程,接近“機器工時”,將重塑價格體系,成本上升與任務價值綁定,成為新的定價基礎。

大模型行業正從訓練時代快速邁向推理時代。在智譜、MiniMax等大模型公司未上市階段,“訓練”曾是主流,但OpenClaw加速了推理時代的到來。隨著任務復雜度上升,Context長度迅速拉長到1M甚至10M級別,這促使廠商在推理側進行結構創新,如Hybrid架構、Linear Attention、Long Context Efficient設計等,目的是在更長Context下降低成本、提高穩定性。這也意味著競爭維度下沉,從模型參數規模轉向推理效率、系統調度甚至能源成本。

在Agent框架下,系統能力開始抵消模型差距。模型之間的能力差距被部分壓縮,通過Skill和工具組合,次頂級模型也能完成復雜任務。此時,用戶更關注任務結果,而非模型本身指標,參與門檻降低,構建能力向系統工程傾斜,不再局限于算法。

對于OpenClaw,各位嘉賓發表了不同看法。楊植麟提出,大家在日常使用或類似產品時,覺得什么最有想象力或印象深刻,并請張鵬從技術角度談談對OpenClaw和相關Agent的看法。張鵬認為它是一個“腳手架”,為在模型基礎上搭建提供了牢固、方便且靈活的可能性,普通人能極低門檻使用頂尖模型,尤其是編程和整體能力,這是重大突破。夏立雪起初不適應OpenClaw,覺得它慢,后來發現能完成大型任務,從按Token聊天到能完成任務的Agent,想象力空間提升,但對系統能力要求增大,作為基礎設施廠商,看到機遇和挑戰,資源需支撐快速增長時代。羅福莉認為OpenClaw具有革命性和顛覆性,在Agent框架設計上領先于Code,其“開源”有利于社區參與,拉高了國內次頂級閉源模型上限,保證了任務完成度下限,還點燃了大家想象力,讓更多人參與AGI變革。黃超表示,OpenClaw在交互模式上給人“更有活人感”的體驗,更接近個人賈維斯,還證明了架構Agent的框架可簡單高效,讓大家思考是否需要All in one的超級智能體,撬動生態工具賦能各行各業。

討論中,楊植麟還詢問張鵬智譜新發布的GLM Turbo模型情況。張鵬稱發布Turbo是為了讓大模型從“簡單對話”轉向“干活”,OpenClaw讓大家看到大模型能干活,但背后Token消耗高,需要規劃、嘗試等,Turbo在這些方面優化,本質是多智能體協同架構,能力上有偏向性加強。關于提價,他解釋因干活消耗的Token量是簡單問答的10倍甚至100倍,成本大幅提高,長期低價競爭不利于行業發展,調整價格是為回歸正常商業價值,持續優化模型提供更好服務。

當被問到小米做大模型的優勢時,羅福莉先談了中國大模型團隊的優勢。兩年前,中國團隊在算力受限,尤其是互聯帶寬受限的情況下,通過模型結構創新(如DPCV3、M1、MA等)追求最高效率,這給了團隊勇氣和信心。如今國產芯片不再受限,但對高效率、低推理成本的探索依然重要,如現在的Hybrid、SPA、Linear attention結構等。結構創新重要是因為OpenClaw越用越聰明的前提是推理Context,難題是在1M或10M的長上下文下做到成本低、速度快,以激發高生產力任務,實現模型自迭代。小米正在探索Long Context Efficient架構,以及在真實長距離任務上做到穩定和高上限。更長期看,隨著推理需求爆發,今年可能增長100倍,競爭維度將下探到算力、推理芯片甚至能源層面。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新