“龍蝦”攪動大模型江湖：新邏輯涌現，推理時代加速狂奔

發布時間：2026-03-28 13:51 來源：快訊作者：鐘景軒

在中關村國際創新中心，一場聚焦大模型行業變革的討論吸引了眾多目光。此次論壇匯聚了月之暗面創始人楊植麟、智譜CEO張鵬、無問芯穹創始人夏立雪、小米MiMo負責人羅福莉以及香港大學助理教授黃超等業內核心人物，他們圍繞近期行業熱點“OpenClaw”展開了深入探討。

過去一個月，OpenClaw成為行業焦點，它幾乎重塑了大模型的調用格局。智譜、Kimi以及小米MiMo等多家模型廠商都從中受益。3月下旬，在全球最大的模型API聚合平臺OpenRouter上，一款名為Hunter Alpha的模型調用量迅速登頂，隨后小米確認該模型正是MiMo - V2 - Pro。OpenClaw帶來的影響遠不止調用量的增長，它讓行業清晰地看到大模型進入實際應用階段后，技術與商業邏輯正發生深刻改變。

在討論中，模型承擔“完整任務鏈路”成為重要話題。過去，用戶向大模型提問，大模型僅作答，任務鏈路斷裂。如今，OpenClaw將模型引入任務執行環節，用戶給出目標，系統負責拆解、嘗試、修正和交付。張鵬將其比作“腳手架”，普通人可借此調用頂級模型完成完整任務，用戶與模型的關系從“提問—回答”轉變為“目標—執行—迭代”。這一轉變改變了評價方式，單輪回答不再重要，復雜任務能否穩定收斂成為關鍵，模型被置于交付結果的語境中，系統規劃、調度和試錯消耗時間，也堆疊了能力。

Token的變化也備受關注。夏立雪提到，公司Token用量從1月底開始每兩周翻一倍，在Agent場景下，單個任務的Token消耗是傳統問答的10倍甚至100倍。過去，大模型對話問答時代，Token消耗量低，普通用戶免費就能使用AI。但OpenClaw出現后，Token用量呈指數增長成為新共識，其消耗量遠高于傳統對話。不過，Token不再只是成本指標，它對應規劃、執行、調用工具的全過程，接近“機器工時”，將重塑價格體系，成本上升與任務價值綁定，成為新的定價基礎。

大模型行業正從訓練時代快速邁向推理時代。在智譜、MiniMax等大模型公司未上市階段，“訓練”曾是主流，但OpenClaw加速了推理時代的到來。隨著任務復雜度上升，Context長度迅速拉長到1M甚至10M級別，這促使廠商在推理側進行結構創新，如Hybrid架構、Linear Attention、Long Context Efficient設計等，目的是在更長Context下降低成本、提高穩定性。這也意味著競爭維度下沉，從模型參數規模轉向推理效率、系統調度甚至能源成本。

在Agent框架下，系統能力開始抵消模型差距。模型之間的能力差距被部分壓縮，通過Skill和工具組合，次頂級模型也能完成復雜任務。此時，用戶更關注任務結果，而非模型本身指標，參與門檻降低，構建能力向系統工程傾斜，不再局限于算法。

對于OpenClaw，各位嘉賓發表了不同看法。楊植麟提出，大家在日常使用或類似產品時，覺得什么最有想象力或印象深刻，并請張鵬從技術角度談談對OpenClaw和相關Agent的看法。張鵬認為它是一個“腳手架”，為在模型基礎上搭建提供了牢固、方便且靈活的可能性，普通人能極低門檻使用頂尖模型，尤其是編程和整體能力，這是重大突破。夏立雪起初不適應OpenClaw，覺得它慢，后來發現能完成大型任務，從按Token聊天到能完成任務的Agent，想象力空間提升，但對系統能力要求增大，作為基礎設施廠商，看到機遇和挑戰，資源需支撐快速增長時代。羅福莉認為OpenClaw具有革命性和顛覆性，在Agent框架設計上領先于Code，其“開源”有利于社區參與，拉高了國內次頂級閉源模型上限，保證了任務完成度下限，還點燃了大家想象力，讓更多人參與AGI變革。黃超表示，OpenClaw在交互模式上給人“更有活人感”的體驗，更接近個人賈維斯，還證明了架構Agent的框架可簡單高效，讓大家思考是否需要All in one的超級智能體，撬動生態工具賦能各行各業。

討論中，楊植麟還詢問張鵬智譜新發布的GLM Turbo模型情況。張鵬稱發布Turbo是為了讓大模型從“簡單對話”轉向“干活”，OpenClaw讓大家看到大模型能干活，但背后Token消耗高，需要規劃、嘗試等，Turbo在這些方面優化，本質是多智能體協同架構，能力上有偏向性加強。關于提價，他解釋因干活消耗的Token量是簡單問答的10倍甚至100倍，成本大幅提高，長期低價競爭不利于行業發展，調整價格是為回歸正常商業價值，持續優化模型提供更好服務。

當被問到小米做大模型的優勢時，羅福莉先談了中國大模型團隊的優勢。兩年前，中國團隊在算力受限，尤其是互聯帶寬受限的情況下，通過模型結構創新（如DPCV3、M1、MA等）追求最高效率，這給了團隊勇氣和信心。如今國產芯片不再受限，但對高效率、低推理成本的探索依然重要，如現在的Hybrid、SPA、Linear attention結構等。結構創新重要是因為OpenClaw越用越聰明的前提是推理Context，難題是在1M或10M的長上下文下做到成本低、速度快，以激發高生產力任務，實現模型自迭代。小米正在探索Long Context Efficient架構，以及在真實長距離任務上做到穩定和高上限。更長期看，隨著推理需求爆發，今年可能增長100倍，競爭維度將下探到算力、推理芯片甚至能源層面。

更多>同類內容