巨人財經 - 專業科技行業財經媒體

AI“推理時代”激戰正酣:英偉達布局降本,中國大模型性價比領跑全球

   發布時間:2026-03-18 07:02 作者:蘇婉清

在近期舉辦的GTC(GPU技術大會)上,英偉達首席執行官黃仁勛宣布,全球人工智能(AI)競爭的焦點正從模型訓練轉向推理環節,標志著AI產業進入“推理時代”。他指出,隨著AI從簡單的對話工具升級為能夠自主執行復雜任務的智能體,持續生成海量Token(AI處理的最小數據單元)已成為行業核心需求。這場變革中,誰能以最低成本高效生成token,誰就能主導未來市場。

黃仁勛在演講中重申了“AI Token工廠”概念,強調數據中心的角色已從傳統“成本中心”轉變為“價值創造中心”。他比喻道:“過去工廠將水轉化為電,如今數據中心將數據和電力轉化為高價值的token。”基于這一邏輯,英偉達推出新一代Vera Rubin計算平臺,宣稱其每瓦特推理性能較前代提升10倍,可將token生成成本降低90%。該平臺通過整合Groq公司的低延遲處理器(LPU),采用GPU與LPU混合架構,分別處理高吞吐量任務與最終token生成,實現推理性能最高35倍的提升。

英偉達的野心不止于硬件創新。黃仁勛展示了一套覆蓋芯片、存儲、網絡到液冷系統的全棧解決方案,并推出數字孿生平臺NVIDIA DSX,幫助客戶在虛擬環境中模擬AI工廠運行,優化能源效率。他直言:“加速計算是系統級工程,必須垂直整合。”這一戰略旨在將英偉達從芯片供應商升級為AI基礎設施的“架構師”與“規則制定者”。

然而,就在英偉達描繪技術藍圖時,中國AI廠商已憑借成本優勢在全球推理市場占據主導地位。數據顯示,2026年2月以來,隨著智能體應用OpenClaw等引發token消耗量激增,中國大模型憑借僅為國外競品1/6至1/10的token價格,在全球最大AI API平臺OpenRouter上連續多周超越美國同行。例如,Minimax M2.5模型運行一輪測試成本僅125美元,而Claude Opus 4.6和GPT-5.2-Codex分別高達4970美元和3244美元。

中國廠商的性價比優勢源于兩方面:一是技術架構創新。DeepSeek等企業通過多頭潛在注意力(MLA)、專家混合(MoE)架構等技術壓縮計算資源需求,使模型在受限GPU環境下仍能保持高性能。二是電力成本優勢。據測算,使用中國數據中心電力,單張英偉達B200芯片每年可節省900美元電費,全球范圍內每年潛在節省空間達百億美元。

市場分析指出,推理環節更依賴用戶生態、電力效率與系統調度能力,而非單純追求芯片算力。這一趨勢正在縮小中美在AI基礎設施領域的差距。隨著全球token生成市場規模預計在2027年突破萬億美元,這場關于成本與效率的競爭將愈發激烈。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新