英偉達創始人兼CEO黃仁勛在近日舉行的GTC大會上發表主題演講,宣布公司正從“芯片公司”向“AI基礎設施和工廠公司”轉型。他提出“Token工廠經濟學”概念,詳細闡述了驅動未來AI增長的底層商業邏輯,并預測到2027年全球AI基礎設施市場規模將達到至少1萬億美元。
黃仁勛指出,隨著AI大模型從感知、生成向推理和行動任務進化,全球AI計算需求呈指數級增長。他透露,英偉達去年預測到2026年有5000億美元需求,如今這一數字已上調至2027年的1萬億美元,且實際需求可能更高。這一預期推動英偉達股價在演講后一度上漲超4.3%。
英偉達的系統已證明自己是全球“成本最低的基礎設施”,能夠運行幾乎所有領域的AI模型。目前,公司60%的業務來自超大型云服務商,其余40%則分布在主權云、企業、工業、機器人和邊緣計算等領域。黃仁勛強調,這種通用性使客戶投入的1萬億美元能夠被充分利用并保持長久的生命周期。
為了解釋萬億需求的合理性,黃仁勛提出“Token工廠”概念。他指出,未來的數據中心將不再是存儲文件的倉庫,而是生產Token的工廠。在電力限制下,每瓦性能將成為決定商業命脈的關鍵因素。英偉達將AI服務分為免費層、中級層、高級層、高速層和超高速層五個商業層級,定價從每百萬Token 3美元到150美元不等。
黃仁勛展示了英偉達最新的AI計算系統Vera Rubin。該系統采用100%液冷設計,安裝時間從兩天縮短至兩小時。通過極致的端到端軟硬件協同設計,Vera Rubin在兩年內將Token生成速率從2200萬提升至7億,實現了350倍的增長,遠超摩爾定律的1.5倍提升。
為解決極速推理條件下的帶寬瓶頸,英偉達整合了被收購公司Groq的技術,采用非對稱式分離推理方案。Groq芯片擁有500MB的SRAM,而Rubin芯片則配備288GB內存。通過Dynamo軟件系統,英偉達將預填充階段交給Vera Rubin處理,將解碼階段交給Groq處理。黃仁勛建議,高吞吐工作負載可100%使用Vera Rubin,而高價值編程級Token生成需求則可拿出25%的數據中心規模給Groq。
在硬件創新之外,黃仁勛還重點介紹了AI軟件和生態的革命。他將開源項目OpenClaw形容為“人類歷史上最受歡迎的開源項目”,稱其僅用幾周時間就超越了Linux在過去30年取得的成就。OpenClaw本質上是一個智能體計算機的“操作系統”,能夠管理資源、執行調度、分解問題并調用子智能體。
黃仁勛斷言,每一個SaaS公司都將變成AaaS(Agent-as-a-Service)公司。為幫助企業安全落地智能體技術,英偉達推出了企業級的NeMo Claw參考設計,增加了策略引擎和隱私路由器。對于普通職場人,黃仁勛描繪了未來職場新形態:工程師將擁有年度Token預算,基礎年薪外再配給相當于薪資一半的token額度,以實現10倍效率提升。
演講最后,黃仁勛“劇透”了下一代計算架構Feynman,它將首次實現銅線與CPO的共同水平擴展。更引人遐想的是,英偉達正在研發部署在太空的數據中心計算機“Vera Rubin Space-1”,徹底打開了AI算力向地球之外延伸的想象空間。






















