螞蟻集團再突破！開源萬億參數混合線性思考模型數學競賽達金牌水準

發布時間：2026-02-14 03:02 來源：快訊作者：李娜

螞蟻集團近日宣布開源全球首個基于混合線性架構的萬億參數思考模型——Ring-2.5-1T。該模型在生成效率、推理深度和長時程任務執行能力三大核心指標上實現突破，尤其在數學競賽、長文本生成和智能體任務處理領域達到開源模型領先水平，標志著大模型技術向復雜場景應用邁出關鍵一步。

在數學推理能力驗證中，Ring-2.5-1T展現出卓越表現。該模型在國際數學奧林匹克競賽（IMO 2025）自測中取得35分（滿分42分），中國數學奧林匹克（CMO 2025）自測更以105分（滿分126分）遠超金牌分數線。研究人員通過對比發現，新模型在推理邏輯嚴謹性、高級數學證明技術應用及答案完整性方面較前代Ring-1T有顯著提升。在編程與邏輯推理基準測試中，該模型在LiveCodeBench-v6代碼生成、HMMT-25數學競賽等任務中均超越DeepSeek-v3.2-Thinking、Kimi-K2.5-Thinking等開源模型及GPT-5.2-thinking-high等閉源系統。

針對長時程任務處理，Ring-2.5-1T通過大規模異步智能體強化學習訓練，在Gaia2-search智能體搜索任務中取得開源模型最優性能。該任務要求模型協調跨應用工具完成復雜操作，新模型在規劃生成與多步工具調用效率上較前代提升40%。在軟件工程基準測試中，其于SWE-Bench Verified任務中的表現超越Claude-Opus-4.5-Extended-Thinking等主流模型，展現出解決實際工程問題的潛力。

技術架構層面，Ring-2.5-1T基于創新的Ling 2.5混合線性注意力機制，將內存訪問開銷降低至前代的1/10。通過將分組查詢注意力（GQA）升級為1:7比例的多頭線性注意力（MLA）與Lightning Linear結構組合，模型在32K以上長文本生成場景中吞吐量提升3倍。實驗數據顯示，在配備8塊H200 GPU的服務器上，當生成長度超過16K token時，其解碼效率較Kimi K2架構提升65%，且優勢隨文本長度增加持續擴大。

該模型激活參數規模從51B擴展至63B，但通過優化KV緩存壓縮技術，在保持推理效率的同時降低了計算資源消耗。研究人員特別改進了查詢-核歸一化（QK Norm）與部分旋轉位置編碼（Partial RoPE）機制，使模型在處理超長序列時仍能維持穩定性能。目前，Ring-2.5-1T的模型權重與推理代碼已在Hugging Face、ModelScope等平臺開放下載，官方API服務與交互體驗頁面將于近期上線。

在應用適配方面，新模型已實現與Claude Code智能體編程框架及OpenClaw個人AI助手的無縫對接，支持多步規劃與工具鏈調用。技術團隊透露，通過底層架構創新，Ring-2.5-1T有效解決了傳統模型在長文檔處理、跨文件代碼理解等場景中面臨的算力成本高、響應延遲大等難題，為金融、法律、科研等需要深度推理的行業提供了高性能技術方案。

更多>同類內容