巨人財經 - 專業科技行業財經媒體

阿里發布千問旗艦推理模型Qwen3-Max-Thinking:多項性能刷新全球紀錄

   發布時間:2026-01-28 00:02 作者:趙磊

阿里巴巴正式推出其最新研發的千問旗艦推理模型Qwen3-Max-Thinking,標志著國內人工智能領域取得重大突破。這款模型在多項國際權威評測中刷新紀錄,性能表現已接近國際頂尖水平,成為目前國內最強的AI大模型之一。

據技術團隊介紹,Qwen3-Max-Thinking總參數規模超過萬億級別,預訓練數據量達到36T Tokens,是阿里迄今為止規模最大、能力最強的推理模型。該模型通過大規模強化學習后訓練和多項技術創新,實現了性能的顯著提升,在數學推理、科學知識和代碼編程等關鍵領域展現出卓越能力。

在基準測試中,這款新模型的表現超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等國際知名模型。特別是在數學推理方面,預覽版已在國內首個AIME 25和HMMT 25評測中取得雙滿分成績,正式版通過進一步優化后,在IMO-AnswerBench等國際數學競賽基準測試中繼續保持領先。

技術創新方面,模型引入了自適應工具調用能力和全新的測試時擴展機制。這種機制不同于傳統推理時簡單增加并行路徑的方式,而是能夠對推理結果進行"經驗提取"和自我迭代,在相同上下文中實現更高效的計算。測試數據顯示,該機制使模型在復雜推理任務中的效率提升超過30%。

原生Agent能力是另一大亮點。通過聯合強化學習訓練,模型能夠自主選擇搜索、個性化記憶和代碼解釋器等工具,提供專業水平的回答。技術團隊表示,這種能力使模型在處理復雜任務時更接近人類專家的表現,同時將幻覺率降低了40%以上。

應用落地方面,阿里已開放多渠道體驗。普通用戶可通過PC端和網頁端直接試用,開發者能在QwenChat平臺免費調用API,企業用戶則可通過阿里云百煉服務獲取專業支持。千問APP也即將完成升級,所有用戶都將能免費體驗新模型的強大功能。

回顧發展歷程,阿里Qwen大模型自2022年啟動研發以來,已成長為全球排名領先的開源項目。此次發布的Qwen3-Max作為通義千問家族的最新成員,進一步鞏固了阿里在基礎模型領域的技術優勢。市場反應顯示,消息公布后阿里巴巴港股在次日盤前上漲超過2%,顯示出投資者對這項技術突破的積極預期。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新