阿里發布千問旗艦推理模型Qwen3-Max-Thinking：多項性能刷新全球紀錄

發布時間：2026-01-28 00:02 來源：快訊作者：趙磊

阿里巴巴正式推出其最新研發的千問旗艦推理模型Qwen3-Max-Thinking，標志著國內人工智能領域取得重大突破。這款模型在多項國際權威評測中刷新紀錄，性能表現已接近國際頂尖水平，成為目前國內最強的AI大模型之一。

據技術團隊介紹，Qwen3-Max-Thinking總參數規模超過萬億級別，預訓練數據量達到36T Tokens，是阿里迄今為止規模最大、能力最強的推理模型。該模型通過大規模強化學習后訓練和多項技術創新，實現了性能的顯著提升，在數學推理、科學知識和代碼編程等關鍵領域展現出卓越能力。

在基準測試中，這款新模型的表現超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等國際知名模型。特別是在數學推理方面，預覽版已在國內首個AIME 25和HMMT 25評測中取得雙滿分成績，正式版通過進一步優化后，在IMO-AnswerBench等國際數學競賽基準測試中繼續保持領先。

技術創新方面，模型引入了自適應工具調用能力和全新的測試時擴展機制。這種機制不同于傳統推理時簡單增加并行路徑的方式，而是能夠對推理結果進行"經驗提取"和自我迭代，在相同上下文中實現更高效的計算。測試數據顯示，該機制使模型在復雜推理任務中的效率提升超過30%。

原生Agent能力是另一大亮點。通過聯合強化學習訓練，模型能夠自主選擇搜索、個性化記憶和代碼解釋器等工具，提供專業水平的回答。技術團隊表示，這種能力使模型在處理復雜任務時更接近人類專家的表現，同時將幻覺率降低了40%以上。

應用落地方面，阿里已開放多渠道體驗。普通用戶可通過PC端和網頁端直接試用，開發者能在QwenChat平臺免費調用API，企業用戶則可通過阿里云百煉服務獲取專業支持。千問APP也即將完成升級，所有用戶都將能免費體驗新模型的強大功能。

回顧發展歷程，阿里Qwen大模型自2022年啟動研發以來，已成長為全球排名領先的開源項目。此次發布的Qwen3-Max作為通義千問家族的最新成員，進一步鞏固了阿里在基礎模型領域的技術優勢。市場反應顯示，消息公布后阿里巴巴港股在次日盤前上漲超過2%，顯示出投資者對這項技術突破的積極預期。

更多>同類內容