阿里發布萬億參數千問旗艦推理模型Qwen3-Max-Thinking 性能效率雙提升

發布時間：2026-01-27 21:01 來源：快訊作者：吳俊

阿里巴巴正式推出其最新研發的千問旗艦推理模型Qwen3-Max-Thinking，標志著該公司在人工智能領域又邁出重要一步。這款模型擁有超過萬億參數，預訓練數據量達到36T Tokens，成為阿里迄今為止規模最大、性能最強的推理模型。

開發者現在可以通過QwenChat平臺免費體驗Qwen3-Max-Thinking模型，企業用戶則可通過阿里云百煉平臺獲取該模型的API服務。普通用戶也能在千問PC端和網頁端試用這一強大模型，千問APP也即將完成新模型的接入，屆時所有用戶均可免費體驗其卓越性能。

在性能方面，Qwen3-Max-Thinking表現尤為突出。預覽版模型已在數學推理AIME 25和HMMT 25測試中斬獲國內首個雙滿分，展現了驚人的推理能力。經過更大規模的強化學習后訓練，正式版模型的性能得到全面提升，特別是在推理效率方面實現了重大突破。

該模型采用了一種創新的測試時擴展（Test-time Scaling）機制，能夠從之前的推理結果中提取"經驗"并進行多輪自我迭代。這種機制避免了傳統推理計算中常見的冗余推導，在相同上下文中實現了更高效的推理計算，從而獲得更智能的推理結果。基于這一技術創新，千問在"人類最后的測試"HLE中取得58.3分的優異成績，遠超GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分，創下當前所有模型的最高分。

面向即將到來的智能體Agent時代，Qwen3-Max-Thinking還顯著增強了自主調用工具的原生Agent能力。這一改進使模型能夠更自主地完成復雜任務，為未來智能應用的發展奠定了堅實基礎。

在太空應用領域，千問大模型也取得了突破性進展。2025年11月，國星宇航成功將千問Qwen3大模型部署至"星算"計劃01組太空計算中心，這是全球首次實現在軌運行的衛星上部署通用大模型。該模型在太空中成功執行多次端到端推理任務，從地面上傳問題到衛星，由大模型完成在軌推理，再將結果數據回傳地面，整個過程耗時不到2分鐘。

在開源社區方面，千問系列模型同樣表現亮眼。全球最大AI開源社區Hugging Face最新數據顯示，阿里千問衍生模型數量已突破20萬個，成為全球首個達成此目標的開源大模型。同時，千問系列模型下載量突破10億次，平均每天被下載110萬次，下載量已全面超越美國Llama模型，穩居開源大模型全球第一的位置。

更多>同類內容