阿里巴巴正式推出其最新研發的千問旗艦推理模型Qwen3-Max-Thinking,標志著該公司在人工智能領域又邁出重要一步。這款模型擁有超過萬億參數,預訓練數據量達到36T Tokens,成為阿里迄今為止規模最大、性能最強的推理模型。
開發者現在可以通過QwenChat平臺免費體驗Qwen3-Max-Thinking模型,企業用戶則可通過阿里云百煉平臺獲取該模型的API服務。普通用戶也能在千問PC端和網頁端試用這一強大模型,千問APP也即將完成新模型的接入,屆時所有用戶均可免費體驗其卓越性能。
在性能方面,Qwen3-Max-Thinking表現尤為突出。預覽版模型已在數學推理AIME 25和HMMT 25測試中斬獲國內首個雙滿分,展現了驚人的推理能力。經過更大規模的強化學習后訓練,正式版模型的性能得到全面提升,特別是在推理效率方面實現了重大突破。
該模型采用了一種創新的測試時擴展(Test-time Scaling)機制,能夠從之前的推理結果中提取"經驗"并進行多輪自我迭代。這種機制避免了傳統推理計算中常見的冗余推導,在相同上下文中實現了更高效的推理計算,從而獲得更智能的推理結果。基于這一技術創新,千問在"人類最后的測試"HLE中取得58.3分的優異成績,遠超GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,創下當前所有模型的最高分。
面向即將到來的智能體Agent時代,Qwen3-Max-Thinking還顯著增強了自主調用工具的原生Agent能力。這一改進使模型能夠更自主地完成復雜任務,為未來智能應用的發展奠定了堅實基礎。
在太空應用領域,千問大模型也取得了突破性進展。2025年11月,國星宇航成功將千問Qwen3大模型部署至"星算"計劃01組太空計算中心,這是全球首次實現在軌運行的衛星上部署通用大模型。該模型在太空中成功執行多次端到端推理任務,從地面上傳問題到衛星,由大模型完成在軌推理,再將結果數據回傳地面,整個過程耗時不到2分鐘。
在開源社區方面,千問系列模型同樣表現亮眼。全球最大AI開源社區Hugging Face最新數據顯示,阿里千問衍生模型數量已突破20萬個,成為全球首個達成此目標的開源大模型。同時,千問系列模型下載量突破10億次,平均每天被下載110萬次,下載量已全面超越美國Llama模型,穩居開源大模型全球第一的位置。




















