阿里巴巴正式推出新一代開源大模型千問Qwen3.5-Plus,在性能指標上與Gemini 3 Pro持平,成為全球最強的開源模型。該模型總參數達3970億,但實際激活參數僅170億,通過架構創新實現了以小博大的技術突破。相較于萬億參數的Qwen3-Max,新模型不僅性能更優,部署顯存占用降低60%,推理吞吐量最高可提升19倍,API調用成本每百萬Token僅0.8元,僅為Gemini 3 Pro的十八分之一。
千問3.5系列最顯著的技術革新在于從純文本模型向原生多模態模型的跨越。不同于前代僅基于文本token訓練,新模型采用視覺與文本混合預訓練方式,新增中英文、多語言、STEM學科及推理數據,使模型具備"觀察"世界的能力。在MMLU-Pro知識推理評測中取得87.8分,超越GPT-5.2;博士級難題GPQA測評達88.4分,優于Claude 4.5;指令遵循IFBench以76.5分刷新紀錄,在通用Agent、搜索Agent等基準測試中全面領先Gemini 3 Pro和GPT-5.2。
視覺能力的飛躍成為千問3.5的核心優勢。在多模態推理、視覺問答、文本識別、空間智能、視頻理解等權威評測中均取得最佳成績。該模型支持長達2小時(100萬token上下文)的視頻直接輸入,可完成長視頻內容分析與摘要生成。更突破性地將視覺理解與代碼能力融合,通過圖搜和生圖工具,能將手繪界面草圖直接轉換為前端代碼,或通過截圖定位修復UI問題,使視覺編程成為實用生產力工具。在學科解題、任務規劃等場景中,其空間定位和帶圖推理能力較專項模型Qwen3-VL提升顯著。
模型效率的革命性提升源于架構創新。研究團隊將斬獲2025 NeurIPS最佳論文的門控技術,與線性注意力機制、稀疏混合專家(MoE)架構深度融合,在保持3970億總參數規模的同時,將激活參數壓縮至170億。通過訓練穩定優化和多token預測技術,在32K常用上下文場景中推理吞吐量提升8.6倍,256K超長上下文場景下最高提升19倍。阿里云AI基礎設施的創新支持,使混合數據訓練吞吐量接近純文本模型水平,FP8/FP32精度策略在訓練數十萬億token時,內存占用減少50%,訓練速度提升10%。
在Agent應用領域,千問3.5實現重大突破。模型可自主操作手機電腦完成復雜任務,移動端支持更多主流應用與指令,PC端能處理跨應用數據整理、自動化流程等高階操作。團隊構建的異步強化學習框架將端到端加速比提升至3-5倍,插件式智能體支持規模擴展至百萬級。1月15日上線的全球首個消費級AI購物Agent,在春節期間6天內協助用戶完成1.2億筆訂單交易,驗證了大規模真實場景商業化能力。
自2023年開源以來,千問系列已發布400余個模型,覆蓋全尺寸、全模態領域,全球下載量突破10億次,單月下載量超過DeepSeek、meta、OpenAI等企業2至8倍的總和。開發者基于千問開發的衍生模型超20萬個,形成全球最大開源生態。為滿足多語言需求,千問3.5擴展支持201種語言,詞表規模從15萬增至25萬,小語種編碼效率最高提升60%。目前千問APP和PC端已接入Qwen3.5-Plus,開發者可通過魔搭社區、HuggingFace下載模型,或通過阿里云百煉平臺調用API服務。據悉,阿里將持續開源不同規格的千問3.5系列模型,性能更強的旗艦版Qwen3.5-Max即將發布。























