阿里開源千問Qwen3.5-Plus：性能比肩Gemini 3 Pro，推理效率大幅提升

發布時間：2026-02-16 21:16 來源：快訊作者：趙靜

阿里巴巴正式推出新一代開源大模型千問Qwen3.5-Plus，在性能指標上與Gemini 3 Pro持平，成為全球最強的開源模型。該模型總參數達3970億，但實際激活參數僅170億，通過架構創新實現了以小博大的技術突破。相較于萬億參數的Qwen3-Max，新模型不僅性能更優，部署顯存占用降低60%，推理吞吐量最高可提升19倍，API調用成本每百萬Token僅0.8元，僅為Gemini 3 Pro的十八分之一。

千問3.5系列最顯著的技術革新在于從純文本模型向原生多模態模型的跨越。不同于前代僅基于文本token訓練，新模型采用視覺與文本混合預訓練方式，新增中英文、多語言、STEM學科及推理數據，使模型具備"觀察"世界的能力。在MMLU-Pro知識推理評測中取得87.8分，超越GPT-5.2；博士級難題GPQA測評達88.4分，優于Claude 4.5；指令遵循IFBench以76.5分刷新紀錄，在通用Agent、搜索Agent等基準測試中全面領先Gemini 3 Pro和GPT-5.2。

視覺能力的飛躍成為千問3.5的核心優勢。在多模態推理、視覺問答、文本識別、空間智能、視頻理解等權威評測中均取得最佳成績。該模型支持長達2小時（100萬token上下文）的視頻直接輸入，可完成長視頻內容分析與摘要生成。更突破性地將視覺理解與代碼能力融合，通過圖搜和生圖工具，能將手繪界面草圖直接轉換為前端代碼，或通過截圖定位修復UI問題，使視覺編程成為實用生產力工具。在學科解題、任務規劃等場景中，其空間定位和帶圖推理能力較專項模型Qwen3-VL提升顯著。

模型效率的革命性提升源于架構創新。研究團隊將斬獲2025 NeurIPS最佳論文的門控技術，與線性注意力機制、稀疏混合專家（MoE）架構深度融合，在保持3970億總參數規模的同時，將激活參數壓縮至170億。通過訓練穩定優化和多token預測技術，在32K常用上下文場景中推理吞吐量提升8.6倍，256K超長上下文場景下最高提升19倍。阿里云AI基礎設施的創新支持，使混合數據訓練吞吐量接近純文本模型水平，FP8/FP32精度策略在訓練數十萬億token時，內存占用減少50%，訓練速度提升10%。

在Agent應用領域，千問3.5實現重大突破。模型可自主操作手機電腦完成復雜任務，移動端支持更多主流應用與指令，PC端能處理跨應用數據整理、自動化流程等高階操作。團隊構建的異步強化學習框架將端到端加速比提升至3-5倍，插件式智能體支持規模擴展至百萬級。1月15日上線的全球首個消費級AI購物Agent，在春節期間6天內協助用戶完成1.2億筆訂單交易，驗證了大規模真實場景商業化能力。

自2023年開源以來，千問系列已發布400余個模型，覆蓋全尺寸、全模態領域，全球下載量突破10億次，單月下載量超過DeepSeek、meta、OpenAI等企業2至8倍的總和。開發者基于千問開發的衍生模型超20萬個，形成全球最大開源生態。為滿足多語言需求，千問3.5擴展支持201種語言，詞表規模從15萬增至25萬，小語種編碼效率最高提升60%。目前千問APP和PC端已接入Qwen3.5-Plus，開發者可通過魔搭社區、HuggingFace下載模型，或通過阿里云百煉平臺調用API服務。據悉，阿里將持續開源不同規格的千問3.5系列模型，性能更強的旗艦版Qwen3.5-Max即將發布。

更多>同類內容