阿里再推Qwen3.6-Plus：國產編程模型新標桿，展現強大工程交付力

發布時間：2026-04-02 18:05 來源：快訊作者：吳婷

阿里云近日正式推出新一代大語言模型Qwen3.6-Plus，將其定位為“國產最強編程模型”。這款模型在編程能力評測中表現突出，在智能體編程SWE-bench系列評測和真實世界智能體任務Claw-eval等權威測試中，編程表現超越參數規模達其2至3倍的GLM-5、Kimi-K2.5等同類產品，編程能力已接近全球頂尖的Claude系列模型。

在邏輯推理測試中，Qwen3.6-Plus展現出深度思考能力。面對經典悖論題“甲說乙說謊，乙說丙說謊，丙稱甲乙均說謊，且僅一人說真話”，該模型未采用概率猜測，而是通過“假設—驗證—排除”的完整鏈路逐步推導。它先假設甲說真話進行驗證，發現矛盾后轉向丙的陳述，最終鎖定乙為唯一說真話者。整個過程結構嚴密，每步推導均有依據，體現了真正的邏輯分析能力。

在復雜指令執行測試中，Qwen3.6-Plus同樣表現優異。當被要求“用300字以內寫自我介紹，開頭須為反問句，禁用‘領先、智能、賦能’三詞，結尾需用比喻，語氣模仿資深科技記者”時，該模型精準滿足所有條件。其生成的文本信息密度高、表達克制，既規避了行業術語，又保持了專業記者的敘事風格，完全擺脫了傳統AI輸出的機械感，達到可直接作為商業稿件發布的標準。

工程交付能力測試進一步驗證了Qwen3.6-Plus的實用性。面對“開發具備選題、生成、打分功能的AI短視頻腳本工具網站”的需求，該模型未局限于代碼生成，而是從產品架構層面進行系統設計。它首先拆解宏觀需求，明確目標用戶與核心功能模塊，隨后規劃技術棧選型、前后端分離方案及數據流轉機制，完整設計了用戶從選題到優化的全流程。模型還提供了交互提示詞設計、接口代碼示例及部署成本優化建議，展現出從創意到落地的完整產品化能力。

行業分析認為，Qwen3.6-Plus的發布標志著國產大模型評價標準從“知識廣度”和“趣味性”轉向“穩定性”與“工程化”。當AI模型能夠像資深員工一樣獨立完成任務拆解、規避業務風險并輸出系統性方案時，其角色已從對話輔助工具升級為獨立的數字生產單元。在數字勞動力快速普及的背景下，企業與個人的核心競爭力正轉向如何高效整合和利用這些智能資源。

目前，Qwen3.6-Plus已上線阿里云百煉平臺，輸入價格低至每百萬Tokens 2元；千問3.6基礎版則通過悟空、千問APP等渠道向開發者和個人用戶開放體驗。

更多>同類內容