巨人財經 - 專業科技行業財經媒體

阿里再推Qwen3.6-Plus:國產編程模型新標桿,展現強大工程交付力

   發布時間:2026-04-02 18:05 作者:吳婷

阿里云近日正式推出新一代大語言模型Qwen3.6-Plus,將其定位為“國產最強編程模型”。這款模型在編程能力評測中表現突出,在智能體編程SWE-bench系列評測和真實世界智能體任務Claw-eval等權威測試中,編程表現超越參數規模達其2至3倍的GLM-5、Kimi-K2.5等同類產品,編程能力已接近全球頂尖的Claude系列模型。

在邏輯推理測試中,Qwen3.6-Plus展現出深度思考能力。面對經典悖論題“甲說乙說謊,乙說丙說謊,丙稱甲乙均說謊,且僅一人說真話”,該模型未采用概率猜測,而是通過“假設—驗證—排除”的完整鏈路逐步推導。它先假設甲說真話進行驗證,發現矛盾后轉向丙的陳述,最終鎖定乙為唯一說真話者。整個過程結構嚴密,每步推導均有依據,體現了真正的邏輯分析能力。

在復雜指令執行測試中,Qwen3.6-Plus同樣表現優異。當被要求“用300字以內寫自我介紹,開頭須為反問句,禁用‘領先、智能、賦能’三詞,結尾需用比喻,語氣模仿資深科技記者”時,該模型精準滿足所有條件。其生成的文本信息密度高、表達克制,既規避了行業術語,又保持了專業記者的敘事風格,完全擺脫了傳統AI輸出的機械感,達到可直接作為商業稿件發布的標準。

工程交付能力測試進一步驗證了Qwen3.6-Plus的實用性。面對“開發具備選題、生成、打分功能的AI短視頻腳本工具網站”的需求,該模型未局限于代碼生成,而是從產品架構層面進行系統設計。它首先拆解宏觀需求,明確目標用戶與核心功能模塊,隨后規劃技術棧選型、前后端分離方案及數據流轉機制,完整設計了用戶從選題到優化的全流程。模型還提供了交互提示詞設計、接口代碼示例及部署成本優化建議,展現出從創意到落地的完整產品化能力。

行業分析認為,Qwen3.6-Plus的發布標志著國產大模型評價標準從“知識廣度”和“趣味性”轉向“穩定性”與“工程化”。當AI模型能夠像資深員工一樣獨立完成任務拆解、規避業務風險并輸出系統性方案時,其角色已從對話輔助工具升級為獨立的數字生產單元。在數字勞動力快速普及的背景下,企業與個人的核心競爭力正轉向如何高效整合和利用這些智能資源。

目前,Qwen3.6-Plus已上線阿里云百煉平臺,輸入價格低至每百萬Tokens 2元;千問3.6基礎版則通過悟空、千問APP等渠道向開發者和個人用戶開放體驗。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新