在AI編程能力的全球競技場上,中國科技企業再次展現強勁實力。國際權威盲測平臺LMArena旗下Code Arena榜單最新一期結果顯示,阿里巴巴自主研發的Qwen 3.6-Plus大語言模型以1452分的成績躍居全球第二,成為該榜單中排名最高的中國大模型。這一突破性成果標志著國產AI模型在工程化開發領域已具備與國際頂尖技術正面競爭的實力。
作為AI領域最具公信力的評測體系之一,LMArena通過真實用戶盲測和實時對抗機制構建評價體系。其React專項榜單聚焦AI模型在復雜Web開發場景中的自主編碼能力,要求模型獨立完成從項目初始化到調試運行的全流程開發。這種評測方式突破傳統代碼補全測試的局限,更強調工程思維與端到端開發能力的綜合考察,被視為當前AI Coding領域最具挑戰性的技術方向。
Qwen 3.6-Plus于4月2日正式發布,憑借原生多模態理解與推理能力,在代碼生成和Agent技術方面表現尤為突出。該模型在多項權威編程評測中持續領先,以更少的參數量實現超越GLM-5、Kimi-K2.5等參數量翻倍甚至三倍模型的性能表現。此次在React榜單中,Qwen 3.6-Plus以4分優勢領先OpenAI最新發布的GPT-5.0-High,與Anthropic旗下Claude-Opus-4.6-Thinking的差距縮小至88分,展現出國產模型在工程化開發領域的顯著進步。
在Code Arena綜合榜單中,Qwen 3.6-Plus同樣穩居國產模型首位。這一成績推動阿里巴巴在全球AI實驗室排名中升至第四位,緊隨Anthropic、OpenAI和Google之后。值得注意的是,該模型發布首日即在開發者社區引發強烈反響,次日便以黑馬姿態沖入React榜單前三,其快速迭代能力與技術落地效率獲得行業高度認可。
據技術團隊透露,Qwen 3.6-Plus作為千問3.6系列的首發模型,后續將開源多個不同參數規模的版本。性能更強的旗艦模型Qwen3.6-Max已進入最終測試階段,預計將于近期正式發布。這一系列布局顯示阿里巴巴正通過開源生態建設與前沿技術研發雙輪驅動,持續鞏固其在AI工程化領域的領先地位。






















