智譜GLM-5.1模型發布：8小時持續工作，代碼能力與長程任務表現亮眼

發布時間：2026-04-08 15:05 來源：快訊作者：孫明

近日，一款名為GLM-5.1的人工智能模型正式亮相，憑借其在代碼處理和長程任務執行領域的突破性表現引發行業關注。與傳統模型僅能維持分鐘級交互不同，該模型可獨立持續工作超過8小時，期間自主完成從任務規劃到成果交付的全流程，展現出工程級應用潛力。

在權威代碼評測基準測試中，GLM-5.1在SWE-Bench Pro、Terminal-Bench 2.0及NL2Repo等平臺均躋身前列。研發團隊透露，該模型已具備參與專業軟件開發的能力，能夠直接在GitHub真實代碼庫中定位并修復工程缺陷。這種突破性能力源于模型對長程任務執行模式的重構，其核心指標從傳統"智能程度"轉向"持續工作時長"，形成"實驗-分析-優化"的閉環迭代機制。

實際應用場景中，GLM-5.1在8小時工作周期內完成了多項復雜工程：從零構建包含完整桌面環境、窗口管理器及應用程序的Linux系統，全程執行超1200個操作步驟，生成4.8MB配套文件。據評估，這項工作相當于4人開發團隊一周的工作量。在向量數據庫優化任務中，模型通過655次自主迭代完成全庫掃描到剪枝優化的完整鏈條，使查詢吞吐量從初始的3108 QPS提升至21472 QPS。在機器學習模型負載優化領域，其經過24小時持續迭代和1000輪工具調用，最終實現3.6倍的幾何平均加速比。

研發團隊指出，延長模型有效工作時長是提升智能體能力的關鍵路徑，但這條技術路線仍面臨多重挑戰：包括如何緩解復雜任務中的上下文過載問題、如何在數千次工具調用后維持執行一致性、如何突破局部最優解陷阱，以及在缺乏明確數值指標的任務中建立可靠的自我評估體系。這些技術瓶頸的突破，將直接影響人工智能從實驗室走向產業應用的進程。

更多>同類內容