林俊旸離職后首談AI：大模型邁向智能體時代，思考模式將迎新變革

發布時間：2026-03-26 23:48 來源：快訊作者：顧青青

前千問大模型技術負責人林俊旸在社交平臺發布長文，首次公開離職后對大模型技術演進方向的深度思考。他指出，2025年上半年行業聚焦于提升模型"推理式思考"能力，即通過延長思考時間優化答案質量，但這種路徑已觸及瓶頸。以OpenAI o1和DeepSeek-R1為代表的模型證明，推理能力可通過特定訓練方式實現，但單純延長推理鏈并不等同于模型智能水平的提升。

林俊旸提出，下一代AI系統應轉向"智能體式思考"模式。這種模式強調模型在真實環境交互中動態調整策略，通過持續接收環境反饋優化行動方案。他以千問團隊2025年初的探索為例，說明構建統一系統面臨的技術挑戰：當試圖融合思考模式與指令模式時，兩種模式的數據分布差異導致模型表現失衡，既無法產生精準思考，也難以執行可靠指令。

實驗數據顯示，強行合并兩種模式會導致系統在兩個維度上均表現平庸。思考行為出現冗余計算，指令執行缺乏清晰性，整體成本超出商業應用預期。這一發現促使團隊在2025年下半年調整策略，推出Qwen 2507版本的獨立Instruct和Thinking模型，分別針對300億和2350億參數規模進行優化。

技術路徑的轉變引發評估體系的重構。傳統推理式思考以內部思辨質量為標準，如定理證明、代碼生成等基準測試；而智能體思維更關注模型在環境交互中的持續進展能力。這要求訓練目標從單一模型轉向"模型+環境"的復合系統，環境設計、多智能體協調、評估器穩定性等要素成為核心考量。

"好的思考應是在真實約束下最能支撐有效行動的軌跡。"林俊旸強調，智能體時代需要建立平滑的推理力度光譜，使模型能根據任務復雜度自動調節計算資源投入。這種轉變標志著行業從訓練靜態模型向訓練動態智能體的范式遷移，其核心挑戰在于構建能夠模擬真實世界復雜性的訓練環境。

千問團隊的實踐顯示，當模型架構、訓練數據與環境設計形成協同效應時，系統在機器人控制、復雜決策等場景中的表現顯著提升。這種技術演進方向正在重塑AI產業鏈，從芯片設計到云服務架構，從數據采集到評估標準，整個生態系統都在適應智能體時代的新要求。

更多>同類內容