巨人財經 - 專業科技行業財經媒體

林俊旸離職后首談AI:大模型邁向智能體時代,思考模式將迎新變革

   發布時間:2026-03-26 23:48 作者:顧青青

前千問大模型技術負責人林俊旸在社交平臺發布長文,首次公開離職后對大模型技術演進方向的深度思考。他指出,2025年上半年行業聚焦于提升模型"推理式思考"能力,即通過延長思考時間優化答案質量,但這種路徑已觸及瓶頸。以OpenAI o1和DeepSeek-R1為代表的模型證明,推理能力可通過特定訓練方式實現,但單純延長推理鏈并不等同于模型智能水平的提升。

林俊旸提出,下一代AI系統應轉向"智能體式思考"模式。這種模式強調模型在真實環境交互中動態調整策略,通過持續接收環境反饋優化行動方案。他以千問團隊2025年初的探索為例,說明構建統一系統面臨的技術挑戰:當試圖融合思考模式與指令模式時,兩種模式的數據分布差異導致模型表現失衡,既無法產生精準思考,也難以執行可靠指令。

實驗數據顯示,強行合并兩種模式會導致系統在兩個維度上均表現平庸。思考行為出現冗余計算,指令執行缺乏清晰性,整體成本超出商業應用預期。這一發現促使團隊在2025年下半年調整策略,推出Qwen 2507版本的獨立Instruct和Thinking模型,分別針對300億和2350億參數規模進行優化。

技術路徑的轉變引發評估體系的重構。傳統推理式思考以內部思辨質量為標準,如定理證明、代碼生成等基準測試;而智能體思維更關注模型在環境交互中的持續進展能力。這要求訓練目標從單一模型轉向"模型+環境"的復合系統,環境設計、多智能體協調、評估器穩定性等要素成為核心考量。

"好的思考應是在真實約束下最能支撐有效行動的軌跡。"林俊旸強調,智能體時代需要建立平滑的推理力度光譜,使模型能根據任務復雜度自動調節計算資源投入。這種轉變標志著行業從訓練靜態模型向訓練動態智能體的范式遷移,其核心挑戰在于構建能夠模擬真實世界復雜性的訓練環境。

千問團隊的實踐顯示,當模型架構、訓練數據與環境設計形成協同效應時,系統在機器人控制、復雜決策等場景中的表現顯著提升。這種技術演進方向正在重塑AI產業鏈,從芯片設計到云服務架構,從數據采集到評估標準,整個生態系統都在適應智能體時代的新要求。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新