巨人財經 - 專業科技行業財經媒體

原阿里Qwen后訓練負責人郁博文離職后,正式加入字節Seed團隊強化多模態布局

   發布時間:2026-03-12 15:05 作者:陳麗

近日,科技行業傳來一則重磅人事變動消息:原阿里巴巴通義實驗室Qwen(千問)大模型后訓練負責人郁博文,已正式入職字節跳動,出任Seed團隊視覺模型與多模態交互團隊后訓練負責人。這一變動引發了業界對大模型技術發展方向的廣泛關注。

郁博文擁有深厚的學術背景,本科就讀于中南大學,隨后在中國科學院信息工程研究所攻讀研究生,并于2022年獲得中國科學院大學博士學位。在校期間,他專注于自然語言處理與信息抽取領域的研究,曾在ACL、EMNLP等國際頂級學術會議上發表多篇論文。他創新性地將信息抽取任務轉化為圖結構問題,有效解決了實體重疊、嵌套等復雜場景下的識別難題,并因此榮獲中國科學院院長獎。

2022年博士畢業后,郁博文以阿里集團最高級別校招項目“阿里星”的身份加入阿里巴巴達摩院,擔任算法專家(P7)。他迅速成長為通義千問大模型團隊的核心成員,深度參與了該模型的早期訓練與研發工作,并最終擔任后訓練負責人。在后訓練領域,郁博文展現出卓越的技術能力,主導了Qwen系列Chat模型的研發工作。他通過監督微調(SFT)、強化學習(RLHF)、直接偏好優化(DPO)等技術手段,將通用大模型轉化為符合人類價值觀和使用習慣的對話模型。

針對不同規模的模型,郁博文設計了“四階段進化論”和“知識蒸餾”策略,使Qwen模型在長文本生成、復雜推理及多模態理解等任務上表現出色。在LMSYS Chatbot Arena等全球權威評測中,Qwen系列多次躋身前十,彰顯了其技術實力。然而,2026年3月,阿里通義實驗室啟動組織架構調整,計劃將原本垂直整合的Qwen團隊拆分為預訓練、后訓練、文本、多模態等多個平行模塊。這一調整導致郁博文的管理范圍大幅縮小,且與其堅持的“預訓練與后訓練必須深度耦合”的技術理念產生沖突。阿里高層對千問團隊施加的商業化考核壓力,也加劇了團隊內部的分歧。

2026年3月3日,郁博文提交了辭職申請,并于次日正式離職。他的工作由前Google DeepMind高級資深研究員周浩接任。郁博文的離職,被視為阿里大模型團隊在技術路線與商業化壓力下的一次重要調整。

與此同時,字節跳動Seed團隊近年來在大模型和多模態領域持續加大投入,取得了顯著進展。郁博文的加入,無疑將為Seed團隊注入新的技術活力。他在視覺與多模態交互方面的后訓練經驗,將有助于字節跳動進一步提升其大模型的技術水平,推動公司在AI領域的布局向更深層次發展。此次人事變動,也反映出科技行業在激烈競爭中,對頂尖技術人才的爭奪愈發激烈。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新