原阿里Qwen后訓練負責人郁博文離職后，正式加入字節Seed團隊強化多模態布局

發布時間：2026-03-12 15:05 來源：快訊作者：陳麗

近日，科技行業傳來一則重磅人事變動消息：原阿里巴巴通義實驗室Qwen（千問）大模型后訓練負責人郁博文，已正式入職字節跳動，出任Seed團隊視覺模型與多模態交互團隊后訓練負責人。這一變動引發了業界對大模型技術發展方向的廣泛關注。

郁博文擁有深厚的學術背景，本科就讀于中南大學，隨后在中國科學院信息工程研究所攻讀研究生，并于2022年獲得中國科學院大學博士學位。在校期間，他專注于自然語言處理與信息抽取領域的研究，曾在ACL、EMNLP等國際頂級學術會議上發表多篇論文。他創新性地將信息抽取任務轉化為圖結構問題，有效解決了實體重疊、嵌套等復雜場景下的識別難題，并因此榮獲中國科學院院長獎。

2022年博士畢業后，郁博文以阿里集團最高級別校招項目“阿里星”的身份加入阿里巴巴達摩院，擔任算法專家（P7）。他迅速成長為通義千問大模型團隊的核心成員，深度參與了該模型的早期訓練與研發工作，并最終擔任后訓練負責人。在后訓練領域，郁博文展現出卓越的技術能力，主導了Qwen系列Chat模型的研發工作。他通過監督微調（SFT）、強化學習（RLHF）、直接偏好優化（DPO）等技術手段，將通用大模型轉化為符合人類價值觀和使用習慣的對話模型。

針對不同規模的模型，郁博文設計了“四階段進化論”和“知識蒸餾”策略，使Qwen模型在長文本生成、復雜推理及多模態理解等任務上表現出色。在LMSYS Chatbot Arena等全球權威評測中，Qwen系列多次躋身前十，彰顯了其技術實力。然而，2026年3月，阿里通義實驗室啟動組織架構調整，計劃將原本垂直整合的Qwen團隊拆分為預訓練、后訓練、文本、多模態等多個平行模塊。這一調整導致郁博文的管理范圍大幅縮小，且與其堅持的“預訓練與后訓練必須深度耦合”的技術理念產生沖突。阿里高層對千問團隊施加的商業化考核壓力，也加劇了團隊內部的分歧。

2026年3月3日，郁博文提交了辭職申請，并于次日正式離職。他的工作由前Google DeepMind高級資深研究員周浩接任。郁博文的離職，被視為阿里大模型團隊在技術路線與商業化壓力下的一次重要調整。

與此同時，字節跳動Seed團隊近年來在大模型和多模態領域持續加大投入，取得了顯著進展。郁博文的加入，無疑將為Seed團隊注入新的技術活力。他在視覺與多模態交互方面的后訓練經驗，將有助于字節跳動進一步提升其大模型的技術水平，推動公司在AI領域的布局向更深層次發展。此次人事變動，也反映出科技行業在激烈競爭中，對頂尖技術人才的爭奪愈發激烈。

更多>同類內容