巨人財經 - 專業科技行業財經媒體

百度文心Moment大會啟幕 文心5.0正式發布 引領AI應用新變革

   發布時間:2026-01-23 06:02 作者:孫雅

百度近日正式推出原生全模態大模型文心5.0,標志著其在人工智能領域的技術突破邁入新階段。該模型采用統一的自回歸架構進行原生全模態建模,將文本、圖像、視頻、音頻等多源數據在同一框架下聯合訓練,實現了真正的多模態統一理解與生成。與傳統的“后期融合”方案不同,這一技術路線使多模態特征在統一架構下充分融合,避免了拼接式處理的局限性。

文心5.0的參數規模達2.4萬億,通過超大規模混合專家結構實現超稀疏激活,激活參數比低于3%,在保持強大能力的同時顯著提升了推理效率。模型還引入了基于思維鏈和行動鏈的端到端多輪強化學習訓練方法,結合大規模工具環境合成的長程任務軌跡數據,大幅增強了智能體和工具調用能力。在40余項權威基準測試中,其語言與多模態理解能力超越Gemini-2.5-Pro、GPT-5-High等國際主流模型,圖像與視頻生成能力與垂直領域專精模型相當,整體處于全球領先水平。

應用層面,文心5.0已構建起覆蓋通用場景與行業需求的模型矩陣。矩陣模型包括文心Lite、視頻大模型和語音大模型,面向產品級應用快速落地;專精模型則針對搜索、電商、數字人等垂直領域開發,如搜索閃電專精模型、電商蒸汽機模型等。百度應用模型研發部負責人透露,基于聲音Token的端到端合成大模型通過離散語音表示、MoE韻律建模和Unet自重構特征等技術,實現了高質量語音合成;5分鐘直播技術通過少量音色采樣和韻律模式匹配,使合成語音具備直播帶貨所需的情緒感染力;實時交互數字人技術采用三態Token聯動架構,突破傳統模態串聯模式,實現文本、語音、視頻的流式控制,百度羅永浩數字人即基于此技術開發。

為推動大模型在產業中的落地,百度千帆平臺推出Agent Infra解決方案,提供包括文心5.0在內的150余個全場景模型服務,集成百度AI搜索等工具及MCP和Agent工具鏈,結合數據管理和企業級服務,為企業提供全周期、多場景的業務運行環境。目前,千帆平臺已累計開發超130萬個Agents,以百度AI搜索為代表的工具日均調用量突破千萬次。此前,百度數字人技術已在直播帶貨等領域廣泛應用,2025年羅永浩數字人直播曾創下行業紀錄。

作為國內大模型領域的先行者,百度正通過“芯云模體”全棧自研生態閉環持續探索AI賦能行業的路徑。該生態以芯片為底座、智能云為平臺框架、模型為支撐,形成覆蓋硬件、算法、應用的完整鏈條,為AI技術從實驗室走向真實場景提供了可復制的解決方案。當前,全球AI行業正加速向應用層拓展,如何讓技術真正服務于產業需求成為關鍵課題,百度的實踐為這一方向提供了重要參考。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新