百度文心Moment大會啟幕文心5.0正式版攜2.4萬億參數引領AI應用新征程

發布時間：2026-01-23 09:01 來源：快訊作者：胡穎

百度近日正式推出并上線了其原生全模態大模型文心5.0正式版，這一模型以2.4萬億參數的龐大規模和原生全模態統一建模技術，成為人工智能領域的新焦點。該模型不僅支持文本、圖像、音頻、視頻等多種信息的輸入與輸出，更在40余項權威基準評測中展現出卓越性能，語言與多模態理解能力超越了Gemini-2.5-Pro、GPT-5-High等國際知名模型，穩居國際第一梯隊，圖像與視頻生成能力也與垂直領域專精模型不相上下，整體處于全球領先水平。

據百度集團副總裁、深度學習技術及應用國家工程研究中心副主任吳甜介紹，文心5.0的技術路線與業界多數采用的“后期融合”多模態方案截然不同。它采用統一的自回歸架構進行原生全模態建模，將文本、圖像、視頻、音頻等多源數據在同一模型框架中進行聯合訓練，實現了多模態特征在統一架構下的充分融合與協同優化，從而具備了原生的全模態統一理解與生成能力。文心5.0還采用了超大規模混合專家結構，具備超稀疏激活參數，激活參數比低于3%，在保持模型強大能力的同時，有效提升了推理效率。

在模型訓練方面，文心5.0基于大規模工具環境，合成長程任務軌跡數據，并采用基于思維鏈和行動鏈的端到端多輪強化學習訓練，顯著提升了模型的智能體和工具調用能力。這一創新使得文心5.0在處理復雜任務時更加得心應手，為AI應用在真實行業與復雜場景中的落地提供了有力支撐。

百度應用模型研發部負責人賈磊在現場分享了文心應用模型的最新進展。他強調，應用模型的價值不在于模型本身，而在于其在實際應用中的表現。百度希望讓模型在真實應用場景里“跑得穩、答得對、用得起”。基于文心基礎大模型，百度構建了矩陣模型和專精模型，分別面向產品級應用和通用場景、行業應用和垂直場景。其中，矩陣模型包括文心Lite模型、視頻大模型和語音大模型；專精模型則包括搜索閃電專精模型、電商蒸汽機模型、文心數字人大模型及行業大模型。

賈磊還分享了三項技術突破：基于聲音Token的端到端合成大模型、5分鐘超越真人的直播技術、實時交互數字人技術。這些技術突破不僅提升了AI應用的性能，也拓展了其應用場景。例如，基于聲音Token的端到端合成大模型通過離散表示定義token，以MoE大語言模型建模韻律，實現了高質量的聲音合成；5分鐘超越真人的直播技術則通過對目標音色的少量采樣和臉譜化妝，使合成語音具備直播帶貨所需的情緒、節奏與感染力；實時交互數字人技術則采用三態Token聯動架構，實現文本、語音、視頻的流式控制，具有低延遲、低成本和高表現力的特點。

在模型應用賦能行業的背后，是百度基于多年積累的全棧自研實力。百度打通了“芯云模體”的全鏈技術架構，以芯片為底座，智能云為平臺框架，以模型支撐各類智能體應用。在文心Moment大會當天，百度千帆平臺產品負責人張婷詳細介紹了千帆專為行業落地打造的Agent Infra。該平臺提供包括文心5.0及全場景150+SOAT模型服務，集成包括百度AI搜索在內的眾多工具及MCP和Agent工具鏈，并結合數據管理和企業級服務，可以為企業提供全周期、穩定支持多場景業務的運行環境，顯著降低企業Agent創新門檻。目前，千帆平臺上已累計開發超130萬個Agents，以百度獨家能力“百度AI搜索”為代表的工具日均調用量已突破千萬次。

隨著全球AI行業的快速發展，AI如何應用于真實世界與行業，從而進一步產生價值，成為行業探索的重點。百度作為國內最早發布大模型的企業之一，正基于其強大的技術實力，持續探索賦能行業的AI解決方案，為AI應用的落地與普及貢獻力量。

更多>同類內容