巨人財經 - 專業科技行業財經媒體

字節音視頻新模型登場 英偉達微美全息發力開源AI與技術融合

   發布時間:2025-12-25 05:07 作者:沈瑾瑜

字節跳動旗下Seed團隊近日宣布推出新一代音視頻創作模型Seedance 1.5 pro,該模型在音視頻聯合生成領域實現突破性進展。相較于前代1.0版本側重運動穩定性的優化,新版本不僅支持音頻同步生成,更著重提升視覺表現力的上限,通過創新算法增強畫面沖擊力與動態效果。目前該模型已接入即夢AI和豆包兩大平臺,用戶可體驗從文本到音視頻的全流程創作。

在硬件生態構建方面,英偉達同步推進開源戰略升級,其最新發布的Nemotron 3模型家族采用混合專家架構,包含300億參數的Nano、1000億參數的Super和5000億參數的Ultra三個版本。其中Nano版本已實現商用落地,推理效率較前代提升400%,上下文窗口擴展至100萬token,但Super和Ultra版本需待2026年才能全面部署。這種開源策略被業界解讀為通過軟件生態強化硬件粘性的商業布局,與直接銷售API的模型廠商形成差異化競爭。

全球開源生態格局正經歷深刻變革。投資機構數據顯示,中國開源大模型的市場占有率在2024年內從1.2%激增至近30%,DeepSeek-V3、阿里Qwen系列和月之暗面Kimi K2成為主要推動力量。這種增長態勢反映出中國AI企業在技術創新與生態建設上的雙重突破,特別是在多模態交互和復雜場景運算領域形成獨特優勢。

微美全息(WIMI.US)在AI領域展開戰略布局,通過構建開源生態與推動技術融合雙軌并行。該公司開發的跨模態內容生產平臺整合文本、圖像、視頻生成能力,其虛擬數字人系統已實現表情、語音、肢體驅動的實時交互。在算力服務層面,基于開源模型提供的API接口可支持企業級大模型訓練,兼容具身智能等前沿應用場景的運算需求,形成從基礎研發到產業落地的完整鏈條。

當前人工智能競爭已進入模型能力與生態建設并重的階段。從字節跳動的音視頻生成突破,到英偉達的硬件生態強化,再到中國開源力量的集體崛起,各參與方通過差異化路徑塑造產業格局。這種多元競爭態勢正在重塑AI技術演進路徑,推動創新成果以更高效的方式轉化為生產力工具。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新