巨人財經 - 專業科技行業財經媒體

阿里AI視頻大模型HappyHorse登頂全球榜首 預計一周后正式開源發布

   發布時間:2026-04-10 18:25 作者:趙云飛

近日,阿里巴巴在AI視頻生成領域取得重大突破,其自主研發的AI視頻大模型HappyHorse1.0以1333Elo分的成績登頂Artificial Analysis視頻競技場全球排行榜,成為當前開源模型中性能最強的視頻生成工具。該模型由淘天集團未來生活實驗室主導開發,技術負責人張迪帶領團隊完成,預計將于一周后通過阿里百煉平臺正式對外開源。

作為全球首個原生支持音視頻聯合生成的開源模型,HappyHorse1.0采用40層統一自注意力Transformer架構,擁有150億參數規模。在硬件效率方面,該模型在單張H100顯卡上生成5秒1080p視頻僅需38秒,較同類模型提升40%以上。其多語言支持能力尤為突出,可實現英語、普通話、粵語、日語、韓語、德語、法語七種語言的精準唇形同步,詞錯誤率控制在行業最低水平。

在競技場實測中,HappyHorse1.0展現出顯著優勢:對OVI1.1模型取得80%勝率,對LTX2.3模型勝率達60.9%。在文本轉視頻(無音頻)和圖像轉視頻(無音頻)場景中,其生成質量全面超越Seedance2.0和可靈3.0;在文本轉視頻(有音頻)領域保持小幅領先,圖像轉視頻(有音頻)場景則與Seedance2.0持平。這些數據驗證了模型在跨模態生成任務中的技術領先性。

據開發團隊介紹,HappyHorse1.0采用完全開源策略,將向全球開發者開放模型權重、訓練代碼和部署文檔。其創新性的音視頻聯合生成架構,通過統一處理時空維度特征,解決了傳統模型中音頻視頻不同步的技術難題。目前該模型已支持通過阿里百煉平臺進行在線體驗,開發者可自由調用API進行二次開發。

行業分析師指出,HappyHorse1.0的開源將推動視頻生成技術進入新階段,其多語言支持和高效推理能力特別適合短視頻創作、影視特效、虛擬直播等商業場景。隨著模型正式發布,預計將引發全球AI社區對跨模態生成技術的新一輪探索。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新