巨人財經 - 專業科技行業財經媒體

阿里“歡樂馬”強勢逆襲:AI視頻領域風云突變,字節快手面臨新挑戰

   發布時間:2026-04-11 00:01 作者:吳婷

一場突如其來的技術風暴,讓AI視頻生成領域的競爭格局驟然生變。一款名為HappyHorse的開源模型以黑馬姿態橫空出世,在權威評測榜單Artificial Analysis Video Arena上連續多日碾壓字節跳動的明星產品Seedance 2.0,引發行業震動。這場技術對決的戲劇性在于,當字節團隊還在為神秘對手的身份困惑時,阿里巴巴突然公開認領了這項突破性成果。

根據第三方評測數據顯示,HappyHorse在文本生成視頻(不含音頻)賽道以1389分領先第二名115分,圖片生成視頻(不含音頻)賽道更以1415分刷新歷史紀錄。即便在含音頻的綜合評測中,該模型仍在三個賽道保持領先,僅在圖片生成視頻(含音頻)賽道以2分之差微弱落后。這種全方位的技術壓制,源于其首創的音視頻聯合生成架構——通過統一自注意力Transformer架構,將音頻、視頻、文本等多模態Token整合為單一序列,實現"一次推理生成完整成片"的革命性突破。

技術細節的披露進一步揭示了這款模型的顛覆性。150億參數量配合40層深度架構,使HappyHorse在單張H100顯卡上僅需38秒即可生成5秒1080p視頻。更引人注目的是其多語言支持能力,模型可自動實現英、中、日、韓等七種語言的唇形同步,詞錯誤率控制在行業最低水平。這種技術優勢直接轉化為用戶體驗:用戶無需再忍受傳統模型"先視頻后配音"的割裂感,也避免了口型錯位等技術瑕疵。

這場技術突圍戰的幕后操盤手張迪,其職業軌跡堪稱傳奇。這位上海交大畢業的工程師,曾在阿里媽媽主導大數據架構,2020年隨團隊跳槽快手后,成為可靈AI的核心架構師。2025年短暫任職B站技術負責人后,他重返阿里擔任淘天集團未來生活實驗室負責人。更戲劇性的是,他帶領團隊僅用5個月就完成了HappyHorse的開發,這個速度僅為行業平均周期的三分之一,甚至快于OpenAI開發Sora的進度。

阿里選擇在此時開源這款戰略級產品,無疑是對競爭對手的精準打擊。對比字節Seedance 2.0的企業級嚴苛準入制度——百萬保證金、并發數限制、功能分級開放等條款,HappyHorse的開源策略直接瓦解了這些商業壁壘。行業觀察者指出,這種技術開放策略不僅將加速AI視頻生成技術的普及,更可能重塑整個行業的競爭規則。特別是在Seedance 2.0因版權爭議暫緩全球發售的背景下,開源模型的技術透明性將成為重要競爭優勢。

面對突如其來的挑戰,字節跳動已啟動緊急應對機制。據內部人士透露,AI視頻團隊連夜召開會議,討論調整Seedance 2.0的商業化策略,包括放寬企業認證限制、取消保證金要求等措施。這場由技術突破引發的商業變局,標志著中國AI視頻生成領域正式進入"三足鼎立"時代——除了字節與阿里的直接交鋒,快手可靈AI憑借用戶生態優勢仍在第二梯隊虎視眈眈。

評測機構Artificial Analysis的盲測機制為此次技術對決增添了公信力。該平臺要求所有參賽模型匿名提交作品,通過用戶觀感投票結合Elo評分系統生成排名。這種去中心化的評測方式,使得HappyHorse的登頂更具說服力。隨著開源代碼的即將發布,行業預計將迎來新一輪技術競賽,特別是在音視頻聯合生成、多語言支持等關鍵領域,各大廠商的研發進度可能因此加速。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新