AI視頻生成賽道近期風云變幻,先是Seedance 2.0陷入版權爭議,后是OpenAI宣布關停Sora獨立應用及相關API,行業格局面臨重塑。就在外界對這一賽道前景產生疑慮時,阿里巴巴推出的HappyHorse-1.0模型橫空出世,在Artificial Analysis榜單上同時登頂文生視頻和圖生視頻(無音頻)兩個賽道,力壓字節、快手等競爭對手,為行業注入新的活力。
HappyHorse的崛起與張迪的回歸密不可分。張迪畢業于上海交通大學計算機專業,本碩連讀后于2010年加入阿里巴巴,長期負責阿里媽媽的大數據和機器學習工程架構。在阿里工作的十年間,他積累了處理大規模數據、復雜工程系統的經驗,這些能力為后續的技術突破奠定了基礎。2020年,張迪離開阿里加入快手,歷任技術副總裁、大模型與多媒體技術團隊負責人,主導了可靈大模型的底層架構研發與應用落地。可靈大模型讓快手從內容分發平臺升級為內容生產基礎設施提供商,構建了完整的業務閉環。2025年9月,張迪短暫加入B站,兩個月后重返阿里,出任淘天集團“未來生活實驗室”負責人,職級P11。
張迪的職業路徑獨特,他既非從零開始涉足AI視頻領域,也非單純從外部空降阿里。他先在阿里熟悉大規模商業系統的運作,又在快手將視頻生成技術轉化為實際產品,如今回到阿里,將這套能力融入更大的商業生態中。這種復合型背景使他能夠同時理解模型技術、業務需求和組織架構,成為推動HappyHorse項目落地的關鍵人物。
HappyHorse的成功并非偶然。該模型采用150億參數、40層統一自注意力Transformer架構,將文本、視頻、音頻三種模態的token放入同一序列聯合建模,解決了傳統視頻生成模型中人物嘴型與聲音不同步、表情與語氣不匹配等問題。它原生支持英語、普通話、粵語、日語、韓語、德語、法語等多種語言的唇形同步,顯著提升了視頻生成的質量。在生成效率方面,HappyHorse在單張H100 GPU上生成5秒1080p視頻僅需38秒,并采用DMD-2蒸餾技術將去噪步驟壓縮至8步,大幅降低了生成成本和時間,為商業化應用鋪平了道路。
與閉源模型不同,HappyHorse選擇開源路線,允許開發者自托管、微調并接入自有產品。這一策略不僅吸引了社區反饋,加速了模型改進,還通過用戶偏好投票在Artificial Analysis榜單上取得領先。開源模式使HappyHorse能夠快速暴露問題并拓展應用場景,而非僅依賴公司內部團隊的迭代。
HappyHorse對阿里的意義遠不止于技術突破。作為淘天集團“未來生活實驗室”的成果,該模型直接服務于阿里的核心業務——電商。在電商場景中,商品視頻是提升轉化率的關鍵工具,但傳統視頻制作成本高、周期長,中小商家難以承擔。HappyHorse通過批量生成不同版本視頻,并利用商品圖、詳情頁、評價、搜索詞等數據優化內容,幫助商家更高效地觸達目標用戶。例如,一個太陽能噴泉泵通過AI視頻被包裝成鳥浴盆、魚池和兒童浴缸的噴水玩具,銷量激增。這種“功能說明”到“使用場景”的轉化,正是電商內容的痛點所在。
阿里在電商領域的優勢為HappyHorse提供了獨特的反饋閉環。商品數據、交易反饋和用戶行為可被用于訓練模型,使其生成更符合銷售需求的視頻。未來,HappyHorse有望成為電商操作系統的一部分,從簡單的視頻生成工具進化為能夠預測用戶偏好、優化內容的智能平臺。這一過程中,阿里需平衡創新與合規,避免AI生成內容夸大商品效果,損害消費者信任。
隨著HappyHorse的登場,AI視頻賽道的競爭進入新階段。張迪的回歸和阿里的戰略布局,為行業提供了新的思路:技術突破需服務于商業價值,開源與閉環反饋可成為制勝關鍵。未來,HappyHorse能否持續領先,將取決于其能否在電商場景中進一步深化應用,并拓展至廣告、直播、教育等領域。阿里的這一嘗試,或許正在重新定義AI視頻技術的商業邊界。





















