巨人財經 - 專業科技行業財經媒體

Runway Gen-4.5登頂全球AI視頻榜!以專注與效率突破巨頭重圍

   發布時間:2025-12-03 01:53 作者:馮璃月

在AI視頻生成領域,一場激烈的競爭剛剛落下帷幕。Runway最新推出的Gen-4.5模型以顯著優勢擊敗谷歌Veo3,重新奪回行業領先地位。根據Artificial Analysis發布的最新榜單,Runway Gen-4.5以1247分的ELO評分位居榜首,成為全球最強的AI視頻生成工具。

Runway Gen-4.5此前代號為WhisperThunder,其技術突破體現在多個維度。該模型在運動質量、提示詞遵循度和視覺保真度方面樹立了新標桿,能夠精準模擬物理世界的復雜交互。例如,在內部測試中,模型成功生成了"一只袋鼠推著另一只坐在嬰兒車里的小袋鼠"的場景,不僅展現了生物運動的復雜性,還完美處理了攝像機的跟隨運鏡效果。

技術團隊透露,Gen-4.5的開發全程基于英偉達GPU架構,從預訓練數據效率到后訓練技術均取得重大進展。該模型能夠處理從照片級真實感到風格化動畫的廣泛美學風格,同時保持視覺語言的連貫性。在液體動力學模擬方面,模型可以準確呈現水流特性;在細節渲染上,發絲和材質紋理在運動過程中保持高度連貫性。

盡管性能飛躍顯著,Runway Gen-4.5仍存在部分技術局限。測試數據顯示,模型在因果推理方面偶現邏輯錯亂,例如門可能在按下把手前就自動打開;物體恒存性方面,被遮擋的物體有時會意外消失;動作成功率也存在偏差,部分復雜動作的完成度超出預期。

Runway創始人Cristóbal Valenzuela在近期訪談中深入解析了技術突破背后的核心邏輯。他強調,模型訓練沒有所謂的"魔法按鈕",成功源于對成千上萬參數的精細調校和無數技術訣竅的組合應用。這種"技術品味"的培養,使得團隊在有限資源下實現了世界級的技術突破。

Valenzuela提出顛覆性觀點:視頻模型本質上是"通用模擬引擎",其價值遠超內容生成工具。通過學習海量觀察數據,模型能夠捕捉物理世界的底層規律,包括因果關系、時空連續性和物體恒存性等核心特性。這種能力使其具備向世界模型演進的潛力,未來可能重塑機器人訓練、個性化教育等眾多領域。

在應用場景拓展方面,Runway已展開多項前沿探索。開發者正利用其生成的合成視頻數據訓練機器人手臂操作,教育領域則嘗試實時生成定制化教學視頻。針對內容安全爭議,Valenzuela表示正在開發類似流媒體平臺的分級控制系統,將內容管理權交還用戶。

從2023年初率先推出Gen-1(視頻生視頻)和Gen-2(文生視頻),到如今Gen-4.5引領行業變革,Runway始終保持著技術先發優勢。當谷歌ImagenVideo和meta Make-A-Video尚在實驗室階段時,Runway已通過SaaS模式讓普通用戶能夠直接生成視頻內容。這種將前沿技術快速產品化的能力,正是其持續領跑的關鍵因素。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新