巨人財經 - 專業科技行業財經媒體

AI模型評估賽道崛起:90后團隊打造LMArena 獲1.5億美元融資估值17億

   發布時間:2026-01-07 23:46 作者:楊凌霄

AI大模型評估領域迎來一匹黑馬——LMArena正式宣布完成1.5億美元A輪融資,公司估值躍升至17億美元。這支由90后華人主導的團隊,憑借獨特的評估模式和開源技術積累,在資本市場掀起熱潮。本輪融資由Felicis與加州大學投資公司UC Investments聯合領投,Andreessen Horowitz、The House Fund等知名機構跟投。

故事要從2023年ChatGPT引發的AI革命說起。當時由UC伯克利、斯坦福等頂尖高校學者組成的開源組織LMSYS,因開發出革命性的推理引擎SGLang嶄露頭角。該引擎首次實現96塊H100顯卡集群達到接近DeepSeek官方報告的吞吐量,現已被xAI、英偉達、阿里云等全球數十家科技企業采用。但真正讓團隊出圈的,卻是他們為驗證自研模型Vicuna性能而打造的第三方評估平臺——Chatbot Arena。

"傳統基準測試無法區分模型的真實水平。"LMSYS核心成員鄭憐憫回憶道。他們開創性地將模型匿名化,通過用戶實際交互投票決定優劣。這種雙盲測試模式迅速吸引全球AI開發者,新模型發布前都會偷偷在這個平臺"打榜"。隨著影響力擴大,2024年Chatbot Arena正式獨立為商業公司lmarena.ai,轉型專注AI模型評估賽道。

當前主打的LMArena平臺構建了三維評估體系:匿名對戰機制下,用戶提問后系統隨機匹配兩個模型匿名作答,投票后才揭曉身份;評分系統采用改進版Elo算法,通過勝負關系動態調整分數;人機協同框架則通過算法平衡模型曝光度,避免"刷榜"行為。這種設計使評估結果兼具實時性與客觀性,成為行業公認的"模型試金石"。

數據印證著平臺的爆發式增長:自2024年獲得1億美元種子輪融資后,累計收集5000萬張跨模態投票,完成400余種開放/專有模型評估,產出14.5萬個開源戰斗數據點。當前排行榜上,Gemini 3 Pro以1490分領跑,OpenAI、Anthropic等頭部企業的模型均在此接受檢驗。資本的青睞與行業的認可,讓這個由學術團隊轉型的創業公司,在AI評估賽道走出獨特路徑。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新