AI模型評估賽道崛起：90后團隊打造LMArena 獲1.5億美元融資估值17億

發布時間：2026-01-07 23:46 來源：快訊作者：楊凌霄

AI大模型評估領域迎來一匹黑馬——LMArena正式宣布完成1.5億美元A輪融資，公司估值躍升至17億美元。這支由90后華人主導的團隊，憑借獨特的評估模式和開源技術積累，在資本市場掀起熱潮。本輪融資由Felicis與加州大學投資公司UC Investments聯合領投，Andreessen Horowitz、The House Fund等知名機構跟投。

故事要從2023年ChatGPT引發的AI革命說起。當時由UC伯克利、斯坦福等頂尖高校學者組成的開源組織LMSYS，因開發出革命性的推理引擎SGLang嶄露頭角。該引擎首次實現96塊H100顯卡集群達到接近DeepSeek官方報告的吞吐量，現已被xAI、英偉達、阿里云等全球數十家科技企業采用。但真正讓團隊出圈的，卻是他們為驗證自研模型Vicuna性能而打造的第三方評估平臺——Chatbot Arena。

"傳統基準測試無法區分模型的真實水平。"LMSYS核心成員鄭憐憫回憶道。他們開創性地將模型匿名化，通過用戶實際交互投票決定優劣。這種雙盲測試模式迅速吸引全球AI開發者，新模型發布前都會偷偷在這個平臺"打榜"。隨著影響力擴大，2024年Chatbot Arena正式獨立為商業公司lmarena.ai，轉型專注AI模型評估賽道。

當前主打的LMArena平臺構建了三維評估體系：匿名對戰機制下，用戶提問后系統隨機匹配兩個模型匿名作答，投票后才揭曉身份；評分系統采用改進版Elo算法，通過勝負關系動態調整分數；人機協同框架則通過算法平衡模型曝光度，避免"刷榜"行為。這種設計使評估結果兼具實時性與客觀性，成為行業公認的"模型試金石"。

數據印證著平臺的爆發式增長：自2024年獲得1億美元種子輪融資后，累計收集5000萬張跨模態投票，完成400余種開放/專有模型評估，產出14.5萬個開源戰斗數據點。當前排行榜上，Gemini 3 Pro以1490分領跑，OpenAI、Anthropic等頭部企業的模型均在此接受檢驗。資本的青睞與行業的認可，讓這個由學術團隊轉型的創業公司，在AI評估賽道走出獨特路徑。

更多>同類內容