巨人財經 - 專業科技行業財經媒體

Meta閉源新篇:Muse Spark“偏科”逆襲,AI賽道開啟新角逐?

   發布時間:2026-04-10 18:55 作者:鄭佳

meta全新大模型Muse Spark的登場,猶如一顆重磅炸彈投入科技圈,激起層層漣漪。這款內部代號為Avocado的模型,不僅是meta超級智能實驗室(MSL)成立9個月后的首個成果,更是扎克伯格在經歷Llama 4的挫折后,大刀闊斧進行組織與戰略調整后的首份答卷。令人意外的是,曾經高舉“開源對抗閉源”大旗的meta,此次給Muse Spark貼上了“閉源”標簽,API也僅向少數指定合作伙伴開放預覽。

回顧Llama 4的發布,可謂開局不利。它承載著meta的厚望,卻很快陷入信譽危機。社區質疑聲不斷,更有爆料稱meta在基準測試中弄虛作假,用針對特定任務微調的“特供版”刷榜,而普通用戶使用的版本表現大相徑庭。這一事件對meta AI品牌造成了致命打擊,就連圖靈獎得主、meta前首席科學家Yann LeCun離職后也承認,Llama 4的測試結果“確實被修飾了一點”。

扎克伯格對此怒不可遏,據外媒報道,他對相關人員失去信心,直接架空了整個生成式AI團隊,大批人員離開。這不僅僅是某個模型的失敗,更意味著過去從模型架構到研發流程,從開源路線到組織文化的道路可能都行不通了。扎克伯格面臨艱難抉擇,最終選擇全部推翻,在廢墟上重建。

2025年夏天,扎克伯格做出震驚硅谷的決策,以143億美元的天價拿下數據標注巨頭Scale AI 49%的無投票權股份。更關鍵的是,時年不到30歲的華裔創始人Alexandr Wang被請進meta,出任首席AI官,統管全新組建的MSL。這位MIT輟學、19歲創立Scale AI、26歲躋身億萬富豪行列的年輕人,被扎克伯格評價為“同輩創業者中最杰出的一位,深刻理解超級智能的歷史重要性”。

Alexandr Wang上任后雷厲風行,從OpenAI、谷歌DeepMind、Anthropic等競爭對手那里,以天價薪酬挖來一整支“復仇者聯盟”。翻看MSL首批11人名單,7位核心研究員都有華人背景,包括浙大校友畢樹超、清華校友趙晟佳、中科大校友于佳慧等業內頂尖高手。這支“億元天團”的目標明確,就是從零開始,重寫meta的AI命運。

Muse Spark究竟實力如何?meta此次態度格外坦誠,在官方博客里列出了一張優缺點分明的成績單。在醫療和視覺多模態領域,Muse Spark表現堪稱驚艷。在極高難度的醫學開放式問答評測HealthBench Hard中,它取得42.8分,而GPT - 5.4只有40.1分,Gemini 3.1 Pro僅20.6分,差距明顯。這得益于meta與超過1000名專業醫生合作整理訓練數據,為模型配備了強大的專家顧問團。在科研論文圖表的深度理解測試(CharXiv Reasoning)中,Muse Spark以86.4分力壓GPT - 5.4的82.8和Gemini 3.1 Pro的80.2。

Muse Spark的應用場景也十分豐富。官方案例顯示,對著食物拍照,它能分析出每種食物的卡路里;能識別瑜伽動作,指出發力肌群并糾正姿態;甚至還會操作咖啡機。可以想象,若應用在AI眼鏡上,將帶來極大便利。

然而,Muse Spark并非完美無缺。在純邏輯推理和代碼編程方面,它的表現不盡如人意。在ARC AGI 2抽象推理測試中,僅拿到42.5分,與Gemini 3.1 Pro(76.5分)和GPT - 5.4(76.1分)差距巨大。在軟件工程實測(SWE - bench Pro)中,通過率(52.4%)也略遜于GPT - 5.4的57.7%。

Muse Spark背后真正令人矚目的,是meta公布的一項技術數據。在新重建的技術棧下,它達到與上一代Llama 4 Maverick同等性能水平所需的計算量,減少了超過一個數量級,實現了10倍以上的效率躍升。這得益于MSL團隊提出的“思維壓縮”(Thought Compression)核心技術。在強化學習訓練階段,引入“思考時間懲罰”機制,模型回答問題時若思考過久就會被“扣分”,從而被迫進化,學會用更少的推理token、更短的邏輯鏈條解決復雜問題,且準確率不降反升。Muse Spark還推出多Agent并行推理的“沉思模式”(Contemplating Mode),傳統推理模式是一個模型獨自思考,而它是同時拉起多個子智能體處理不同維度信息后匯總,在相近響應時間內,在Humanity‘s Last Exam等評測中表現出色。

Muse Spark雖不完美,但用9個月時間將meta從Llama 4的輿論困境中拉出,重新回到與GPT - 5.4、Gemini 3.1 Pro同場競技的第一梯隊。對于扎克伯格和這支“華人天團”來說,它更像是一個宣言,標志著靠開源攢口碑的meta已成為過去,一個更務實、更有技術野心的新meta正嶄露頭角。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新