巨人財經 - 專業科技行業財經媒體

馬斯克xAI新模型Grok 4.2公測,通過趣味測試,回答傾向引發熱議

   發布時間:2026-02-18 18:28 作者:孫雅

馬斯克旗下xAI公司推出的Grok 4.2公測版近日悄然上線,盡管團隊近期經歷高層動蕩,這款新模型仍成為科技圈焦點。與當前主流大模型動輒萬億參數的規模不同,Grok 4.2僅采用5000億參數架構,這種"輕量化"設計在測試階段引發了截然相反的評價。

馬斯克在社交平臺連續轉發十余條用戶好評,并親自下場"公關":"當前版本仍有缺陷,但公測結束后將比前代快得多、聰明得多。模型具備每周自我迭代能力,未來會持續進化。"據技術團隊披露,新架構引入實時反饋機制,使模型能像人類一樣通過實踐快速優化,這種動態更新模式區別于傳統靜態升級邏輯。

測試階段暴露的爭議尤為突出。支持者展示其通過"弱智吧"風格邏輯測試的案例——當被問及"50米外洗車店該開車還是步行"時,模型準確識別出距離過近的矛盾性。另有用戶證實其成功通過涉及性別認知的敏感測試,這項曾讓ChatGPT陷入爭議的題目,成為Grok 4.2的加分項。代碼生成和多模態處理能力也獲得開發者認可,部分測試顯示其響應速度超越競品。

反對聲音則聚焦于參數規模限制。深度用戶指出,在處理復雜邏輯推理時,5000億參數明顯力不從心,有開發者調侃:"馬斯克說的'橫掃榜單'可能只在特定實驗室環境成立。"更尖銳的批評指向模型偏見問題,測試顯示多個回答與馬斯克個人觀點高度吻合,這與他宣稱的"無偏見"原則形成反差。成本爭議同樣存在,有消息稱其訓練成本高于同類模型。

技術細節的缺失加劇了討論的兩極分化。xAI至今未發布完整技術報告,公開的評測數據僅限于部分排行榜成績。這種信息透明度引發兩種猜測:要么模型尚未成熟,要么團隊在刻意保持神秘感。值得注意的是,馬斯克轉發確認了AI工程師Mark Krechman的爆料——當前版本只是"小尺寸"試水,中大型版本將在后續推出。

在模型公測同期,xAI還低調上線了Grok imagine視頻生成工具,目前僅支持iOS平臺。這項新功能與模型升級形成互補,顯示出團隊在多模態領域的布局野心。隨著公測持續至下月,這場關于參數規模、更新模式與商業化的爭論,或將因更多實測數據披露而迎來新轉折。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新