馬斯克xAI新模型Grok 4.2公測，通過趣味測試，回答傾向引發熱議

發布時間：2026-02-18 18:28 來源：快訊作者：孫雅

馬斯克旗下xAI公司推出的Grok 4.2公測版近日悄然上線，盡管團隊近期經歷高層動蕩，這款新模型仍成為科技圈焦點。與當前主流大模型動輒萬億參數的規模不同，Grok 4.2僅采用5000億參數架構，這種"輕量化"設計在測試階段引發了截然相反的評價。

馬斯克在社交平臺連續轉發十余條用戶好評，并親自下場"公關"："當前版本仍有缺陷，但公測結束后將比前代快得多、聰明得多。模型具備每周自我迭代能力，未來會持續進化。"據技術團隊披露，新架構引入實時反饋機制，使模型能像人類一樣通過實踐快速優化，這種動態更新模式區別于傳統靜態升級邏輯。

測試階段暴露的爭議尤為突出。支持者展示其通過"弱智吧"風格邏輯測試的案例——當被問及"50米外洗車店該開車還是步行"時，模型準確識別出距離過近的矛盾性。另有用戶證實其成功通過涉及性別認知的敏感測試，這項曾讓ChatGPT陷入爭議的題目，成為Grok 4.2的加分項。代碼生成和多模態處理能力也獲得開發者認可，部分測試顯示其響應速度超越競品。

反對聲音則聚焦于參數規模限制。深度用戶指出，在處理復雜邏輯推理時，5000億參數明顯力不從心，有開發者調侃："馬斯克說的'橫掃榜單'可能只在特定實驗室環境成立。"更尖銳的批評指向模型偏見問題，測試顯示多個回答與馬斯克個人觀點高度吻合，這與他宣稱的"無偏見"原則形成反差。成本爭議同樣存在，有消息稱其訓練成本高于同類模型。

技術細節的缺失加劇了討論的兩極分化。xAI至今未發布完整技術報告，公開的評測數據僅限于部分排行榜成績。這種信息透明度引發兩種猜測：要么模型尚未成熟，要么團隊在刻意保持神秘感。值得注意的是，馬斯克轉發確認了AI工程師Mark Krechman的爆料——當前版本只是"小尺寸"試水，中大型版本將在后續推出。

在模型公測同期，xAI還低調上線了Grok imagine視頻生成工具，目前僅支持iOS平臺。這項新功能與模型升級形成互補，顯示出團隊在多模態領域的布局野心。隨著公測持續至下月，這場關于參數規模、更新模式與商業化的爭論，或將因更多實測數據披露而迎來新轉折。

更多>同類內容