技術浪潮未歇，上海AI企業緣何執著深耕基礎大模型？

發布時間：2026-01-19 13:04 來源：快訊作者：趙云飛

2025年的AI領域，技術迭代與市場格局的演變持續吸引著全球目光。當生成式AI應用如雨后春筍般涌現，覆蓋文案生成、情感交互、供應鏈優化等場景時，上海的AI企業卻選擇了一條看似“逆流”的道路——持續深耕基礎大模型研究。這一現象背后，既有對技術本質的堅守，也暗含對行業未來的深度思考。

谷歌Gemini 3的逆襲案例為這種選擇提供了注腳。2025年11月，這款模型以1501分的成績登頂LMArena排行榜，并在數學能力測試中以23.4%的得分率碾壓競爭對手，成為AI領域的現象級產品。其成功并非偶然：在ChatGPT引爆行業后，谷歌未跟隨OpenAI的強化學習路線，而是堅持“理解生成一體化”的技術路徑，將大模型定位為效率工具而非情感伴侶。這種差異化策略最終在Gemini 3上得到驗證——截至2025年11月，其全球月活躍用戶同比增長170%，市場表現遠超預期。

國內“百模大戰”的余波仍在持續。復旦大學計算機科學技術學院教授邱錫鵬觀察到，2023年行業高峰期全國涌現近80個10億參數以上大模型，但兩年后持續投入基礎研究的企業已不足10家，其中上海企業占據重要席位。他指出，同質化競爭導致基礎研究萎縮，例如自然語言處理領域從2015年前的多方向探索，逐漸收縮至單一的語言模型賽道，這種趨勢可能扼殺技術突破的可能性。

階躍星辰的實踐印證了基礎研究的重要性。這家成立不到3年的企業已發布22款基座模型，其新一代Step 3模型在視覺感知和復雜推理能力上表現突出。副總裁李璟直言：“基礎大模型的能力上限決定了應用的天花板。”他強調，當前技術尚未收斂，過早轉向應用開發可能面臨底層變革帶來的顛覆風險。這種判斷與商湯科技的戰略調整不謀而合——2024年底，這家成立十年的企業啟動“1+X”戰略，將智能駕駛、家庭機器人等應用業務整合為“X創新業務”，自身則聚焦生成式AI與視覺AI雙引擎，完成從技術突破到核心業務的代際轉換。

世界模型成為2025年AI競爭的新焦點。美國斯坦福大學教授李飛飛團隊推出的3D世界生成模型Marble，與商湯“開悟”世界模型3.0形成直接對壘。后者在真實世界建模能力上表現優異，其生成視頻的時間與空間一致性獲得業內高度評價。值得注意的是，商湯早在2024年就已布局該領域，這種前瞻性投入凸顯了基礎研究對技術演進的關鍵作用。

稀宇科技（Minimax）的案例則展現了技術突破與商業化的平衡。這家擁有2億個人用戶的企業在2024年10月發布“技術全家桶”，涵蓋文本、視頻、語音、音樂全模態模型。其中，10B參數的M2模型在Artificial Analysis榜單上沖入全球前五，綜合成本僅為Claude 4.5的8%，推理速度卻提升近一倍。這種“高智能、低成本”的模式，正在改寫AI領域的算力競爭規則。

學術界對技術路徑的反思愈發深入。復旦大學計算與智能創新學院教授張軍平提出，當前AI研究可能偏離了人類智能的進化邏輯——從感知到認知的順序不應被顛倒。與此同時，部分學者仍堅持從“AI符號主義”路線中尋找突破，這種多元化聲音為行業注入新的思考維度。

在應用層繁榮的表象下，上海AI企業選擇了一條更具挑戰性的道路。當技術收斂的終點尚未顯現，持續探索基礎模型的邊界，既是對科學精神的堅守，也是對顛覆性創新的布局。正如行業觀察者所言：“爆款往往誕生于冷門領域，而冷門領域的突破需要有人甘坐冷板凳。”

更多>同類內容