2025年的AI領域,技術迭代與市場格局的演變持續吸引著全球目光。當生成式AI應用如雨后春筍般涌現,覆蓋文案生成、情感交互、供應鏈優化等場景時,上海的AI企業卻選擇了一條看似“逆流”的道路——持續深耕基礎大模型研究。這一現象背后,既有對技術本質的堅守,也暗含對行業未來的深度思考。
谷歌Gemini 3的逆襲案例為這種選擇提供了注腳。2025年11月,這款模型以1501分的成績登頂LMArena排行榜,并在數學能力測試中以23.4%的得分率碾壓競爭對手,成為AI領域的現象級產品。其成功并非偶然:在ChatGPT引爆行業后,谷歌未跟隨OpenAI的強化學習路線,而是堅持“理解生成一體化”的技術路徑,將大模型定位為效率工具而非情感伴侶。這種差異化策略最終在Gemini 3上得到驗證——截至2025年11月,其全球月活躍用戶同比增長170%,市場表現遠超預期。
國內“百模大戰”的余波仍在持續。復旦大學計算機科學技術學院教授邱錫鵬觀察到,2023年行業高峰期全國涌現近80個10億參數以上大模型,但兩年后持續投入基礎研究的企業已不足10家,其中上海企業占據重要席位。他指出,同質化競爭導致基礎研究萎縮,例如自然語言處理領域從2015年前的多方向探索,逐漸收縮至單一的語言模型賽道,這種趨勢可能扼殺技術突破的可能性。
階躍星辰的實踐印證了基礎研究的重要性。這家成立不到3年的企業已發布22款基座模型,其新一代Step 3模型在視覺感知和復雜推理能力上表現突出。副總裁李璟直言:“基礎大模型的能力上限決定了應用的天花板。”他強調,當前技術尚未收斂,過早轉向應用開發可能面臨底層變革帶來的顛覆風險。這種判斷與商湯科技的戰略調整不謀而合——2024年底,這家成立十年的企業啟動“1+X”戰略,將智能駕駛、家庭機器人等應用業務整合為“X創新業務”,自身則聚焦生成式AI與視覺AI雙引擎,完成從技術突破到核心業務的代際轉換。
世界模型成為2025年AI競爭的新焦點。美國斯坦福大學教授李飛飛團隊推出的3D世界生成模型Marble,與商湯“開悟”世界模型3.0形成直接對壘。后者在真實世界建模能力上表現優異,其生成視頻的時間與空間一致性獲得業內高度評價。值得注意的是,商湯早在2024年就已布局該領域,這種前瞻性投入凸顯了基礎研究對技術演進的關鍵作用。
稀宇科技(Minimax)的案例則展現了技術突破與商業化的平衡。這家擁有2億個人用戶的企業在2024年10月發布“技術全家桶”,涵蓋文本、視頻、語音、音樂全模態模型。其中,10B參數的M2模型在Artificial Analysis榜單上沖入全球前五,綜合成本僅為Claude 4.5的8%,推理速度卻提升近一倍。這種“高智能、低成本”的模式,正在改寫AI領域的算力競爭規則。
學術界對技術路徑的反思愈發深入。復旦大學計算與智能創新學院教授張軍平提出,當前AI研究可能偏離了人類智能的進化邏輯——從感知到認知的順序不應被顛倒。與此同時,部分學者仍堅持從“AI符號主義”路線中尋找突破,這種多元化聲音為行業注入新的思考維度。
在應用層繁榮的表象下,上海AI企業選擇了一條更具挑戰性的道路。當技術收斂的終點尚未顯現,持續探索基礎模型的邊界,既是對科學精神的堅守,也是對顛覆性創新的布局。正如行業觀察者所言:“爆款往往誕生于冷門領域,而冷門領域的突破需要有人甘坐冷板凳。”























