在國際消費電子展(CES)這場全球矚目的“科技盛宴”上,英偉達創始人黃仁勛拋出了一個引發廣泛討論的觀點:物理AI的“ChatGPT時刻”即將來臨。這一論斷并非孤立存在,北京智源人工智能研究院發布的《2026人工智能十大趨勢》報告也給出了相似判斷——人工智能的發展重心正從單純追求語言模型的參數規模,轉向對物理世界底層規律的理解與建模,行業技術范式迎來重大變革。
智源研究院院長王仲遠在發布會上強調,基礎模型競爭的焦點已從“參數規模”轉變為“對世界運行規律的理解”。AI正從“預測下一個詞”向“預測世界下一個狀態”跨越,這意味著AI的演進方向正發生結構性轉變。以“下一狀態預測”(NSP)為代表的新機制,正推動AI從感知數字世界,邁向理解并規劃物理世界的因果變化。
在這份指引行業未來的報告中,螞蟻集團作為產業實踐的典型代表被多次提及。其在AI大模型、超級應用、AI安全等關鍵領域的系統性布局和扎實成果,為報告所預測的未來提供了生動的實踐案例。
報告指出,2026年將成為AI從數字世界向物理世界拓展、從技術演示走向規模應用的關鍵轉折點。這一轉變背后,有三條主線值得關注:首先是AI的認知方式發生了變化。過去,AI主要擅長處理靜態的語言和圖像數據,如今則開始嘗試預測“下一步會發生什么”。以世界模型和NSP為代表的新方向,讓AI不再局限于識圖識話,而是要理解物體的運動規律和行為演化,為自動駕駛仿真、機器人學習等物理任務提供“預判力”。
其次是AI的形態發生了改變。AI正從代碼形態轉變為能走能動的機器人形態,從單打獨斗的智能體轉變為可以分工協作的“AI團隊”。通用人形機器人開始走進工業場景,不再局限于實驗室研究。在軟件層面,多智能體(MAS)之間的標準化通信協議逐漸成型,使得AI之間能夠像人類團隊一樣完成科研、工業等復雜任務。
最后是AI創造價值的方式發生了變化。在消費端,一個集多種功能于一體的超級應用入口正在形成,成為科技巨頭競爭的焦點。在企業端,AI正憑借完善的數據治理和行業標準接口,在垂直領域孕育出真正具有商業價值的產品(MVP),越過早期概念驗證的“幻滅期”。
從技術前沿來看,四大趨勢正在重塑AI的基礎能力。一是世界模型成為通用人工智能(AGI)的共識方向,NSP有望成為新的技術范式。行業共識正從語言模型轉向能夠理解物理規律的多模態世界模型,NSP標志著AI開始掌握時空連續性和因果關系,從感知走向認知。二是具身智能迎來行業洗牌,產業應用進入廣泛工業場景。具身智能正從實驗室演示階段進入產業篩選和落地階段,隨著大模型與運動控制、合成數據的結合,人形機器人有望在2026年突破演示階段,進入真實的工業和服務場景。三是多智能體系統決定應用上限,Agent時代的“TCP/IP”初具雛形。復雜問題的解決依賴多智能體協同,隨著MCP、A2A等通信協議趨于標準化,智能體之間擁有了通用“語言”,多智能體系統將突破單體智能的局限,在科研、工業等復雜工作流中發揮關鍵作用。四是AI Scientist成為AI for Science(AI4S)的核心目標,國產科學基礎模型正在孕育。AI在科研中的角色正從輔助工具升級為自主研究的“AI科學家”,構建自主的科學基礎模型體系已成為緊迫的國家戰略需求。
在產業落地方面,AI時代的“新BAT”格局逐漸清晰,垂直賽道仍存在高盈利機會。C端AI超級應用的“All in One”入口成為巨頭競爭的焦點。海外以OpenAI的ChatGPT和Google Gemini為代表,通過深度集成各類服務,塑造了一體化智能助手的新范式。國內字節、阿里、螞蟻等企業也依托自身生態積極布局。螞蟻推出的“靈光”和“阿福”分別成為通用入口和垂類場景的典型案例。“靈光”是一款全模態AI助手,精準解決了AI應用“重聊天、輕行動”的痛點。上線首周下載量突破200萬,其核心功能“閃應用”允許用戶通過自然語言快速生成可交互的輕應用,大幅降低了開發門檻,推動了“全民手搓AI應用”的風潮。其全模態信息生成能力提升了交互效率和體驗的“信息美感”,滿足了用戶對AI實用性的需求。“阿福”則聚焦醫療健康領域,定位為“AI健康朋友”。目前,其App月活用戶已突破3000萬,單日健康問答量超過1000萬。為了讓健康服務更專業、可信,阿福自研專用底座大模型,并與全國院士、名醫深度合作,連接了超5000家醫院資源、50萬真人醫生和500位名醫AI分身,形成了從專業問答到醫療服務的完整閉環。
企業級AI應用在經歷概念驗證熱潮后,正因數據、成本等問題進入“幻滅低谷期”。但隨著數據治理和工具鏈的成熟,預計2026年下半年將迎來轉折,一批真正具有商業價值的MVP產品將在垂直行業實現規模落地。
在關鍵支撐領域,螞蟻集團在推理和安全方面進行了系統性布局。合成數據占比不斷攀升,有望解決高質量真實數據枯竭的問題。修正擴展定律為合成數據提供了理論支持,尤其在自動駕駛和機器人領域,由世界模型生成的合成數據將成為降低訓練成本、提升性能的關鍵資產。推理優化仍有很大提升空間,“技術泡沫”的說法并不成立。推理效率仍是AI大規模應用的核心瓶頸和競爭焦點,通過算法創新和硬件變革,推理成本持續下降,能效比不斷提升,使得在資源受限的邊緣端部署高性能模型成為可能,這是AI普惠的關鍵前提。螞蟻百靈大模型體系就是這一趨勢的典型代表,其涵蓋了Ling(語言)、Ring(思考)、Ming(多模態)三大系列。語言模型Ling系列采用高稀疏度MoE等高效架構,基于二十萬億Tokens語料訓練,并推出了包含萬億參數模型Ling-1T與Ring-1T在內的完整產品矩陣。螞蟻團隊首創的“棒冰算法(icepop)”有效提升了模型穩定性,百靈大模型在Hugging Face等社區榜單上表現優異,其中Ling-1T曾持續登頂總榜,展現了強大的工程實力和社區認可度。
為打破算力壟斷和供應風險,構建兼容異構芯片的軟件棧至關重要。繁榮的算子語言和趨于收斂的編譯器技術正在降低開發門檻,以智源FlagOS為代表的平臺致力于構建軟硬解耦、開放普惠的AI算力底座。AI安全風險已從“幻覺”演變為更隱蔽的“系統性欺騙”。技術上,Anthropic的回路追蹤研究致力于從內部理解模型機理,OpenAI推出自動化安全研究員。產業上,智源研究院聯合全球學者發布AI欺騙系統性國際報告,警示前沿風險,安全正成為AI系統的內在屬性。螞蟻集團在此領域構建了貫穿線上與終端的立體防線,其推出的大模型安全解決方案“蟻天鑒”已升級為面向智能體時代的一體化安全解決方案,基于“以攻促防”的安全理念,構建了“對齊-掃描-防御”技術棧,形成全流程防護體系。面對AI眼鏡等新一代智能終端快速增長帶來的安全挑戰,螞蟻發布的全球首個智能終端可信連接技術框架gPass,具備“安全、交互、互連”三大核心能力,支持AI眼鏡與智能體之間的實時可信通信,打通用戶與設備、模型與服務之間的安全連接鏈路,為AI眼鏡廠商與開發者提供統一、安全的底層架構,構建面向個人智能體時代的安全AI數字服務生態。






















