在商業格局加速演變的當下,一場聚焦科技與商業前沿的盛會——36氪WISE2025商業之王大會于北京798藝術區傳導空間舉行。此次大會以“風景這邊獨好”為主題,在充滿不確定性的商業環境中,探尋中國商業確定性的發展路徑,吸引了眾多行業目光。
與傳統的行業峰會不同,今年的WISE大會別出心裁,以“科技爽文短劇”的形式打造了一場沉浸式體驗。從AI對硬件邊界的重塑,到具身智能開啟真實世界新入口;從品牌在出海浪潮中實現全球化,到傳統行業借助科技完成升級,大會呈現的不僅是行業趨勢,更是在無數商業實踐中沉淀的寶貴經驗。
在大會上,后摩智能創始人兼CEO吳強分享了關于端邊AI計算的深刻見解。他指出,大模型推動AI進入2.0時代,不僅改變了云端數據中心的計算格局,也讓端邊側迎來巨大發展機遇。由于端邊設備對實時性和隱私性的天然需求,以及AI普惠化的發展趨勢,端邊AI計算有望成為AI競爭的主戰場。
目前,端邊計算市場規模雖處于起步階段,但未來潛力巨大。行業分析機構STL Partners預測,未來五到十年,端邊計算市場規模可能達到四千億美元甚至更高。當下端邊計算以邏輯控制為主,不過未來五到十年,格局將發生重大轉變,從邏輯控制為主逐步轉向以數據為中心的AI計算為主。回顧數據中心過去十年的發展,計算范式由應用場景演變驅動,從邏輯控制類計算為主轉變為AI計算為主,端邊側也有望出現類似變化。未來,端邊任務將更多轉向感知、理解、決策等,以數據和AI為主導。
端邊AI計算可分為垂類和通用兩大類。垂類場景如手機、智能駕駛等,因場景明確、體量大,已受廣泛關注并做了大量軟硬件協同優化。而端邊通用AI計算覆蓋眾多不同場景,每個場景規模雖不大,但總和可觀。這類計算需求多樣,既要保證效率又要兼顧通用性,目前才剛開始受到重視。
端邊通用AI芯片處于端邊側,面臨成本敏感、功耗敏感、帶寬易成瓶頸等問題,尤其在大模型時代更為突出。同時,作為通用芯片,它要適配眾多場景,需在不損失通用性的前提下提升能效。傳統架構雖靈活性好,但如今遇到“存儲墻”和“功耗墻”瓶頸,數據搬運成為主要阻礙,90%的功耗可能都耗費在數據搬運上。因此,突破這兩大瓶頸成為提升端邊通用AI效率的關鍵。
存算一體被認為是突破存儲墻和功耗墻的有效路徑之一。它通過拉近數據與計算的距離,減少數據搬運,從而提升能效。存算一體有多種實現方式,基于SRAM適合提升計算密度和能效,基于DRAM更擅長解決帶寬問題。后摩智能自成立起就專注于存算一體的大算力芯片研發,是首家將存算一體大算力從論文推向實踐的企業,已推出兩代量產產品。
今年7月,后摩智能發布旗艦芯片M50,這是首款專為端邊大模型設計的芯片。它提供約100 - 160T算力,功耗僅10W,能支持從140億到1200億參數的大模型。產品形態多樣,如M.2卡和Duo M.2卡,最小的M.2卡僅口香糖大小,卻可運行140億甚至300億參數的模型,給端邊場景客戶帶來驚喜。
發布以來,后摩智能積極推動M50落地。端側合作場景包括智能語音設備、AIPC、陪伴機器人、AI NAS等;邊側主要聚焦AI網關、5G + AI、計算盒子等。針對M50,后摩智能提供完整工具鏈,支持各類已訓練好的模型直接轉換到硬件運行,無需重新訓練,且支持bFP等浮點精度,編譯過程順暢,客戶可快速完成模型適配。
從7月至今,后摩智能與芯片上下游伙伴緊密合作,完成了與多種操作系統(包括Windows、Linux,以及麒麟、統信等信創系統)的適配,也協同了各類主控芯片(x86、ARM及國產CPU)。同時,正與算法層、解決方案層伙伴開展大量適配工作,預計明年初將有更多落地應用推出,致力于與更多伙伴共建端邊AI生態。






















