出身商湯的曦望：押注推理GPU賽道三年構建三代芯片矩陣謀突破

發布時間：2026-01-23 06:00 來源：快訊作者：胡穎

高性能GPU及多模態推理芯片領域迎來新勢力——曦望Sunrise。這家脫胎于商湯科技大芯片部門的創新企業，自2024年底獨立運營以來，正以差異化技術路線和豪華陣容引發行業關注。其核心團隊由200余名專業人士組成，其中80%為技術研發人員，匯聚了來自AMD、華為海思、百度等科技巨頭的精英，碩士及以上學歷占比超八成，平均行業經驗達15年。

公司管理層陣容堪稱"全明星"：董事長徐冰作為商湯科技聯合創始人，曾主導完成超66億美元融資并推動港交所上市，創下全球AI領域融資紀錄；聯席CEO王勇擁有20年芯片研發經驗，曾擔任AMD dGPU首席架構師，主導多款7nm芯片從設計到量產的全流程；另一位聯席CEO王湛則是百度創始團隊成員，在百度任職16年間擔任資深副總裁，深度參與人工智能戰略布局。這個兼具技術深度與商業視野的團隊，正帶領曦望在GPU賽道開辟新戰場。

與傳統GPU廠商"訓推一體"的路徑不同，曦望選擇聚焦推理場景的"純推理"路線。通過在調度機制、緩存架構、片上SRAM等核心環節進行原生優化，結合LPDDR內存技術，實現了單位Token推理成本的大幅降低。公司宣稱，其技術方案可使推理成本下降90%，同時提供更穩定的服務質量。"我們要重寫中國AI產業的成本結構，"王湛在接受采訪時表示，"當推理算力變得像水電一樣普惠，AGI的潛力才能真正釋放。"

這種技術自信源于持續的研發投入和產品迭代。據披露，曦望已累計投入20億元研發資金，構建起三代芯片產品矩陣：2020年量產的S1芯片作為國內首款視覺推理芯片，已適配超千種計算機視覺模型，獲得索尼、小米等頭部企業IP授權；2024年推出的S2芯片實現對主流GPU生態的兼容，支持DeepSeek、Qwen等主流大模型運行；計劃2026年發布的S3芯片更將目標設定為"推理性價比之王"，通過FP8/FP4低精度推理技術，力爭實現"百萬Token一分錢"的行業新基準，在能耗和成本上形成數量級優勢。

在生態建設方面，曦望展現出開放姿態。S2芯片通過兼容CUDA生態，降低了開發者遷移成本，同時針對國產大模型進行深度優化。這種"雙軌并行"的策略，既保證了技術兼容性，又為本土AI應用提供了定制化解決方案。隨著所籌資金逐步投入下一代GPU研發和規模化量產，這家成立僅數年的企業，正在重塑高性能計算領域的競爭格局。

更多>同類內容