高性能GPU及多模態推理芯片領域迎來新勢力——曦望Sunrise。這家脫胎于商湯科技大芯片部門的創新企業,自2024年底獨立運營以來,正以差異化技術路線和豪華陣容引發行業關注。其核心團隊由200余名專業人士組成,其中80%為技術研發人員,匯聚了來自AMD、華為海思、百度等科技巨頭的精英,碩士及以上學歷占比超八成,平均行業經驗達15年。
公司管理層陣容堪稱"全明星":董事長徐冰作為商湯科技聯合創始人,曾主導完成超66億美元融資并推動港交所上市,創下全球AI領域融資紀錄;聯席CEO王勇擁有20年芯片研發經驗,曾擔任AMD dGPU首席架構師,主導多款7nm芯片從設計到量產的全流程;另一位聯席CEO王湛則是百度創始團隊成員,在百度任職16年間擔任資深副總裁,深度參與人工智能戰略布局。這個兼具技術深度與商業視野的團隊,正帶領曦望在GPU賽道開辟新戰場。
與傳統GPU廠商"訓推一體"的路徑不同,曦望選擇聚焦推理場景的"純推理"路線。通過在調度機制、緩存架構、片上SRAM等核心環節進行原生優化,結合LPDDR內存技術,實現了單位Token推理成本的大幅降低。公司宣稱,其技術方案可使推理成本下降90%,同時提供更穩定的服務質量。"我們要重寫中國AI產業的成本結構,"王湛在接受采訪時表示,"當推理算力變得像水電一樣普惠,AGI的潛力才能真正釋放。"
這種技術自信源于持續的研發投入和產品迭代。據披露,曦望已累計投入20億元研發資金,構建起三代芯片產品矩陣:2020年量產的S1芯片作為國內首款視覺推理芯片,已適配超千種計算機視覺模型,獲得索尼、小米等頭部企業IP授權;2024年推出的S2芯片實現對主流GPU生態的兼容,支持DeepSeek、Qwen等主流大模型運行;計劃2026年發布的S3芯片更將目標設定為"推理性價比之王",通過FP8/FP4低精度推理技術,力爭實現"百萬Token一分錢"的行業新基準,在能耗和成本上形成數量級優勢。
在生態建設方面,曦望展現出開放姿態。S2芯片通過兼容CUDA生態,降低了開發者遷移成本,同時針對國產大模型進行深度優化。這種"雙軌并行"的策略,既保證了技術兼容性,又為本土AI應用提供了定制化解決方案。隨著所籌資金逐步投入下一代GPU研發和規模化量產,這家成立僅數年的企業,正在重塑高性能計算領域的競爭格局。






















