近日,專注于推理GPU領域的曦望(Sunrise)正式推出新一代推理GPU芯片啟望S3,這是該公司在完成近30億元戰略融資后的首次公開亮相。此次發布標志著曦望在國產AI芯片領域邁出關鍵一步,其定位為國內首家專注于推理算力的GPU芯片企業,致力于通過極致性價比推動AI應用的普及。
曦望董事長徐冰在發布會上表示,公司脫胎于商湯科技的大芯片部門,核心團隊擁有十年AI應用落地經驗,覆蓋人臉識別、自動駕駛到大模型多模態物理AI等全周期。他強調,曦望的研發并非紙上談兵,而是基于真實業務場景打磨,旨在成為"更懂AI的GPU芯片公司"。據悉,2025年全球大模型token消耗量激增100倍,曦望團隊全年無休研發,最終實現技術突破。
公司兩位聯席CEO的組合被內部稱為"越湛越勇"。負責研發的王勇曾是AMD昆侖芯核心架構師,擁有20年芯片研發經驗,主導曦望兩代芯片實現一次性點亮成功;另一位聯席CEO王湛作為百度創始團隊成員,打造了鳳巢系統并創造數百億利潤,2025年初加入后全面負責產品化與商業化。目前,曦望團隊規模超300人,核心成員平均行業經驗達15年,匯聚了英偉達、AMD、商湯等企業的精英。
在融資方面,曦望獲得三一集團旗下華胥基金、IDG資本、高榕創投等產業資本與VC/PE機構近30億元投資,商湯仍為其單一最大股東。徐冰透露,商湯董事長兼CEO徐立親臨發布會現場,雙方啟動百萬token推流合作。他指出,獨立運營是經過深思熟慮的戰略選擇,既傳承商湯的原創精神,又賦予團隊突破原創性技術的空間。
面對國產GPU行業從"拼參數"轉向"拼經濟性"的趨勢,曦望明確將戰略重心放在推理算力賽道。徐冰解釋稱,AI應用正從訓練階段轉向實戰階段,德勤報告顯示2026年推理算力占比將達66%。同時,智能體物理AI的爆發對實時交互、3D生成等場景提出更高要求,而推理成本已占AI應用總成本的70%,成為商業化關鍵瓶頸。
與傳統訓推一體GPU不同,曦望S3芯片從底層架構開始專為推理場景設計。徐冰批評通用計算路線存在成本高、功耗大、算力利用率低(僅5%-10%)等問題,而曦望通過去除冗余設計,將真實業務場景中的token成本、能耗和穩定性作為核心指標。他透露,公司過去八年累計投入20億元研發,S1、S2已驗證量產能力,S3則標志著向"百萬token一分錢"目標發起沖擊。
在生態布局上,曦望提出"芯片+系統+生態"戰略。除提供標準化服務器和集群方案外,公司還與商湯、范式等AI巨頭合作打造推理加速專區,并與杭鋼數字科技、浙江算力科技等本地平臺合作推廣基礎設施。目前,曦望已與三一、協興等十余家企業簽約,將推理芯片嵌入制造、能源、機器人等具體場景。
徐冰強調,曦望的目標是重構中國AI產業損益表,通過極致性價比讓70%-90%的價值回歸產業。他比喻稱,未來AI推理應像水電一樣普及,而曦望愿做底層基礎設施的提供者,讓企業不再為算力"卡脖子"、電費或芯片限制所困擾,從而專注構建AI爆款應用。





















