國內人工智能領域迎來重要進展,智譜與華為攜手打造的GLM-Image圖像生成模型正式開源。該模型依托華為昇騰Atlas 800T A2計算設備與昇思MindSpore AI框架,實現從數據預處理到模型訓練的全流程國產化,成為首個在國產芯片上完成全鏈路訓練的SOTA級多模態生成模型。這一突破標志著中國AI產業在自主可控技術路徑上取得實質性進展,為行業提供了可復制的國產化技術方案。
技術架構層面,GLM-Image創新性地融合圖像生成與語言理解能力,通過"自回歸+擴散解碼器"的混合架構設計,實現了文本指令與視覺內容的高精度映射。該架構既保留了擴散模型在圖像生成中的創造性優勢,又通過自回歸機制確保與語言模型的協同效率,在圖像語義一致性、細節豐富度等核心指標上達到行業領先水平。實驗數據顯示,模型在復雜場景理解任務中的準確率較傳統方案提升37%,生成效率提高2.2倍。
國產化適配是該模型的核心突破。研發團隊針對昇騰芯片的算力特性優化了模型并行策略,通過動態負載均衡技術將訓練效率提升40%。在昇思框架支持下,模型實現了訓練過程的完全國產化,驗證了國產硬件在大規模AI模型訓練中的可行性。華為昇騰計算業務部負責人表示,此次合作攻克了異構計算集群調度、分布式訓練優化等關鍵技術難題,為國產AI生態建設提供了重要實踐樣本。
商業化應用方面,GLM-Image展現出顯著成本優勢。當前API調用單價已降至0.1元/張,較國際主流方案降低85%,有效降低了中小企業接入先進生成式AI技術的門檻。智譜商業產品總監透露,即將推出的速度優化版本將把生成延遲控制在2秒以內,同時保持圖像質量不變。這種"高性能+低成本"的定價策略,延續了該公司在多模態模型領域的商業化思路——2025年8月推出的GLM-4.5V模型已將輸入成本壓至2元/百萬tokens,12月開源的GLM-4.6V系列更實現價格腰斬。
行業分析認為,GLM-Image的開源將加速國產AI生態建設。其全鏈路國產化方案為金融、醫療等對數據安全敏感的行業提供了可行路徑,而極具競爭力的定價策略可能重塑圖像生成市場的競爭格局。據第三方機構預測,隨著國產模型性能持續提升,2026年中國圖像生成API市場規模有望突破120億元,其中國產化方案占比將超過35%。






















