飛豬用戶增長廣告外部投放系統(RTA)自2022年上線以來,已成為支撐廣告業務快速發展的重要基礎設施。該系統通過與頭條、小紅書、華為等十余家頭部媒體渠道的深度對接,日均處理千億級請求,峰值QPS突破百萬級別,對系統性能和穩定性提出了嚴苛要求。隨著業務規模持續擴張和策略復雜度不斷提升,如何實現研發效能提升與極致性能優化成為核心挑戰。
在研發效能提升方面,系統通過架構解耦實現突破性進展。原有架構中RTA模塊與多個業務系統混部,導致資源分配失衡和迭代效率低下。技術人員將RTA獨立拆分為專用服務,采用Java技術棧升級方案,引入JDK21虛擬線程、SpringBoot 3.x框架和網絡中間件優化。這一改造使應用重啟時間縮短80%以上,單機CPU利用率降低15%,為后續優化奠定基礎。測試環節創新構建流量回放系統,通過采集線上真實請求在預發環境回放,將測試周期從3天壓縮至1天,發布周期從24小時縮短至2小時。
性能優化工程貫穿整個技術棧。網絡層通過啟用HTTP長連接復用,消除每次請求的TCP握手開銷,使深圳、南通等跨地域機房的超時率從100%驟降至8%以下。針對首次請求必經建連的痛點,改造HTTP客戶端實現"失敗建連保留"機制,打破惡性循環。單元化部署戰略將服務拆分為多個獨立單元,配合緩存本地化部署和配置中心異步同步,最終實現阿里媽媽平臺和小紅書直連的超時率分別降至0.07%和0.01%。
網關層優化取得顯著成效。技術人員發現Tengine網關存在大量TIME_WAIT連接,通過啟用后端長連接池和TCP keepalive機制,使連接數下降99%,CPU使用率降低10個百分點。配置精簡行動移除gzip壓縮、關閉非必要日志、啟用reuseport等措施,進一步釋放2%的CPU資源。應用層針對日志系統實施協議精簡、批量聚合和異步刷盤改造,在保持可觀測性的同時減少60%日志體積,CPU占用降低9個百分點。
業務邏輯優化聚焦參競率和精準度提升。原有單一ID優先級規則導致30%的匹配失敗,新構建的多維身份召回引擎整合OAID、IMEI、CAID等12種設備標識,使召回成功率提升40%。通過統一定向表、溢價系數表等8個核心離線表的標識體系,消除策略執行偏差。設備身份質量監控系統自動過濾無效標識,將無效拉新率降低25%,營銷資源觸達目標用戶的效率顯著提高。
技術改造帶來顯著業務價值。系統在QPS提升60%的情況下,服務器數量減少30%,每年節省數百萬成本。研發流程重構使新媒體渠道接入周期從5天縮短至2天,問題定位效率提升40%。實時決策漏斗可視化呈現各環節折損率,幫助業務團隊快速優化策略。這些改進共同推動廣告投放ROI提升18%,用戶質量評分增長22%,形成技術驅動業務增長的良性循環。






















