巨人財經 - 專業科技行業財經媒體

谷歌“Agent Skill”庫上線:為開發者減負,云服務與AI融合再升級

   發布時間:2026-04-27 23:08 作者:顧青青

在人工智能大模型競爭愈發激烈的當下,谷歌生態的技術從業者正積極探尋應對策略。隨著OpenAI發布GPT-5.5與DeepSeek推出V4模型,大模型市場已進入白熱化階段。為在這場競爭中脫穎而出,越來越多開發者借助智能體Agent來構建和優化基于谷歌云平臺的應用,涵蓋從Firebase、Gemini API到BigQuery和Google Kubernetes Engine(GKE)等眾多服務。

然而,在開發過程中,一個關鍵問題逐漸凸顯:如何確保模型掌握關于這些技術的準確且最新信息?開發者在實際操作中面臨諸多難題,他們需為每個云服務編寫適配器,將API調用封裝成智能體可調用的工具函數,還要反復調試模型是否正確調用工具、傳入正確參數。一旦底層服務API發生變化,所有適配器都得手動更新,這不僅耗費大量精力,還形成了隱性的技術債。

為解決這一問題,谷歌推出了Model Context Protocol(MCP)服務器,讓智能體能夠連接到可靠的實時信息源。但新的問題也隨之而來——“上下文膨脹”(Context Inflation)成為新的挑戰。MCP服務器雖能為模型提供即時外部信息,可當智能體大規模使用時,大量上下文信息會不加區分地加載到模型上下文窗口中。這會導致兩個嚴重后果:一是過多信息使模型混亂,降低推理質量,有團隊發現智能體每次調用時加載1.5萬個tokens的指令,幾乎不給實際處理內容留下上下文空間;二是上下文窗口填充會產生Token成本,隨著調用量增長,開銷會大幅增加。

在此背景下,Agent Skills應運而生。Agent Skills是一種“簡單開放的格式,用于賦予智能體新的能力和專業知識”,可理解為針對特定技術或任務的精簡、以智能體為中心的文檔。其設計哲學是用Markdown編寫,保持輕量;按需加載,避免冗余。每份Skill文件可包含參考文檔、代碼片段和其他資源,智能體僅在需要時加載相關信息,大大降低了上下文信息過載風險。

從技術定位看,Skills具有獨特優勢。它高于傳統提示Prompt,因為可復用且持久;比微調(Fine-tuning)更輕,能以業務邏輯速度迭代;比RAG(檢索增強生成)更主動,是主動的專業知識注入;比普通工具(Tools)更豐富,不僅編碼了“做什么”,還編碼了“怎么做”和“為什么這么做”。

在Google Cloud Next 2026大會上,谷歌正式宣布推出Google官方Agent Skills倉庫,這一消息被視為大會最具實用價值的發布之一。該代碼庫包含十三項技能,涵蓋谷歌云核心服務,如AlloyDB、BigQuery、Cloud Run等,幫助智能體理解如何創建、查詢和管理云資源,是Agent操作谷歌云基礎設施的能力基礎。還包含三大架構支柱技能:安全性(Security),讓智能體理解云安全最佳實踐;可靠性(Reliability),涵蓋高可用架構設計等;成本優化(Cost Optimization),指導智能體在架構決策中考慮資源效率與成本控制。這些支柱技能重點在于讓智能體理解云系統設計原則與決策邏輯,提升應用質量。倉庫還提供三項面向常見任務的流程指南,將日常操作拆解為可執行步驟,讓智能體按流程完成工作。

官方Skills倉庫解決了開發者的諸多痛點。官方Skills經過針對實際模型的測試和優化,能在Gemini上可靠運行;兼容MCP標準,可跨平臺使用,不限于Vertex AI;當底層云API變化時,谷歌會負責更新相應技能,開發者無需自行維護;直接使用開發者已有的GCP憑證,無需編寫額外認證代碼。在兼容性方面,通過npx skills install github.com/google/skills命令,開發者可將技能安裝到多種智能體平臺,如Antigravity、Gemini CLI以及Claude Code、Cursor等第三方工具。近期發布的Antigravity平臺深度整合了Skills體系,Gemini CLI也原生支持Skills,讓開發者可在命令行環境直接調用專業化技能。

以BigQuery技能為例,使用該技能時,代碼示例如下:

from google.adk.agents import LlmAgent
from google.skills.gcp import BigQuerySkill, CloudStorageSkill, PubSubSkill
agent = LlmAgent(
name="data_pipeline_agent",
model="gemini-2.5-pro",
tools=[
BigQuerySkill(project_id="my-project", dataset_id="analytics"),
CloudStorageSkill(bucket="my-output-bucket"),
PubSubSkill(topic="pipeline-results"),
]
)

而未使用該技能時,代碼則要復雜得多,每個項目可能需寫四到十個這樣的工具代碼,技能庫可幫開發者省去這些代碼。

事實上,早在谷歌發布官方Agent Skill庫之前,谷歌云AI總監、Gemini工程負責人Addy Osmani就在領英宣布開源了一款Agent Skills庫,包含為AI編碼智能體打造的19項工程技能和7條命令,靈感源自Google最佳實踐。該項目地址為https://github.com/addyosmani/agent-skills。Addy Osmani在文章中表示,AI編碼智能體雖強大,但若任其自由發揮,會走捷徑,更追求“完成”而非“正確”。因此他構建Agent Skills,每項技能編碼了資深工程師實際使用的工作流、質量關卡和最佳實踐,覆蓋完整生命周期,包括定義、規劃、構建、驗證、審查和交付等環節,且兼容Claude Code、Cursor、Antigravity等智能體。

這兩款出自谷歌的Agent Skills代碼庫各有側重。Osmani的項目解決“如何正確地構建”問題,是確保智能體編碼行為符合專業標準的通用工程紀律框架,適用于任何云平臺和軟件類型。谷歌官方開源的Agent Skills倉庫解決“構建什么以及如何操作”問題,提供針對Google Cloud的具體操作知識。在實際使用中,兩者可并存于同一智能體環境,Osmani的技能包規范智能體整體開發行為,Google官方技能庫在智能體與Google Cloud服務交互時提供精準操作知識,二者協同構成既遵守工程紀律又掌握專業知識的人工智能“超級員工”。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新