Skip to main content

Google Cloud正式推出GKE Agent Sandbox,並發表Agent Substrate開源專案

Posted in 業界新聞
新聞

Google Cloud指出,AI代理已從早期聊天介面,進一步發展到可呼叫函式、執行程式碼,甚至持續使用終端機環境的型態。這也使代理工作負載不只需要模型能力,還需要可擴充且具隔離能力的運算環境,才能安全執行不受信任的邏輯。

GKE Agent Sandbox是建置於Kubernetes之上的開源雲端原生執行環境,主打讓開發者在自有基礎架構上執行AI代理工作負載。

Google Cloud強調GKE Agent Sandbox正式版進一步降低閒置運算成本、縮短沙箱啟動時間,同時強化隔離機制。針對AI代理常見的短時間執行、長時間閒置特性,GKE Agent Sandbox整合Pod快照(Pod Snapshots)機制,讓系統可在代理工作負載閒置時暫停Pod狀態,並在收到請求後快速恢復執行。

在沙箱布建方面,GKE Agent Sandbox導入負責分配沙箱執行個體的Sandbox API,並整合可快速啟用沙箱副本的暖池(warm pool)機制。Google Cloud表示,這項機制可讓GKE在每個叢集每秒分配300個沙箱,且90%的分配作業可在200毫秒內完成。為降低暖池的維持成本,GKE Agent Sandbox也整合待命容量緩衝區(standby capacity buffers),提供由暫停狀態沙箱構成的冷池(cold pool),可用較低成本快速補充暖池容量。

安全隔離方面,GKE Agent Sandbox原生支援Google開源容器沙箱執行環境gVisor,以及預設拒絕(default-deny)的Kubernetes網路政策;也提供可插拔介面,支援以輕量虛擬機器強化容器隔離的開源專案Kata Containers,讓使用者依需求調整核心層級隔離機制。

Google Cloud也提出Agent Substrate開源專案,將其定位為下一階段代理式基礎架構。Google Cloud認為,AI代理工作負載可能擴展到數千萬至數億個執行個體,但這類代理多半不是長時間持續執行,而是經常等待使用者互動、事件或觸發條件,因此Kubernetes控制平面將面臨大量短時間啟動、暫停與恢復工作負載的壓力。

因此,Agent Substrate的設計重點,是在保留GKE Agent Sandbox安全執行與快照能力的同時,降低控制平面處理大量代理任務時的負擔。Google Cloud表示,標準Kubernetes主要用於管理數千個長時間執行的服務,Agent Substrate則鎖定數百萬個執行時間不到1秒的工具呼叫場景,目標是改善標準Kubernetes在處理大量短時間工具呼叫時的延遲與擴充性限制。後續Google Cloud也計畫將資料在地性納入排程核心,讓系統安排代理任務時,同步考量代理狀態與相關資料所在位置,降低跨節點搬移狀態或資料造成的延遲。

View original 0 Likes 0 Boosts

Comments (0)

No comments yet.