Skip to main content

Google Cloud推出Cloud Storage Rapid,強化AI訓練與分析工作負載的儲存效能

Posted in 業界新聞
新聞

Cloud Storage Rapid目前包含兩項主要能力。Rapid Bucket已正式上市,前身為Rapid Storage,是一種高效能區域型物件儲存桶,底層採用Google分散式儲存系統Colossus,也就是支撐Gemini與YouTube的儲存基礎架構。Google Cloud表示,單一Rapid區域型儲存桶可提供超過15 TB/s彙總讀取傳輸量,並支援每秒最高2,000萬次查詢。

Rapid Bucket主要用於資料準備、模型訓練、檢查點處理、批次與串流分析,以及分散式資料庫架構最佳化等高效能需求的應用場景。Google Cloud宣稱,在多模態訓練作業中,Rapid Bucket可讓GPU閒置等待時間減少50%,資料載入速度最高提升2.5倍;相較傳統物件儲存,檢查點還原速度最高提升5倍,寫入速度提升3.2倍。

另一項能力Rapid Cache前身為Anywhere Cache,可針對既有Cloud Storage儲存桶加速讀取,而且不需要修改程式碼。Google Cloud表示,Rapid Cache可為資料準備、訓練,以及推論期間突發的模型載入需求,提供2.5 TB/s彙總讀取傳輸量;在推論工作負載中,模型載入速度最高提升2.1倍,並可帶來47%的總持有成本(TCO)節省。

Google Cloud這次也為Rapid Cache新增「寫入即同步快取(ingest on write)」功能,讓資料寫入Cloud Storage儲存桶時,同步進入Rapid Cache,避免第一次讀取時才建立快取而造成效能落差。Google Cloud指出,這項功能可讓檢查點還原時間最高加快2.2倍,適合用於訓練中斷後需要快速恢復的AI工作負載。

Google Cloud並以AI研究與產品公司Thinking Machines Lab為例指出,該公司在AI/ML流程中導入Rapid Cache,用於資料處理、多模型訓練與模型載入等作業後,穩定讀取傳輸量峰值超過1.8 TB/s,也降低長尾延遲與429錯誤。Google Cloud表示,Rapid Cache目前已由客戶部署數千個快取,過去一年的部署量成長20倍,最高可承載Cloud Storage全球對外資料流量的20%。

View original 0 Likes 0 Boosts

Comments (0)

No comments yet.