Red Hat發布OpenShift 4.21,整合AI、容器與虛擬化於單一平臺並強化GPU資源調度

圖片來源/紅帽
隨著企業逐步將AI應用導入正式營運環境,AI訓練與推論工作負載對於資源調度與系統整合的需求持續提高。Red Hat指出,過去AI、容器、虛擬機器多半分散於不同平臺運作,不僅增加系統管理複雜度,也降低資源配置效率。OpenShift 4.21強調在統一營運模型下整合不同類型工作負載,並可依實際需求自動調整資源配置。
在AI工作負載支援方面,OpenShift 4.21導入Red Hat組建的Kueue(Red Hat build of Kueue)1.2版,以及用於OpenShift Container Platform的JobSet Operator。Kueue是Kubernetes上的工作負載排程與佇列管理機制,適用於AI訓練等批次任務,並提供任務佇列可視化能力,讓使用者可掌握執行順序與預估啟動時間;JobSet Operator則用於協調多個相互依賴的分散式任務,支援容錯與重試機制,使企業可在既有GitOps與權限控管架構下,執行大規模分散式運算。
針對AI運算核心的GPU資源管理,Red Hat在此版本中強化Dynamic Resource Allocation(DRA)機制。DRA為Kubernetes的動態資源配置功能,允許工作負載依硬體條件(如GPU記憶體容量)提出資源需求,由系統自動匹配符合條件的設備,並支援資源優先順序與替代策略,以提升資源配置彈性。此外,該機制也提供管理員例外存取能力,以利進行監控與除錯。
在核心平臺能力方面,OpenShift 4.21針對Hosted Control Plane導入Vertical Pod Autoscaler(VPA)。Hosted Control Plane是將Kubernetes控制層元件集中託管,並與工作節點分離的架構設計,而VPA可依據實際資源使用情況,自動調整Pod(容器執行單元)的CPU與記憶體配置,降低人工設定負擔並提升資源使用效率,以降低基礎架構成本。
在既有企業環境整合方面,OpenShift 4.21支援VMware Cloud Foundation 9,並可部署於Oracle的Oracle Database Appliance,提供整合硬體與軟體的資料庫環境,以強化混合雲部署彈性。
在安全機制上,此版本支援Microsoft Azure環境執行的Confidential Containers,透過硬體層級保護機制,確保資料在記憶體中處理時仍維持隔離狀態,以降低雲端平臺或底層系統存取敏感資料的風險。
虛擬化方面,OpenShift Virtualization支援在同一平臺上同時執行虛擬機與容器工作負載,並提供跨叢集零停機遷移功能,可在不中斷服務的情況下進行維護或資源調整。此外,該版本亦支援IPv6專用的控制層與次要網路,並可在Google Cloud裸機環境執行虛擬化工作負載,以滿足低延遲與高效能需求。
Comments (0)