Skip to main content

AWS強化Amazon EMR on EC2可觀測性,新增近即時日誌串流與YARN Application ID對應功能

Posted in 業界新聞
新聞

這波更新的重點之一,是自Amazon EMR 7.11.0版起,支援將叢集日誌近即時串流到雲端日誌服務Amazon CloudWatch Logs。使用者啟用CloudWatch日誌功能後,不需要另外透過叢集啟動自動化指令Bootstrap Actions或手動設定代理程式,Amazon EMR即可擷取並串流EMR步驟執行日誌、分散式運算引擎Spark的驅動程式與執行器日誌。AWS也新增步驟層級的Amazon S3日誌控制,企業可針對個別步驟指定專屬的S3日誌路徑與金鑰管理服務AWS KMS金鑰,以因應多租戶環境或不同資料分級需求。

另一項更新則是擴充Amazon EMR主控臺功能,新增叢集資源管理介面YARN ResourceManager UI與查詢執行監控介面Tez UI的直接存取能力,讓使用者不必建立加密遠端連線SSH通道、透過代理連線,或直接連線至叢集節點,就能檢視執行中工作的資源配置、查詢執行計畫與容器日誌。AWS也在步驟細節面板中加入應用程式識別碼YARN Application ID顯示,方便使用者直接比對EMR步驟與底層YARN應用程式,加快問題追查流程。

在指標監控方面,AWS也補強自訂指標相關文件與設定說明。Amazon EMR預設會每5分鐘將叢集層級指標傳送到CloudWatch;自Amazon EMR 7.0版起,啟用CloudWatch代理程式(CloudWatch Agent)後,可收集1分鐘間隔的詳細指標;Amazon EMR 7.1版則導入自訂指標分類,讓用戶可更細緻地定義分散式資料處理框架Hadoop、資源管理系統YARN與分散式資料庫HBase等元件的監控項目。不過,若啟用CloudWatch Logs與自訂指標功能,仍會依日誌擷取量與指標發布頻率產生額外CloudWatch費用。

View original 0 Likes 0 Boosts

Comments (0)

No comments yet.