AWS推Redshift RG執行個體,採Graviton處理器提升效能並降低資料湖查詢成本
Amazon Redshift是AWS的雲端資料倉儲服務,企業常以Redshift處理結構化且經常存取的資料,並以資料湖保存更多樣、成本較低的大量資料。AWS強調,隨著BI儀表板、ETL流程與AI代理程式帶來更頻繁的查詢需求,分析平臺需要在延遲、效能與成本之間取得更好的平衡。
RG執行個體的主要變化,是Redshift可用同一套查詢引擎存取資料倉儲與資料湖。AWS指出,內建資料湖查詢引擎預設啟用,使用者可從單一引擎執行SQL分析,查詢Redshift資料表與Amazon S3資料湖資料。在查詢資料湖格式資料時,AWS表示,RG執行個體查詢Apache Iceberg的效能最高可達RA3的2.4倍,查詢Apache Parquet則最高可達RA3的1.5倍。
該架構調整也改變Redshift查詢資料湖的成本組成,AWS說明,Redshift現在會在叢集節點上執行資料湖查詢,也就是使用處理資料倉儲工作負載的同一批運算資源。因此Amazon Redshift Spectrum現在不再是必要元件,資料湖查詢可留在使用者的VPC邊界內,沿用既有IAM角色,也不再產生過去Spectrum每TB掃描5美元的費用。
企業可透過AWS管理主控臺、AWS CLI或AWS API建立新的RG叢集,也可將既有Redshift叢集搬遷至RG執行個體。AWS提供兩種使用方式,一是Elastic Resize,適用於相容組態,AWS提到,停機時間約10至15分鐘。另一種是快照還原(Snapshot and Restore),可從RA3快照建立RG叢集,適合在搬遷時一併調整組態。
AWS表示,既有外部資料表、Schema與查詢語法,包括原本的Spectrum查詢,都不需要重建或修改應用程式碼。Redshift RG執行個體目前已在多個AWS地區開放,包括美國、加拿大、歐洲、南美,以及亞太區的香港、首爾、新加坡、東京、大阪、臺灣和雪梨等地區。
Comments (0)