AWS Glue

GLUE Yönetilen ETL (Extract-Transfer-Load) aracıdır. Analitik işlem öncesi veriyi dönüştürmeye yardımcı olur. Serverless Bir Çözümdür

Parquet dönüşümü diyagramı

Üst Düzeyde Bilinmesi Gerekenler

  • Glue Job Bookmarks: Eski verilerin yeniden işlenmesini önler.

  • Glue DataBrew: Önceden hazırlanmış dönüşümler kullanarak veriyi temizler ve normalize eder.

  • Glue Studio: Glue’da ETL işleri oluşturmak, çalıştırmak ve izlemek için yeni bir grafik arayüz (GUI) sunar.

  • Glue Streaming ETL: Apache Spark Structured Streaming üzerine kuruludur; Kinesis Data Streaming, Kafka ve MSK (yönetilen Kafka) ile uyumludur.

Last updated