Amazon EMR

  • EMR: Elastic MapReduce anlamına gelir.

  • Hadoop kümeleri (Big Data) oluşturarak büyük veri kümelerini analiz etme ve işleme imkanı sunar.

  • Kümeler yüzlerce EC2 instance’tan oluşabilir.

  • Apache Spark, HBase, Presto, Flink gibi araçlarla birlikte gelir.

  • Tüm sağlama (provisioning) ve yapılandırma işlemlerini otomatik olarak yapar.

  • Otomatik ölçeklendirme ve Spot instance entegrasyonu destekler.

Kullanım Alanları:

  • Veri işleme

  • Makine öğrenmesi

  • Web indeksleme

  • Büyük veri analizleri

Amazon EMR – Node Türleri ve Satın Alma Seçenekleri

Node Türleri:

  • Master Node: Kümenin yönetimi, koordinasyonu ve sağlık durumunu izler – uzun süreli çalışır.

  • Core Node: Görevleri çalıştırır ve veriyi depolar – uzun süreli çalışır.

  • Task Node (opsiyonel): Sadece görev çalıştırır – genellikle Spot instance olarak kullanılır.

Satın Alma Seçenekleri:

  • On-demand: Güvenilir, tahmin edilebilir, sonlandırılmaz.

  • Reserved (minimum 1 yıl): Maliyet tasarrufu sağlar (EMR mevcutsa otomatik olarak kullanır).

  • Spot Instances: Daha ucuzdur, sonlandırılabilir, daha az güvenilirdir.

Küme Türleri:

  • Uzun süreli çalışan kümeler

  • Geçici (transient/temporary) kümeler

Last updated