Amazon EMR
EMR: Elastic MapReduce anlamına gelir.
Hadoop kümeleri (Big Data) oluşturarak büyük veri kümelerini analiz etme ve işleme imkanı sunar.
Kümeler yüzlerce EC2 instance’tan oluşabilir.
Apache Spark, HBase, Presto, Flink gibi araçlarla birlikte gelir.
Tüm sağlama (provisioning) ve yapılandırma işlemlerini otomatik olarak yapar.
Otomatik ölçeklendirme ve Spot instance entegrasyonu destekler.
Kullanım Alanları:
Veri işleme
Makine öğrenmesi
Web indeksleme
Büyük veri analizleri
Amazon EMR – Node Türleri ve Satın Alma Seçenekleri
Node Türleri:
Master Node: Kümenin yönetimi, koordinasyonu ve sağlık durumunu izler – uzun süreli çalışır.
Core Node: Görevleri çalıştırır ve veriyi depolar – uzun süreli çalışır.
Task Node (opsiyonel): Sadece görev çalıştırır – genellikle Spot instance olarak kullanılır.
Satın Alma Seçenekleri:
On-demand: Güvenilir, tahmin edilebilir, sonlandırılmaz.
Reserved (minimum 1 yıl): Maliyet tasarrufu sağlar (EMR mevcutsa otomatik olarak kullanır).
Spot Instances: Daha ucuzdur, sonlandırılabilir, daha az güvenilirdir.
Küme Türleri:
Uzun süreli çalışan kümeler
Geçici (transient/temporary) kümeler
Last updated