Felaketten Kurtarma Servisleri

Temel Bilgiler

Şirketin iş sürekliliğini veya mali durumunu olumsuz etkileyen herhangi bir olay felakettir.
Felaket kurtarma (Disaster Recovery - DR), bir felakete hazırlık yapma ve felaketten kurtulma sürecidir.
Hangi tür felaket kurtarma yöntemleri vardır?
- On-premise => On-premise: Geleneksel felaket kurtarma, çok pahalıdır.
- On-premise => AWS Cloud: Hibrit felaket kurtarma
- AWS Cloud Bölge A => AWS Cloud Bölge B
İki terimi bilmek gerekir:
- RPO: Recovery Point Objective (Kurtarma Noktası Hedefi)
- RTO: Recovery Time Objective (Kurtarma Süresi Hedefi)

RPO (Recovery Point Objective): RPO, bir veri kaybı durumunda kabul edilebilir maksimum veri kaybı miktarını belirler. Veri kurtarma işlemi sırasında ne kadar veri kaybının tolere edilebileceğini ifade eder.

RTO (Recovery Time Objective): RTO, bir kesinti veya felaket durumunda sistemlerin veya süreçlerin ne kadar sürede yeniden çalışır hale getirilmesi gerektiğini tanımlar. Kesintinin kabul edilebilir maksimum süresini gösterir.

Stratejiler

Backup and Restore Stratejisi

Backup and restore stratejisi, sistem verilerini belirli aralıklarla yedekleme ve veri kaybı yaşandığında bu yedekler üzerinden sistemi geri yükleme işlemidir. Bu stratejinin amacı, herhangi bir kesinti veya veri kaybı durumunda minimum zarar ile hızlı bir şekilde sistemin eski haline getirilebilmesidir. Genellikle en ekonomik felaket kurtarma yöntemidir.

Yedekleme Frekansı: Verilerin ne sıklıkla yedekleneceğini belirler. Daha sık yedekleme daha az veri kaybı riski anlamına gelir.
Yedekleme Lokasyonu: Yedeklerin nerede saklanacağı önemlidir. Yedeklerin on-premise veya bulut gibi farklı lokasyonlarda saklanması önerilir.
Geri Yükleme Süreci: Veri kaybı durumunda yedeklenen verilerin hızlı bir şekilde geri yüklenmesini sağlar ve RTO'yu karşılayacak şekilde tasarlanmalıdır.

Pilot Light

Uygulamanın küçük bir versiyonu her zaman bulutta çalışır.
Kritik çekirdek (pilot light) için kullanışlıdır.
Yedekleme ve Geri Yükleme (Backup and Restore) yöntemine çok benzer.
Kritik sistemler zaten çalışır durumda olduğu için Backup and Restore yönteminden daha hızlıdır.

Multi-Site/Hot-Site Approach

Düşük RTO Sunar bu yüzden pahalıdır
Ürün Tam production düzeyinde (On-prem/AWS ortamında )olması tavsiye edilir.

Tamamı AWS Multi Region'da

AWS ile On-Premise Stratejisi

Amazon Linux 2 AMI’yi VM (.iso formatında) indirme imkanı
- VMware, KVM, VirtualBox (Oracle VM), Microsoft Hyper-V desteği

VM Import / Export

Mevcut uygulamaları EC2’ye taşıma
On-premise sanal makineleriniz için felaket kurtarma stratejisi oluşturma
EC2’den tekrar on-premise’e VM’leri geri aktarabilme

AWS Application Discovery Service

On-premise sunucularınız hakkında bilgi toplayarak taşınma planı hazırlama
Sunucu kullanımını ve bağımlılık haritalarını çıkarma
AWS Migration Hub ile takip etme

AWS Database Migration Service (DMS)

On-premise ⇒ AWS, AWS ⇒ AWS, AWS ⇒ On-premise replikasyon
Oracle, MySQL, DynamoDB vb. çeşitli veritabanı teknolojileri ile çalışma

AWS Server Migration Service (SMS)

On-premise canlı sunucuların AWS’ye artımlı replikasyonu

Tavsiyeler

1. Yedekleme (Backup)

EBS Snapshot’lar, RDS otomatik yedeklemeler / anlık görüntüler (snapshots) vb.
Düzenli olarak S3 / S3 IA / Glacier’a yükleme, Lifecycle Policy, Cross Region Replication
On-Premise’ten: Snowball veya Storage Gateway ile

2. Yüksek Erişilebilirlik (High Availability)

Route53 kullanarak DNS’i bölgeler arası taşımak
RDS Multi-AZ, ElastiCache Multi-AZ, EFS, S3
Site-to-Site VPN kullanarak Direct Connect’ten kurtarma

3. Replikasyon (Replication)

RDS Replikasyonu (Bölgeler arası), AWS Aurora + Global Databases
On-premise’ten RDS’e veritabanı replikasyonu
Storage Gateway

4. Otomasyon (Automation)

CloudFormation / Elastic Beanstalk ile tüm ortamı yeniden oluşturma
CloudWatch alarm verdiğinde EC2 instance’larını kurtarma / yeniden başlatma
AWS Lambda ile özelleştirilmiş otomasyonlar

5. Kaos (Chaos)

Netflix’in “simian-army” aracıyla rastgele EC2 sonlandırma testi

PreviousDiğerleri NextDatabase Migration Service (DMS)

Last updated 7 months ago

hashtagTemel Bilgiler

hashtagStratejiler

hashtagBackup and Restore Stratejisi

hashtagPilot Light

hashtagMulti-Site/Hot-Site Approach

hashtagTamamı AWS Multi Region'da

hashtagAWS ile On-Premise Stratejisi

hashtagTavsiyeler