Felaket kurtarma planı¶

Kapsam ve hedefler¶

Bu plan, Weblate hizmetinin kullanılabilirliğini, veri bütünlüğünü veya operasyonel sürekliliği etkileyen felaket olaylarından kurtarmayı ele alır.

Not

Plan özellikle Weblate s.r.o. tarafından yapılmış Weblate dağıtımları için tasarlanmıştır, ancak benzer şekilde diğer dağıtımlara da uygulanabilir.

Tanımlar¶

Felaket: Hizmet, veri veya sistem işlevselliğinin tümüyle veya önemli ölçüde kaybına neden olan planlanmamış herhangi bir olay. Örnekler, donanım arızası, veri bozulması, altyapı kesintisi veya kötü niyetli saldırı olabilir.
Kurtarma noktası hedefi (RPO): Kabul edilebilecek en fazla veri kaybı aralığı: 24 saat.
Kurtarma süresi hedefi (RTO): Hizmetin tam olarak geri yüklenmesi için kabul edilebilecek en fazla süre: 8 saat.

Kritik bileşenler¶

Uygulama katmanı: Weblate Python/Django uygulaması, arka plan işlemleri (Celery) ve zamanlanmış görevler.
Veri katmanı: PostgreSQL veri tabanı, çeviri depoları (Git) ve günlükler.
Altyapı: Site sunucusu (NGINX/Apache), ters vekil sunucu, depolama birimleri, SSL/TLS yapılandırması ve isteğe bağlı SIEM kayıt sistemi.

Yedekleme ilkesi¶

BorgBackup ile kendiliğinden yedekleme işlemi, tüm temel bileşenlerin (veri tabanı, veri ve yapılandırma) günlük olarak yedeklenmesini garanti eder. Yedekler coğrafi olarak farklı iki konumda saklanır. Yedek tutma ilkesi, son yedeklerin günlük olarak kullanılabilir olmasını ve altı aylık yedeklerin tutulmasını sağlar.

Kurtarma İşlemleri¶

Sorun senaryosu: Tam sunucu/sistem kaybı¶

Yeni sunucuyu hazırlayın.
Hazırlama yazılımı kullanarak Weblate uygulamasını çalıştırın.
Weblate yedeğini BorgBackup yedeklerini geri yüklemek adımlarını izleyerek geri yükleyin.
Weblate kapsayıcısını başlatın.
İşlevselliği doğrulayın ve tutarlılık denetimlerini yapın.

Sorun senaryosu: Veri tabanı bozulması veya veri biriminin kaybı¶

Daha fazla yazma işlemini önlemek için Weblate çalışmasını durdurun.
Weblate yedeğini BorgBackup yedeklerini geri yüklemek adımlarını izleyerek geri yükleyin.
Hizmetleri yeniden başlatın ve çeviri ile kullanıcı verilerinin tutarlılığını doğrulayın.

Sorun senaryosu: Kötü niyetli kurcalama veya fidye yazılımı¶

Etkilenen sunucuyu ağdan ayırın.
Bilinen son iyi yedeklemeyi (bulaş öncesi) belirleyin.
Sistemi yeni bir sunucuya kurmak için Sorun senaryosu: Tam sunucu/sistem kaybı adımlarını izleyin.

Doğrulama ve sınama¶

Yedek doğrulama: Weblate yedeklerini aylık geri yükleme sınaması.
Felaket kurtarma tatbikatı: En az yılda bir kez, bir deneme ortamına tam geri yükleme yapılarak gerçekleştirilir.
Kendiliğinden bütünlük denetimleri: BorgBackup yedekleme arşivlerinin bütünlüğünden emin olur.

Kurtarma sonrası adımlar¶

Tüm hizmetlerin çalışır ve erişilebilir durumda olduğunu doğrulayın.
Kullanıcıları ve paydaşları kurtarma durumu ile ilgili bilgilendirin.
Zaman çizelgesini, temel nedeni ve çıkarılan dersleri belgeleyin.
Yinelenmemesi için gerekli güncellemeleri veya altyapı değişikliklerini yapın.
Güvenlik açığının söz konusu olması durumunda Güvenlik açığını açıklama ilkesi adımlarını izleyin.