PRA / PCA (Veeam)

Concepts de reprise d'activite

Le Plan de Reprise d'Activite (PRA) et le Plan de Continuite d'Activite (PCA) sont deux strategies complementaires pour assurer la resilience de l'infrastructure face aux sinistres.

  • PCA : maintenir le service en continu, meme en mode degrade (haute disponibilite, failover)
  • PRA : restaurer le service apres une interruption majeure (sauvegarde, restauration, site DR)

RPO vs RTO

Ces deux metriques definissent les exigences de protection :

timeline
    title Chronologie d'un sinistre
    section Avant le sinistre
        Derniere sauvegarde : RPO = donnees perdues
    section Sinistre
        Interruption : Debut du RTO
    section Apres le sinistre
        Service restaure : Fin du RTO
Metrique Signification Question cle
RPO (Recovery Point Objective) Quantite maximale de donnees que l'on accepte de perdre "Combien de temps de travail peut-on perdre ?"
RTO (Recovery Time Objective) Duree maximale d'interruption acceptable "En combien de temps doit-on etre de retour ?"

RPO et RTO sont inversement proportionnels au cout

Un RPO de 0 (zero perte) necessite de la replication synchrone, extremement couteuse. Un RPO de 24h ne necessite qu'une sauvegarde quotidienne. Le choix depend de la criticite metier.

Business Impact Analysis (BIA)

Avant de definir RPO et RTO, il faut realiser une analyse d'impact metier :

Etape Action Resultat
1. Inventaire Lister tous les services et applications Catalogue des actifs
2. Classification Evaluer la criticite de chaque service Tiers de criticite
3. Impact financier Estimer le cout d'une heure d'arret Cout horaire par service
4. Dependances Cartographier les dependances entre services Arbre de dependances
5. Objectifs Definir RPO/RTO par service Matrice de protection

Tiers de reprise

Tier Description RPO RTO Technologie
Tier 1 Pas de DR Illimite Illimite Aucune
Tier 2 Sauvegarde hors site 24h 24-72h Bandes, stockage objet
Tier 3 Sauvegarde + site tiede 4-12h 4-12h Veeam + VM hors site
Tier 4 Site chaud actif-passif 15 min - 1h 1-4h CDP + replication
Tier 5 Site actif-actif ~0 ~0 Replication synchrone

Notre positionnement

L'infrastructure INDIO Group se situe entre le Tier 3 et Tier 4 selon les services : CDP pour les applications critiques (RPO < 15 min), sauvegarde classique pour le reste (RPO < 4h).


Regle 3-2-1-1-0

La regle 3-2-1 est un standard de l'industrie, etendu par Veeam en 3-2-1-1-0 :

graph TD
    subgraph RULE["Regle 3-2-1-1-0"]
        R3["<b>3</b> copies des donnees<br/>Production + 2 sauvegardes"]
        R2["<b>2</b> types de support differents<br/>Disque local + Stockage objet"]
        R1A["<b>1</b> copie hors site<br/>Azure Blob (region distante)"]
        R1B["<b>1</b> copie immutable<br/>WORM Azure Compliance"]
        R0["<b>0</b> erreur de restauration<br/>Verification SureBackup"]
    end

    R3 --> R2 --> R1A --> R1B --> R0
Element Implementation chez INDIO Justification
3 copies Production + sauvegarde locale + Azure Blob Redondance contre la perte physique
2 supports Disque SSD/HDD local + stockage objet cloud Diversification des risques (incendie, panne)
1 hors site Replication vers Azure (region France Central) Protection contre sinistre du site principal
1 immutable Azure Blob WORM Compliance-mode Impossible a supprimer, meme par un admin compromis
0 erreur Tests automatises SureBackup hebdomadaires Garantie que la restauration fonctionne reellement

Pourquoi l'immutabilite est critique

Les ransomwares modernes ciblent en priorite les sauvegardes avant de chiffrer la production. Sans copie immutable, une attaque reussie peut rendre toutes les sauvegardes inutilisables.


Architecture Veeam

Veeam Backup & Replication est compose de plusieurs briques :

graph TB
    subgraph VEEAM["Veeam Architecture"]
        VBR["Veeam Backup Server<br/>INF-ASAV12A<br/>10.15.100.241"]
        CONSOLE["Veeam Console<br/>(interface web)"]
        PROXY["Veeam Proxy<br/>(traitement des donnees)"]
        REPO["Repository Local<br/>(Performance Tier)"]
    end

    subgraph SOURCES["Sources de donnees"]
        VCENTER["vCenter / ESXi"]
        HYPERV["Hyper-V"]
        PHYS["Serveurs physiques"]
    end

    subgraph CLOUD["Stockage Cloud"]
        AZURE["Azure Blob Storage<br/>(Capacity Tier)"]
        ARCHIVE["Azure Archive<br/>(Archive Tier)"]
    end

    CONSOLE --> VBR
    VCENTER -->|"API vSphere"| PROXY
    HYPERV -->|"WMI"| PROXY
    PHYS -->|"Agent Veeam"| PROXY
    PROXY -->|"Deduplication + Compression"| REPO
    REPO -->|"Tiering automatique"| AZURE
    AZURE -->|"Lifecycle policy"| ARCHIVE

    SUREBACKUP["SureBackup<br/>Sandbox de test"]
    REPO --> SUREBACKUP

Composants detailles

Composant Role Detail technique
Backup Server Orchestrateur central Gere les jobs, la planification, la retention, les notifications
Proxy Moteur de traitement Lit les donnees source, applique deduplication et compression, ecrit sur le repository
Repository Stockage des sauvegardes Disque local ou NFS/SMB, organise en chaines incrementales
Console Interface d'administration Web UI pour configurer jobs, surveiller, lancer des restaurations

Mode de transport du Proxy

Le proxy Veeam utilise le mode Virtual Appliance (Hot-Add) sous VMware : il monte directement les disques virtuels de la VM source, evitant le passage par le reseau LAN. Cela accelere considerablement les sauvegardes.


Continuous Data Protection (CDP)

Le CDP represente le niveau de protection le plus eleve de Veeam.

CDP vs Snapshots traditionnels

Critere Snapshot traditionnel CDP Veeam
Methode Photo a un instant T (planifiee) Capture continue des I/O en temps reel
RPO Egal a la frequence des snapshots (1h, 4h, 24h) Secondes a minutes
Impact performance Stun a la creation/suppression du snapshot Negligeable (filtre I/O hyperviseur)
Granularite restauration Points discrets (chaque snapshot) N'importe quel point dans le temps

Fonctionnement technique

sequenceDiagram
    participant VM as VM Source
    participant Filter as Filtre I/O vSphere
    participant Proxy as CDP Proxy
    participant Target as VM Cible (DR)
    participant Journal as Journal CDP

    VM->>Filter: 1. Ecriture disque normale
    Filter->>VM: Ecriture confirmee (pas de latence ajoutee)
    Filter->>Proxy: 2. Copie asynchrone du bloc modifie
    Proxy->>Target: 3. Replication vers la cible
    Proxy->>Journal: 4. Ecriture dans le journal (timeline)
    Note over Journal: Permet la restauration a<br/>n'importe quel point dans le temps

Quand utiliser le CDP

Le CDP est reserve aux applications les plus critiques (base de donnees de production, serveur de messagerie, controleur de domaine) car il consomme davantage de ressources (bande passante, stockage journal). Les autres VMs utilisent la sauvegarde incrementale classique.


Scale-out Backup Repository (SOBR)

Le SOBR est le mecanisme de tiering automatique de Veeam.

graph LR
    subgraph SOBR["Scale-out Backup Repository"]
        PT["<b>Performance Tier</b><br/>Stockage local SSD/HDD<br/>Restauration rapide<br/>Retention : 14 jours"]
        CT["<b>Capacity Tier</b><br/>Azure Blob Cool<br/>Cout optimise<br/>Retention : 90 jours"]
        AT["<b>Archive Tier</b><br/>Azure Blob Archive<br/>Cout minimal<br/>Retention : 365+ jours"]
    end

    PT -->|"Donnees > 14 jours<br/>Copie + Deplacement"| CT
    CT -->|"Donnees > 90 jours<br/>Deplacement"| AT
Tier Support Acces Cout relatif Cas d'usage
Performance Disque local (SSD/HDD) Immediat Eleve Restaurations rapides, operationnelles
Capacity Azure Blob Cool Minutes Modere Sauvegardes mensuelles, archivage court terme
Archive Azure Blob Archive Heures (rehydratation) Faible Conformite legale, retention longue duree

Immutabilite et conformite

Azure Blob WORM (Write Once Read Many)

L'immutabilite garantit qu'un objet stocke ne peut etre ni modifie ni supprime pendant sa periode de retention, meme par un administrateur global Azure.

Mode Comportement Cas d'usage
Legal Hold Immutable jusqu'a levee manuelle du hold Investigations legales
Time-based (Unlocked) Immutable pour la duree definie, politique modifiable Tests, environnements non regules
Time-based (Locked/Compliance) Immutable pour la duree definie, politique non modifiable Production, conformite reglementaire

Normes de conformite

Norme Secteur Exigence
SEC 17a-4 Finance (USA) Conservation des enregistrements electroniques en mode non modifiable
FINRA Courtage (USA) Retention des communications et transactions
RGPD Europe Droit a l'effacement vs obligation de conservation (equilibre legal)
HDS Sante (France) Hebergement securise des donnees de sante

Ransomware et sauvegardes

En 2024, 93% des attaques ransomware ciblent les sauvegardes (source : Veeam Data Protection Trends). L'immutabilite WORM est la seule garantie qu'une copie saine existe apres compromission.


SureBackup

SureBackup est la technologie de verification automatisee des sauvegardes. Veeam cree un sandbox reseau isole, demarre les VMs directement depuis les fichiers de sauvegarde (Instant VM Recovery), execute des tests automatises (ping, port TCP, scripts applicatifs) puis detruit l'environnement de test.

Frequence des tests SureBackup

Tests hebdomadaires pour les VMs critiques, mensuels pour les autres. Un echec declenche un ticket et une investigation immediate.


Lab

VM IP VLAN Specs Role
INF-ASAV12A 10.15.100.241 105 (Sauvegarde) 2 vCPU, 4 Go RAM Veeam Backup Server

Objectifs de protection

Classification Services RPO RTO Methode
Critique AD, DNS, Vault, BDD production < 15 min < 1h CDP
Important Mail, GitLab, Nextcloud < 1h < 2h Incremental + Replication
Standard Supervision, Wiki, Outils internes < 4h < 4h Incremental quotidien
Dev/Test Environnements de dev < 24h < 24h Sauvegarde hebdomadaire