PRA / PCA (Veeam)¶
Concepts de reprise d'activite¶
Le Plan de Reprise d'Activite (PRA) et le Plan de Continuite d'Activite (PCA) sont deux strategies complementaires pour assurer la resilience de l'infrastructure face aux sinistres.
- PCA : maintenir le service en continu, meme en mode degrade (haute disponibilite, failover)
- PRA : restaurer le service apres une interruption majeure (sauvegarde, restauration, site DR)
RPO vs RTO¶
Ces deux metriques definissent les exigences de protection :
timeline
title Chronologie d'un sinistre
section Avant le sinistre
Derniere sauvegarde : RPO = donnees perdues
section Sinistre
Interruption : Debut du RTO
section Apres le sinistre
Service restaure : Fin du RTO
| Metrique | Signification | Question cle |
|---|---|---|
| RPO (Recovery Point Objective) | Quantite maximale de donnees que l'on accepte de perdre | "Combien de temps de travail peut-on perdre ?" |
| RTO (Recovery Time Objective) | Duree maximale d'interruption acceptable | "En combien de temps doit-on etre de retour ?" |
RPO et RTO sont inversement proportionnels au cout
Un RPO de 0 (zero perte) necessite de la replication synchrone, extremement couteuse. Un RPO de 24h ne necessite qu'une sauvegarde quotidienne. Le choix depend de la criticite metier.
Business Impact Analysis (BIA)¶
Avant de definir RPO et RTO, il faut realiser une analyse d'impact metier :
| Etape | Action | Resultat |
|---|---|---|
| 1. Inventaire | Lister tous les services et applications | Catalogue des actifs |
| 2. Classification | Evaluer la criticite de chaque service | Tiers de criticite |
| 3. Impact financier | Estimer le cout d'une heure d'arret | Cout horaire par service |
| 4. Dependances | Cartographier les dependances entre services | Arbre de dependances |
| 5. Objectifs | Definir RPO/RTO par service | Matrice de protection |
Tiers de reprise¶
| Tier | Description | RPO | RTO | Technologie |
|---|---|---|---|---|
| Tier 1 | Pas de DR | Illimite | Illimite | Aucune |
| Tier 2 | Sauvegarde hors site | 24h | 24-72h | Bandes, stockage objet |
| Tier 3 | Sauvegarde + site tiede | 4-12h | 4-12h | Veeam + VM hors site |
| Tier 4 | Site chaud actif-passif | 15 min - 1h | 1-4h | CDP + replication |
| Tier 5 | Site actif-actif | ~0 | ~0 | Replication synchrone |
Notre positionnement
L'infrastructure INDIO Group se situe entre le Tier 3 et Tier 4 selon les services : CDP pour les applications critiques (RPO < 15 min), sauvegarde classique pour le reste (RPO < 4h).
Regle 3-2-1-1-0¶
La regle 3-2-1 est un standard de l'industrie, etendu par Veeam en 3-2-1-1-0 :
graph TD
subgraph RULE["Regle 3-2-1-1-0"]
R3["<b>3</b> copies des donnees<br/>Production + 2 sauvegardes"]
R2["<b>2</b> types de support differents<br/>Disque local + Stockage objet"]
R1A["<b>1</b> copie hors site<br/>Azure Blob (region distante)"]
R1B["<b>1</b> copie immutable<br/>WORM Azure Compliance"]
R0["<b>0</b> erreur de restauration<br/>Verification SureBackup"]
end
R3 --> R2 --> R1A --> R1B --> R0
| Element | Implementation chez INDIO | Justification |
|---|---|---|
| 3 copies | Production + sauvegarde locale + Azure Blob | Redondance contre la perte physique |
| 2 supports | Disque SSD/HDD local + stockage objet cloud | Diversification des risques (incendie, panne) |
| 1 hors site | Replication vers Azure (region France Central) | Protection contre sinistre du site principal |
| 1 immutable | Azure Blob WORM Compliance-mode | Impossible a supprimer, meme par un admin compromis |
| 0 erreur | Tests automatises SureBackup hebdomadaires | Garantie que la restauration fonctionne reellement |
Pourquoi l'immutabilite est critique
Les ransomwares modernes ciblent en priorite les sauvegardes avant de chiffrer la production. Sans copie immutable, une attaque reussie peut rendre toutes les sauvegardes inutilisables.
Architecture Veeam¶
Veeam Backup & Replication est compose de plusieurs briques :
graph TB
subgraph VEEAM["Veeam Architecture"]
VBR["Veeam Backup Server<br/>INF-ASAV12A<br/>10.15.100.241"]
CONSOLE["Veeam Console<br/>(interface web)"]
PROXY["Veeam Proxy<br/>(traitement des donnees)"]
REPO["Repository Local<br/>(Performance Tier)"]
end
subgraph SOURCES["Sources de donnees"]
VCENTER["vCenter / ESXi"]
HYPERV["Hyper-V"]
PHYS["Serveurs physiques"]
end
subgraph CLOUD["Stockage Cloud"]
AZURE["Azure Blob Storage<br/>(Capacity Tier)"]
ARCHIVE["Azure Archive<br/>(Archive Tier)"]
end
CONSOLE --> VBR
VCENTER -->|"API vSphere"| PROXY
HYPERV -->|"WMI"| PROXY
PHYS -->|"Agent Veeam"| PROXY
PROXY -->|"Deduplication + Compression"| REPO
REPO -->|"Tiering automatique"| AZURE
AZURE -->|"Lifecycle policy"| ARCHIVE
SUREBACKUP["SureBackup<br/>Sandbox de test"]
REPO --> SUREBACKUP
Composants detailles¶
| Composant | Role | Detail technique |
|---|---|---|
| Backup Server | Orchestrateur central | Gere les jobs, la planification, la retention, les notifications |
| Proxy | Moteur de traitement | Lit les donnees source, applique deduplication et compression, ecrit sur le repository |
| Repository | Stockage des sauvegardes | Disque local ou NFS/SMB, organise en chaines incrementales |
| Console | Interface d'administration | Web UI pour configurer jobs, surveiller, lancer des restaurations |
Mode de transport du Proxy
Le proxy Veeam utilise le mode Virtual Appliance (Hot-Add) sous VMware : il monte directement les disques virtuels de la VM source, evitant le passage par le reseau LAN. Cela accelere considerablement les sauvegardes.
Continuous Data Protection (CDP)¶
Le CDP represente le niveau de protection le plus eleve de Veeam.
CDP vs Snapshots traditionnels¶
| Critere | Snapshot traditionnel | CDP Veeam |
|---|---|---|
| Methode | Photo a un instant T (planifiee) | Capture continue des I/O en temps reel |
| RPO | Egal a la frequence des snapshots (1h, 4h, 24h) | Secondes a minutes |
| Impact performance | Stun a la creation/suppression du snapshot | Negligeable (filtre I/O hyperviseur) |
| Granularite restauration | Points discrets (chaque snapshot) | N'importe quel point dans le temps |
Fonctionnement technique¶
sequenceDiagram
participant VM as VM Source
participant Filter as Filtre I/O vSphere
participant Proxy as CDP Proxy
participant Target as VM Cible (DR)
participant Journal as Journal CDP
VM->>Filter: 1. Ecriture disque normale
Filter->>VM: Ecriture confirmee (pas de latence ajoutee)
Filter->>Proxy: 2. Copie asynchrone du bloc modifie
Proxy->>Target: 3. Replication vers la cible
Proxy->>Journal: 4. Ecriture dans le journal (timeline)
Note over Journal: Permet la restauration a<br/>n'importe quel point dans le temps
Quand utiliser le CDP
Le CDP est reserve aux applications les plus critiques (base de donnees de production, serveur de messagerie, controleur de domaine) car il consomme davantage de ressources (bande passante, stockage journal). Les autres VMs utilisent la sauvegarde incrementale classique.
Scale-out Backup Repository (SOBR)¶
Le SOBR est le mecanisme de tiering automatique de Veeam.
graph LR
subgraph SOBR["Scale-out Backup Repository"]
PT["<b>Performance Tier</b><br/>Stockage local SSD/HDD<br/>Restauration rapide<br/>Retention : 14 jours"]
CT["<b>Capacity Tier</b><br/>Azure Blob Cool<br/>Cout optimise<br/>Retention : 90 jours"]
AT["<b>Archive Tier</b><br/>Azure Blob Archive<br/>Cout minimal<br/>Retention : 365+ jours"]
end
PT -->|"Donnees > 14 jours<br/>Copie + Deplacement"| CT
CT -->|"Donnees > 90 jours<br/>Deplacement"| AT
| Tier | Support | Acces | Cout relatif | Cas d'usage |
|---|---|---|---|---|
| Performance | Disque local (SSD/HDD) | Immediat | Eleve | Restaurations rapides, operationnelles |
| Capacity | Azure Blob Cool | Minutes | Modere | Sauvegardes mensuelles, archivage court terme |
| Archive | Azure Blob Archive | Heures (rehydratation) | Faible | Conformite legale, retention longue duree |
Immutabilite et conformite¶
Azure Blob WORM (Write Once Read Many)¶
L'immutabilite garantit qu'un objet stocke ne peut etre ni modifie ni supprime pendant sa periode de retention, meme par un administrateur global Azure.
| Mode | Comportement | Cas d'usage |
|---|---|---|
| Legal Hold | Immutable jusqu'a levee manuelle du hold | Investigations legales |
| Time-based (Unlocked) | Immutable pour la duree definie, politique modifiable | Tests, environnements non regules |
| Time-based (Locked/Compliance) | Immutable pour la duree definie, politique non modifiable | Production, conformite reglementaire |
Normes de conformite¶
| Norme | Secteur | Exigence |
|---|---|---|
| SEC 17a-4 | Finance (USA) | Conservation des enregistrements electroniques en mode non modifiable |
| FINRA | Courtage (USA) | Retention des communications et transactions |
| RGPD | Europe | Droit a l'effacement vs obligation de conservation (equilibre legal) |
| HDS | Sante (France) | Hebergement securise des donnees de sante |
Ransomware et sauvegardes
En 2024, 93% des attaques ransomware ciblent les sauvegardes (source : Veeam Data Protection Trends). L'immutabilite WORM est la seule garantie qu'une copie saine existe apres compromission.
SureBackup¶
SureBackup est la technologie de verification automatisee des sauvegardes. Veeam cree un sandbox reseau isole, demarre les VMs directement depuis les fichiers de sauvegarde (Instant VM Recovery), execute des tests automatises (ping, port TCP, scripts applicatifs) puis detruit l'environnement de test.
Frequence des tests SureBackup
Tests hebdomadaires pour les VMs critiques, mensuels pour les autres. Un echec declenche un ticket et une investigation immediate.
Lab¶
| VM | IP | VLAN | Specs | Role |
|---|---|---|---|---|
| INF-ASAV12A | 10.15.100.241 | 105 (Sauvegarde) | 2 vCPU, 4 Go RAM | Veeam Backup Server |
Objectifs de protection¶
| Classification | Services | RPO | RTO | Methode |
|---|---|---|---|---|
| Critique | AD, DNS, Vault, BDD production | < 15 min | < 1h | CDP |
| Important | Mail, GitLab, Nextcloud | < 1h | < 2h | Incremental + Replication |
| Standard | Supervision, Wiki, Outils internes | < 4h | < 4h | Incremental quotidien |
| Dev/Test | Environnements de dev | < 24h | < 24h | Sauvegarde hebdomadaire |