Virtualisation VMware vSphere 8¶
Concepts de virtualisation¶
La virtualisation consiste a abstraire les ressources physiques (CPU, RAM, stockage, reseau) pour creer des machines virtuelles (VMs) independantes sur un meme serveur. Cette technologie est au coeur de toute infrastructure d'entreprise moderne.
Pourquoi virtualiser ?
Sans virtualisation, chaque service necessite un serveur physique dedie. Avec la virtualisation, un seul serveur physique peut heberger dizaines de VMs, reduisant les couts materiels de 60 a 80% tout en ameliorant la flexibilite et la disponibilite.
Hyperviseur Type 1 vs Type 2¶
| Critere | Type 1 (bare-metal) | Type 2 (hosted) |
|---|---|---|
| Installation | Directement sur le materiel | Sur un OS hote (Windows, Linux) |
| Performances | Quasi-natives, acces direct au hardware | Overhead lie a l'OS hote |
| Exemples | VMware ESXi, Hyper-V Server, KVM | VirtualBox, VMware Workstation |
| Usage | Production, datacenters | Developpement, tests locaux |
| Securite | Surface d'attaque reduite | Depend de la securite de l'OS hote |
Dans notre infrastructure
Nous utilisons ESXi 8.0 U2, un hyperviseur de Type 1. Il s'installe directement sur le materiel serveur sans OS intermediaire, garantissant des performances maximales et une surface d'attaque minimale.
Fonctionnalites cles de vSphere¶
| Fonctionnalite | Description |
|---|---|
| vMotion | Migration a chaud d'une VM d'un hote ESXi a un autre sans interruption de service. Le CPU state, la memoire et les connexions reseau sont transferes en temps reel. |
| High Availability (HA) | Si un hote ESXi tombe en panne, vSphere HA redemarre automatiquement les VMs sur les hotes restants du cluster. Le temps de reprise est de l'ordre de 1 a 5 minutes. |
| DRS (Distributed Resource Scheduler) | Equilibrage automatique de la charge entre les hotes. DRS surveille l'utilisation CPU/RAM et deplace les VMs via vMotion pour optimiser les performances. |
| vSAN | Stockage distribue hyperconverge integre aux hotes ESXi (detaille ci-dessous). |
| Fault Tolerance (FT) | VM dupliquee en temps reel sur un second hote : zero downtime meme en cas de panne materielle (usage critique uniquement, cout eleve en ressources). |
Architecture vSphere 8 (Production)¶
L'architecture de production comprend 8 noeuds ESXi repartis sur deux sites geographiques (4+4), geres par un vCenter Server Appliance en haute disponibilite. vSAN Enterprise Plus assure le stockage distribue avec replication synchrone inter-sites.
graph TB
subgraph VCENTER["vCenter Server 8.0 U2 - HA"]
VC["vcenter.infra.indio<br/>10.15.100.10<br/>Gestion centralisee"]
end
subgraph SITE_A["Site Principal - 4 noeuds"]
ESX1["ESXi-01<br/>512 GB RAM<br/>NVMe vSAN"]
ESX2["ESXi-02<br/>512 GB RAM<br/>NVMe vSAN"]
ESX3["ESXi-03<br/>512 GB RAM<br/>NVMe vSAN"]
ESX4["ESXi-04<br/>512 GB RAM<br/>NVMe vSAN"]
end
subgraph SITE_B["Site Secondaire - 4 noeuds"]
ESX5["ESXi-05<br/>512 GB RAM<br/>NVMe vSAN"]
ESX6["ESXi-06<br/>512 GB RAM<br/>NVMe vSAN"]
ESX7["ESXi-07<br/>512 GB RAM<br/>NVMe vSAN"]
ESX8["ESXi-08<br/>512 GB RAM<br/>NVMe vSAN"]
end
subgraph MGMT["Management"]
ARIA_A["Aria Automation<br/>Orchestration IaC"]
ARIA_O["Aria Operations<br/>Monitoring + Capacity"]
end
VC --> SITE_A
VC --> SITE_B
VC --> MGMT
SITE_A <-->|"vSAN Stretched Cluster<br/>Replication synchrone"| SITE_B
vCenter HA (High Availability)¶
Le vCenter est deploye en mode HA avec 3 noeuds : Active, Passive et Witness. Si le noeud actif tombe, le noeud passif prend le relais en moins de 5 minutes. Le witness arbitre le quorum pour eviter les split-brain.
Composants de la plateforme¶
| Composant | Version | Configuration | Role |
|---|---|---|---|
| vCenter Server | 8.0 Update 2 (VCSA) | HA Active/Passive/Witness | Gestion centralisee des clusters, inventaire, permissions |
| ESXi | 8.0 Update 2 | 8 hotes, 512 Go RAM chacun | Hyperviseur bare-metal, execution des VMs |
| vSAN | Enterprise Plus | FTT=1, NVMe, Stretch Cluster | Stockage distribue hyperconverge |
| Aria Automation | 8.x (ex-vRealize) | Blueprints IaC, self-service | Orchestration, provisionnement automatise |
| Aria Operations | 8.x (ex-vRealize) | Dashboards, alertes, projections | Monitoring, capacity planning, optimisation |
Licences VMware
Depuis le rachat par Broadcom (2023), le modele de licences VMware a profondement change. vSAN Enterprise Plus est desormais inclus dans la licence VMware Cloud Foundation (VCF). Il est essentiel de bien dimensionner les licences par CPU socket.
Capacites de stockage¶
| Type de stockage | Technologie | Capacite brute | Capacite utilisable | Perte overhead | Usage principal |
|---|---|---|---|---|---|
| vSAN | NVMe SSD | 200 To | ~140 To | ~30% (FTT + metadata) | VMs critiques, bases de donnees |
| Ceph | HDD + SSD cache | 500 To | ~350 To | ~30% (replication x3) | Mail, fichiers, objets S3 |
| Veeam | HDD SATA | 300 To | ~250 To | ~17% (filesystem) | Sauvegardes, retention longue |
vSAN en detail¶
vSAN transforme les disques locaux de chaque hote ESXi en un datastore distribue partage. Au lieu d'un SAN externe couteux, le stockage est integre directement dans les serveurs.
Fonctionnement des Disk Groups¶
Chaque hote contribue un ou plusieurs disk groups composes de :
- Cache Tier : disque NVMe/SSD rapide servant de buffer en lecture (70%) et ecriture (30%)
- Capacity Tier : disques NVMe/SSD/HDD stockant les donnees persistantes
graph LR
subgraph HOST["Hote ESXi"]
subgraph DG1["Disk Group 1"]
CACHE1["NVMe Cache<br/>800 Go"]
CAP1A["NVMe Capacity<br/>3.2 To"]
CAP1B["NVMe Capacity<br/>3.2 To"]
end
subgraph DG2["Disk Group 2"]
CACHE2["NVMe Cache<br/>800 Go"]
CAP2A["NVMe Capacity<br/>3.2 To"]
CAP2B["NVMe Capacity<br/>3.2 To"]
end
end
CACHE1 --> CAP1A
CACHE1 --> CAP1B
CACHE2 --> CAP2A
CACHE2 --> CAP2B
Politiques FTT et modes RAID¶
La politique Failures To Tolerate (FTT) definit combien de pannes le cluster peut supporter :
| Politique | Methode | Copies/Parite | Hotes minimum | Overhead stockage | Usage |
|---|---|---|---|---|---|
| FTT=0 | Aucune | 1 copie | 1 | 0% | Dev/Test uniquement |
| FTT=1 (RAID-1) | Mirroring | 2 copies | 3 | 100% | Notre choix - Production |
| FTT=1 (RAID-5) | Erasure coding | 3+1 parite | 4 | 33% | Bon compromis capacite/perf |
| FTT=2 (RAID-1) | Mirroring | 3 copies | 5 | 200% | Haute criticite |
| FTT=2 (RAID-6) | Erasure coding | 4+2 parite | 6 | 50% | Capacite + resilience |
FTT=0 interdit en production
Avec FTT=0, la perte d'un seul disque ou hote entraine une perte de donnees. En production, FTT=1 minimum est obligatoire. Notre infrastructure utilise FTT=1 en RAID-1 (mirroring) pour des performances d'ecriture optimales.
Stretched Cluster¶
Le vSAN Stretched Cluster replique de maniere synchrone les donnees entre les deux sites. Un hote witness (heberge sur un troisieme site ou reseau isole) assure le quorum en cas de perte d'un site complet.
graph LR
subgraph SA["Site A - 4 hotes"]
DA["Donnees<br/>Copie 1"]
end
subgraph SB["Site B - 4 hotes"]
DB["Donnees<br/>Copie 2"]
end
subgraph SW["Site Witness"]
W["Witness<br/>Quorum metadata"]
end
DA <-->|"Replication synchrone<br/>RPO = 0"| DB
DA --- W
DB --- W
Lab de deploiement¶
Notre lab reproduit l'architecture de production a echelle reduite pour valider les concepts et les procedures.
Infrastructure du lab¶
| Element | Detail |
|---|---|
| Hotes ESXi | 4 au total : 1 physique + 3 nested (ESXi dans ESXi) |
| Clusters | 2 clusters vSphere (simulation multi-site) |
| vCenter | vcenter.infra.indio - 10.15.100.10 |
| VMs deployees | 21 VMs Rocky Linux 9 |
| Provisionnement | Terraform (modules YAML-driven) |
| Configuration | Ansible (playbooks idempotents) |
Nested ESXi
Le nested ESXi consiste a installer un hyperviseur ESXi dans une VM. Cela permet de simuler un cluster multi-hotes avec un seul serveur physique. Les performances sont reduites mais suffisantes pour un lab de validation.
Pipeline de deploiement¶
graph LR
TF["Terraform<br/>Infrastructure as Code"]
VCENTER["vCenter API<br/>10.15.100.10"]
VMS["21 VMs<br/>Rocky Linux 9"]
ANS["Ansible<br/>Configuration"]
PROD["VMs configurees<br/>et operationnelles"]
TF -->|"Cree les VMs<br/>via provider vSphere"| VCENTER
VCENTER -->|"Provisionne"| VMS
VMS -->|"Inventaire dynamique"| ANS
ANS -->|"Playbooks<br/>idempotents"| PROD
Les 21 VMs Rocky Linux 9 couvrent l'ensemble des services de l'infrastructure : DNS, LDAP, proxy, monitoring, stockage, bastion, et services applicatifs. Chaque VM est definie dans un fichier YAML Terraform, permettant un deploiement reproductible et versionne dans GitLab.