On dit toujours qu’il faut faire des backups, encore des backups, toujours plus de backups. Ce qu’on a tendance à dire moins souvent c’est que tant que les données n’ont pas été restaurées avec succès un backup ne sert à rien.
Un exemple marquant est le cas de Ma.gnolia, site social où il était possible de stocker des marque pages sur Internet. Le 30 Janvier dernier, le site a subit un crash catastrophique de sa base de données MySQL 5, entraînant de fait la coupure du site. Ce crash était du à une corruption de données étalée dans le temps (non détectable a priori sans véritable contrôle de cohérence) qui a aussi corrompue les backups. Un passage par des spécialistes de la récupération de données n’a malheureusement rien donné non plus, ce qui signifie une perte totale de près de 500 Go de données utilisateurs et la mort effective du site dans sa version actuelle. Heureusement des systèmes de caches sur d’autres sites Internet (FriendFeed, flux RSS, etc) ont permis à certains utilisateurs de récupérer une partie de leurs données.
Voici un podcast où le responsable de Ma.gnolia explique un peu plus en détails ce qu’il s’est passé :
Citizen Garden Episode 11: Whither Ma.gnolia? from Larry Halff on Vimeo.
La leçon principale à retenir pour un opérateur de backups est donc ici de régulièrement tester jusqu’au bout sa procédure de restauration de données. Il est aussi utile, bien que techniquement parfois difficile voire impossible, d’effectuer des vérifications de cohérences des données à sauvegarder ainsi que des backups.