Annonce

#1 2020-08-15 20:12:00

o2switch
o2switch
Lieu : Clermont-Ferrand
Inscription : 2014-06-17
Site Web

[15/08/2020] Incident "gateau"

Bonjour,

Notre équipe a été alerté/a constaté par monitoring le reboot intempestif d'un node de "gateau".
Nous avons investigué l'origine de ces reboots, et aucune partie "software" ne peut en être responsable : le kernel part alors en panic sans raison, sans charge, ni élément complémentaire d'investigation.

Il apparait qu'un RAID SSD a posé problème, sur les partitions de boot et système.
Après tentative de réparation sans effet, et dans la mesure où une réparation va prendre plus de temps qu'un remplacement : nous changeons totalement le node.

Les données sont naturellement intactes, et nous recopions le RAID sur des mediums neufs.
Le serveur devrait remonter dès que possible, et dès opération physique, à durée incompressible, sera terminée.

Cordialement
Equipe Technique

Hors ligne