×
9 sept. 2025 :
une maintenance nécessaire est planifiée de nuit pour vérification de l'intégrité du système de fichiers du serveur Kiwi (FSCK). C'est la procédure conseillée pour retrouver la pleine stabilité de ce serveur, notamment validée par les équipes de KernelCare.
Compte tenu des nombreux facteurs pouvant influencer une telle opération (quantité d'inodes, nombre de corrections à réaliser, etc), il ne nous est malheureusement pas possible d'évaluer à l'avance la durée de cette maintenance.
Soyez sûr que l'équipe fait tout son possible afin que celle-ci soit la plus brève possible.
Merci pour votre compréhension et collaboration.
UPDATE 9 sept. 2025 suite à maintenance terminée :
L'opération de maintenance s'est très bien passée et n'a pas excédé 36 min de downtime.
Le serveur reboot à présent normalement et les services semblent plus stables que jamais.
Nous demandons néanmoins la confirmation à KernelCare que tout est en ordre.
Notre équipe se tient à disposition pour tout complément.
UPDATE, 29 août 2025, 7h48 :
Aujourd'hui, vers 6h, suivant les conseils de notre fournisseur kernel (TuxCare), nous avons switché notre firewall iptables-legacy vers la nouvelle technologie recommandée iptables-nft et avons mis à jour le kernel du serveur dans sa dernière version kernel-5.14.0-570.37.1.el9_6 + reboot.
Malheureusement, malgré ces corrections et évolutions, et comme précédemment, la séquence de reboot ne s'est pas déroulée normalement, empêchant le démarrage automatique du réseau et nécessitant encore une fois une longue intervention via IPMI pour rétablir l'accès au serveur (down time total : 22 min).
Nous discutons en ce moment avec les équipes de TuxCare pour trouver une solution à cette situation bancale que nous regrettons et pour laquelle nous nous excusons vivement encore une fois.
Un nouveau reboot est prévu pour la semaine prochaine, en espérant que les prochaines actions entreprises nous permettrons de vous annoncer une situation stable pour ce serveur Kiwi.
__________
Annonce initiale, 27 août 2025 :
Dans le cadre de nos procédures de surveillance proactive, une anomalie mineure a été détectée par nos soins sur le service de live-patching du noyau, KernelCare :
insmod: ERROR: could not insert module /var/cache/kcare/patches/none-5f7eab9877a324b4068aeda04db16e2fd9d1c09f-17-default/fixup_vmlinux.ko: Unknown symbol in module
Celle-ci a été immédiatement escaladée à son éditeur, CloudLinux, par notre équipe, pour conserver une bonne stabilité du système.
Lors de l'intervention du support technique de KernelCare, l'application d'un patch noyau défectueux a malheureusement provoqué une instabilité critique du système iptables, menant à un « Kernel Panic » et rendant le serveur inopérable pendant +45 minutes.
Malgré une impossibilité d'accès réseau provoquée par ce patch défectueux, notre équipe technique a forcé au plus haut niveau un redémarrage en mode sans échec via la console IPMI, avec dépannage réseau d'urgence pour restaurer les services vitaux en urgence.
L'incident reste ouvert et sous investigation active entre notre équipe et celle de KernelCare pour obtenir une analyse de la cause racine.
Bien que les services soient actuellement opérationnels et stables pour la plupart, la stabilité du serveur ne peut être considérée comme optimale tant que l'enquête est en cours…
Un nouveau redémarrage contrôlé et supervisé sera planifié pour garantir le retour à une stabilité complète dès que la cause racine aura été définitivement corrigée par leurs équipes, sans ETA de leur part actuellement.
Nous nous permettons de vous réaffirmer le dévouement complet d'EasyHoster dans la stabilité et la disponibilité des services que nous vous proposons et nous excusons pour cet incident indépendant de notre volonté.
Merci pour votre compréhension.