OVH Community, votre nouvel espace communautaire.

Plantage serveur : arret de tous les process et services chaque semaine même heure


janus57
29/05/2015, 14h37
Bonjour,

déjà :
Le serveur tourne sous Release 2
la R2 est censé être morte depuis un bon moment est théoriquement les clients on reçut un mail de OVH (@MaikoB peu confirmer ou non ?).

Sinon pour le coup suivre les commandes de @MaikoB et prévoir une migration en R3 (ou autre choses) serait plus que mieux pour éviter de voir son serveur transformé en zombie.
En tout cas bonne chance, cela semble "trop régulier et précis" pour être un problème matériel ou logiciel lié à un bug (sa sens l'action humaine à plein nez via un cron ou autre comme dit plus haut par les autres membres).

Cordialement, janus57

Nowwhat
29/05/2015, 14h16
Citation Envoyé par cooladn
....,
Depuis 3 semaines, mon serveur stop ses process et services à 9h00 sans intervention de ma part et sans que j'en sois alerté.
Le serveur reste disponible au ping...
Le serveur tourne sous Release 2 en boot reseau 3.14.32 (Stable Kernel, with GRSec - 64bit) .
Je sais que vous allez me dire de changer de release, mais j'aimerai avant tout comprendre pourquoi il fait ca alors qu'il est en place depuis 4 ans sans aucun problème.
Bascule ton serveur en mode rescue.
Fait tester (par toi même avec les outils proposé) ton serveur coté RAM, disque dur etc.
Si ces tests ne mentionne rien, que tout va bien, t'auras ta réponse => c'est coté 'logiciel' et dans ce cas, il un petit ménage de printemps qui s'impose.

MaikoB
29/05/2015, 13h45
Bonjour,

Première chose : est-ce que le serveur est à jours ?

cat /etc/ovhrelease

J'ai déjà eu des comportements similaire et cela s'est malheureusement fini lors de la découverte que le serveur était hacké en root.

Pourrais-tu effectuer la commande suivante :

lsattr /usr/local/sbin /usr/local/bin /usr/sbin /usr/bin /bin /sbin 2>&1 | grep ia

Aussi, as-tu bien vérifié les crons ?

cat /etc/crontab

aussi les dossiers /etc/cron.d/ /etc/cron.dialy,weekly, etc.

Cordialement,

TBC_Ly0n
28/05/2015, 17h31
En effet, il faudrait voir les logs systèmes.
Ou soit, un plaisantin qui a ajouté une tâche cron qui génère ces reboots.

Kioob
28/05/2015, 11h35
Bonjour,

ça ressemble beaucoup à une saturation de la RAM, et OOM killer qui fait ensuite des ravages. As-tu un minimum de supervision de la bête ? (munin, nagios, cacti, etc)

cooladn
28/05/2015, 11h04
Bonjour,

Depuis 3 semaines, mon serveur stop ses process et services à 9h00 sans intervention de ma part et sans que j'en sois alerté.
Le serveur reste disponible au ping...
Le serveur tourne sous Release 2 en boot reseau 3.14.32 (Stable Kernel, with GRSec - 64bit) .
Je sais que vous allez me dire de changer de release, mais j'aimerai avant tout comprendre pourquoi il fait ca alors qu'il est en place depuis 4 ans sans aucun problème.

Je n'ai rien coté tache cron ni dans les logs (à part des tentatives de connexions ssh erronées comme on en subit tous...)