OVH Community, votre nouvel espace communautaire.

[Cluster 015] Site offline depuis 20h30 ?


staan
06/03/2016, 22h41
22h30 : UP, problème similaire ce soir, depuis 22h30 , enorme pic CPU, j'ai check les logs rien d'anormal, idem sur la base SQL... quelqu'un pourrait regarder ?

02h19 : problème réglé.

staan
24/02/2016, 22h18
Merci

En tout cas, toujours satisfait de vos services, la réactivité est à son top

L.YA
24/02/2016, 22h05
En fait, à partir du moment où côté php, il a accumulé les requêtes en attentes, il va re-saturer le serveur SQL (et il est vrai qu'il est difficile pour vous d'agir de ce côté là sans avoir la main sur nos machines à moins d'attendre la fin de tous les timeout php). Cela me donne une idée d'amélioration pour le manager à proposer d'ailleurs...

Pour les offres performances, les nouveaux SQL privé fournissent maintenant de base 256Mo RAM (nouvelle infrastructure). Il est prévu de migrer ceux qui résident encore sur l'ancienne infrastructure (et donc de passer à 256Mo au passage) mais je ne suis pas encore en mesure de vous donner une date (je vais quand même essayer de me renseigner demain ).

staan
24/02/2016, 21h54
Hum, pourtant j'ai reboot le serveur SQL quand j'ai constaté les timeout.

Merci pour l'intervention rapide et efficace

Concernant les offres performance, un boost des SQL dediés de 128Mo vers 256Mo n'est pas prévu prochainement ?

L.YA
24/02/2016, 21h52
Alors, j'ai "kill" (dégommé) à coup de hache tous les process php lié à ton hébergement sur le cluster.
Le site est repartit.

De par les quelques observations que je viens de faire, j'ai l'impression qu'il y a eu une saturation de la mémoire vive côté SQL (sqlprivé à première vue => voir le mysql.err) et du coup, il a finit par être complétement saturé de requête (plus lente donc), ce qui a ensuite entrainé une saturation (pages qui attendent un retour de mysql) côté php/web (sacré réaction en chaine !).

J'aurais tendance à dire qu'il doit y avoir des requêtes trop gourmandes en mémoire pour le sql privé et qu'il a eu beaucoup de mal à suivre (et a entrainé ton serveur web dans sa chute).

staan
24/02/2016, 21h50
Loïc, le site vient de repartir à l'instant (22:32:39), tu est intervenu ? tu sais d'où ca vient ?

staan
24/02/2016, 21h26
le site

merci L. YA

L.YA
24/02/2016, 21h18
Bonjour staan, ça ressemble à des pages qui freeze, sature tes worker php et tombent en timeout.
Il doit y avoir quelque chose qui génère ces timeout.

Peux-tu me donner le domaine pour vérifier (ou au moins trouver une piste ) stp ?

staan
24/02/2016, 20h59
Bonsoir,

Mon site est down depuis 20h30 environ (ca tourne dans le vent, et aucune page de s'affiche, ca fini par timeout...)

Je suis sur le cluster015, d'autres personnes dans ce cas ?

(mon site est stable depuis plusieurs mois, aucune modif recente).

Première vague de timeout de 17h à 17h30

Deuxième vague depuis 20:23:12

dans les logs j'ai de nombreux

FastCGI: incomplete headers (0 bytes) received from server

et

(104)Connection reset by peer: FastCGI: comm with server "

une idée ?