OVH Community, votre nouvel espace communautaire.

VPS cloud en panne depuis plusieurs heures


damien.rannou
25/09/2014, 14h14
Non il n'est pas possible "d'annuler une task", nous ne proposons pas cette fonctionnalité.

Je suis pas sur de comprendre ton soucis. Si je comprend bien tu parles de deux options différentes : le backup automatique, et le snapshot. Ce n'est pas la même chose. Le snapshot N'EST PAS un backup, il est là pour faire un rollback en cas de tests douteux (une mise a jour d'un soft par exemple). Le backup automatique fonctionne complétement différemment.

Le snapshot manuel peut en effet être plus gourmand en ressources. Nous avons eu un soucis de robot hier, il a fallut débloquer pas mal de task "à la main", cela ne devrait plus arriver.

En dehors de ces deux points, je ne vois rien d'anormal sur ton VPS de notre point de vue, les latences de disques sont bonnes, le CPU est sous utilisé, bref rien qui me permet d'expliquer ta load importante

- - - Mise à jour - - -

Non il n'est pas possible "d'annuler une task", nous ne proposons pas cette fonctionnalité.

Je suis pas sur de comprendre ton soucis. Si je comprend bien tu parles de deux options différentes : le backup automatique, et le snapshot. Ce n'est pas la même chose. Le snapshot N'EST PAS un backup, il est là pour faire un rollback en cas de tests douteux (une mise a jour d'un soft par exemple). Le backup automatique fonctionne complétement différemment.

Le snapshot manuel peut en effet être plus gourmand en ressources. Nous avons eu un soucis de robot hier, il a fallut débloquer pas mal de task "à la main", cela ne devrait plus arriver.

En dehors de ces deux points, je ne vois rien d'anormal sur ton VPS de notre point de vue, les latences de disques sont bonnes, le CPU est sous utilisé, bref rien qui me permet d'expliquer ta load importante

fredbriand
24/09/2014, 13h59
Bonjour et merci pour ton intervention, je me demandais qui s'en etait occupe puisqu'aucun des tickets n'a ete traite...

Donc suite au debloquage de la tache, le VPS a pu rebooter, en retomber en kernel panic, a quoi je m'attendais un peu. Au moins j'ai pu ensuite rebooter en rescue, sans aucun soucis cette fois. fsck ok... rien de special apparent. J'ai edite le grub.conf pour forcer le reboot sur le kernel precendent et j'ai rebooter en mode normal. Boot ok, pas de probleme. Ensuite j'ai force une reinstallation du dernier kernel et des firmwares, puis reboote a nouveau sur le dernier kernel, sans probleme toujours. Depuis le VPS est up et fonctionne normalement.

En revanche je pense que c'est le systeme qui genere les snapshot qui a un probleme. On a les 2 options sur ce vps, automatique et manuel. La snapshot automatique aurait du se faire au memes heures ou le vps a commencer a merder et a monter en charge. Et dans le panel, jusqu'a tu debloques le tache, je ne voyais pas le snapshot d'hier. Ce midi il y est. Pour valider mes soupcons, j'ai voulu faire un snapshot manuel "post-crash", et en voulant supprimer le dernier snapshot, la charge a a nouveau fait un bon (quelques secondes) et la tache est restee bloquee encore, a 50%, pendant pres d'une heure en mode error. La tache s'est debloquee elle aussi et j'ai pu refaire un backup...

Peux tu me confirmer qu'on n'a aucun moyen d'annuler en tache pour les VPS depuis l'admin ou l'API? j'ai rien trouve...

perso j'aimerais quand meme bien comprendre ce qui a pu se passer, parce que ce soir, snapshot automatique again!! et j'aimerais bien dormir!

En tout cas merci encore
++

damien.rannou
24/09/2014, 11h24
La task était bloqué, je viens de la débloquer. Désolé pour le délai.

fredbriand
24/09/2014, 10h39
Salut,

quand j'essayais de créer le ticket d'incident, le nom du VPS était grisé et pas sélectionnable. A cause du ticket automatiquement créé par le monitor d'OVH.

J'ai cherché dans l'API, mais je ne trouve pas de commande qui permette d'annuler une tache pour le VPS. J'ai bien la liste des tâches associées au service, puis le statut de chaque tâche, mais je trouve pas de moyen de stopper ça comme avec une serveur dédié...

florent060
24/09/2014, 09h37
Bonjour

Tu a essayé d'annuler le TASK en question via l'API ?

gaboul49
24/09/2014, 09h29
"je ne peux même pas déclarer un incident" => Normalement tu peux ouvrir un ticket incident pour n'importe quel service. C'est ici : http://www.ovh.com/fr/support/declarer_incident.xml

Seul ovh peut te dépanner.

- - - Mise à jour - - -

"je ne peux même pas déclarer un incident" => Normalement tu peux ouvrir un ticket incident pour n'importe quel service. C'est ici : http://www.ovh.com/fr/support/declarer_incident.xml

Seul ovh peut te dépanner.

fredbriand
24/09/2014, 06h17
Salut,

Mon VPS (vps51693.ovh.net) est en panne depuis près de 6 heures, avec une tâche bloquée et je ne peux plus rien faire. Le ticket est bien sur ouvert, mais c'est long...
On a commencé a avoir une grosse montée en charge (load avg de 57 a un moment!!!) sans raison, des pertes de paquets, des résolutions dns qui ne se faisaient plus... J'ai quand même pu fermer tous les services un par un, ça a été long, et au final j'ai fait un reboot propre, encore plus long.
Au moment du reboot, j'ai eu le menu de Grub, puis les messages du kernel, et après quelques secondes, kernel panic, impossible de trouver le disque sda1. J'ai donc fait un reboot hard...
Depuis la tâche est bloquèe (id: 689508), je peux pas faire de nouveaux reboot, ni passer en mode rescue, ni faire de stop/start via l'API, je ne peux même pas déclarer un incident...

Quelqu'un connait il une solution pour enfin reprendre la main?

Merci,
fred