OVH Community, votre nouvel espace communautaire.

Instabilité serveur et demande d'aide


p4c
30/04/2015, 13h45
C'est bon, le support vient de prendre mon incident en compte et on fait un chargement de carte-mère.
Depuis, ça marche mieux tout de même.

passetemps
30/04/2015, 13h04
fait une déclaration d'incident laisse tomber le ticket au supp

p4c
30/04/2015, 10h50
J'ai encore envoyé un ticket ce matin et un email, toujours pas de réponse.
J’appellerai dans l'après-midi, mais ça sera pas pour demander le mode rescue, mais un remboursement, si au moins, j'avais eu une réponse de leur part, j'aurai vu les choses autrement. Là, c'est une déception des services d'OVH.

Merci en tout cas.

Kioob
30/04/2015, 10h28
Si le serveur ne support pas le rescue, c'est qu'il y a un très sérieux problème. J'ai du mal à croire qu'OVH n'intervienne pas. Essaye d'appeler, ne serait-ce que pour qu'ils mettent la machine en rescue.

p4c
30/04/2015, 10h16
Impossible à faire, un démarrage Netboot sur Rescue m'indique que ce n'est pas supporté par mon serveur...
Je vois mal comment faire un diag HW...

J'ai demandé un remboursement et une résiliation (7 jours sur la loi de rétractation française)

passetemps
30/04/2015, 10h05
et comme je te l'ai indiqué as tu fais les tests HW ??? de toutes façons c'est la première chose que va te demander le support!

p4c
30/04/2015, 08h21
Debian 8 installé, serveur complétement HS , pas de ping, connexion SSH en timeout.
Je veux bien, mais là, c'est hardware tout de même !

p4c
30/04/2015, 08h13
Citation Envoyé par Kioob
Tu as des humains en face, s'il y a vraiment un problème hardware avec la machine, suffit de le dire et ils répareront.
J'ai ouvert un ticket depuis hier matin, un email au support, toujours pas de réponses. Si j'avais une réponse, bien sur que tout se passerait bien.

Kioob
30/04/2015, 08h05
Bref, je reteste avec une debian 8 et si toujours même soucis, j'envoi un courrier recommandé pour remboursement.
Tu as des humains en face, s'il y a vraiment un problème hardware avec la machine, suffit de le dire et ils répareront.

p4c
30/04/2015, 07h57
Hello,

En fait, j'étais parti sur une debian 8 au début, puis, j'ai réinstallé une 7.8 que je connais mieux.
C'est à partir de cette installation que j'ai eu les soucis (je suis resté 2 heures à peine sur debian 8 faut dire).

Cette nuit, trois reboot hard auto du support pour les mêmes raisons, apache et mysql coupé. Donc aucune connexion externe dessus.

De toute façon, avoir une réponse à 2 paquets sur 4 sur un ping constant, c'est qu'il y a bien un soucis.
Bref, je reteste avec une debian 8 et si toujours même soucis, j'envoi un courrier recommandé pour remboursement.

Merci de ton aide.

captainadmin
29/04/2015, 23h02
Hello

Est-ce que tu as betement refait l'installation.
Si ca fait 2 jours que c'est actif, autant recommencer pour être sur que tout s'est bien passé.

Bonne soirée

p4c
29/04/2015, 18h05
bonsoir captainadmin,

merci pour ces réponses.
Le serveur à encore subit un reboot hard de la part du support, puis encore un autre, en boucle actuellement, mais ils ne prennent pas en compte l'incident.
Actuellement, plus de ping sur le serveur à nouveau.

Concernant les logs syslog, kernel et autre, j'ai fais le tour. Rien vu d'anormal.

A part dans le kernel : Apr 29 19:22:27 nsxxxxxx kernel: ACPI BIOS Warning (bug): 32/64X length mismatch in FADT/Gpe0Block: 128/64 (20131218/tbfadt-603)
Apr 29 19:22:27 nsxxxxxx kernel: PCI host bridge to bus 0000:ff
Apr 29 19:22:27 nsxxxxxx kernel: pci_bus 0000:ff: root bus resource [io 0x0000-0xffff]
Apr 29 19:22:27 nsxxxxxx kernel: pci_bus 0000:ff: root bus resource [mem 0x00000000-0xffffffffff]
Apr 29 19:22:27 nsxxxxxx kernel: pci_bus 0000:ff: No busn resource found for root bus, will use [bus ff-ff]
Apr 29 19:22:27 nsxxxxxx kernel: pci 0000:00:1c.0: bridge window [mem 0x00100000-0x000fffff 64bit pref] to [bus 06-07] add_size 200000
Apr 29 19:22:27 nsxxxxxx kernel: pci 0000:00:1f.0: BAR 13: [io 0x0800-0x087f] has bogus alignment
Apr 29 19:22:27 nsxxxxxx kernel: pci 0000:00:1f.0: BAR 14: [io 0x0500-0x053f] has bogus alignment
Apr 29 19:22:27 nsxxxxxx kernel: kvm: VM_EXIT_LOAD_IA32_PERF_GLOBAL_CTRL does not work properly. Using workaround
Apr 29 19:22:27 nsxxxxxx kernel: EDAC MC0: Giving out device to module ghes_edac.c controller ghes_edac: DEV ghes (INTERRUPT)
Apr 29 19:22:27 nsxxxxxx kernel: EDAC MC1: Giving out device to module ghes_edac.c controller ghes_edac: DEV ghes (INTERRUPT)
Apr 29 19:22:27 nsxxxxxx kernel: [Firmware Warn]: GHES: Poll interval is 0 for generic hardware error source: 1, disabled.
Apr 29 19:22:27 nsxxxxxx kernel: GHES: Failed to enable APEI firmware first mode.
Apr 29 19:22:27 nsxxxxxx kernel: input: AT Translated Set 2 keyboard as /devices/platform/i8042/serio0/input/input0
Apr 29 19:22:27 nsxxxxxx kernel: md: Waiting for all devices to be available before autodetect
Apr 29 19:22:27 nsxxxxxx kernel: md: If you don't use raid, use raid=noautodetect
Apr 29 19:22:27 nsxxxxxx kernel: md: Autodetecting RAID arrays.
Apr 29 19:22:27 nsxxxxxx kernel: md: Scanned 0 and added 0 devices.
Apr 29 19:22:27 nsxxxxxx kernel: md: autorun ...
Apr 29 19:22:27 nsxxxxxx kernel: md: ... autorun DONE.
Apr 29 19:22:27 nsxxxxxx kernel: EXT3-fs (sda1): error: couldn't mount because of unsupported optional features (240)
Apr 29 19:22:27 nsxxxxxx kernel: EXT2-fs (sda1): error: couldn't mount because of unsupported optional features (244)
Apr 29 19:22:27 nsxxxxxx kernel: EXT4-fs (sda1): INFO: recovery required on readonly filesystem
Apr 29 19:22:27 nsxxxxxx kernel: EXT4-fs (sda1): write access will be enabled during recovery
Apr 29 19:22:27 nsxxxxxx kernel: EXT4-fs (sda1): orphan cleanup on readonly fs
Apr 29 19:22:27 nsxxxxxx kernel: EXT4-fs (sda1): 5 orphan inodes deleted
Apr 29 19:22:27 nsxxxxxx kernel: EXT4-fs (sda1): recovery complete
Apr 29 19:22:27 nsxxxxxx kernel: EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)


Je sais que c'est ni ma conf php, ni ssh, apache2 ou mysql, elle est identique à l'autre serveur sur lequel j'ai rapatrié mes données.
Pour ipmi, je connais pas du tout. Mais j'avoue que louer un serveur +70€/mois depuis à peine 2 jours et avoir ce genre de soucis sans réponse du support, ça fais mal où je pense.

D'ailleurs, pour isoler le problème, j'ai tout coupé, apache, mysql.
Donc à part SSH qui tourne, y'a rien d'autre.

Et quand je fais un test de ping sur la durée quand il est en ligne (durée de vie : 15 minutes avant hard reboot nécessaire), j'obtiens un paquet sur 1/4 voir 2/4 qui ne passe pas.


Mais le support ne réagit pas et la carte du réseaux RBX3 n'affiche aucun problème sur mon slot :/
Incroyable !

captainadmin
29/04/2015, 16h13
Hello

Il y a pleins de logs à regarder, comme le syslog message ou autre kernel.log
Il faut voir s'il n'y a pas une erreur kernel, si le problème dure lorsque tu le constates, il peut etre intéressant de se connecter via ipmi pour voir les messages en live.

Je pense pas que le reboot en mode rescue apporte grand chose, il faut déjà faire un check matériel sur la machine en mode normal.

Bon courage
http://www.captainadmin.com

p4c
29/04/2015, 13h55
Ce n'est pas un problème de disque, lorsque le problème survient, le ping ne passe même plus. Si il y avait un défaut de disque (serveur fraichement loué depuis 2 jours), je n'aurai pas un fonctionnement comme celui-ci.

L'indisponibilité du serveur via une simple commande ping montre tout de même un défaut sur le serveur sur le plan IP

Je vais tester le reboot en rescue, mais j'ai du mal à croire que le disque soit responsable

passetemps
29/04/2015, 13h35
Problème HW (disque) ? Reboot en rescue et lance des tests HW

p4c
29/04/2015, 11h49
Bonjour à tous,

Si je fais appel au forum OVH, c'est que j'ai déjà épluché pas mal de chose de mon côté sans trouver réponse.
J'ai deux serveurs dédiés, un ancien et un nouveau. J'ai établi la même configuration sur les deux serveurs (php5,mysql,apache2)

Depuis que j'ai fais ma migration, le site fonctionne, mais j'ai plusieurs problèmes d'instabilité.

- Coupure serveur : Ping ne répond plus, apache 2 non plus, SSH non plus. Celà arrive aléatoirement (hier 19h40, 23h11, et aujourd'hui, 6h30 et 11h52)

La configuration est identique entre les deux serveurs, le monitoring OVH m'indique un état stable sur CPU/RAM/SWAP

J'ai regardé les logs apache2 , rien de particulier.
D'ailleurs, j'ai remarqué que Apache2 écrivait bien les logs dans error.log mais uniquement pous les accès au site par défaut et non pour mes virtualhost. J'ai bien les access.log de mes virtualhost mais pas les errors.log (pourtant conf identique apache2 entre les deux serveurs)

Je suis dispo, donc si besoin d'informations, je suis là, j'ai déjà passé plus de 10 heures dessus.

Merci d'avance,