OVH Community, votre nouvel espace communautaire.

Problèmes de latences


Math33
16/11/2012, 21h01
A voir en effet. J'ai quelques serveurs MySQL un peu chargés mais pas dans cet ordre d'idée.
Par exemple celui dédié à encaisser les données du monitoring se bouffe 200 écritures/sec sans trop broncher, pourtant sa config n'est pas extrême (1 vCPU, 1Go de RAM, 60Go sur un DS utilisé par d'autres VMs).

Après à voir selon le type de BDD, la charge, etc.

Math33
16/11/2012, 20h21
Tout dépend de ce que tu appelles gourmand. Pour ma part, ça passe sans problème

Math33
16/11/2012, 15h46
Curieux, chez moi la latence des DS n'a pas ce phénomène assez nettement observable chez toi depuis le 5-6 novembre où la latence semble vraiment croître.

Pour ma part la moyenne sur une VM qui tape un peu d'IO est de 35ms en lecture et 80ms en écriture...

jchelink
16/11/2012, 12h02
voiçi les caps ; la 2ème correspond à la moyenne sur 1 mois :




Math33
16/11/2012, 11h15
Pour info, petit aperçu de mon vScope avec 2 DS (1 de 300Go, 1 de 1,2To) :
http://www.toopix.eu/userfiles/fed99...f61dbe341e.png

As-tu quelque chose de semblable/proche ?

jchelink
16/11/2012, 10h51
nop, pas de zéro en trop ;-) et je confirme que je suis au delà des 250ms en permanence, du moins en langage "vScope"

J'ai 5 VMs en tout. Quatre VMs sur le datastore fournit dans l'offre packagée Datacentre M et une VM sur un autre datastore 300 Go. Les performances d'écriture sont quasiment les mêmes sur les 2 datastores et je constate les mêmes problèmes de latences.

Du coup là je penche plus pour un problème de Host, peut-être une carte réseau défectueuse

Math33
16/11/2012, 00h31
Dans le cas d'un stockage NAS, il me semble que la latence prend en compte la latence des disques physiques également.

Math33
15/11/2012, 23h03
En fait vScope donne des valeurs moyennes basées sur des checks assez espacés. La bonne valeur est celle de vSphere sur le graphique Real Time où la latence est plus souvent sous les 50ms en effet

Au-delà de 100-150ms, c'est déjà pas bon signe c'est clair...

Math33
15/11/2012, 13h48
Les tests me paraissent un peu faiblards en ce qui te concerne, les miens étaient un peu supérieurs sur un DS en utilisation par un poignée de VMs :
http://forum.ovh.com/showthread.php?t=78446

La modification des shares ne t'apporte rien niveau perf car définissent une priorité entre différentes VMs, si tu n'en as qu'une elle ne pourra pas être perturbée niveau IO par une VM concurrente donc les shares n'interviennent pas.

Comme tu le dis justement, tu ne satures pas le lien donc c'est clairement côté DS que ça marche, soit niveau réseau si le DS a un lien saturé, soit niveau disque (mode dégradé ou autre).

Il est clair que le point faible de l'archi PCC est le stockage, c'est très souvent le cas sur une infra virtualisée basée sur du NAS.

Le test très intéressant serait de voir sur un host XL en 10G si un DS SSD s'exprime au mieux ou non, mettant en relief la performance de l'infra (ou ses limites...).

jchelink
15/11/2012, 12h05
Exact, j'ai également fait ces tests et je confirme les mêmes problèmes de latence en dehors d'une architecture Firewall(VMNetwork) / VMs(LocalPortGroup).
RAS côté vScope, mise à part une utilisation RAM > 90% sur le host primaire (RAM provisionnée mais réellement utilisée à hauteur de 40% max. par VM) ; Le statut des NICs est au 'vert' et les latences disques en écriture n’excèdent pas en moyenne 500 ms (le graphe indique un pic à ~850 ms).

Cela dit, j'ai effectué plusieurs tests de vitesse d'écriture sur les disques; en théorie on devrait se situer à ~125 Mb/s max. (limite imposée par les 1 Gbps de la carte réseau) or je m'aperçois que je suis très en dessous des perfs attendues :

temps de lecture depuis le cache du disque : iming cached reads: 4798 MB in 2.00 seconds = 2399.51 MB/sec
temps de lecture en accès direct : Timing buffered disk reads: 164 MB in 3.05 seconds = 53.80 MB/sec
temps d'écritute : 1073741824 octets (1,1 GB) copiés, 23,4438 s, 45,8 MB/s => !

ce test a été effectué à partir d'une VM seule sur son datastore..
, et même en bricolant la valeur des partages je ne vais pas au delà des 50 MB/s :-(

A noter que mon cluster fonctionne en mode "failover" (hôte de basculement spécifié) du fait de mon architecture, du coup je ne profite pas du VMware HA :-( (fonctionnement sur un seul hôte). Je ne me suis pas encore penché sur la question du switch virtuel non plus, d'ailleurs je me demande dans quelle mesure il sera possible d'utiliser pleinement les ressources du cluster avec un seul FW (?)..

++

Math33
15/11/2012, 09h45
Pfsense est une distribution FreeBSD remplissant notamment la fonction de routeur/firewall assez puissant et plutôt user-friendly (interface web dispo). Néanmoins, Nikos56 a bien indiqué que même sans passer par le firewall, les latences perdurent.

Pour en revenir sur les latences, toujours rien du côté latence du stockage ? (via vScope)
Sur mon DS, j'ai récemment eu des épisodes de grosses latences avec des trous de bien + de 5 secondes, dans vScope j'avais des latences sur le DS qui dépassaient allègrement 1500ms. Le phénomène était semblable, bien que plus ponctuel en ce qui me concerne.

Rien du côté des NIC non plus ? Les 2 sur chaque host sont bien actives et fonctionnelles ?

superkikim
15/11/2012, 09h37
Bonjour,

Je ne constate aucun problème de latence de mon côté, aussi avec l'offre M. Ca fait des jours que je travaille à la mise en place de mes serveurs, et tout se passe bien... à priori.

Je n'ai pas de VM PfSense (je sais même pas à quoi ça sert... ?)

Mes machines sont sur des DS 300GB et 1.2TB

jchelink
14/11/2012, 18h35
Bonjour,

J'ai une config identique à peu de chose près : 2 hosts M, une VM PfSense en frontale et des VM LAMP en ce qui concerne le reste. A noter que j'utilise des datastores de 300 Go

J'observe les mêmes problèmes de latence, que ce soit en CLI/ssh ou pendant la navigation des sites :-(

pour l'instant je n'ai pas trouvé d'explication :-\ Est-ce que quelqu'un à une piste/solution ?

Any clue

Math33
17/10/2012, 15h27
Oups, j'avais pas vu qu'il l'avait mis, merci

Nikos56
17/10/2012, 13h31
Citation Envoyé par superkikim
On aura bien sûr tous compris 1.2TB
Oui évidemment je voulais bien dire 1,2 To....

Comme je le disais dans mon précédent message, les vm ont été téléchargées sur mon infra VMWare en local dans ma société et je n'ai aucunes latences. Je pense donc avoir éliminé tout problème d'optimisation.
Les fichiers swap des VM sont stockés sur les datastores des ESX.
Les VM communiquent par le VM Network par contre je n'utilise pas les adresses IP publiques, c'est la VM pfSense qui fait office de routeur pour un réseau de classe A.

superkikim
17/10/2012, 11h17
Citation Envoyé par Nikos56
Pour le stockage c'est sur un datastore 1,2 Go hybrid.
On aura bien sûr tous compris 1.2TB

Math33
17/10/2012, 11h01
A moins que tu aies une configuration non optimisée de tes services, je ne vois pas vraiment ce qui peut poser problème.

De mon côté, je n'observe pas ces latences, sauf éventuellement sur mes VMs hébergées sur le DS de base de 300Go qui est nettement moins réactif que le DS 1,2To supplémentaire.

Sur ce point, quel type de DS as-tu sur ton PCC ?!

Nikos56
17/10/2012, 08h50
Je reviens sur mon problème qui existe toujours.
J'ai ouvert un ticket mais pour le moment pas de solutions trouvées.
Entre temps, j'ai téléchargé les vm (et même la pfsense) sur mon infra vmware hébergée dans mon Entreprise.
Les temps de réponses sont identiques par contre je n'ai aucuns phénomènes de latence.
Tout est normal.
Je ne vois vraiment pas pourquoi le PCC d'OVH génère des latences.
Aurais-je oublié un paramètre de config sur mes vm, j'en doute car la copie sur mon infra locale fonctionne bien.
Aurais-je mal configuré le pcc ? J'en doute également car le technicien de mon ticket au support dis que tout est normal...

Que faire ?

Nikos56
24/09/2012, 10h16
La VM qui fait un pic est le serveur web.
J'ai copié en local les différentes VM.
Nous avons en effet des ESX avec la même version de VMWare dans mon entreprise.
J'ai fait les tests de charge et c'est parfait, je n'ai pas de latence.

La différence avec OVH c'est que je n'ai pas de vShield ici en local. Alors que je l'ai activé chez OVH.

Math33
24/09/2012, 10h02
Ok donc déjà on peut exclure l'hypothèse d'un problème induit par pfSense.

Quelle est la VM qui observe un pic CPU ? La VM hébergeant la BDD ? Si oui, as-tu modifié la conf d'une manière particulière ?

Nikos56
24/09/2012, 08h43
Oui les requêtes se font bien.
J'ai testé également des tests de charges à partir d'une autre VM présente sur le même réseau que la VM Serveur Web et VM Base de données.
J'observe le même phénomène de latence.

Math33
24/09/2012, 01h54
Les requêtes entre tes différents serveurs se font bien ? Ou seulement celles qui traversent le firewall ?

Le CPU de quelle VM fait des pics lorsque tu testes ?

Nikos56
23/09/2012, 22h29
Bonjour,

Merci pour ta réponse.
Mes hosts sont bien à jour et les VMTools installés.
Les cartes réseaux installées sont des E1000.
Pour le stockage c'est sur un datastore 1,2 Go hybrid.

Math33
23/09/2012, 10h59
Bonjour,

Avant toute chose, tes hosts sont-ils à jour ? Idem pour les VMTools ? Quels périph utilises-tu niveau NIC, carte stockage, etc ?

Nikos56
22/09/2012, 19h54
Bonjour,

Nous avons fait des tests de performances de notre infra structure mise en place. (2 Hosts L+)
A savoir :
Une VM avec pfSense en frontal
Une VM qui sert de reverse proxy sous centos
Une VM serveur web avec apache sous centos
Une VM serveur bdd sous windows 2008 R2

Nous avons effectué des tests de charges avec jmeter.
La montée en charge se fait bien et les temps de réponses sont très corrects.
Par contre, nous observons très régulièrement des trous, des latences d'environ 5 secondes. Quand j'observe la consommation CPU pendant les tests, le CPU monte par exemple à 80% puis d'un coup passe à 0% pendant 5 secondes et reprend à 80%. Pourtant les envois de requêtes ne sont jamais interrompues.
Ces latences je les observes également quand je suis connecté en ssh sur les vm. Parfois en tapant des commandes il peut se passer quelques secondes avant de voir ma commande saisie.

A quoi cela peut-il être du ?

Merci pour vos réponses.

Nicolas