PDA

Voir la version complète : =?ISO-8859-15?Q?Am=E9lioration?= de referencement


oles@ovh.net
01/02/2008, 13h58
Bonjour,
Sur 90plan, nous avons mis en production une installation parallele
qui repond aux requetes des moteurs de recherche. Le but est
d'améliorer la qualité de reponse et eviter tout genre de problemes
sur le referencement de vos sites sur google. yahoo & co.
Vous avez l'accès à la qualité de service proposé aux moteurs de
recherche sur
http://smokeping.ovh.net/ovh-server-statistics/show.cgi?target=Plans.90plan.crawler-90plan

Merci de regarder de votre côté si le referencement se passe mieux,
moins bien, pareil ?

Amicalement
Octave

RaphAstronome
01/02/2008, 14h34
Techniquement parlant ça ce passe comment ?
Que voit google exactement ?
robots.txt imposé ?

Laurent
01/02/2008, 16h59
Techinquement, on a mis un cluster, identique a celui en place actuellement, avec 60 serveurs.
Donc sur le cluster de Crawler, il n'y a que les requetes provenant des crawler (google, live, yahoo, etc.). Sur l'autre, le reste du monde.

Pourquoi avoir fait ca ?
Les crawler font une multitude de requetes et on s'est apercu que de temps
a autre, le serveur ralentissait. Pour les crawler, un ralentissement n'est pas tres
grave, alors que pour un internaute devant sont ecran ca l'est.

Nous sommes encore en reglages.

Abogil
01/02/2008, 17h10
Merci Octave et Laurent pour cette initiative.

Continuera t'on à voir les traces des passages des crawlers de Google, Yahoo, Msn, etc. dans nos logs et dans nos tables de bases données ?

RaphAstronome
01/02/2008, 17h10
Ok mais le robots.txt est t'il imposé ?
Sinon j'amerais que vous confirmiez que c'est exactement les mêmes pages qui sont vues du visiteur et du crowler.
Oles avait parlé de ça la dérinière fois et ça m'avait rendu ... très inquiet ...

Sinon effectivement il y a 2-3 petits réglages à faire :
http://smokeping.ovh.net/ovh-server-statistics/show.cgi?start=2008-02-01+14%3A45&end=2008-02-01+18%3A10&target=Plans.90plan.crawler-90plan&displaymode=n&Generate%21=Generate%21

apocalx
01/02/2008, 17h53
RaphAstronome, si c'est juste un cluster, le moteur verra les mêmes pages que sur ton site, et il ne devrait pas y avoir de robots.txt si tu n'en a pas mis sur ton site (enfin c'est ce que je comprend).

C'est vraiq u'il y a certains crawler qui sont assez violents parfois...

Par contre, c'est bien joli, mais quid de l'interrogation des bases de données?
Beaucoup de sites fonctionne avec une bdd, est-ce qu'il y a aussi un cluster special pour les bdd quand c'est un moteur de recherche qui les interroge? Sinon je vois peu l'interet si c'est juste pour donner des pages html statiques aux moteurs...

RaphAstronome
01/02/2008, 18h02
Beaucoup de sites fonctionne avec une bdd, est-ce qu'il y a aussi un cluster special pour les bdd quand c'est un moteur de recherche qui les interroge?
C'est bien ça qui m'inquette.

Bruno-KS
01/02/2008, 18h07
Par contre, c'est bien joli, mais quid de l'interrogation des bases de données?
Je vois mal OVH mettre en place un cluster dédié aux crawlers pour servir des pages HTML. C'est juste les requêtes des crawlers qui sont traités séparémment des requêtes de visiteurs. Le reste ne change pas.

apocalx
01/02/2008, 18h30
Ce qui pourrait être bien également pour le référencement, ça serait de régler les problèmes avec les serveurs dns d'ovh qui ne répondent pas toujours...

oles@ovh.net
01/02/2008, 19h22
apocalx <apocalx.34477b@no-mx.forums.ovh.com> a écrit:
>
> Ce qui pourrait être bien également pour le référencement, ça serait de
> régler les problèmes avec les serveurs dns d'ovh qui ne répondent pas
> toujours...

tu peux être plus precis ? nous avons changé le dns.ovh.net

simba
01/02/2008, 20h22
C'est clair que les problèmes de serveurs de dns ont pénalisé le référencement
les sites se trouvant inaccessibles par intermittence , cela a fait des degats ...maintenant le nécessaire à été fait on en prend acte . A voir si le résultat est stable .

Pour cette histoire de traiter à part les crawlers , pourquoi pas mais comment vérifier le bon fonctionnement du système et donner l'alerte le cas échéant ? il faut souvent plusieurs passages du googlebot pour modifier les résultats du référencement . Donc si problème il y a on découvrira plus tard !!!

Impossible de vérifier le passage du crawler dans nos stats en ce moment puisque les stats ne semblent pas fiable du tout depuis hier !!

En espérant que le nouveau remède soit fiable !! L'expérimental c'est bien gentil mais le bon référencement c'est vital cela détermine le nombre de visite et donc le gagne-pain de beaucoup !

lololo
02/02/2008, 19h46
Qu'est ce qui se passe? quand je vais sur mon site en utilisant le user agent googlebot les pages sont blanches??? et quand je met user agent switcher sur Internet explorer le site s'affiche??

ca sent pas bon? qu'est e qui se passe?

Oles je t'envois en mp le lien de mon site

Merci de me tenir informé, je reste sur le forum.

édité, je t'ai envoyé un mail

oles@ovh.net
02/02/2008, 23h44
lololo <lololo.3465e0@no-mx.forums.ovh.com> a écrit:
>
> Qu'est ce qui se passe? quand je vais sur mon site en utilisant le user
> agent googlebot les pages sont blanches??? et quand je met user agent
> switcher sur Internet explorer le site s'affiche??

j'sais pas mais ça n'a rien à avoir avec le thread.

lololo
03/02/2008, 00h53
j'sais pas mais ça n'a rien à avoir avec le thread.

Oui tu as raison, je viens de faire un test en local et idem. (désolé pour le hs)

Pour revenir au thread actuel,

Est ce qu'il serait possible qu' ovh crée une règle user agent du type:

ovhmuturobots. ce user agent (ovhmuturobots) serait redirigé sur le même cluster que les robots google yahoo etc..

cela permettrait aux utilisateur d'utiliser ce user agent et de voir leurs sites tel que les robots le voient.

Qu'en penses tu?

Merci

oles@ovh.net
03/02/2008, 01h08
> cela permettrait aux utilisateur d'utiliser ce user agent et de voir
> leurs sites tel que les robots le voient.

je ne comprends pas ce que tu dis. de quoi tu parles exactement.

sinon, comment marche le systeme avant et après la modifications ?

avant:
toutes les requetes de monde entier arrivent sur un et gros cluster
de plein de serveurs web en paralelle (environ 400 serveurs pour
90plan).

après
nous avons reperé les IP de robots de google, yahoo & co. nous avons
enlevé 60 serveurs du cluster et mis dans une configuration à part.
ces IP là (de google & co) tombent sur ces 60 serveurs. si les IP
ne sont pas de google & co, ça tombe sur les 340 serveurs. ainsi,
ce que voient les robots et ce que vous voyez, c'est pareil et identique.
simplement, les robots sont très violent et parfois ils tapent tellement
fort que d'un coup en quelques secondes plusieurs serveurs sont très
surchargés et repondent plus lentement que d'habitude (2-3 secondes,
parfois 10 au lieu d'imediatement). pour un robot ce n'est pas très
grave. mais si un visiteur tombe par hazard sur un serveur qui se fait
laminé par un robot de google, il a l'impression que c'est très lent
comme le site. pour eviter ce sensation de lenteur qui peut arriver
parfois (regardez le smokeping ça arrive tous 2-3h pendant 5 minutes
http://smokeping.ovh.net/ovh-server-statistics/show.cgi?target=Plans.90plan.crawler-90plan
) nous avons separé le flux de requetes sur 2 installations au lieu
d'1. les 2 sont identiques. puisque les 2 ont été 1 avant. si ça marche
tant mieux. sinon en 2 minutes les 2 c'est 1 à nouveau.

merci de relire cet email avant de donner les conclusions inexactes
sur ce que nous avons mis en place. il n'y a pas d'user agent ni aucune
analyse de headers, il n'y a pas de serveur de cache, il n'y a pas
d'autres astuces. juste un if (si t'es google) tu vas par là else
tu vas ici. et là et ici c'est pareil.

Nissart
03/02/2008, 01h30
a priori et selon ton explication octave ça ne devrait avoir aucune influence sur la qualité du référencement effectivement, et le google bot ne devrait pas voir de différence : cluster A, B ou Z c'est transparent.

Juste une légère interrogation : il semblerait (même si personne ne connait les algorithmes exacts des moteurs) que l'adresse IP du serveur joue, notamment pour la géolocalisation. Avec ton système, tu confirmes bien que si une des IP que vous avez noté comme appartenant à google interroge les DNS du site, cela ne changera rien à ce qu'il obtiendra ?

Bruno-KS
03/02/2008, 02h20
Juste une légère interrogation : il semblerait (même si personne ne connait les algorithmes exacts des moteurs) que l'adresse IP du serveur joue, notamment pour la géolocalisation. Avec ton système, tu confirmes bien que si une des IP que vous avez noté comme appartenant à google interroge les DNS du site, cela ne changera rien à ce qu'il obtiendra ?
Là tu parles de serveurs DNS qui n'ont rien avoir avec le cluster hybride. Quand Google fait une requête DNS, il interroge dns11.ovh.net par exemple, qui lui renvoie l'IP géographique du 90plan où tu as mis ton site. Quelque soit le serveur du cluster qui traitera la requête, le bot ou le visiteur verra l'IP du 90plan, car c'est de la répartition de charge transparente.

oles@ovh.net
03/02/2008, 08h58
> joue, notamment pour la géolocalisation. Avec ton système, tu confirmes
> bien que si une des IP que vous avez noté comme appartenant à google
> interroge les DNS du site, cela ne changera rien à ce qu'il obtiendra ?

c'est la même ip TO.

raoul-h
03/02/2008, 15h09
Merci de regarder de votre côté si le referencement se passe mieux,
moins bien, pareil ?


bonjour,

c'est très inquiet que j'interviens ici.

en clair, OVH fait de l'expérimentation avec ses clients. cette dernière petite phrase "mieux, moins bien, pareil?" résume bien la problématique, OVH place le référencement de ses clients sur le même plan que la couleur d'un favicon.

les guidelines de Google sont très claires: le robot et le visiteur doivent emprunter les mêmes chemins et accéder au même contenu, le reste c'est du cloaking et est (lourdement) pénalisé. je rappelle qu'un nombre non-négligeable de sites pros sont hébergés sur 90PLAN, et que le référencement est le nerf de la guerre. pour les infos voir ici: http://docs.abondance.com/question17.html

il se pose alors plusieurs questions:

1. il existera forcément un temps de retard entre la mise à jour des pages visiteurs et celle des pages robots > cloaking

2. qui met la liste des IP à jour, et quand? (en effet, ces IP bougent régulièrement Google n'est pas idiot); une seule IProbot non mise à jour dans les 2 minutes. je doute qu'il y ait du monde les dimanche à 3h du mat' et plus généralement pour assurer la veille IProbots > cloaking

3. enfin, j'aimerais connaître la documentation qui permet à OVH d'affirmer qu'un temps de chargement long "n'est pas problématique pour les robots"; mon expérience et mes tests personnels me font croire tout le contraire: si le site rame pour le robot, Google peut parfaitement en déduire qu'il rame pour le visiteur, et déclasse gentiment les pages concernées. par ailleurs cela a systématiquement pour conséquence de faire sauter la vérification du site (Google Webmaster Tools) quand cette dernière est effectuée via la méthode d'ajout de balise <meta verify>.

sur un plan plus commercial:

4. nous sommes mis devant le fait accompli, alors qu' OVH lui-même avoue n'être sûr de rien (encore une fois: "mieux, moins bien, pareil?")

5. aucune alternative n'est laissée au client.

cordialement,

raoul.

Bruno-KS
03/02/2008, 15h25
les guidelines de Google sont très claires: le robot et le visiteur doivent emprunter les mêmes chemins et accéder au même contenu, le reste c'est du cloaking et
Ton lien parle de donner une version différente de la page en fonction du visiteur, or c'est la machine physique qui change, la page renvoyée est strictement la même.

1. il existera forcément un temps de retard entre la mise à jour des pages visiteurs et celle des pages robots > cloaking
Non, c'est le même contenu mais traité par différente machines.

Google peut parfaitement en déduire qu'il rame pour le visiteur, et déclasse gentiment les pages concernées.
Je te retourne la question : où est ta documentation ?

5. aucune alternative n'est laissée au client.
Aux dernières nouvelles, seuls les 90plan sont concernés. Il te reste : prendre un autre mutu, prendre un dédié, prendre un RPS, monter ton datacenter, aller voir ailleurs. Tout ça pour te sentir plus "libre".

Bruno-KS
03/02/2008, 15h32
2. qui met la liste des IP à jour, et quand? (en effet, ces IP bougent régulièrement Google n'est pas idiot); une seule IProbot non mise à jour dans les 2 minutes. je doute qu'il y ait du monde les dimanche à 3h du mat' et plus généralement pour assurer la veille IProbots > cloaking
Je suppose que quelque soit l'IP du bot Google, sa reverse contiendra toujours "googlebot" qui trahira l'identité du bot.

raoul-h
03/02/2008, 15h39
Je te retourne la question : où est ta documentation ?


bonjour bruno.

j'ai bien mieux que de la documentation, j'ai des tests, établis dans les règles de l'art, càd en ne faisant varier qu'un facteur à la fois. les conclusions sont sans appel: un serveur qui rame, c'est pénalisant pour le référencement. il semblerait que je ne sois pas le seul à avoir enfoncé cette porte ouverte (http://forum.ovh.com/showpost.php?p=153823&postcount=11).
vous êtes-vous demandé pourquoi Google fournit aux webmasters des infos très précises sur les temps d'accès aux pages de ses robots, via l'interface Webmaster Tools?

vous-mêmes, bruno, vous "supposez" concernant les IP robots. il semblerait que vous ne soyez guère sensibilisé aux enjeux colossaux du référencement, et à l'extrême sensibilité de Google sur ce genre de manip.

Bruno-KS
03/02/2008, 16h29
bonjour bruno.

j'ai bien mieux que de la documentation, j'ai des tests, établis dans les règles de l'art, càd en ne faisant varier qu'un facteur à la fois. les conclusions sont sans appel: un serveur qui rame, c'est pénalisant pour le référencement.
Et il est où le problème ?

vous-mêmes, bruno, vous "supposez" concernant les IP robots. il semblerait que vous ne soyez guère sensibilisé aux enjeux colossaux du référencement, et à l'extrême sensibilité de Google sur ce genre de manip.
Ok, trouve-moi une IP d'un bot Google dont la reverse ne contient pas "google".

raoul-h
03/02/2008, 16h49
Et il est où le problème ?


Ok, trouve-moi une IP d'un bot Google dont la reverse ne contient pas "google".

votre question est stérile: comment vérifierez-vous que l'IP que je vous fournis est une IP de GoogleBot? nous ne sommes plus en 1998.

pour en revenir au sujet, cette manip comporte des risques. mon intervention consistait à démontrer que ces risques semblaient mal mesurés et appréhendés.

"mieux, pareil, moins bien?"

si cette phrase n'est pas un aveu de tâtonnement, je ne comprends plus notre langue. ceci est tout simplement inacceptable. je ne paie pas pour être un cobaye. les cobayes sont rémunérés, ils ne paient pas.

Abogil
03/02/2008, 18h47
Je n'ai pas très bien compris les opérations d'OVH de création d'un groupe de serveurs dédiés aux moteurs de recherche.

Mais je constate qu'en moins de 8 jours le nombre des URL de mon site indexées par GOOGLE a chuté de moitié. :mad:

C'est curieux.

Mon fichier sitemap.xml est pourtant considéré comme correct par GOOGLE Webmaster Tools.

Bruno-KS
03/02/2008, 18h55
votre question est stérile: comment vérifierez-vous que l'IP que je vous fournis est une IP de GoogleBot? nous ne sommes plus en 1998.
C'est facile : via des outils comme RIPE et IANA... A défaut de pouvoir prouver que la déviation mise en place par Ovh comporte des failles de reconnaissance de bot... j'attends donc cette fameuse IP :)

lololo
03/02/2008, 19h25
Si j'ai bien compris peut importe l'ip de google puisque si google se pointe mais n'est pas repéré il est dirigé vers le cluster visiteurs qui lui donne la meme page.

Maintenant j'ai quelques questions

Ton lien parle de donner une version différente de la page en fonction du visiteur, or c'est la machine physique qui change, la page renvoyée est strictement la même.

1 Et que ce passe t'il si un cluster (robots ou visiteurs) tombe en panne? D'un coté une page d'erreur de l'autre la page nikel??

2 Quels seront les moyens pour les clients d'ovh de repérer un cluster robots HS?

Merci de m'aiclairer

Bruno-KS
03/02/2008, 19h31
1 Et que ce passe t'il si un cluster (robots ou visiteurs) tombe en panne? D'un coté une page d'erreur de l'autre la page nikel??
On parle d'un ensemble de minimum 60 machines. Ca tombera jamais en panne simultanément.

oles@ovh.net
03/02/2008, 19h42
raoul-h <raoul-h.347n6n@no-mx.forums.ovh.com> a écrit:
>
> oles@ovh.net;153731 Wrote:
>>
>> Merci de regarder de votre côté si le referencement se passe mieux,
>> moins bien, pareil ?
>>
>
> bonjour,
>
> c'est très inquiet que j'interviens ici.

ce n'est pas la question qui était posé. je ne vous ai pas demandé la
permission, le conseil ou d'autres. j'ai posé la question: est-ce que
le referencement est mieux, moins bien ou pareil. merci de repondre à
cette question et de maniere concrete.

à mon avis ça sera mieux.

RaphAstronome
03/02/2008, 20h01
2 Quels seront les moyens pour les clients d'ovh de repérer un cluster robots HS?
Ca : http://smokeping.ovh.net/ovh-server-statistics/show.cgi?target=Plans.90plan.crawler-90plan
D'ailleurs c'est plutôt rapide du moins actuellement.
Ce qui peut tomber en panne ce serait plutôt les filers (panne du 90plan), les serveurs sql (ça m'est déjà arrivé une fois mais court), le dispatcheur de tâches (c'est déjà arrivé, 2-3 fois il y a quelques années). Dans tout ces cas les visiteurs et les bots seront à la même enseigne.

En ce qui concerne le filer ça marche comme ça (a ce que j'ai cru comprendre) :
- Une requête arrive sur le dispatcheur (qui est 213.186.33.2 dans tout les cas pour le 90plan)
- Il est envoyé sur un serveur Web (le cluster).
- La page téléchargée du filer où est votre site au serveur Web (si il ne l'a pas en cache).
- Éventuellement des fichiers annexes sont demandés (fopen, include...) et des requêtes sont faites sur le MySQL.
- Le serveur Web répond au client qui avait demandé la page.

Il n'y a pas de correspondance tel site => tel serveur mais tel visiteur => tel site. Lorsqu'on demande une requête il attribue un serveur au client et ce sera ce serveur qui répondra à ce client. Le fait que Google (et autres, y a pas que Google dans la vie) soit sur un serveur au lieu d'un autre n'a pas d'influence sur la page (même IP, même contenu). On a simplement une correspondance IP source => serveur qui répond, ça à toujours été ça mais maintenant en plus on a des serveur QUE pour le bots et des serveurs QUE pour les visiteurs c'est tout.

Après il ne faut pas que ça ralenti vraiment trop non plus mais d'après le smokeping ça marche plutôt bien.

Oles tu peut confirmer ?

raoul-h
03/02/2008, 20h30
Merci de regarder de votre côté si le referencement se passe mieux, moins bien, pareil ?

peut-être un début de réponse:
en moins de 8 jours le nombre des URL de mon site indexées par GOOGLE a chuté de moitié.
je ne vous ai pas demandé la
permission, le conseil ou d'autres[...]à mon avis ça sera mieux.
demandé ou pas demandé, je m'exprime. c'est à un client que vous parlez, avec lequel votre société a passé un contrat (http://209.85.129.104/search?q=cache:rcjRuR2cSbAJ:www.ovh.com/fr/espaceclients/documents_legaux/Conditions-generales-hebergement-mutualise.pdf), pas à un pote. je vous saurais donc gré de rester poli et professionnel.

je ne fais que mettre mon expérience et mes connaissances au profit de la communauté, et j'espère très sincèrement me tromper. ce qui me chagrine, c'est le côté "expérimental" de la chose, alors que les enjeux sont conséquents: on ne joue pas avec la visibilité d'un site dans les SERPs. il n'y a pas que moi que ça inquiète.

d'autres inquiétudes légitimes sur le plus gros forum de référencement de France (http://www.webrankinfo.com/forums/viewtopic_88062.htm) concernant ce bricolage.

cordialement,

raoul.

oles@ovh.net
03/02/2008, 21h02
raoul-h <raoul-h.34823b@no-mx.forums.ovh.com> a écrit:

je voie que vous ne repondez toujours pas à ma question.
pourquoi ? parce que ça marche ? parce qu'il n'y a pas
de probleme ? si vous avez un probleme, autre qu'emotionel,
merci de faire part de ce probleme et nous laisser de faire
notre job. et ne pas utiliser ou instrumentaliser notre
transparence ainsi que notre volonté de faire mieux, comme
des arguments contre nous. le fait qu'aucun hébergeur n'a
pensé de faire ce que nous faisons c'est dans nos habilites.
le resultat est là: ovh est le n°1 d'hébergement en France.

je repete ma question: est-ce que le referencement est
meilleurs, pareil, moins bien ?

je repete à nouveau: à mon avis ça sera nettement mieux.

j'attends de chiffres et de vrais constats. pas du resentiment.

Bruno-KS
03/02/2008, 21h13
le plus gros forum de référencement de France (http://www.webrankinfo.com/forums/viewtopic_88062.htm) concernant ce bricolage.
Je vois pas d'inquiétudes mais un conglomérat de choses fausses émanant de gens qui n'ont rien compris. Pas la peine de jouer sur la popularité de WRI, ce sont de simples internautes qui s'expriment, pas WRI ;)

Abogil : t'es sur que c'est du à ça.. ? je vois mal ce qui pourait influencer à tel point googlebot.

raoul-h
03/02/2008, 21h27
je repete à nouveau: à mon avis ça sera nettement mieux.
j'attends de chiffres et de vrais constats. pas du resentiment.

je ne demande qu'à vous croire, mais c'est le principe qui est problématique!

je suis chef d'entreprise, et je suis simplement éberlué (émotionnellement, if you want) par vos initiatives! c'est comme si une banque me vendait un livret A en me disant "vous gagnez, vous perdez, ou ça stagne? passez donc me voir dans 1 mois me faire un petit compte rendu, bien le bonsoir chez vous!".

avez-vous testé votre "solution" avant d'impliquer tous les clients 90PLAN?

c'est à OVH de tester, pas à ses clients! imaginez Renault vendre 10 000 voitures "il y a un nouveau système de freinage, ça freine mieux, ça freine pas, ça freine pareil, tenez-nous au courant?"

mon intervention relève du bon sens, pas de la polémique!

Bruno-KS
03/02/2008, 21h41
c'est comme si une banque me vendait un livret A en me disant "vous gagnez, vous perdez, ou ça stagne? p
Ca n'a aucun rapport : ovh n'indique nulle part dans ses contrats qu'ils s'engagent sur un quelconque reférencement. T'es en train de polémiquer sur du vent.

Abogil
03/02/2008, 22h11
Abogil : t'es sur que c'est du à ça.. ? je vois mal ce qui pourrait influencer à tel point Googlebot.
Il s'agit d'un constat.
Malheureusement, je n'ai pas mis ma page de gestion de Google en PDF pour en regarder une trace.

Nota :
Depuis 8 jours je n'ai pas touché fondamentalement mon site.
J'ai surtout travaillé aux pages visibles seulement par les visiteurs connectés.

Bruno-KS
03/02/2008, 22h29
Depuis 8 jours je n'ai pas touché fondamentalement mon site.
Bah 8 jours... Le basculement date d'il y a deux jours donc ça peut pas être du à ça.. Si ?

Abogil
03/02/2008, 22h41
Bah 8 jours... Le basculement date d'il y a deux jours donc ça peut pas être du à ça.. Si ?
C'est quand curieux, hier le nombre des URL de mon site indexées par GOOGLE avait chuté seulement de d'environ 10 %.

simba
04/02/2008, 06h48
Bonjour .
En ce qui concerne google le resultat peut être bien différent suivant le datacenter ou serveur google sur lequel on tombe . Dans le temps tous les serveurs se synchronisaient , on parlait de googledance etc ....

Maintenant il semblerait que ces différences permettent à google de tester différents algorithms ......ma page d'accueil a carrément disparu du référencement sur certains serveurs google pas sur d'autres !!

( moi j'ai supposé au départ que les pannes d'accès en 90 plan à cause des serveurs dns saturés de ovh en avait été la cause , certains googlebot ne trouvant plus nos pages provoquant ce résultat sur certains datacenters google)

Bon enfin pour le moment impossible de donner une réponse binaire qui plait à Oles car je suis clairement dans le camp des " émotionnels " inquiet des derniers résultats de google sans certitude sur la cause .

oles@ovh.net
04/02/2008, 08h24
> je ne demande qu'à vous croire, mais c'est le principe qui est
> problématique!

le principe de transparence ?

> je suis chef d'entreprise, et je suis simplement héberlué
> (émotionnellement, if you want) par vos initiatives! c'est comme si une

il faut s'habituer que le net evolue. si vous cherchez un hébergeur
qui ne vous propose pas plus demain pour le même prix, faites moi le
signe. ça m'evitera de passer les nuits à vous sortir du nouveau.
or sur le net ce n'est pas possible de ne rien faire. on meurt demain.
et donc nous on evolue. je suis surpris de votre réaction pour un rien
pareil. alors qu'on fait tous les jours plusieurs dizaines d'opérations
beaucoup plus "hard". ça fait parti de notre job. chacun a le sien. nous
c'est l'hébergement. je peux comprendre que votre confiance dans le fait
que nous on fait bien notre boulot est proche de 0. dans ce cas là ce
n'est pas un hébergeur qu'il faut choisir mais devenir son propre
hébergeur. un serveur dédié pour commencer.

> avez-vous testé votre "solution" avant d'impliquer tous les clients
> 90PLAN?

oui. d'autres questions ? si vous relisez le forum vous trouverez
plein de thread à ce genre de sujet.

> mon intervention relève du bon sens, pas de la polémique!

votre intervention releve de manque de confiance et d'ignorance
sur l'organisation et le contenu de notre travail. ce genre
d'intervention me fait penser qu'on ne devrait pas tout vous
dire. parce que ça ne sert à rien de vous dire qqchose qui ne vous
change rien. mais on est transparent et on dit tout. on est là
après à expliquer pour rassurer. puis au finale à entendre que
le bon sens va dans une autre direction.

oles@ovh.net
04/02/2008, 08h28
simba <simba.348upc@no-mx.forums.ovh.com> a écrit:
> Bon enfin pour le moment impossible de donner une réponse binaire qui
> plait à Oles car je suis clairement dans le camp des " émotionnels "
> inquiet des derniers résultats de google sans certitude sur la cause .

on aurait pas dû vous l'annoncer. on annonce pas qqchose qui ne fait
rien. mieux on aurait dû vous l'annoncer et ne pas faire. je suis
sûr que le thread serait EXACTEMENT pareil.

simba
04/02/2008, 09h11
Oles tu es j'en suis sûr un brillant mathématicien , un jeune chef d'entreprise
dynamique , boss chez ovh à ce que j'ai lu .....pour tout cela respect !

Mais la sur ce forum tu t'adresses à des clients à l'esprit pas forcément binaire
des littéraires aussi et la façon de présenter les choses peuvent choquer !

La vie c'est pas forcément blanc ou noir , marche marche pasl ....y'a du gris du marche moyen etc....

Alors de deux choses l'une pour reprendre vos shémas , soit l' opération effectuée ne peut mathématiquement avoir aucune incidence négative et alors pourquoi demander si marche moins bien ? C'est effectivement mettre le doute dans l'esprit des clients ........soit tous les effets sont possibles et on en discute calmement .

la confiance en ovh c'est pas non plus 100 ou 0 ......

MnMs
04/02/2008, 12h47
Je viens de voir les temps d'accès du robot google dans "Google Outils pour webmaster" . Temps Max: 1052ms, Moyen: 730ms, Min: 561ms

J'ai l'impression que c'est pas super super. Les visiteurs ont quand même de meilleurs temps non ? En tout cas, l'infrastructure dédiée aux robots peut elle tenir le coup lors d'une grande activité ou d'un changement d'algo de google par exemple ? Vu que les temps d'accès sont déjà moyens, je crains un gros problème d'accès à nos sites lors d'une grosse mise à jour.

Justement, la dernière fois lors d'une grande mise à jour de google, vous aviez dit que cela avait causé des ralentissements sur tout le réseau et même pour les visiteurs puisqu'il n'y avait pas encore de serveurs spécifiques pour robot.

J'aimerais savoir aujourd'hui, s'il se passe la même chose, est-ce que les serveurs robots pourront satisfaire toutes les requêtes et provoquer simplement un ralentissement ou bien seront-ils complètement engorgés ? Car lors d'une mise à jour de google, ça y va sec ... Et j'aimerais vraiment que mon site soit accessible lors de ces mises à jour, question de référencement et de positionnement ;)

Merci à vous.

oles@ovh.net
04/02/2008, 13h08
> Alors de deux choses l'une pour reprendre vos shémas , soit l'
> opération effectuée ne peut mathématiquement avoir aucune incidence
> négative et alors pourquoi demander si marche moins bien ? C'est

parceque ce sont nos valeurs. les valeurs d'entreprises. on ne
cache rien ici. on dit tout. et ceux qui disent le contraire
ne peut pas avoir des exemples parce qu'ils n'existent pas. ça
marche comme ça ovh. quite à avoir ce genre de thread.

oles@ovh.net
04/02/2008, 13h12
MnMs <MnMs.349b9z@no-mx.forums.ovh.com> a écrit:
>
> Je viens de voir les temps d'accès du robot google dans "Google Outils
> pour webmaster" . Temps Max: 1052ms, Moyen: 730ms, Min: 561ms

comment c'est mesuré ?

à mon avis c'est normal comme temps d'accès (web + sql).

rubenxela
04/02/2008, 15h49
Actuellement quelques pertes de positions mais pas catastrophiques et je ne sais pas si elles sont dues à vos changements ou à des changement côté Google.
Côté Yahoo et MSN pas de changements récents.

A mon avis ... mais si ça fait 2 jours que c'est en place c'est dur à dire ... ça ne change rien niveau ref. Après l'essentiel c'estque ça augmente les performances serveur côté utilisateurs.

lololo
04/02/2008, 16h22
if (si t'es google) tu vas par là else
tu vas ici.

Ce que je proposait oles, c'est d'offrir au client d'ovh la possibilité de tester en direct live les cluster robots (et non par un outil graphique smokeping)

De la meme facon que if google ip tu vas par la.
Tu pourrais créer une règle if user agent = ovhmuturobots tu vas sur les clusters robots.

Ca nous permettrais de nous connecter sur nos site en utilisant le user agent ovhmuturobots et d'avoir acces en direct live aux cluster robot.

Parceque meme si on est ok que la page robots et la page visiteur sont identiques, nous clients avons besoin de tester la qualité du service reservé aux robots (vitesse de transfert, etc..).

Pour les stats de vitesse d'exploration google, ils sont calculés sur 90j mais une courbe nous permet de voir un peu mieux.

ca serait bien que chacun poste la valeur de ces stats (Temps de téléchargement d'une page (en millisecondes) ) du google webmaster tool. ca permettrait de connaitre les changements suite à la modif d'ovh.

Voici mes Temps de téléchargement d'une page en millisecondes (par googlebot)

1962ms temps maxi se situe d'après la courbe à fin octobre début novembre 2007

567ms temps moyen

403ms temps minimum se situe d'apres la courbe a prox 25 décembre 2007

J'esperes que cela peut aider

Cordialement

alain-b
04/02/2008, 16h27
C'est quoi encore cette bidouille ! Qu'est ce que vous avez contre les robots ! c'est eux qui nous font vivrent ! Les visiteurs ils peuvent attendre de temps en temps que la page s'affiche ! Pour un robot c'est un possible déclassement voir pire ... Et puis je comprend rien a ce que dit Oles .. :-( Je suis le seul ?


EST-CE QUE PHYSIQUEMENT (sur le disque dur) CE SONT LES MEMES DONNEES QUI SONT RENVOYEES QUAND UN BOT OU UN VISTEUR FAIT UNE REQUETE ? EST -CE QU'ON PEUT AVOIR UNE REPONSE CLAIRE !!

Bruno-KS
04/02/2008, 16h50
EST-CE QUE PHYSIQUEMENT (sur le disque dur) CE SONT LES MEMES DONNEES QUI SONT RENVOYEES QUAND UN BOT OU UN VISTEUR FAIT UNE REQUETE ?
OUI. Relisez le thread la prochaine fois avant de reposer une question déjà posée.

oles@ovh.net
04/02/2008, 16h58
> De la meme facon que if google ip tu vas par la.
> Tu pourrais créer une règle if user agent = ovhmuturobots tu vas sur
> les clusters robots.

je repete: c'est pas comme ça que ça marche.

> 1962ms temps maxi se situe d'après la courbe à fin octobre début
> novembre 2007
>
> 567ms temps moyen
>
> 403ms se situe d'apres la courbe a prox 25 décembre 2007

okey et maintenant ça donne quoi ?

raoul-h
04/02/2008, 17h16
bien, il est temps de faire un premier pointage concernant les réponses à la question "mieux, moins bien, pareil?".

Actuellement quelques pertes de positions mais pas catastrophiques

J'ai l'impression que c'est pas super super

ma page d'accueil a carrément disparu du référencement sur certains serveurs google pas sur d'autres !!

quand je vais sur mon site en utilisant le user agent googlebot les pages sont blanches (au passage, vous semblez ne pas voir le rapport avec le sujet, mais pour les webmasters qui savent ce qu'est le référencement, ils comprennent très bien le rapport, eux)

Mais je constate qu'en moins de 8 jours le nombre des URL de mon site indexées par GOOGLE a chuté de moitié.

hier le nombre des URL de mon site indexées par GOOGLE avait chuté seulement de d'environ 10 %.

voilà pour les premières réponses à la question posée. pour donner un peu de poids à mes inquiétudes, je vais préciser un peu mon domaine d'activité: je suis référenceur professionnel depuis 2001 et je suis actuellement en train de me battre pour le site d'un de mes clients.

donc quand je lis des choses pareilles:

Après l'essentiel c'est que ça augmente les performances serveur côté utilisateurs.
j'aimerais rire doucement, si cela n'avait pas autant de conséquences; il faut des mois de travail et d'expertise pour positionner efficacement et durablement une page sur une requête concurrentielle; oui, la vie d'un site professionnel est suspendue à l'activité des robots du moteur de recherche qui fait plus de 90% de parts de marché en France; oui, il faut faire un site d'abord pour les visiteurs, et ensuite pour les moteurs, mais sans positionnement moteur, pas de visiteur!

je ne laisserai pas un Mac Giver mettre par terre des années de travail sous prétexte qu'il surestime le champ de ses compétences; M. Oles, vous êtes sûrement un informaticien brillant, un technicien hors-pair, ou ce que vous voulez, compétent et qualifié, et je comprends parfaitement que vous souhaitiez qu'on vous laisse faire votre travail, qui mérite, comme tout travail, le respect.

mais une chose est sûre, vous n'êtes pas référenceur.

notre job à nous, webmasters et référenceurs, c'est un tout autre métier dont vous paraissez ignorer les simples bases; une de ces bases est la suivante:

on ne filtre surtout pas les robots

une deuxième pourrait être:

quand le robot galère, le référencement aussi.

à chacun son métier, merci de respecter le nôtre. deux ans de boulot et de veille technologique à la poubelle, ce n'est pas acceptable, ni pour moi ni pour mes clients, ni pour les autres webmasters. c'est comme si je venais cramer vos locaux et tout ce qui se trouve dedans. tous les sites hébergés sur 90PLAN ne sont pas des blogs de Tata Josiane.

maintenant on sent bien à travers votre attitude que rien n'est négociable, vous êtes le meilleur et nous sommes tous des m*rdes en comparaison. ayez bien conscience que si je me bats, ce n'est pas contre vous, ce n'est pas pour remettre vos compétences en question, mais c'est bel et bien dans votre intérêt, et surtout dans celui des webmasters.

à ce sujet:

1. j'aimerais également connaître quel est le filtrage effectué sur les robots de Google Adsense à savoir MediaPartner.

2. si le système est révolutionnaire et performant, pourquoi les autres offres serveurs mutualisés ne sont pas concernées par cette manip? les autres clients sont lésés, alors?

3. en matière de référencement, les choses sont tellement complexes qu'un site peut chuter plusieurs semaines après la manip; si conséquences négatives, ou positives, il y a, c'est dans 2 mois que l'on pourra faire le point, pas avant. si ces conséquences sont négatives, il est ensuite extrêmement difficile - en termes d'investissement temporel comme financier - de remonter la pente, en avez-vous conscience, ou pas?

merci de répondre précisément à ces 3 points.

cordialement,

raoul, un client.

lololo
04/02/2008, 17h51
> De la meme facon que if google ip tu vas par la.
> Tu pourrais créer une règle if user agent = ovhmuturobots tu vas sur
> les clusters robots.

je repete: c'est pas comme ça que ça marche.

> 1962ms temps maxi se situe d'après la courbe à fin octobre début
> novembre 2007
>
> 567ms temps moyen
>
> 403ms se situe d'apres la courbe a prox 25 décembre 2007

okey et maintenant ça donne quoi ?

J'ai bien compris que tu n'utilsait pas le user agent pour rediriger google vers le cluster robot.

Ma question est est ce qu'il est possible de rediriger un user agent vers les clusters robot? Si oui tu redirige par exemple le user agent "ovhmuturobots" vers ces clusters.

Comme ca, quand on veut avoir un direct live sur les clusters robots, on se connecte sur nos sites avec ce user agent.

Est ce possible techniquement?

Pour les stats, il faut un peu de temps pour que google webmaster tools se mette a jour. Je vous tiendrez informez.

Cordialement

oles@ovh.net
04/02/2008, 17h56
> Ma question est est ce qu'il est possible de rediriger un user agent
> vers les clusters robot? Si oui tu redirige par exemple le user agent
> "ovhmuturobots" vers ces clusters.

pour la 3ème fois: non.

oles@ovh.net
04/02/2008, 17h56
raoul-h <raoul-h.349nrz@no-mx.forums.ovh.com> a écrit:

nous avons remis l'installation comme avant. le thread est clos.

simba
04/02/2008, 17h56
En ce qui concerne ma phrase :
"ma page d'accueil a carrément disparu du référencement sur certains serveurs google pas sur d'autres !! "

le phénomène est apparu avant le basculement , donc moi j'ai imputé cela
au fait que 90 plan était souvent inaccessible ces derniers temps ....à cause des serveurs dns ovh saturés ....le serveur a été renforcé ....je ne constate plus ces pannes ......donc j'espère une amélioration de ce côté pour le référencement ....

La ou je suis d'accord c'est qu'il faut plusieurs semaines pour voir les effets du basculement , je suis un des premiers je crois à l'avoir écrit ...

RaphAstronome
04/02/2008, 17h57
En ce qui me concerne la quasi totalité des pages de mon site groupemshareware.com sont référencés, mais ça fait pas beaucoup donc pour mesurer ...

Quant à l'accessibilité coté visiteur j'ai eu un gros lag (env 7.8s) vers 18:30 confirmé par le smokeping pas bien joli : plein de paquets perdus mais même si ça a l'air d'avoir été pire à 18:00 -> 18:10.

alain-b
04/02/2008, 18h12
OUI. Relisez le thread la prochaine fois avant de reposer une question déjà posée.

moi je lis ca : " Techinquement, on a mis un cluster, identique a celui en place actuellement, avec 60 serveurs. Donc sur le cluster de Crawler, il n'y a que les requetes provenant des crawler (google, live, yahoo, etc.)."

Ce que je comprends (et je suis pas le seul) c'est que c'est une recopie (mais je peux me tromper) donc que les enregistrements de nos sites sont présents à 2 endroits différents.

Si c'est le cas, il y a fort à parier que les données risquent de ne pas toujours être identiques au même moment. On sait que google est très vigilant sur les techniques de cloacking qui consistent à ne pas présenter les mêmes données aux visiteurs et aux moteurs de recherche.

si Google en utilisant un user-agent de navigateur pour se cacher voit des choses différentes dans le 2 clusters le sites sera blacklisté. Voila le risque que nous faire courrir cette bidouille.

Est ce qu'on peut me garantir que ce risque n'existe pas ?

Shadow aok
04/02/2008, 18h18
Un cluster ne possède ni ne gère le contenu (les fichiers et les bases), il gère juste les requêtes.
Le contenu est sur des filers.
Donc les 2 clusters tapent sur le même filer, ce qui fait que les données sont identiques.

L'explication est très claire, il faut juste savoir ce qu'est réellement un cluster.

simba
04/02/2008, 18h55
Pour les pannes d'accessibilité j'ai parlé trop vite !!!
Voila que ça recommence .....
90 plan de nouveau super lent !!! ( ou inaccessible )
Pas bon pour les robots tout cela .....

oles@ovh.net
04/02/2008, 19h04
simba <simba.349sbb@no-mx.forums.ovh.com> a écrit:
> Pas bon pour les robots tout cela .....

c'est le même cluster pour les robots que pour les visiteurs maintenant
il fallait pas raler.

Abogil
04/02/2008, 19h09
Quasi blocage de mon 90plan vers 20h.

simba
04/02/2008, 19h14
simba <simba.349sbb@no-mx.forums.ovh.com> a écrit:
> Pas bon pour les robots tout cela .....

c'est le même cluster pour les robots que pour les visiteurs maintenant
il fallait pas raler.


Alors la c'est sûr comme cela on est bien puni :D

Bon enfin doit bien y avoir une soluce pour faire tout fonctionner ensemble.....

marchait bien pourtant l'année dernière .....

Bruno-KS
04/02/2008, 19h17
Quasi blocage de mon 90plan vers 20h.
Toutes les plaintes et réclamations sont à adresser à raoul-h, professionnel en réfférencement :D

simba
04/02/2008, 20h15
Toutes les plaintes et réclamations sont à adresser à raoul-h, professionnel en réfférencement :D

Non non trop facile le coup du bouc émissaire ;)

Google on le sait tous est très très chatouilleux et raoul à voulu tirer la sonnette d'alarme sur un possible effet néfaste sur les référencements ....

maintenant si c'est pour revenir à un blocage comme ce soir , c'est pas jouable non plus .....j'ai l'impression que l'on a cherché à absorber les pics
de connections avec le même nombre et puissance machine .....en regroupant
les crawlers dans un coin , le ralentissement pour les crawlers étant jugés moins grâve ....


La soluce :Faut peut être courrir au p'tit casino pour acheter plus de machines ou upgrader tout le toutime :D

lcarrere
04/02/2008, 20h21
Passionant ce thread !

alain-b
04/02/2008, 20h27
Un cluster ne possède ni ne gère le contenu (les fichiers et les bases), il gère juste les requêtes.
Le contenu est sur des filers.
Donc les 2 clusters tapent sur le même filer, ce qui fait que les données sont identiques.

L'explication est très claire, il faut juste savoir ce qu'est réellement un cluster.

Ok .. Comme certains j'ai fait confusion entre clusters et filers. Alors on risque pas le backlistage pour cloacking... (pas sûr d'ailleur, car entre une 404 avec un user agent de bot et une réponse correcte ave cun user agent de navigateur, je sais pas comment la chose peut être intrêprêtée par google ... )

Mais le risque d'une panne partielle ou totale (pas facile à détecter) du cluster des bots demeure. Cela bloquerait leurs accès à un site ou plusieurs sites et ca reste un problème à mon avis ingérable. Et lorsque le déréférencement commencera à ce voir dans les stats, il faudra des semaines pour revenir dans le SERP.

Je trouve donc cette technique inacceptable même si l'idée à première vue est séduisante. Ca revient à travailler en aveugle avec le référencement qui est vital pour bon nombre de webmaster. En cas de pépin les pertes financières seront énormes et insurmontables pour beaucoup de sociétés dont le trafic moteur représente souvent plus 50% des visiteurs.

Bruno-KS
04/02/2008, 20h33
Mais le risque d'une panne partielle ou totale (pas facile à détecter) du cluster des bots demeure.
Si un serveur tombe, il en reste 59 pour gérer les requêtes et un serveur down ça se voit tout de suite au monitoring. C'est un faux problème.

Bref, ça ne sert à rien de continuer puisque les polémiqueurs ont eu ce qu'ils voulaient. Que leures craintes soient fondées c'est déjà autre chose.

raoul-h
04/02/2008, 20h47
Toutes les plaintes et réclamations sont à adresser à raoul-h, professionnel en réfférencement :D

1. référencement ne prend qu'un "f"
2. merci de me contacter par email pour les polémiques personnelles; accessoirement, débloquez le contact email dans votre profil (http://forum.ovh.com/profile.php?do=editoptions) afin que je puisse vous joindre.
3. postez donc une de vos URL afin de voir où vous en êtes sur le plan référencement, je vous offre un audit gratuit et en public si vous y tenez.
4. la question posée ici est "mieux, moins bien, pareil?"; il semblerait que de votre côté vous soyez enchanté, on l'a bien compris, vous vous êtes exprimé, c'est noté. merci de respecter tranquillement le point de vue d'autrui.

> Oles: même si les délais serveur sont catastrophiques, il vaut largement mieux que tout le monde (internautes, robots mais aussi les redoutés évaluateurs humains de Google (http://www.google.fr/search?q=%C3%A9valuateurs+humains+google)) soit logé à la même enseigne; merci.

simba
04/02/2008, 20h53
Pour l'instant personne n'a rien gagné ....y'a eu un coup de barre à droite un coup de barre à gauche ......les gens d'expriment ....on les y a quand même invité .....le référencement c'est un sujet explosif parce qu'il touche au portefeuille .......donc tout ce que j'ai lu était prévisible ....

Espérons que la meilleure solution sera au final retenue , on ne peut rester
quand même avec des sites carrément inaccessible comme ce soir !

raoul-h
04/02/2008, 21h30
Passionant ce thread !

n'est-ce pas? lcarrere, je ne peux m'empêcher de jeter un oeil rapide sur toutes les URL qui me tombent sous le touchpad, vous avez un problème de duplicate content (contenu dupliqué) sur le site de votre signature; en effet votre page d'accueil est accessible via au moins 2 URL différentes:

1. -http://gdpicture.com/index_fr.php
2. -http://www.gdpicture.com/index_fr.php

idem pour la version anglophone, 4 URL différentes pour la même page:

1. -http://gdpicture.com/
2. -http://gdpicture.com/index.php
3. -http://www.gdpicture.com/
4. -http://www.gdpicture.com/index.php

quelles conséquences? pour un moteur de recherche, 2 URL différentes= 2 pages différentes, or leur contenu est strictment identique; il suffit d'un seul lien externe (backlink), placé par bienveillance OU malveillance vers ces 2 URL (2 inscriptions annuaires par exemple), pour mettre votre site dans une situation de Duplicate Content (contenu dupliqué càd tentative de spam), et hop bonjour les dégâts.

quel remède? la redirection 301 (R 301 ou redirection permanente via fichier .htaccess). on balance tout vers -http://www.gdpicture.com/index_fr.php et vers -http://www.gdpicture.com/ (pour la version anglophone), à moins que l'une des 2 URL recoive déjà un nombre non-négligeable de liens, auquel cas il faudra tout rediriger vers cette URL.

cordialement,

raoul

Shadow aok
04/02/2008, 21h58
D'un autre côté, tout le monde ne génère pas de publicité sur son site et n'est pas forcément "omnubilé" par le référencement ;)

alain-b
04/02/2008, 22h50
oui .. mais certains en vivent .. et il y a bcp de monde qui a déjà mis la clé sous la porte à cause des états d'ame de Google.. Alors si en plus on ajoute un risque au niveau de l'hébergement... Je crois pas qu'il y ait volonté de polémiquer de la part des intervenants mais plutot de mettre en garde ...

Est ce qu'il ne seraient pas possible de filtrer les robots qui font un crawl trop agressif pendant les heures de pointe ? Je préfererais encore cette solution qui serait de ne pas répondre à certaines heures. C'est + propre.

Bruno-KS
04/02/2008, 22h54
Je crois pas qu'il y ait volonté de polémiquer de la part des intervenants mais plutot une crainte bien réelle...
La crainte était infondée.

alain-b
04/02/2008, 23h00
Non, la crainte n'est pas totalement infondée .. Difficile à évaluer , je le reconnais. Mais comment font les autres hébergeurs ??

raoul-h
04/02/2008, 23h15
La crainte était infondée.

sors de ce corps, Jérôme Kerviel!

;)

Bruno-KS
04/02/2008, 23h49
Non, la crainte n'est pas totalement infondée .. Difficile à évaluer , je le reconnais. Mais comment font les autres hébergeurs ??
On s'en fou des autres hébergeurs. L'histoire c'est que certaines personnes aux connaissances techniques limitées ont fait un scandale sur qqch qui ne l'était pas. je n'ai pas vu un seul argument objectif et fondé qui aurait pu aller dans leur sens, juste des geignardises de grand-mère.

raoul-h
05/02/2008, 00h41
certaines personnes aux connaissances techniques limitées ont fait un scandale sur qqch qui ne l'était pas. je n'ai pas vu un seul argument objectif et fondé qui aurait pu aller dans leur sens, juste des geignardises de grand-mère.

allons, allons, M. KS, reprenez-vous.

j'attends toujours votre (ou vos) URL, ainsi que la possibilité de répondre en privé à vos attaques personnelles (j'ai une dizaine d'IP supposées d'évaluateurs humains de Google, mais je crains que parmi les 10 à 15 000 supposés ça fait pas beaucoup, je fais quoi, je transmets à OVH? parce que vous imaginez bien que la reverse n'est pas "google_human_evaluator", non se sont de bonnes vieilles IP comme la vôtre et la mienne, avec une reverse de FAI).

par ailleurs je peux vous envoyer un mail (ou visiter votre site) avec une ip provenant de l'Elysée, si ça vous amuse, ou d'un us.gov, ou ce que vous voudrez, j'espère que je ne vous l'apprend pas. et pour la reverse, un fournisseur d'accès du groenland, ça vous ira?

j'espère que vous ne mesurez pas les "connaissances techniques" des intervenants à leur nombre de posts, au moins?

si?

rhôôôô!

si vous voulez bien vous donner la peine de nous expliquer en quoi le fait

1. de filtrer les robots f(IP)
2. de rabattre tout ça (ou le peu qui est pris dans le filet) sur un serveur qui rame

améliore le référencement des sites concernés, et

3. pourquoi seuls les 90PLAN auraient été concernés par cette géniale révolution, et les autres clients PLAN lésés?

merci de nous éclairer sur ces 3 points, M. KS, avec quelques arguments, documentation ou expérience, et, de grâce, sans vous emporter à coups d'adjectifs qualificatifs désobligeants qui ne vous abaissent que vous-mêmes.

je n'ai pas vu un seul argument objectif et fondé
ce n'est pas aux clients d'argumenter, ou de tester, c'est au prestataire de services! ce que j'ai fait, comme l'ont rapporté plus haut d'autres webmasters, c'est tirer une sonnette d'alarme; une sorte de principe de précaution, vous saisissez? on ne parle pas de la couleur d'un favicon, au risque de me répéter.

maintenant ces 36 heures de filtrage peuvent avoir des conséquences dans les prochaines semaines, ainsi qu'un effet domino sur toute la structure d'un réseau de site: il n'est jamais bon ni de recevoir, ni surtout de faire un lien vers un site pénalisé.

il semblerait (je dis bien il semblerait) que les choses soient revenues à la normale sur le plan du filtrage des IP, je vais faire mes propres tests afin de vérifier tout ceci.

cordialement,

raoul.

Bruno-KS
05/02/2008, 00h53
blablabla
cordialement,

raoul.

Je vois toujours pas d'argument objectif qui prouve que diviser le cluster cause un dommage au référencement. Ca sert à rien de me proposer tes services et de me raconter n'importe quoi, tout ce que je veux c'est une preuve chiffrée. Le reste est inutile.

raoul-h
05/02/2008, 01h04
mhh, brillant.

en fait, vous êtes un aventurier, un défenseur de la roulette russe: impossible de savoir si il y a une balle de positionnée en face du percuteur avant de presser la queue de détente.

ce que vous demandez, c'est de presser d'abord la détente, "pour voir", et de parler après.

très peu pour moi, je ne mange pas de ce pain-là, et je paie, en plus. s'il vous prend de bien vouloir vous pencher sur mes 3 questions ci-dessus, je vous lirai avec intérêt.

bonsoir.

Bruno-KS
05/02/2008, 01h18
ce que vous demandez, c'est de presser d'abord la détente, "pour voir", et de parler après.
Ce que je demande, c'est d'appuyer un avis avec des arguments, pas avec diverses formules de rhétorique. Car c'est facile de faire peur aux personnes pour qui cluster=filer, sauf quand t'as en face de toi qqn qui te demande de le prouver. Pas de chance, je suis passé par ici.

simba
05/02/2008, 07h18
Moi je suis pas un super technicien ni un pro du référencement cependant je constate :

- Mon site régulièrement inaccessible ces derniers temps sur 90 plan , je suis pas le seul cas à lire le forum .

- Pas de réponse clair du support technique sur ce sujet via ce forum , pas de prise de conscience de la gravité de cette situation à mon humble avis .

- Mon site carrément plus référencé sur certains datacenter google alors que j'ai rien touché et que tout marchait bien l'année dernière.

- Je me dis que cette situation pourrait bien être due au fait que le googlebot
ne peut accéder autant qu'il le veut à mon site tout comme mes visiteurs d'ailleurs .... bien sûr pas de preuve scientifique car ma boulangère à changé de coiffure au début des pannes donc peut- être est ce la cause:D

- Un problème de saturation des serveurs dns ovh est mis à jour , mauvaise propagation des dns ? En vidant le cache dns je retrouve souvent la connection ...alors hazard ? Bon ovh fait les travaux sur les dns , je ne constate plus les pannes d'accessibilité mais peut-être pas vraiment de rapport .

- Ovh nous annonce que les crawlers gourmands vont être regroupés dans leur coin , que si le temps de réponse est plus long c'est pas grâve pour eux !!! et nous demande si moins bien pareil ou mieux question référencement.
( impossible de vérifier le passage du googlebot dans nos stats , stats en panne comme d'habitude ...)

- Personne n'est bien sûr en mesure de répondre avec certitude à la question
vu que google peut mettre plusieurs mois pour réagir à une situation que ce soit à la hausse ou à la baisse .

- on commence a s'interroger sur la pertinence de ce choix technique , le risque premier à mon avis étant que les robots rament dans leur coin sur des serveurs saturés sans que personne ne s'en rende compte avec effet négatif
plus tard sur le référencement . Intervient un référenceur pro qui liste toutes les raisons de s'inquiéter de ce choix , ne veut pas faire le cobaye etc ....

- Devant le tollé , ovh fait marche arrière , retour nous dit on à la config
précédente avec au passage accés à nos sites très très lent voir accès impossible . C'est normal nous dit on , fallait pas rouspéter ! les robots sont dans le coin , cela ira mieux demain ! .....non mais je rêve :confused: !!!

- Alors oui question : comment font les autres hébergeurs ? pourquoi les autres plans pas concernés ? Pas possible d'upgrader ou multiliplier les machines pour avoir tout sur un même plan , robots et visiteurs mais avec
réserve de puissance suffisante ?

- Non pas de polémiqueurs sur ce forum , juste des clients qui veulent que ça marche .

Donc toujours en attente d'une solution satisfaisante , fiable et éprouvée .

nouveauxmondes
05/02/2008, 08h44
Nombre de pages indexées en baisse sur le site Télévision Utile et Responsable (http://www.nouveaux-mondes.org).
Mis à part un problème d'accès, je n'en comprends pas la raison !

Merci ...

lcarrere
05/02/2008, 09h15
n'est-ce pas? lcarrere, je ne peux m'empêcher de jeter un oeil rapide sur toutes les URL qui me tombent sous le touchpad, vous avez un problème de duplicate content (contenu dupliqué) sur le site de votre signature; en effet votre page d'accueil est accessible via au moins 2 URL différentes:

1. -http://gdpicture.com/index_fr.php
2. -http://www.gdpicture.com/index_fr.php

idem pour la version anglophone, 4 URL différentes pour la même page:

1. -http://gdpicture.com/
2. -http://gdpicture.com/index.php
3. -http://www.gdpicture.com/
4. -http://www.gdpicture.com/index.php

quelles conséquences? pour un moteur de recherche, 2 URL différentes= 2 pages différentes, or leur contenu est strictment identique; il suffit d'un seul lien externe (backlink), placé par bienveillance OU malveillance vers ces 2 URL (2 inscriptions annuaires par exemple), pour mettre votre site dans une situation de Duplicate Content (contenu dupliqué càd tentative de spam), et hop bonjour les dégâts.

quel remède? la redirection 301 (R 301 ou redirection permanente via fichier .htaccess). on balance tout vers -http://www.gdpicture.com/index_fr.php et vers -http://www.gdpicture.com/ (pour la version anglophone), à moins que l'une des 2 URL recoive déjà un nombre non-négligeable de liens, auquel cas il faudra tout rediriger vers cette URL.

cordialement,

raoul



Merci beaucoup Raoul c'est très aimable.
A charge de revanche !

A vrai dire j'avais déjà dans le passé effectué cette redirection. J'ai du la virer par inadvertance.

Pour ceux que ca intéresse, j'ai rajouté les lignes suivantes dans le .htaccess situé à la racine de mon site.

RewriteCond %{HTTP_HOST} !^www.gdpicture.com$ [NC]
RewriteRule ^(.*)$ http://www.gdpicture.com/$1 [L,R=301]


Source: http://enarion.net/web/apache/htaccess/redirect-www-and-no-www/


Amicalement,

Loïc Carrère

Abazada
05/02/2008, 09h22
Bonjour,
J'y crois pas !
9 pages de "discussion" sur ce sujet mais rien de concret, que du blabla et du "sentiment" comme dit Octave ... :(

C'était pourtant pas compliqué de voir si ça marchait ou pas, il suffisait de demander à Google ce qu'il voyait/faisait, et il vous aurait répondu avec quelque chose du style : http://demo21.ovh.com/1ae973f0ce02c0e28cd4bd95f6388cf0P/GoogleCrawlRate.png

Je précise que ces courbes viennent d'un site sur une dédié vu que je n'ai pas de domaine en 90plan, mais s'agissant d'outils Google ça ne change rien au principe.

Donc que quelqu'un affiche ici les courbes de son domaine sur 90plan, et l'on saura de suite si la modif OVH a eu un impact ou pas, et si oui dans quel sens.
Le reste c'est du blabla. :cool:

Abazada

simba
05/02/2008, 09h37
Ben justement moi aussi j'ai essayé d'interpreter ces courbes données
par l'outil google .

En ce qui concerne ma courbe de temps de téléchargement je constate que des pics dents de scie entre 0 et 600 ms avant et après manip ....donc pour moi c'est pas très bon la courbe n'en est pas une , pas assez lissé et rien à voir avec la courbe du dédié !

( zéro cela veut dire quoi ? pas d'accés ? )

Edit : Au final je ne suis pas sûr que le graphique google prenne bien en compte les derniers jours et le basculement car le graphique n'est pas assez précis au niveau des jours entre janvier et février .....ma page cache étant d'ailleurs toujours du 29 janvier . donc à surveiller et voir si le graphique évolue ...

nakuni
05/02/2008, 11h07
Je vois toujours pas d'argument objectif qui prouve que diviser le cluster cause un dommage au référencement. Ca sert à rien de me proposer tes services et de me raconter n'importe quoi, tout ce que je veux c'est une preuve chiffrée. Le reste est inutile.

L'argument objectif est que si les robots tombent sur un cluster embouteillé et que le temps de réponse est beaucoup trop lent voir que le site est inaccessible, le positionnement du site sera affecté de manière négative. Ce n'est quand même pas compliqué à comprendre, intéresse toi un eu au référencement, mets toi dans la peau d'un professionnel qui a passé plusieurs mois à se battre pour gagner 10 places dans google et qui risque d'en perdre 4 fois plus à cause d'un test de son hebergeur qui ne lui a rien demandé, je ne vois pas ce que tu veux de +

Merci Raoul d'avoir "tiré la sonnette d'alarme"!

alain-b
05/02/2008, 11h25
Il y a une règle simple pour l'accès à un site si on ne veut pas d'ennui avec le référencement. Les accès visiteurs et robots doivent être traités EXACTEMENT de la même façon.

Que la solution mises en place hiers (et retirées depuis) puissent améliorer certains problèmes, c'est très possible.

C'est comme rouler à moto sans casque. Ca améliore apparement la sécurité car on voit mieux, on entend mieux .. on peut rouler + vite ... cool .. Allé ! Roulez sans casque, je vous dis que c'est mieux ! Et testez ! Dans 1 an on fera le bilan.

lcarrere
05/02/2008, 11h50
L'argument objectif est que si les robots tombent sur un cluster embouteillé et que le temps de réponse est beaucoup trop lent voir que le site est inaccessible, le positionnement du site sera affecté de manière négative. Ce n'est quand même pas compliqué à comprendre, intéresse toi un eu au référencement, mets toi dans la peau d'un professionnel qui a passé plusieurs mois à se battre pour gagner 10 places dans google et qui risque d'en perdre 4 fois plus à cause d'un test de son hebergeur qui ne lui a rien demandé, je ne vois pas ce que tu veux de +

Merci Raoul d'avoir "tiré la sonnette d'alarme"!



Nakuni, je pense que c'est peine perdu de tenter de lui expliquer...


Perso ce qui me chagrinait avec l'idée d'oles c'est qu'on allait couper la chique aux robots d'exploration.


From google webmaster:

"[...]Notre objectif est d'explorer autant de pages de votre site que possible à chaque visite"


En toute logique on peut, je pense, en conclure que plus la b.p. est large plus le robot de Google pourra recueillir d'informations relatives à nos chères sites, et inversement non ??

Et plus google aura d'infos et plus il pourra en transmettre à ses utilisateurs...


Sinon pour ce qui est du Cloaking je suis un peu partagé. Par précaution j'irai toutefois dans le sens de ceux qui savent que Google de fais pas de cadeau et qu'à tout moment il peut considérer cette méthode comme telle (si ce n'est pas déjà fait). Mais bon, ça ne va pas dans le sens des nombreuses définitions que l'on peut trouver sur le net. Voici celle du WRI:


Cloaking: "Technique permettant de fournir une page différente aux moteurs de recherche qui indexent un site de celle visible par un internaute. Considérée comme du spamdexing, elle est interdite par les moteurs de recherche."


Tout en restant simpliste, je pense qu'il faut parfois l'être, j'aurai tout d'abord augmenté le nombre de serveurs pour palier à la surcharge. Ou à défaut, en prendre de plus puissants. Ensuite, je réalise une phase de test avec l'aide de volontaires, tests que je fais progressivement monter en puissance avant de passer tout ça en production. Si possible je choisis des volontaires issus du monde du référencement dans la mesure où le but visé semble être d’augmenter la qualité de l’indexation.
Certains diront que dans une entreprise il faut savoir prendre des risques, je répondrai à ces derniers qu'il faut tout d'abord les mesurer car ces derniers me semblent disproportionnés au regard de l'enjeu en question. Mais ce n'est que mon avis...



Cordialement,

Loïc

Bruno-KS
05/02/2008, 13h13
L'argument objectif est que si
Avec des "si" on refait le monde. Le smokeping montrait que le crawler 90plan était très stable donc pourquoi rajouter de nouveaux serveurs si ça marche bien ?

Comme le dit Abazada, donnez plutot des chiffres, des courbes.. bref des trucs précis sur lesquels on peut se fonder pour dire oui, ce cluster était mauvais pour le référencement.

Bruno-KS
05/02/2008, 13h24
- Mon site régulièrement inaccessible ces derniers temps sur 90 plan , je suis pas le seul cas à lire le forum .
Oui et je crois que c'est pour ça qu'octave a voulu séparer crawlers et visiteurs, car c'étaient eux qui faisaient ramer les 90plan (les crawlers).

- Mon site carrément plus référencé sur certains datacenter google alors que j'ai rien touché et que tout marchait bien l'année dernière.
Oui, ça peut être du aux lenteurs.. ou pas.

- Je me dis que cette situation pourrait bien être due au fait que le googlebot
ne peut accéder autant qu'il le veut à mon site tout comme mes visiteurs d'ailleurs .... bien sûr pas de preuve scientifique car ma boulangère à changé de coiffure au début des pannes donc peut- être est ce la cause:D
C'est vrai, mais fournir un certain nombre d'indicateurs c'est déjà mieux que rejeter la faute sur une cause car ça parait "logique".

- Ovh nous annonce que les crawlers gourmands vont être regroupés dans leur coin , que si le temps de réponse est plus long c'est pas grâve pour eux !!! et nous demande si moins bien pareil ou mieux question référencement.
( impossible de vérifier le passage du googlebot dans nos stats , stats en panne comme d'habitude ...)
Rien ne t'empêche d'utiliser les outils de Google. Le smokeping montrait que ça se passait plutot bien et que les robots ne voyaient pas de charge. Je crois que ce qu'a voulu dire octave c'est : si ça rame pour les robots de temps en temps, c'est pas trop grave. Avant, quand ça ramait pour tout le monde c'était du aux visiteurs+crawlers. Après, les visiteurs n'auront pas de problème si les robots tapent fort. Est-ce que ça veut dire que les robots verront des lenteurs ? Peut-être mais ces lenteurs seront moindres qu'avant puisque tu auras enlevé les requêtes des visiteurs. Peut-être même que là où le cluster ramait ensemble, il ne ramerait plus dans sa configuration séparée. Faut éviter les racourcis.

raoul-h
05/02/2008, 13h31
Avec des "si" on refait le monde. [...] des trucs précis sur lesquels on peut se fonder pour dire oui, ce cluster était mauvais pour le référencement.

ce n'est pas le problème, vous êtes hors-sujet et de mauvaise foi, de surcroît.

le problème, c'est que ce n'est pas aux clients de démontrer que c'est nocif, mais au prestataire de démontrer que c'est bénéfique.

vous saisissez la différence, ou pas, sincèrement?

Bruno-KS
05/02/2008, 13h38
au prestataire de démontrer que c'est bénéfique.
Vous savez lire des graphes Smokeping ? On dirait pas.

raoul-h
05/02/2008, 13h56
Vous savez lire des graphes Smokeping ? On dirait pas.

vous parlez peut-être des 3000 millisecondes de délai serveur (latency page for crawler) (http://smokeping.ovh.net/ovh-server-statistics/show.cgi?start=2008-02-04+08%3A47&end=2008-02-04+10%3A00&target=Plans.90plan.crawler-90plan&displaymode=n&Generate%21=Generate%21)?

pour un site de 1 000 pages possédant un bon internal-linking, ça donne 1 000 X 3 = 3 000 secondes = 50 minutes pour crawler le site, (et je ne parle pas de MediaPartner, le robot Adsense), bref autant dire qu'il s'est barré depuis longtemps, le GoogleBot...

à lire cette excellente discussion comment capturer un bot (http://www.webrankinfo.com/forums/viewtopic_49433.htm). :D

simba
05/02/2008, 14h02
Moi perso j'ai jamais dit que la solution choisie par oles était nulle et qu'il fallait impérativement revenir à la situation antérieure qui de toute façon n'était pas satisfaisante . D'un autre côté l'expérience d'un référenceur pro
c'est bon à prendre pour faire avancer les choses ...

Pour ce qui est des outils google difficile également à utiliser car il semble y avoir un retard de plusieurs jours sur l'affichage des graphiques .

En ce qui concerne les stats souvent en panne , ne pas voir le passage du googlebot cela ne rassure pas sur la capacité d'ovh à réparer rapidement toute avarie ! ( fusse les stats qui c'est vrai on peut vivre sans ou voir ailleurs pour le service)

L'engorgement sur 90 plan datant maintenant de quelques semaines , on peut se dire également ; " si le crawler plan rame dans son coin , combien de temps pour réagir , quel résultat pour mon référencement "

Alors c'est vrai avec des si on peut refaire le monde .....
Tous les points de vue ont été donnés .

Il faut sans doute que la team ovh prenne un peu de recul et nous dise ensuite ce qu'elle compte mettre en place pour améliorer la situation.

Bigbangbel
05/02/2008, 14h17
Client d'OVH depuis 3 ans, j'ai lu tout le thread ainsi que celui sur webrankinfo, et cela me pousse à m'inscrire pour pouvoir répondre. C'est dire l'intérêt que je porte à tout se qui s'est dit ici.

- êtes vous de ceux qui ont vu des variations dans votre hébergement ? Il y a tant de raisons possibles, pourquoi serait-ce la manipulation sur les clusters d'OVH ? Moi, je n'ai rien remarqué. Mes stats indiquaient encore le passage de Googlebot avant qu' "oles" ne revienne en arrière.

- il faut servir le même contenu à Google qu'aux utilisateurs : ce qu'OVH voulait mettre en place ne modifiait en rien la réponse. Le seul impact était le temps de réponse qui "pouvait" être un peu différent en cas de surcharge d'un des deux pools de serveurs. Comme la charge des robots est plus "lisse" que celle des utilisateurs, on courrait avec la nouvelle solution moins de risque que la réponse du serveur ne vienne pas.

- le manque de connaissance de certains dans ce forum, y compris des webmasters et des "référenceurs" parmi eux, sur le fonctionnement d'une infrastructure d'hébergement telle que celle d'OVH a généré beaucoup de peurs, de craintes, et ... à juste titre.

- si la solution d' "oles" me paraît intéressante à mettre en place, son annonce quelque peu maladroite allait évidemment provoquer un tollé parmi les clients. Un décideur/entrepreneur/... ne peut supporter l'idée d'un risque technique. Logique.

- Est-ce trop demander à OVH, lorsqu'une prochaine mise en place du genre est imaginée, d'informer ses clients en long et en large et recueillir les réactions avant l'implémentation ? Cela évitera peut-être un tel dérapage.

Allez ! Un partout, la balle au centre. On est revenus à la solution antérieure. Jolie tempête dans un verre d'eau.

raoul-h
05/02/2008, 14h41
Mes stats indiquaient encore le passage de Googlebot avant qu' "oles" ne revienne en arrière.

bonjour,

il est beaucoup trop tôt pour se prononcer sur d' éventuels effets, les temps d'accés fournis par GWT n'étant pas encore mis à jour, et les SERPs pouvant eux aussi se mettre à jour plusieurs jours après un éventuel incident. (index update, algo update, export PR).

or ces stats sont les seules auxquelles on peut faire confiance concernant Google, puisque c'est lui-même qui les fournit.

son annonce quelque peu maladroite allait évidemment provoquer un tollé parmi les clients. Un décideur/entrepreneur/... ne peut supporter l'idée d'un risque technique. Logique.
Est-ce trop demander à OVH, lorsqu'une prochaine mise en place du genre est imaginée, d'informer ses clients en long et en large et recueillir les réactions avant l'implémentation ?

en effet, vous avez cerné le problème; je ne suis pas en mesure d'affirmer que l'hypothèse d'Oles était pénalisante, même si j'ai exposé plusieurs arguments solides qui vont en ce sens (le premier étant "on ne filtre pas les robots", le second "un robot ne doit pas ramer" et le troisième "personne ne connaît toutes les IP de Google à un instant t");

le fait est que personne n'est non plus en mesure d'affirmer et de prouver le contraire, et que c'est au prestataire de prouver les bienfaits d'une telle mesure, à un instant t mais aussi t+1 càd demain, et non pas au client de prouver la nocivité d'une telle mesure;

quand un labo pharmaceutique élabore une nouvelle molécule, il la teste, d'abord en labo, puis sur des animaux, puis en double-aveugle (effet placebo) sur des sujets volontaires et rémunérés.

la problématique consiste dans la manière de faire qui relève de l'expérimentation tâtonneuse sur des sujets réels (nos sites!), alors que les enjeux sont colossaux.

merci pour votre résumé et votre vision objective de la chose. il n'y a pas de tempête ou de polémique; ce forum est censé permettre aux clients de s'exprimer; s'il ne sert qu'aux béni-oui-oui, il en devient hypocrite.

lololo
05/02/2008, 17h00
Voila je poste des captures d'écran de mes stats
http://www.hebergementimages.com/images/1202229654_exploration.png


Et une autre capture qui me fait flipper
http://www.hebergementimages.com/images/1202228844_sitemap.png

Dans cette capture on voit URL indexées dans le plan sitemap 417 alors que j'étais a + de 1 000 il y a 3jours. Bien sur je n'associe pas ca à ca c'est juste une constatation.

Pour la commande site: sur google, j'avais 1180 url il y a 3jours et 1 130 maintenant, donc ca na pas trop bouger de ce côté

et vous de votre côté?

J'éspèe que ca peut aider

Cordialement

RaphAstronome
05/02/2008, 17h32
Temps de téléchargement d'une page : 500ms tout a fait normal, il ne faut pas oublier que Google est aux USA donc il prend direct de la latence.

Pour le 2e c'est moins rassurant mais il n'est pas du tout sur que ce soit dû à ça. Les pages à faibles PageRank (et donc majoritaires) on tendance a aller et revenir, il est peut être juste en train de recalculer quelques chose. Mais c'est vrai que en général ce genre de choses rend inquiet.

En tout cà en dit long sur l'importance (abusive?) de Google :
http://www.pcinpact.com/actu/news/39434-Google-Dieu-Googlisme.htm

simba
05/02/2008, 17h37
Bon allez moi aussi je poste l'image du temps de téléchargement de ma page
outil google :
http://www.hebergementimages.com/images/1202232476_TELPAGE.jpg

Voir les belles dents de scie , et pourquoi des descente à Zéro ?
je pense que google n'accède pas en zéro secondes mais que cela correspond
aux cas des échecs connection du googlebot .
( si un spécialiste peut me confirmer ou infirmer l 'hypothese )

Le graphique fini à quelle date exactement mystère !!! je ne pense pas que les derniers jours soient visibles sur ce graphique donc pas encore trace de la
manip aller retour d'oles .

la_flegme
05/02/2008, 18h01
salut
je comprend pas la reaction de certain

200 serveurs pour le cluster (puissance de calcule)
1 filer pour les fichier

utilisateur et robot utilise les 200 serveurs et le meme filer ça rame a mort

ovh decide de separer 60 serveurs des 200 ce qui donne

140 serveurs cluster pour les utilisateur
et
60 serveurs pour les robots
et toujours 1 seul filer pour les fichiers

donc les robot vois exactement la meme chose que les utilisateur vu que les fichiers sont sur le meme filer c'est uniquement la puissance de calcule qui as ete separer pour utilisateur et robot mais le fichier sont les memes


donc pour certain c'est mieux que les robots et les utilisateur rame sur 200 serveur plutot que les utilisateurs ne rame plus mais les robot rame toujours

bref je comprend pas trop la vu que le contenu est identique meme filer y avais pas de probleme niveau referencement seul chose les utilisateur arrettais de ramer et les robot continuais maintenant que le cluster a ete remis comme avant les robots et les utilisateur rame donc pour les robots ça change rien une solution ou l'autre y rame alors que l'utilisateur lui n'aurais plus eu de probleme avec 2 cluster separer bref en gros certain prefere que tout le monde rame plutot que seulement les robots alors que la les robots et les utilisateurs rame ......

simba
05/02/2008, 18h04
Non non moi ce que je veux c'est une soluce ou personne ne rame ;)

( ni robots ni visiteurs )

oles@ovh.net
05/02/2008, 18h12
la_flegme <la_flegme.34bkhb@no-mx.forums.ovh.com> a écrit:
>
> salut
> je comprend pas la reaction de certain
>
> 200 serveurs pour le cluster (puissance de calcule)

90plan c'est 400 serveurs HG en parallele. chaque serveur est
identique en terme de puissance de calcul (sinon on s'en sort
pas) et le contenu.

la_flegme
05/02/2008, 18h17
la_flegme <la_flegme.34bkhb@no-mx.forums.ovh.com> a écrit:
>
> salut
> je comprend pas la reaction de certain
>
> 200 serveurs pour le cluster (puissance de calcule)

90plan c'est 400 serveurs HG en parallele. chaque serveur est
identique en terme de puissance de calcul (sinon on s'en sort
pas) et le contenu.

desoler pour l'erreur ;) mais au final je comprend toujours pas les utilisateurs qui rallais cela permettais que les user qui visite leur site ne rame plus et que les robots qui ramais deja continu de ramer dans leur coin sans faire chiez les user

oles@ovh.net
05/02/2008, 18h34
la_flegme <la_flegme.34bl7z@no-mx.forums.ovh.com> a écrit:
>
> oles@ovh.net;154802 Wrote:
>> la_flegme <la_flegme.34bkhb@no-mx.forums.ovh.com> a écrit:
>> >
>> > salut
>> > je comprend pas la reaction de certain
>> >
>> > 200 serveurs pour le cluster (puissance de calcule)
>>
>> 90plan c'est 400 serveurs HG en parallele. chaque serveur est
>> identique en terme de puissance de calcul (sinon on s'en sort
>> pas) et le contenu.
>
> desoler pour l'erreur ;) mais au final je comprend toujours pas les
> utilisateurs qui rallais cela permettais que les user qui visite leur
> site ne rame plus et que les robots qui ramais deja continu de ramer
> dans leur coin sans faire chiez les user

j'sais pas non plus. pour moi le sujet est clos. on a d'autres
projets à faire (ce ne sont pas les seuls idées qu'on a).

raoul-h
05/02/2008, 18h36
salut
je comprend pas la reaction de certain [...] separer pour utilisateur et robot mais le fichier sont les memes

on n'essaye pas de filtrer les robots.
point.

un robot est là, entre autres, pour simuler un visiteur. donc oui, au risque d'en choquer certains, un robot a la même valeur qu'un visiteur. sans robot, pas de référencement, et sans référencement, pas de visiteur.

n'allez pas imaginer qu'une boîte comme Google, qui pèse 189 milliards (je dis bien milliards) de dollars, et emploie les meilleurs ingénieurs de la planète, va fermer les yeux sur une tentative de filtrage provenant d'un hébergeur français pesant 500 000 EUR (capital social).

vous cherchez une solution sûre? il suffit qu'OVH contacte officiellement Google France:

Google France SARL
38, avenue de l'Opéra
75002 Paris, France
Téléphone: +33 (0)1 42 68 53 00
Télécopie: +33 (0)1 53 01 08 15

et accessoirement Yahoo! et MSN-LiveSearch, afin de soumettre très précisément le problème.

la_flegme
05/02/2008, 18h44
on n'essaye pas de filtrer les robots.
point.

un robot est là, entre autres, pour simuler un visiteur. donc oui, au risque d'en choquer certains, un robot a la même valeur qu'un visiteur. sans robot, pas de référencement, et sans référencement, pas de visiteur.

n'allez pas imaginer qu'une boîte comme Google, qui pèse 189 milliards (je dis bien milliards) de dollars, et emploie les meilleurs ingénieurs de la planète, va fermer les yeux sur une tentative de filtrage provenant d'un hébergeur français pesant 500 000 EUR (capital social).

vous cherchez une solution sûre? il suffit qu'OVH contacte officiellement Google France:

Google France SARL
38, avenue de l'Opéra
75002 Paris, France
Téléphone: +33 (0)1 42 68 53 00
Télécopie: +33 (0)1 53 01 08 15

et accessoirement Yahoo! et MSN-LiveSearch, afin de soumettre très précisément le problème.

tout le truc est la c'etait pas un filtrage mais simplement une separation des ressources CPU/RAM utilisant le meme filer pour les data mais en aucun cas c'etait un filtrage un filtrage voudrais dire que le robot est carrement jeter des serveurs la c'etait pas le cas ils avais juste 60 serveurs pour puissance cpu/ram separer mais le meme filer donc c'etait pas un filtrage faut pas tout melanger non plus je ne doute pas des tes capaciter loint de la ;) mais la en gros tout le monde rame robot+user alors que la solution d'ovh etait de laisser ramer les robots et plus les utilisateur donc ça changeais rien au niveau des robot il ramais deja avant et continu de ramer maintenant

simba
05/02/2008, 19h01
Moi ce qui me choque c'est bien dans la présentation , on a fait croire à une technique pour améliorer le référencement , en fait c'était juste une astuce pour que les robots galèrent dans leur coin .....histoire de déserrer un peu l'engorgement des serveurs pour les users .

Un user mécontent qui ne peut pas accéder à son site , il rale tout de suite ...

Un robot ça râle rarement ......bon il risque de se venger plus tard pour le référencement ......mais ovh ne s'engage pas sur le référencement ai je lu sur le forum ......de plus google est tellement capricieux et mystérieux qu'il va être bien difficile de prouver quoique soit pour le client .

Cela fait un peu solution rustine ....

Alors les autres projets ovh téléphonie etc ...moi perso pas demandeur .
Par contre une capacité réseau à absorber tout le trafic visiteurs+robots
si possible sans filtrage spécial robots alors la oui cela m'interresse !

oles@ovh.net
05/02/2008, 19h28
simba <simba.34bn9b@no-mx.forums.ovh.com> a écrit:
>
> Moi ce qui me choque c'est bien dans la présentation , on a fait croire
> à une technique pour améliorer le référencement , en fait c'était juste
> une astuce pour que les robots galèrent dans leur coin .....histoire de
> déserrer un peu l'engorgement des serveurs pour les users .

et si à l'inverse les robots pourraient avoir un cluster de haute
qualité / de meilleur qualité que les visiteurs ? je veux dire, lorsqu'on
fait de la recherche et dev on ne sait pas de suite toutes les autres
idées qu'on peut avoir. dans mon esprit, le but est d'améliorer le
referecement alias le rendre de qualité constante afin de vous aider
à avoir un meilleur positionement. avoir un bouton sur lequel on peut
tourner pour faire mieux ou moins bien sur un referecement est une idée
qui dans tous les cas reviendra. là on a arreté les tests uniquement
parce que les 400 serveurs pour les visiteurs ne sont pas suffisants.
la semaine prochaine j'ai 300 machines dans 90plan en plus et puis je
refais les tests. je ne sais pas encore si je vais partager avec vous
les resultats de mes recherches parce que le feedback n'est pas celui
que j'ai demandé (peut etre sur une ml je trouverai des clients 90plan
qui pourront nous le faire).

en tout cas merci à tout le monde pour ce thread qui ne m'a rien appris.

raoul-h
05/02/2008, 19h33
en tout cas merci à tout le monde pour ce thread qui ne m'a rien appris.

ben voyons.

de mon côté je ne vous remercie pas pour votre absence de professionnalisme et votre incapacité à vous remettre en question.

c'est noté.

simba
05/02/2008, 19h37
Bon alors la si on met des machines en plus on va dans la bonne direction ...

Moi j'ai pas la prétention d'apprendre quelquechose à Oles ......mais de lire tous les posts des clients c'est pas complètement inutile ....

C'est bien pour ovh de garder le contact avec sa base de client , pour cela bravo !

raoul-h
05/02/2008, 19h38
parce que le feedback n'est pas celui
que j'ai demandé

c'est une plaisanterie j'espère?

le client n'est pas là pour ronronner ce que vous avez envie d'entendre!

lcarrere
05/02/2008, 21h03
en tout cas merci à tout le monde pour ce thread qui ne m'a rien appris.

A défaut de ne t'avoir rien appri je pense que certains clients t'auront aidé à prendre la bonne décision ;)


Cordialement,

Loïc

Bruno-KS
05/02/2008, 23h21
c'est une plaisanterie j'espère?

le client n'est pas là pour ronronner ce que vous avez envie d'entendre!

STFU (http://www.stfu.se/stfu.swf)

:)

simba
06/02/2008, 09h15
Restons courtois !

En ce qui concerne les pannes d'accessibilité des sites 90 plan ( pénalisantes
pour le référencement , je suis bien dans le sujet ) il me semble que certains
domaines sont plus touchés que d'autres , certains clients ne remarquent pas grand chose même avec un monitoring pour d'autres c'est assez systématique semble t il ! les pannes d'acces continuent à lire tous les posts du forum .

Mes questions : Y a t il un traitement prioritaire sur les serveurs pour certains et selon quel critère ( ancienneté , grosseur du site , nombre habituel de visiteurs etc.. ?)

- Ou alors non tout le monde à égalité mais possibilités certaines machines defecteuses ou moins performantes ?

En tout cas le résultat final ne me semble pas homogène ....c'est une idée que je me fais ? Si quelqun à une petite idée sur la question !

voir :
http://forum.ovh.com/showthread.php?t=31209

lcarrere
06/02/2008, 09h30
STFU (http://www.stfu.se/stfu.swf)

:)


Ca rame ce site, il est hébergé sur un 90 plan ? :D

iordanoff
06/02/2008, 10h15
Bonjour,

j'ai eu ce matin des appels d'internautes qui ne pouvaient pas accéder à mes sites hier soir, entre 21h et minuit. juste au moment où je venais d'envoyer un emailing très important!

C'est un peu problèmatique.


http://sofica-credits.fr et http://sofica-credits.com sont hébergés sur deux 90plan différents.

Serait il possible d'avoir une explication à ceci?

Merci beaucoup.

simba
06/02/2008, 10h20
Je constate que mon déréférencement de ma page principale progresse sur un nombre croissant de datacenters google ....

Avec toutes les pannes d'accès à mon avis pas étonnant .....

A suivre .....

jlt
06/02/2008, 10h38
STFU (http://www.stfu.se/stfu.swf)

:)

Lamentable...

Je suis client d'OVH depuis 2000 et s'il y a une chose qui n'a pas changé c'est bien le déplorable sens de la communication d'Octave, que ce soit sur les mailing lists, sur f.r.i.h. ou sur ce forum.

Mettons nous bien d'accord, Octave est sans doute un brillant entrepreneur, un technicien compétent et OVH est certainement une réussite technique et commerciale dans son ensemble.

Cela étant dit la relation client a toujours été déplorable et ce sujet en est un exemple flagrant.

Oles : "je viens de mettre en place x, sans concertation, qu'en pensez-vous ?"
Client : "ben j'ai rien demandé moi, et j'ai peur que cette nouveauté affecte mon activité, peut-être auriez vous pu faire des tests avant ?"
Oles : "ouais ben ça je m'en tape, je t'ai pas demandé si tu étais inquiet, je te demande les résultats du beta test que je viens de t'imposer. Oh et puis de toute façon vous ne comprenez rien à rien, allez je remballe mais je vous préviens que je le referai et que la prochaine fois je vous dirai rien comme ça je ne vous entendrai pas geindre"

ok. rassurant.

Même s'il s'avérait que la solution proposée par Octave ne pose finalement aucun pb technique au référencement, il faut quand même avouer que la façon de faire est très limite. Nous sommes des clients, nous avons le droit d'avoir des interrogations, nous aimerions éviter de nous faire envoyer chier quand nous les exprimons.

Je sais, si je suis pas content, je peux aller voir ailleurs... Mais ce qui pourrait être jouable également c'est une communication du type :

1. Je fais un beta test avec des clients intéressés.

2. À l'issue du test, si celui ci est positif, je préviens l'ensemble des clients que dans un délai de x mois, OVH basculera vers la nouvelle architecture. Je prends le temps d'expliquer la nature du changement et le résultat des tests.

3. Le client qui ne désire pas basculer a le choix et le temps de trouver une solution alternative chez un concurrent.

C'est pas possible ça ?

Abogil
06/02/2008, 10h40
Je constate que mon déréférencement de ma page principale progresse sur un nombre croissant de datacenters google ....
Bonjour Simba,
A quoi le vois-tu ?
Merci.

simba
06/02/2008, 10h56
Bonjour Simba,
A quoi le vois-tu ?
Merci.

Bon je pense pas t'apprendre grand chose en te disant que l'on tombe pas toujours sur le même serveur google , il suffit de pointer son curseur sur une page cache dans les résultats google pour voir l'ip du serveur exemple
http://209.85.129.104/

mais il y a des dizaines de serveurs il suffit de noter l'ip au passage , il y a également des listes plus ou moins à jour sur le net ....

Ensuite on tape l'adresse ip dans son navigateur et l'on fait une recherche
par mots clef pour son site , on peut donc noter ainsi les évolutions pour un même serveur : progression , régression ou disparition !!!

Après doit exister également des automates pour vérifier les résultats d'une requête avec différents ip de google et donner pour chaque le résultat .

voir :
http://www.outil-referencement.com/blog/index.php/310-round-robin-datacenter

coté automate :

http://www.webrankinfo.com/outils/google-dance/google-dance3.php

oles@ovh.net
06/02/2008, 12h28
> C'est pas possible ça ?

techniquement non.

lololo
06/02/2008, 16h21
Je vais essayer de recadrer le débat parce qu’il est plus adapté de parler les uns avec les autres que de parler les uns contre les autres et d'autre part parce que les enjeux sont importants pour chacun de nous.

Du côté d'Ovh, nous avons la recherche d'optimisation technique afin de permettre que nos sites soient plus fluides (temps de charge plus court, moins d'attente, moins de pages d'erreur pendant les rushs, etc.)

De l'autre côté nous avons les exigences clients
-Un site web accessible rapidement à toutes heures et pour tous
-Un robots = un visiteur comme un autre (pas de if google, pas de cluster robots, etc.. )

Je pense que tout le monde va être d'accord.

Établir un plan d'optimisation technique qui respecte les exigences clients serait une solution agréable pour tous.

Cordialement

alain-b
06/02/2008, 17h21
ben voyons.

de mon côté je ne vous remercie pas pour votre absence de professionnalisme et votre incapacité à vous remettre en question.

c'est noté.

+1 Je suis sidéré également d'une telle sufisance apres toutes les défaillances qu'OVH nous a subir fait en 2007 ...

Spinger
06/02/2008, 19h48
Salut,
J'étais absent du 01/02 jusqu'à aujourd'hui , et je peux dire que plus de pages ont été indexées !!
Le 01/02 4750 pages référencées dans Google, là le 06/02 retour de vacances et 5840 pages indexées ! Sachant la lenteur de google ces derniers temps, c'est tant mieux !

Donc c'est bénéfique pour le référencement. Merci !! Je ne veux pas polémiquer, mais un cluster à part ne peut être que bénéfique. Si ya des pertes de positionnement, après ça peut être soit effectivement quelques pannes du 90plan quoi que ... Du 01/02 au 06/02 22 minutes de panne sur le 90 plan.

Augmentation du trafic, augmentation des revenus, le référencement s'est très compliqué à gérer.

Si vous pensez que votre site a subi des baisses de positionnement : posez vous les questions suivantes pour éliminer le doute sur le cluster
- mon site est t'il présent depuis moins de 8 mois ? si oui Prime de Fraicheur, bien classé, puis PAF à la page 120 du jour au lendemain
- ais je référencer dans des centaines d'annuaires depuis cette semaine ? Sandbox Bac à sable le site peut ressortir dans 2 mois, 6 mois ...
- quand je tape : ma requete -asf -asf -asf -asf -asf -asf -asf mon site apparrait t'il mieux ? Si oui, alors sandbox
- votre nombre de pages indexées : site:www.monsite.com a t'il changé
- connecter vous à votre compte google webmaster, pour voir l'indexation de votre site

Bon Courage, ne paniquez pas, un cluster, ne peut avoir que des répercussions positives sous réserve qu'il soit bien maintenus, et Octave nous fournit le smokeping pour suivre tout cela.

simba
06/02/2008, 21h19
Le problème pour les pannes d'accès c'est que certains constatent que 22 minutes avec monitoring de leur site sur plusieurs jours et d'autres des pannes plus longues sur une seule journée ....

C'est la loterie suivant les domaines ......

Y'a peut-être un bonus pour les anciens chez ovh un peu comme chez google , ou les gros sites bien fréquentés :D va savoir ...

raoul-h
06/02/2008, 21h59
Salut,
je peux dire que plus de pages ont été indexées !!
Le 01/02 4750 pages référencées dans Google, là le 06/02 retour de vacances et 5840 pages indexées ! Sachant la lenteur de google ces derniers temps, c'est tant mieux !
Donc c'est bénéfique pour le référencement.

bonjour,

il semblerait que vous mélangiez un peu différentes notions; l'indexation d'une page n'est pas la même chose que le référencement d'une page, et j'ai l'impression que vous n'êtes pas le seul, et que cette confusion entre indexation et référencement est la cause du mal-entendu. peut-être qu'Oles aurait plutôt dû titrer son thread "amélioration de l'indexation", cela aurait été (un peu) moins ahurissant.

indexation:

processus d'insertion d'une page dans l'index de Google (par exemple en 123ème page de résultats); le nombre de pages indexées d'un site est effectivement donné via la commande site:http://www.domaine.tld . une page indexée, c'est une page qui a été visitée au moins une fois par un robot; c'est une page dont Google et les autres moteurs connaissent simplement l'existence.


référencement:

ensemble de savoirs-faire et de techniques onpage et offpage qui permettent de positionner efficacement et durablement une page sur les bons mots-clés et sur l'ensemble des moteurs de recherche.

en résumé, une page indexée par Google est une page simplement connue de Google; une page référencée est une page évidemment indexée, mais également positionnée sur les bons mots-clés.

99,9% des pages du web mondial sont indexées, càd des milliards et des milliards de pages. par contre, sur une requête, il n'y en a que 10 en première page.

vous saisissez l'énorme différence entre indexation et référencement?

évidemment, sans indexation, pas de référencement, nous sommes d'accord.

nous sommes d'acord aussi pour dire qu'une indexation difficile est un facteur pénalisant du référencement; mais en aucun cas, une indexation facilitée n'est un facteur améliorant du référencement.

au passage, l'indexation Google n'a jamais été aussi RAPIDE qu'actuellement (et non pas "lente" comme vous le suggérez). depuis environ 6 mois, l'indexation (càd l'apparation d'une nouvelle page dans l'index google) peut se faire en moins de 5 minutes sur les sites très crawlés). il apparaît alors une petite information en couleur du genre "il y a 3 minutes".

nostromo
07/02/2008, 01h54
Bonsoir,
je découvre ce thread, et cette polémique qui me semble inutile car je doute que les decisions d'OVH ailles a l'encontre des intérêts de ces propres clients.
Perso , je regrette que cette idée soit "abandonnée", je la trouvais pertinente, en tout cas pas inintéressante.

je ne sais pas encore si je vais partager avec vous
les resultats de mes recherches parce que le feedback n'est pas celui
que j'ai demandé (peut etre sur une ml je trouverai des clients 90plan
qui pourront nous le faire).

en tout cas merci à tout le monde pour ce thread qui ne m'a rien appris.

oles, j'ai repris la gestion d'un 90plan il y a 2 ans, j'en ai acheté un autre il y 2 jours, je risque (:D vu le client c'est bien un risque)) de recuperer un 3eme 90 plan dans quelques semaines, j'ai aussi d'autres sites chez Amen & 1&1 , et je veux bien vous communiquer tout les chiffres dont vous pourriez avoir besoin. MP si je peux vous aider.
et merci de vous occuper de nous :)
++

oles@ovh.net
07/02/2008, 06h08
> et merci de vous occuper de nous :)

avec plaisir :)

Spinger
07/02/2008, 07h59
raoul-h je travaille dessus depuis 2000 . Il n'y a pas eu de baisses de positionnement depuis le 01/02 sur mes requêtes qui apportent du trafic.

Je ne confonds rien, pour qu'une page soit correctement positionné, il faut d'abord qu'elle soit indexée ! Et je peux vous assurer que depuis 1 an et demi, j'avais ce différentiel de 1090 articles (et ceux malgré le sitemap, des liens trust rank.. ) qui n'était pas indexées, et maintenant tout est indexé.

M'enfin, j'ai fait un très bon travail de référencement depuis 7 ans, ce qui me permet aujourd'hui de cumuler plus de 350 000 visiteurs unique chaque mois (stats Xiti et non Urchin qui n'est pas fiable)

Certes, hier soir, j'étais fatigué de mon voyage, et donc j'ai écrit peut être trop simplement pour éviter du blabla. Nous vous remercions d'avoir complété par vos infos, qui sont justes mais ne m'apprennent rien à moi mais aux autres surement.

Bonne continuation,

bendicott
09/02/2008, 11h48
DEFERENCEMENT DE MON SITE !
je me joins sur ce fil pour vous expliquer ma mésaventure depuis 3 jours. Je suis en train "d'optimiser" un site en construction : www.e*asy-plv.fr pour le référencement (titre, balise H1, urlrewriting...). Les mots clés convoités sont plv, présentoir, fabricant.... J'avais une vingtaine / trentaine (c'est un début) de visites par jour sur des combinaisons de mots clés composés : colonne carton / arche carton etc... etc ... Je tire ces résultats depuis google analytics. Je n'ai RIEN touché aux fiches produits de mon site, je ne travaille QUE sur la galerie. Depuis 3 jours.... plus une seule visite par ces mots cles. Je vais dans google analytics, tape les mots clés sur lequels j'étais 1er sous google : plus rien du tout. Je tape même easy plv, plus rien (alors qu'avant j'avais toutes mes pages). Je ne suis pas blacklisté. D'ou cela peu venir ? d'une erreur de ma part ? ,du "bidouillage" d'OVH, de mon .htacces qui est mauvais ? (c'est la seule chose que j'ai changé qui aurait pu jouer sur les pages produits.

SetEnv SESSION_USE_TRANS_SID 0
DirectoryIndex index.php

ErrorDocument 404 /error404.php

RewriteEngine on
RewriteRule ^galerie-([0-9]+)-(.*)\.html$ /galerie/index.php?galid=$1 [L]
RewriteRule ^plv-([0-9]+)-(.*)\.html$ /achat/produit_details.php?id=$1 [L]
RewriteRule ^news-([0-9]+)-(.*)\.html$ /lire/article_details.php?rubid=$1 [L]
RewriteRule ^galerie/img-([0-9]+)-([0-9]+)-(.*)\.html$ /galerie/image_details.php?id=$1&galid=$2 [L]

HEEEEEEEEEEEEEEEEEEELP, et bonne journée.

lololo
09/02/2008, 18h40
Rien a voir avec ton htaccess
Si tu arrives a acceder à tes pages rewrité c'est que tes RewriteRule sont bons.

Rien a voir non plu a priori avec la manip ovh

Rajoutes du textes sur ta home page fais que les titres sous tes images soient cliquables, dans ton footer évite de mettre deux fois ton mots clé de suite, dans ton bouton nos produits et dans ton header vire le /index.php et surtout évite de poster tes groupes de mots clés sur tous les forum.

bendicott
09/02/2008, 19h58
salut lololo,
ok je vais mettre des textes cliquables sous mes images (cela manque pour le référencement)
mais pourquoi enlever /index.php du header, c'est pas comme cela que l'on revient sur la page d'accueil d'un site - en cliquant sur le logo ? (disons qu'on le voit souvent non ?)

Bon ces infos sont hyper importante pour le référencement de mon site, mais cela ne m'avance pas plus du pourquoi mon site a disparu de google....

bendicott
09/02/2008, 20h47
re,
j'aurais pu supprimer mon post, mais je me réponds tt seul. Bien sur que c'est plus propre d'enlever le /index.php ... il n'avait pas d'intérêt. merci.

lololo
09/02/2008, 23h14
Peut être si tu viens de faire ton rewritting, google dois crawler tes pages et tes anciennes pages doivent avoir une redirection 301 et être dans ton robots.txt.

tu as encore un probleme index.php avec ton bouton blog
la aussi tu dois faire une redirection 301 de tes pages index.php vers leur dossier
par exemple blog/index.php doit être redirigé vers blog/

Fais gaffe aussi de pas trop repeté tes mots clé tu as 28 fois ton mot clé sur ta home alors que tu n'as quasi pas de texte.

Met des rel="noffolow" sur tes liens sans contenu comme membre.php et mets les dans ton robots.txt

pourquoi n'as tu pas rewrité galerie.php en galerie.html

tu as 54 erreurs dans ton code html

mets aussi tes liens en entier avec ton nom de domaine et nom juste le nom de la page

tu as écris tes liens comme ce <a href=xxx.html> tu as oublié les guillemet <a href="http://www.tonsiteenentier/tapage.html">xx</a>

en éspérant que ca puisse t'aider

bendicott
10/02/2008, 07h06
bonjour lololo,
Un GRAND merci pour avoir passé un peu de temps sur mon site afin de me montrer mes erreurs. Tes remarques sont hyper pertinentes. Bon le site est en construction, mais il faut que modifie tous les points que tu viens de souligner.

2 questions : tu dis qu'il faut mettre la redirection dans le robots.txt, ce n'est pas plutôt dans le htaccess ? En local, j'ai simplement remplacé le lien /blog/index.php par /blog/ cela fonctionne. Faire une redirection 301 sert aux moteurs à trouver les anciennes pages par rapport aux nouvelles? Si je ne fais pas de redirection, je perds mes pages référencées?

je n'ai pas compris : "mets aussi tes liens en entier avec ton nom de domaine et nom juste le nom de la page" - tu aurais un exemple (je sais j'abuse)


Je suis en train de travailler sur l'urlrewriting de ma galerie, mais pas sur celui des produits. Celui ci n'a pas changé depuis un mois.
La seule chose que j'ai changé depuis 3 jous, c'est le sitemap.xml. J'ai essayé de le générer à la volée lorsque je rajoute un produit, mais cela n'était pas encore bon. Alors je suis allé sur un générateur en ligne afin qu'il fasse le boulot pour moi. Mais de là a me jeter complétement de google, je ne pense pas que le blème vienne de là...
j'ai pris le sitemap là : http://www.xml-sitemaps.com/
je viens de regarder mes stats sur analytics.... plus une seule entrée via les mots clefs depuis 3 jours.

lololo
10/02/2008, 13h17
Par exemple si tu rewrite galerie.php en galerie.html

tu dois faire un redirection 301 dans ton htaccess de galerie.php vers galerie.html et tu rajoute un disalow galerie.php dans ton robot.txt

J'ai regardé vite fais ton robots txt

tu ne fais que d'interdire des robots. Tu dois aussi interdire (disallow) les pages .php que tu as rewritté en html. mets le lien vers ton sitemap tout en haut de ton robots.txt

Maintenant si google t'as désindexé ca vient surement que ton site a de gros problemes de duplicate content

regarde sur ta page
http://www.e*sy-plv.fr/achat/ t'es liens sont sous cette forme

http://www.e*sy-plv.fr/achat/produit_details.php?id=61&catid=0 (non rewritté)

Alors que cette page existe en rewritté sur ta home
http://www.e*sy-plv.fr/plv-61-box-palette.html

donc quand tu fais de l'url rewritting la regle n1 c'est de le faire sur tout ton site parceque sur le coups tu as deux pages avec des url différents et le meme contenue.

dans ton sitemap tu as mis les liens vers les pages images (je sais pas si c'est vraiment efficace surtout quand on voit le nom des pages lol)

dans ton sitemap tu dois virer aussi les /index.php

Bonne chance

bendicott
10/02/2008, 20h05
re lololo,
bon, il y a encore du boulot. Je remet les mains dans le cambouis. C'est vachement plus clair maintenant. Merci d'avoir passé autant de temps a m'expliquer tt cela. Si tu as le temps revient sur mon site me donner tes commentaires d'ici 15jours / 1 mois :)
si j'ai un mail de la part de lololo, je serais qui qui cela vient.
bye