OVH Community, votre nouvel espace communautaire.

Accès Googlebot (entre autres)


ze@forum
28/02/2012, 14h51
Ils arrivent sur le www, sur lequel est posé le cdn.
S'ils arrivent sans www, ils sont redirigés (avec le htaccess).

Exemple des logs (j'ai enlevé ce qui peut identifier mon client) :
Code PHP:
46.105.196.6 - - [28/Feb/2012:11:06:52 +0100"GET / HTTP/1.1" 200 5333 "http://www.google.be/url?sa=t&rct=j&q=le%20mot%20cle&source=web&cd=1&ved=0CDIQFjAA&url=http%3A%2F%2Fwww.monsite.com%2F&ei=OKdMT9Gku8AOPs9jiAg&usg=AFQjCNF-hGO5WiN9TfsZ12bYMtb-mFvYUg" "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; GTB7.3; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C)"

46.105.196.6 - - [28/Feb/2012:11:06:54 +0100"GET /index.php/rub/page/ HTTP/1.1" 200 1173 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

46.105.196.6 - - [28/Feb/2012:11:06:03 +0100"GET /images/GreyscaleResizedImage.jpg HTTP/1.1" 200 4082 "http://www.monsite.com/" "Mozilla/5.0 (iPhone; CPU iPhone OS 5_0_1 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A405 Safari/7534.48.3" 
...donc plusieurs user-agent.
Bon, le temps passe, et je commence à comprendre comment tout ça fonctionne en fait

Abazada
28/02/2012, 03h34
Quelle est la conf DNS de ton domaine ?
Sur quels domaines/sous-domaines ces visiteurs arrivent-ils sur ton serveur ?
(example.org, www.example.org, foo.example.org, ...)

ze@forum
27/02/2012, 13h55
Merci pour ta réponse.
Pour ce qui est du délai de latence, le cdn est installé depuis près d'un mois, c'est la raison principale pour laquelle je me posais cette question du passage de visiteurs directement sur le serveur.
Pour ce qui est des ip d'ovh, ce sont celles du cdn oui, je comprends bien, mais pourquoi les user-agent sont-ils ceux de google.. de bing... ou de vrais navigateurs ?

spykeer
26/02/2012, 16h11
De plus qui faut réussir a cacher le PHP, et sa, sa ne l'est pas donc, il est assurément possible que certains passent encore par leurs DNS a TTL trop vieux, donc ne comprennes pas encore que le domaine n'est plus lié a ton Dédié/mutu.

Pour ce qui est des IP's d'OVH qui viennent sur ton serveur, ce sont les CDN qui viennent se synchro

chtitux
26/02/2012, 16h02
L'IP associée à ton nom de domaine est gardée dans les caches des serveurs DNS de tes visiteurs.
Il y a généralement une durée d'expiration de ce cache d'un jour (TTL : Time To Live de 86400 secondes), donc après 24h, tous tes visiteurs devraient avoir l'IP du CDN d'OVH et ne pas passer directement par ton serveur.

En pratique, certains caches DNS ne respectent pas cette durée de vie et la garde un peu plus longtemps, pour des raisons diverses et variées (bug dans le serveur par exemple).
La solution est : « il faut attendre ». Au fur et à mesure, l'ancienne adresse disparaîtra des caches.

ze@forum
20/02/2012, 16h35
Bonjour tout le monde,

J'aimerais bien comprendre pourquoi certaines ip arrivent à se connecter directement sur mon serveur, et donc ne passent pas par le CDN.
Si je ne fais pas fausse route, je ne devrais voir dans les logs Apache que l'ip d'ovh (à quelques exceptions prêt ; comme les éléments non cachés..).

Pourquoi alors puis-je y trouver le passage de Googlebot, de Bing, ou encore des ip ovh (46.105.196.103, 46.105.196.39, 46.105.194.7...) avec des user-agents qui soient aussi variés que du ie7, de l'iphone...

Merci,