Bonjour
Je reçois l'avertissement qu'un site web personnel sur un mutualisé dépasse les limites du nombre de visites acceptables et que, pour préserver la qualité du service, ce site a été isolé.
Et c'est clair: au lieu de 200 à 300 hits/min, je suis actuellement à près de 4000 hits/min depuis deux à trois jours..
Dans les logs, je découvre énormément de lignes du type suivant:
Code:
66.249.64.50 info.sio2.be - [09/Aug/2016:23:59:05 +0200] "GET /infobase/5/python/kpz/impress/index.phphttps://info.sio2.be/infobase/5/python/kpz/impress/calcooo/tdtooo/draw/infosc/impress/python/impress/index.php HTTP/1.1" 200 2814 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"
qui me semblent montrer qu'un Bot de Google s'emmêle les pinceaux dans la structure du site (qui n'a pas été modifiée depuis des mois).
Apparemment, le souci semble dû à des liens en boucle entre les pages de différents répertoires. Et le robot tourne en rond.
Interprété-je correctement si je dis qu'il semble entrer dans
http://info.sio2.be/infobase/5 (qui existe, et qui contient un lien en retour vers
http://info.sio2.be/infobase, contenant lui-même un lien en retour vers
http://info.sio2.be ; rien que du "normal" dans un site à l'arborescence logiquement structurée)
puis, sauter vers le répertoire python (qui existe, mais, en fait, pas dans /infobase/5 mais à l'adresse
http://info.sio2/be/python
puis sauter vers le répertoire
http://info.sio2.be/infobase/5/python/kpz (qui existe, mais à l'adresse
http://info.sio2.be/kpz
et ainsi de suite...
comme s'il existait une redirection dans chacun de ces répertoires. Ce qui n'est pas vrai.
Dans ma perplexité, j'ai aussi découvert que toutes les adresses incorrectes mènent à la même page:
http://info.sio2.be/python/5/25.php
Comme s'il y avait une redirection 404 vers cette page.
Et cette page d'erreur (???) est mal formée puisque, à la place des fichiers CSS, on trouve... le même fichier php. On se trouverait devant une récursion, que cela ne m'étonnerait pas.
Bien sûr, j'ai cherché où j'aurais pu introduire un lien 404 vers cette page-là.
Et j'ai trouvé un fichier .htaccess à la racine de
http://info.sio2.be . Mais il ne contenait rien d'incorrect du type
Code:
ErrorDocument 404 message_ou_destination
De plus, j'ai supprimé ce fichier qui n'était vraiment pas indispensable. Et rien n'a changé.
Curieusement (et peut-être est-ce une piste):
http://info.sio2.be/existepas renvoie systématiquement vers
http://info.sio2.be
http://info.sio2.be/infobase/2/existepas renvoie vers la même page mais mal formée
Quelqu'un aurait-il une idée de savoir où chercher:
- Pourquoi le robot de Google tourne fou
- Pourquoi la page
http://info.sio2.be semble se comporter comme une redirection 404
- Si les deux soucis sont liés (ce que je pressens)
Complément d'information: depuis trèèèès longtemps, un Wordpress se trouve dans le même hébergement (
http://www.sio2.be .
On y trouve le .htaccess suivant (qui pourrait être la cause du problème, mais pourquoi maintenant?). Je pense que ce fichier a été généré lors de l'installation de Wordpress, il y a des dizaines de mois; et j'avoue ne pas maîtriser sa syntaxe.
Code:
# BEGIN WordPress
RewriteEngine On
RewriteBase /
RewriteRule ^index\.php$ - [L]
RewriteCond %{REQUEST_FILENAME} !-f
RewriteCond %{REQUEST_FILENAME} !-d
RewriteRule . /index.php [L]
# END WordPress
Déjà merci et bravo de m'avoir suivi jusqu'à cette ligne-ci...
Encore un plus grand merci à celui ou celle qui aura l'étincelle vers la résolution.