Script anti-aspirateur et Google (et les autres...)

  • Auteur de la discussion Auteur de la discussion malango
  • Date de début Date de début
WRInaute discret
A la recherche d'un script qui m'aide à combattre le fléau des aspirateurs de sites, je suis tombé sur un script qui semble basé sur une bonne idée, astucieuse et tout et tout... mais qui me fait craindre qu'il ne banisse Google et les autres moteurs de recherche...
Les lignes qui dévoilent le principe :
//lien invisible pour la personne qui navigue sur le site
//mais pas pour l'aspirateur de site qui va se bannir en parcourant le lien
echo "<a href=ban.php></a>";
//parametre de connection a la base de données
$host = $SERVER_ADDR;
$uname = "root";
$pass = "";
$name = "Secure_IP";

Fûté, certes, mais est-que Google ne va pas suivre le lien? ou est-ce que, comme iles super-intelligent, il ne va pas réagir puisuqe la balise <a href> ne contient aucun texte?
:lol:
 
WRInaute passionné
...

Peut-être chaud pour le ggogle, mais.......

Si dans ta page ban, tu place en haut une balise meta "noindex".......

Je ne sais pas comment bosse google, mais s'il quitte dès qu'il voit la meta, il n'ira donc pas plus loin et tu pourra mettre se que tu veux par la suite.
Meta que l'aspi ne verra pas lui.


Par ontre les moteur qui ne comprennent pas la meta............ dommage.
 
WRInaute occasionnel
Je pense que ça ne sert pas à grand chose, de toute façon l'aspirateur va regarder toutes les urls de ta page. Il n'y a pas grand chose à faire sauf pour les gros sites le seul moyen me semble-t-il est de bloquer l'ip au delà d'un certain nombre de hits. Si ton site contient beaucoup de pages (plusieurs milliers)
 
WRInaute discret
Mmmmmmmouais......

Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....

Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

Merci!
:wink:
 
WRInaute discret
malango a dit:
Mmmmmmmouais......

Très chaud quand même!
J'aimerais pas trop disparaitre de Goggle, ne serait-ce qu'entre deux visites....

Bouhouhou! Je sais pas koi faire...
Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

Merci!
:wink:

Il y a bien des scripts qui bloquent l'IP au delà d'un certain nombre de pages, mais ça fait appel à Mysql et j'ai déjà assez de pbl avec ça sans en rajouter!

-> tu oulbie ça...c'est antiflood qui va te sortir google aussi..pour virer les aspirateurs il faut un htaccess qui bloque en fonction du http agent, on trouve ça partout sur le net en cherchant un peu
 
Nouveau WRInaute
L' "HTTP agent", comme vous dites, ne sert strictement à rien (on sait combien les sites "d'ultra-pros" qui interdisent aux autres navigateurs qu'IE d'accéder à leur site sont en fait de gros nuls via ce système - si j'ose me permettre).
Les aspirateurs n'hésiteront pas un instant à truquer cette donnée pour se faire passer pour un navigateur ou un robot "correct".

Le seul moyen correct est effectivement un lien invisible bloqué par un fichier "robot.txt", et dont la page liée fait de "vilaines choses" (par exemple, inscrire l'IP appelante dans sa liste noire pour un certain temps et lui interdire désormais l'accès au site). Google ne sera absolument pas bloqué. Quant aux robots de moteurs qui refusent de respecter robot.txt, tu as vraiment l'impression qu'ils manqueraient ?
 
Discussions similaires
Haut