Bonjour
Petit soucis rencontré sur le CMS e-commerce Prestashop, avec son système de stats intégrées... Et en réalité, je pense que c'est plus du ressort de Google, qui ingère des URLs qu'il ne devrait pas !
Je vois effectivement apparaître des URL en erreur HTTP 404 dans les Google Webmaster Tools, qui n'existent pas ou tout du moins, qui ne "devraient pas" être crawlées, du type :
En effet, quand je dis "ne devraient pas être crawlées" c'est que ces URLs n'existent PAS dans le code, mais sont la résultante d'un code Javascript qui envoie un token crypté pour les statistiques internes du site !
En clair, Google "suit" la requête HTTP Post envoyée en JS 8O (c'est en tout cas mon analyse !)
Exemple de code inclus par Prestashop :
C'est le SEUL endroit où l'on retrouve ce type de "chaîne encryptée", répondant toujours à la même structure (avec les signes "=" au milieu), c'est donc à mon sens bien la source du problème !
Cela concerne toutes les boutiques que je gère, en v1.1, 1.2 et 1.3...
Même si on ne s'en sert pas beaucoup, le module de stats peut apporter des indications intéressantes en complément de Google Analytics, j'aimerais donc éviter de m'en passer totalement (pour le moment je l'ai désactivé).
Comme on ne peut pas interdire via le robots.txt des modèles d'URL, je ne vois vraiment pas comment faire
Une idée ?
Et si j'interdisais au bot Google les URL répondant à ce schéma via le htaccess ? J'aimerais éviter de faire une ânerie, ce sont des sites en production :mrgreen:
Petit soucis rencontré sur le CMS e-commerce Prestashop, avec son système de stats intégrées... Et en réalité, je pense que c'est plus du ressort de Google, qui ingère des URLs qu'il ne devrait pas !
Je vois effectivement apparaître des URL en erreur HTTP 404 dans les Google Webmaster Tools, qui n'existent pas ou tout du moins, qui ne "devraient pas" être crawlées, du type :
Code:
www.lesite.com/k7EmSXMxKU=3X02px8z28=oIgf2W8P2gI=u5T/NHIAX1Q=
En effet, quand je dis "ne devraient pas être crawlées" c'est que ces URLs n'existent PAS dans le code, mais sont la résultante d'un code Javascript qui envoie un token crypté pour les statistiques internes du site !
En clair, Google "suit" la requête HTTP Post envoyée en JS 8O (c'est en tout cas mon analyse !)
Exemple de code inclus par Prestashop :
Code:
<script type="text/javascript">
var time_start;
$(window).load(
function() {
time_start = new Date();
}
);
$(window).unload(
function() {
var time_end = new Date();
var pagetime = new Object;
pagetime.type = "pagetime";
pagetime.token = "uXA4nSAFkrE=wgNekXfW3OU=tarGSiTEyVE=pYPHWRBs/Is=";
pagetime.time = time_end-time_start;
$.post("http://www.lesite.com/statistics.php", pagetime);
}
);
</script>
C'est le SEUL endroit où l'on retrouve ce type de "chaîne encryptée", répondant toujours à la même structure (avec les signes "=" au milieu), c'est donc à mon sens bien la source du problème !
Cela concerne toutes les boutiques que je gère, en v1.1, 1.2 et 1.3...
Même si on ne s'en sert pas beaucoup, le module de stats peut apporter des indications intéressantes en complément de Google Analytics, j'aimerais donc éviter de m'en passer totalement (pour le moment je l'ai désactivé).
Comme on ne peut pas interdire via le robots.txt des modèles d'URL, je ne vois vraiment pas comment faire
Une idée ?
Et si j'interdisais au bot Google les URL répondant à ce schéma via le htaccess ? J'aimerais éviter de faire une ânerie, ce sont des sites en production :mrgreen: