Nouveau WRInaute
Bonjour à tous,
Tout d'abord merci pour le contenu de ce site et les échanges qui m'ont aidé dans plusieurs cas.
Je suis actuellement en train de construire un site sous wordpress pour ma future entreprise. Dès l'obtention de l'hébergement, j'ai verrouillé l'accès au site par un mot de passe (.htaccess + .htpasswd), principalement pour éviter que le site soit indexé par les moteurs de recherches. J'ai enlevé la protection par mot de passe pendant une dizaine de minutes afin de tester un plugin qui ne fonctionnait pas (WP Super Cache).
Avec la fonction inurl:monsite.fr, je viens de voir que la page d'accueil de mon site est indexée sur google, ainsi que quelques autres pages (dont certaines totalement "random" avec du texte en anglais et latin). Avec la fonction cache:monsite.fr, je vois que l'heure de l'indexation correspond au créneau d'une dizaine de minutes où mon site était accessible sans mot de passe.
Je me pose donc les questions suivantes:
1) Comment google a-t-il eu connaissance de mon site, sachant qu'il n'y a en principe aucun lien externe pointant vers celui-ci? Cela peut-il être via une carte google maps que j'ai insérée dans mon site, par exemple?
2) Y-a-t-il une raison expliquant que mon site ait été "crawlé" justement pendant l'intervalle de 10 minutes sans mot de passe? Ou c'est simplement que le robot est passé au mauvais endroit au mauvais moment... (pas de chance) ?
3) En attendant que mon site soit terminé et publié, que me recommandez-vous pour faire désindexer ces pages?
- attendre: les pages seront-elles désindexées naturellement, étant donné que leur accès est verrouillé?
- demander la désindexation via la Search Console: mais cela sera-t-il préjudiciable pour l'indexation à l'avenir?
- autre...?
Je vous remercie!
Tout d'abord merci pour le contenu de ce site et les échanges qui m'ont aidé dans plusieurs cas.
Je suis actuellement en train de construire un site sous wordpress pour ma future entreprise. Dès l'obtention de l'hébergement, j'ai verrouillé l'accès au site par un mot de passe (.htaccess + .htpasswd), principalement pour éviter que le site soit indexé par les moteurs de recherches. J'ai enlevé la protection par mot de passe pendant une dizaine de minutes afin de tester un plugin qui ne fonctionnait pas (WP Super Cache).
Avec la fonction inurl:monsite.fr, je viens de voir que la page d'accueil de mon site est indexée sur google, ainsi que quelques autres pages (dont certaines totalement "random" avec du texte en anglais et latin). Avec la fonction cache:monsite.fr, je vois que l'heure de l'indexation correspond au créneau d'une dizaine de minutes où mon site était accessible sans mot de passe.
Je me pose donc les questions suivantes:
1) Comment google a-t-il eu connaissance de mon site, sachant qu'il n'y a en principe aucun lien externe pointant vers celui-ci? Cela peut-il être via une carte google maps que j'ai insérée dans mon site, par exemple?
2) Y-a-t-il une raison expliquant que mon site ait été "crawlé" justement pendant l'intervalle de 10 minutes sans mot de passe? Ou c'est simplement que le robot est passé au mauvais endroit au mauvais moment... (pas de chance) ?
3) En attendant que mon site soit terminé et publié, que me recommandez-vous pour faire désindexer ces pages?
- attendre: les pages seront-elles désindexées naturellement, étant donné que leur accès est verrouillé?
- demander la désindexation via la Search Console: mais cela sera-t-il préjudiciable pour l'indexation à l'avenir?
- autre...?
Je vous remercie!