Une petite question pour les professionnels de Google et du sitemap.
Imaginez un site comme Digg.
Il y a des news, et celles-ci peuvent être classées sur les 24 dernières heures, la dernière semaine, le dernier mois et sur toute l’année.
Du coup, on a une page (et donc une url) pour chaque news, et une liste pour chaque type de classement (ça fait 4 listes en tout).
Si on associe chaque news à une catégorie, et qu’on a 10 catégories en tout, on aurait également 4 listes par catégorie, soit 40 listes possibles en tout et pour tout.
Vu qu’il y a beaucoup de news, chaque liste est normalement décomposée en plusieurs pages.
Au final, ça fait un bon paquet d’urls que Google va devoir regarder tous les jours (c-a-d nombre de news + nombre de classements possibles x nombre de catégories x nombre de pages).
Donc ma question est : « comment donner des priorités à toutes ces urls pour que Google regarde en priorité les pages des news ? »
Attention, je ne parle pas d'indexation, mais juste de parcours des pages web. Ce que Google fait avec le contenu qu'il a parcouru est un autre problème pour moi.
Comme ça, à première vue, je dirais d’utiliser le sitemap.
Si je liste toutes les urls des pages de news dans le sitemap, Google devrait les parcourir en premier…
Brrrrriinn (<= son très mal imité d’un strident buzzer) : ça ne marche pas. Google s’enfonce dans les méandres des pages des listes, sans jamais parcourir les dernières news.
Ma deuxième idée serait d’interdire le parcours de ces listes dans le fichier « robots.txt », mais ça va donner un fichier d’une taille monstrueuse qu’il faudra très souvent mettre à jour (car chaque nouveau lot de news ajoute une page dans les listes).
Ma troisième idée revient vers le sitemap : peut-être qu’il faut indiquer clairement à Google que les listes existent mais leur donner une priorité toute petite pour qu’il parcourt d’abord les news (qui, elles, auront, bien sûr, une priorité beaucoup plus grande).
Quatrième possibilité : je me plante complètement car je ne suis qu’un débutant, et on va gentiment m’expliquer qu’on ne peut rien faire, et que c’est comme ça la vie. ;o)
Si une âme charitable pouvait me mettre sur la voie, je la remercie chaleureusement d’avance.
En tout cas, merci de m’avoir lu jusqu’au bout.
Imaginez un site comme Digg.
Il y a des news, et celles-ci peuvent être classées sur les 24 dernières heures, la dernière semaine, le dernier mois et sur toute l’année.
Du coup, on a une page (et donc une url) pour chaque news, et une liste pour chaque type de classement (ça fait 4 listes en tout).
Si on associe chaque news à une catégorie, et qu’on a 10 catégories en tout, on aurait également 4 listes par catégorie, soit 40 listes possibles en tout et pour tout.
Vu qu’il y a beaucoup de news, chaque liste est normalement décomposée en plusieurs pages.
Au final, ça fait un bon paquet d’urls que Google va devoir regarder tous les jours (c-a-d nombre de news + nombre de classements possibles x nombre de catégories x nombre de pages).
Donc ma question est : « comment donner des priorités à toutes ces urls pour que Google regarde en priorité les pages des news ? »
Attention, je ne parle pas d'indexation, mais juste de parcours des pages web. Ce que Google fait avec le contenu qu'il a parcouru est un autre problème pour moi.
Comme ça, à première vue, je dirais d’utiliser le sitemap.
Si je liste toutes les urls des pages de news dans le sitemap, Google devrait les parcourir en premier…
Brrrrriinn (<= son très mal imité d’un strident buzzer) : ça ne marche pas. Google s’enfonce dans les méandres des pages des listes, sans jamais parcourir les dernières news.
Ma deuxième idée serait d’interdire le parcours de ces listes dans le fichier « robots.txt », mais ça va donner un fichier d’une taille monstrueuse qu’il faudra très souvent mettre à jour (car chaque nouveau lot de news ajoute une page dans les listes).
Ma troisième idée revient vers le sitemap : peut-être qu’il faut indiquer clairement à Google que les listes existent mais leur donner une priorité toute petite pour qu’il parcourt d’abord les news (qui, elles, auront, bien sûr, une priorité beaucoup plus grande).
Quatrième possibilité : je me plante complètement car je ne suis qu’un débutant, et on va gentiment m’expliquer qu’on ne peut rien faire, et que c’est comme ça la vie. ;o)
Si une âme charitable pouvait me mettre sur la voie, je la remercie chaleureusement d’avance.
En tout cas, merci de m’avoir lu jusqu’au bout.