Extraction Screaming Frog / Xenu ou Webrankinfo impossible

WRInaute discret
Bonjour,
Je me permets de laisser un message sur le forum car je souhaiterais extraire toutes les META (TITLE / DESCRIPTION) de mon site et je n'y parviens pas avec Screaming Frog ou encore Xenu.

Mon site est https://www.agencetapisrouge.com/ et je serai très content d'avoir votre aide :) Est-ce une erreur dans le header ? Déjà je trouve étrange quand vous allez sur une catégorie de mon site et que vous copiez / collez l'URL, c'est celle-ci n'est pas la même (% -)

Merci d'avance,
Jonathan
 
Membre Honoré
Bonjour,

Vous pouvez vérifier les paramètres de vos outils et site Internet (cf. ci-dessous avec la première page).
Xenu fonctionne bien, mais Screaming Frog de base indique 0 en size de la page d'accueil.
Il semble que pour certains UA le site ne souhaite pas présenter les contenus des pages.
Et un peu d'URL rewriting serait bien avec certaines de vos URL (qui n'en ont pas).
Vérifier aussi le fonctionnement des URL pour corriger certaines erreurs actuelles.

Temps de réponse : 15 minutes.
Cordialement.
 
Olivier Duffez (admin)
Membre du personnel
J'ai testé (avec mon outil RM Tech) les 10 000 premières pages (URL) et c'est assez catastrophique : 90% des URL ont un problème qui fait qu'elles ne sont pas indexables. En gros, c'est ce que j'appelle "un paquet de masse noire"...
Avant même de s'attaquer aux titres, je pense qu'il faudrait nettoyer le site du côté technique. Je n'ai pas trouvé quel CMS est utilisé (s'il y en a un).
 
WRInaute passionné
J'ajouterai que les virgules dans les liens vont empêcher pas mal de copies de liens avec des systèmes anciens d' "autolink". Même si la virgule est théoriquement autorisée dans des url, pas mal de serveurs (nginx peut être paramétré pour cela par exemple) la filtre dans les urls pour éviter certaines attaques...

C'est probablement le problème de ton (% ... ;-)
 
WRInaute discret
D'ailleurs pour toutes ces pages produits sans réel contenu que me conseillez-vous de faire ? NOINDEX en attendant d'avoir du contenu de qualité afin de garder que mes pages importantes sur lesquelles je veux ranker ? Si oui comment reconnaître ces pages à "cacher" ?

Merci
 
Membre Honoré
Bonjour,
ces pages produits sans réel contenu que me conseillez-vous de faire ?
Améliorer les pages pour avoir un bon contenu et indexer celles-ci une fois à jour (en attendant noindex si celles-ci sont pénalisantes).
Vous pouvez aussi corriger les bugs du site Internet.

Temps de réponse : 5 minutes.
Cordialement.
 
Discussions similaires
Haut