L'ajout de flux RSS à une page statique améliore-t-il le référencement par Google ?

Nouveau WRInaute
Bonjour,

Mon site contient environ 200 pages de contenu statique, principalement des informations de référence qui n'ont pas vocation à changer souvent.
Je compte inclure, en fin de chacune de ces pages, du contenu agrégé via SimplePie à partir de flux RSS sur les sujets traités dans la page.
Chaque page aura alors environ 80 à 90% de contenu original (celui que j'ai moi-même créé) et 10 à 20% de contenu en provenance de fils RSS (titres, descriptions et extraits des posts retenus dans le fil)


1) En utilisant SimplePie (ou un autre agrégateur écrit en PHP), les "news" du fil RSS sont-elles lues et comprises par le robot d'indexation de Google comme le reste de la page ?
2) Google détecte-t-il qu'il s'agit d'un contenu extérieur ?
3) Google passera-t-il plus souvent réindexer la page dès lors que le robot "constate" que le contenu change ?
4) Est-ce susceptible d'améliorer le référencement des pages ?
5) Ou, au contraire de détériorer le référencement à cause d'une sorte de "duplicate content" pour les 10 à 20% de la page qui proviennent en dit d'une source externe ?


Merci de vos réponses

François
 
WRInaute impliqué
Bonjour,

1) SimplePie est comme son nom ne l'indique pas très lourd, surtout pour gérer des flux simples
On peut gérer ce cas simplement avec par exemple:
Code:
function getFeed($url){
	try{  
    	if(!@$fluxrss=simplexml_load_file($url)){  
        	//throw new Exception('Flux introuvable');  
    	}  
          if(empty($fluxrss->channel->title) || empty($fluxrss->channel->description) || empty($fluxrss->channel->item->title))  {
          	       // throw new Exception('Flux invalide');  
          }
  		return $fluxrss;
	}  
	catch(Exception $e){  
    	echo $e->getMessage();  
	} 
}
2) Si il y a un lien vers la source (ce qui est obligatoire) oui je pense
3) je pense
4) si il y a un lien avec la thématique du site et de la page, je pense :)
5) si c'est seulement une petite partie (200 à 250 caractères), je ne pense pas
 
Nouveau WRInaute
Merci Bibb06,

1a) "très lourd", ça veut dire quoi ? lourd à mettre en oeuvre ou lourd en temps d'exécution et donc de chargement de la page pour l'internaute ?

1b) J'ai l'impression que l'un des intérêts de SimplePie est qu'il gère le cache, ce qui permettrait d'accélérer le chargement des pages dans le cas où le flux chargé par l'internaute sur une page serait aussi inclus dans d'autres pages qu'il lirait ensuite

1c) A partir de quel type de fonctionnalités est-il plus efficace d'utiliser SimplePie?
Par exemple, je voudrais aussi créer une page du type Googlenews sur ma thématique, en agrégeant dans 4 ou 5 catégories 10 à 15 flux différents. J'ai l'impression que c'est le genre de contexte pour lequel SimplePie est adapté, non ?

2) Pour être plus précis sur la question, je prends un exemple :
Disons que j'ajoute en bas de page 5 posts d'un flux RSS, avec leur titre, un extrait de 5 lignes pour chaque post, (et bien sûr un lien vers la source originale de chaque post)
Si un jour, au lieu d'utiliser SimplePie, je code en HTML ces 5 posts avec leurs titre et leurs 5 lignes d'extrait, et si le moteur de Google explore la page juste après, y aura-t-il une différence d'interprétetation par rapport à la page qui utilise les fonctions PHP ?

NB : je ne vais pas m'amuser à coder à la main en HTML ce que le PHP fait très bien de manière automatique, mais c'est seulement pour savoir si Google "voit" du HTML lorsqu'il passe sur la page où du contenu est généré via une boucle en PHP
 
WRInaute discret
Pour être tombé récemment sur des MFA dont le seul contenu était du flux RSS, je peux confirmer qu'ils sont bien indexés :/

Sinon pour ton autre question : le PHP est interprété par le serveur, qui génère du HTML à destination du navigateur et des robots d'exploration. Au vu d'un code source, impossible de dire si le code vient de HTM ou de PHP (à part certains détails comme l'indentation, la propreté du code, etc.).
 
WRInaute accro
RobindesBonds a dit:
Au vu d'un code source, impossible de dire si le code vient de HTM ou de PHP (à part certains détails comme l'indentation, la propreté du code, etc.).
mais dans les en-têtes, se trouve un header "content-location" qui indique le vrai nom du script, s'il est différent de la page appelée (négociation de contenu, entres autres)
 
Discussions similaires
Haut