Créer un flux RSS depuis pages HTML

WRInaute discret
Bonjour,

Je viens vers vous afin de savoir si vous connaissez un service sur le web ou un script "prêt à l'emploi" (important car je n'ai pas les compétences pour le réaliser) qui propose la création d'un flux RSS d'un site web "archaïque" ?

J'entends par là que le site possède des pages codées en html statique et d'autres pages en base de données... Pour les pages en base de données, ce serait un plus, mais pas indispensable. En revanche le flux doit contenir tous les articles dispo depuis un fichier html.

Le flux doit reprendre tout le contenu des articles.
Cette demande fait suite car je souhaite basculer tout un site web sous Dotclear 2 qui propose d'importer tous les articles depuis un flux RSS.


Merci par avance :wink:
 
WRInaute discret
Bonjour,
En automatique, ça va être chaud :D
Est-ce les pages ont exactement la même structure HTML avec des balises claires ?

Sinon y reste la solution à la mano avec des copier/coller vers un fichier rss/xml ...
 
WRInaute accro
ah oui, je n'avais pas vu qu'il voulait l'intégralité de son contenu dans le flux. Là, il faudra le faire à la main et, en plus, si les pages html n'ont pas la même architecture, ça risque d'être assez compliqué, sans compter les liens qui peuvent être en références relatives...
 
Membre Honoré
Bon retour au forum.
Mathieu M. a dit:
Cette demande fait suite car je souhaite basculer tout un site web sous Dotclear 2 qui propose d'importer tous les articles depuis un flux RSS.
Si c'est pour une importation essayer directement avec les urls.

Merci à vous pour votre participation sur le forum en répondant aussi à d'autres topics ou remerciant les membres (lien).
C'est ce qui motive les membres et permet d'avoir un forum qui permet de faire évoluer les sites tous les jours.
 
WRInaute discret
Bonjour,

fobec a dit:
En automatique, ça va être chaud :D

Oui, je me doute hélas...

fobec a dit:
Est-ce les pages ont exactement la même structure HTML avec des balises claires ?

Non, justement c'est ce que je disais, le site est assez "archaïque" puisqu'il a évolué en même temps que les compétences des divers webmasters et diverses structures html / css. :?

fobec a dit:
Sinon y reste la solution à la mano avec des copier/coller vers un fichier rss/xml ...

A ce compte là, autant les copier directement dans Dotclear je pense.

Madrileño a dit:
Si c'est pour une importation essayer directement avec les urls.

Hmmm, oui mais Dotclear ne va pas m'importer le contenu des articles.

UsagiYojimbo a dit:
Si toutes tes pages sont baties sur le même modèle (mais vu qu'elles semblent être en full HTML, j'ai des doutes) tu peux essayer un service comme Ponyfish : http://www.ponyfish.com/

Je ne dois pas comprendre leur service, car il me génère un flux avec seulement le lien vers différentes pages.

Il n'existe donc pas un petit script sur le oueb qui extirpe tout le contenu d'un site ? (à partir des fichiers sur ftp par exemple)
J'avais trouvé ça pour créer un sitemap, mais il manque le contenu quoi...


Merci.
 
WRInaute discret
Je connais bien Dotclear (enfin... me semble-t-il), mais l'import d'un flux RSS importe seulement le contenu du flux RSS (si le flux est tronqué à 100 caractères, Dotclear importe ces 100 caractères). Cela dit, ce n'est pas un problème pour une partie des articles de mon site qui sont en BDD (je peux donc créer un flux qui comprendra tous les articles dans leur intégralité).

En revanche, se pose toujours la question des pages statiques html... et ces dernières représentent peut-être près de 50% du contenu (environ 5000 articles en pages statiques).


Merci.
 
Discussions similaires
Haut