Accueil > Outils et techniques > Internet - Html - CMS > Tout savoir sur... le RSS

Tout savoir sur... le RSS

dimanche 28 septembre 2003, par Stephane Cottin

Tout savoir, ou presque... sur le RSS. Quelques notions rapides sur cette (pas si) nouvelle technologie, et les moyens de les approfondir.

Syndication, comarquage, RSS (Rich Site Summary ou Really Simple Syndication), RDF, normes RSS 0.91, 0.92, 1.0, 2.0, agrégateur de news, de fils, ... que de noms, néologismes et nouvelles notions...

A quoi ça sert tout ça ? nouveau gadget inutile, folie passagère ? Pas sûr...

Qu’est-ce que c’est ?

Tout d’abord, ce n’est pas si nouveau, le concept et la technique sont nés en 1997 avec l’hébergeur de weblog (les carnets personnels sur Internet) Radio Userland et, un peu plus tard, Netscape, qui a stabilisé la technique du RSS en la versant dans le monde du logiciel libre. Le garant du concept est depuis 2003, à la Harvard School of Law, le Berkman Center for Internet & Society).

Comment ça marche ?

L’idée, vraiment simple, est de réaliser automatiquement un sommaire dynamique du site web : à chaque fois qu’une nouvelle page est créée, elle est signalée et référencée dans un fichier au format xml. Sans entrer dans les détails et les querelles techniques entre les différentes versions de RSS (qui, de toutes façons, n’influencent pas les utilisateurs au final), on pourra retenir que les fichiers ont alors la structure suivante :


- <rss version="0.91"> [numéro de version de RSS, le nombre et la complexité des champs sont fonction de la version de RSS]

  • <channel> [début de canal d’information, peut être multiple selon les versions de rss]
    • <title>ServiceDoc.Info - Juriblog</title> [titre du canal]
    • <link>http://www.servicedoc.info/</link> [lien du canal et descriptif]
    • <description />
    • <language>fr-fr</language>
  • <image> [logo du canal]
    (...)
  • </image>
  • <item> [l’unité informative = l’item]
    • <title>Rameau et le domaine juridique</title>
    • <link>http://www.servicedoc.info/article.php3?id_article=78</link>
    • <date>2003-09-27 15:37:24</date>
    • <description />
    • <author>sc</author>
    • </item>
  • </channel>

- </rss>


Il est relativement facile à un programmeur de générer automatiquement un tel fichier, soit à chaque mise à jour du site, soit à la demande. De plus, la plupart des outils de génération de sites dynamiques offrent désormais cette fonctionnalité, même sans que les webmestres le sachent ou, au mieux, ne s’en préoccupent ; par exemple, tous les sites développés sous SPIP offrent par défaut deux fils RSS que l’on peut atteindre par les fichiers [url du site]/backend.php3 et /backend-breves.php3. Il s’agit de deux fils RSS au format RSS 0.91 qui sont générés en temps réel à chaque d’articles ou de brèves.

Quant aux sites non dynamiques ou qui n’ont pas cette fonctionnalités de prévues, de nombreux outils existent pour développer facilement un fil. (voir la rubrique ’Générer des fils rss sur cette page’)

A quoi ça sert ?

Le fait de savoir qu’un site vient d’être modifié est l’usage essentiel des fils RSS : on aurait pu faire plus facile, mais il y a quelque chose de plus dans le fichier xml produit = du CONTENU.

En effet, on a non seulement le lien vers la page créée, mais aussi son titre, sa description, éventuellement des mots-clefs, son ou ses auteur(s), un logo ou une image, selon les normes RSS, des forums, des rétroliens, etc.

Comment on s’en sert ?

Deux méthodes peuvent être utilisées, satisfaisant des besoins différents.
- La première consiste à insérer les fils en question sur un autre site distant, intranet ou internet : c’est le co-marquage ou la syndication de contenus. On peut imaginer des petites fenêtres déroulantes, distinctes du contenu habituel du site hébergeur, où s’affichent des informations (comme le fil afp...) ; on peut aussi imaginer des pages entières de contenus distants, regroupés par matière et offrant une masse d’information considérable (voir, pour les fils d’informations issus de weblogs juridiques my.detod.com).
- La seconde technique consiste en la mise en place d’un lecteur de fils RSS, dit en anglais, news-aggregator. La plupart de ces outils logiciels sont disponibles gratuitement ou à faible coût (voir le comparatif sur le numéro de septembre de PCMag, version US). Ces lecteurs ressemblent simplement à des utilitaires de messagerie, avec une grande colonne à gauche contenant la liste des fils auxquels on est abonné, et deux espaces à droite, en haut la liste des ’items’ du fil choisi, et en bas, le contenu de l’item sélectionné.

On peut ici décider des délais de mise à jour des fils auxquels on est abonné, leur nombre, etc. De tout lire, de ne lire que les descriptif, de filtrer par mots-clefs, etc. A brève échéance, on se constitue un stock d’information qualifiée dans ce logiciel, qui, en général, contient un petit moteur de recherche permettant de retrouver une info parmi le stock accumulé.

Les avantages ?

Les experts prédisent à brève échéance le remplacement des mailing lists par les fils RSS. Cela fait cinq ans qu’ils le disent...

Pourtant... un argument impressionnant est que, par construction, on ne peut pas spammer un fil (sauf à pirater un serveur, ce qui est notablement plus complexe que le spam).

Plus prosaïquement, l’intérêt déjà développé dans la notion de co-marquage permet de reproduire efficacement du contenu issu d’autres sites, et de le rediffuser à son image. Pour les émetteurs de contenu, ce nouveau média permet de diffuser des informations sur des canaux valorisés et à moindre coût. En effet, le diffuseur n’a qu’à proposer un (ou plusieurs) fils rss, qui ne sont autres que de simples (et très légers) fichiers en xml : il y a très peu de ressources technologiques, humaines et de réseau à mettre en oeuvre (par exemple, sous spip, cela se fait tout seul). En contrepartie, le fichier généré n’est proposé qu’une fois au rediffuseur, qui se charge de le proposer à nouveau à son public propre. L’avantage par rapport aux lettres de diffusion, est donc le phénomène de propagation virale de l’information (l’inconvénient est, comme le remarque Cyril Fievet dans PointBlog.com le manque de mesurabilité de cette propagation).

Si on recherche la diffusion d’une information qualifiée (fiabilisée) au moindre coût, il semble que la solution des fils rss s’impose. On peut imaginer, comme le fait déjà eux-lex avec le JOCE, que par exemple le Journal officiel français diffuse ses éditions quotidiennes via un ou plusieurs fils rss. Quel intérêt par rapport à la liste de diffusion ? Cette liste nécessite la génération d’un fichier html quotidien, et l’envoi de n messages aux n abonnés à la liste. Le souci est que ce fichier est monolithique, et que l’envoi de tous ces courriers, même par des machines rapides, peut être ralenti (de nombreux ’abonnés’ se plaignent de recevoir leur sommaire de JO le soir au lieu du matin...), et est soumis aux aléas des mails (la gestion des abonnés est très lourde). Un fil rss permettrait de mettre un fichier à disposition à une heure quelconque, et, immédiatement, d’inonder tous les sites internet et intranet juridiques abonnés à ce fil, tous servant ensuite de relais ’fiables’ à cette information. De même pour les utilisateurs de la méthode des news-aggregators, qui, au lieu d’être des récepteurs passifs (à qui on ’pousse’ l’information), deviennent des ’tireurs’ et viennent chercher le fil quand ils le souhaitent, le conservent dans leur logiciel, et libèrent d’autant la bande passante en conservant les sommaires des JO, ou en les filtrant selon les combinaisons de mots-clefs qu’ils auront eux-mêmes développées.

Pour approfondir le sujet

Pas la peine d’en dire plus quand Cyril Fievet a déjà tout dit, sur son Abc du Blog de l’excellent site Pointblog, (weblog sur les weblogs). Il y propose une série de définition très détaillée et précise, dont Rss et syndication (1/2) (le Rss) et (2/2) (les lecteurs de fils).

On trouvera aussi sur le même site une catégorie ’Syndication’ donnant l’actualité mondiale du secteur en français.

SPIP | | Plan du site | Suivre la vie du site RSS 2.0