Pourquoi et comment faire xml ? Synthèse des points pour supporter la réflexion

Le 18 mars 2005, par Marc-Alexandre Cartiant,

On peut se poser encore des questions sur l’opportunité d’un passage à la technologie (aux technologies ?) XML. Voici quelques jalons pour aider à la réflexion.

Cette question s’est posée dans le cadre de la refonte d’un système informatique, supportant le fonds documentaire d’une institution.

La réflexion s’est alors articulée en six points, accompagnés pour chacun d’entre eux de plusieurs problématiques qui aident à mieux définir les finalités du recours au xml.

Structuration

Le passage au XML permet de se poser déjà des questions utiles à la compréhension générale de son propre fonds documentaire.
- Quel est le degré d’analyse d’un document ?
- Peut-on/faut-il isoler des ensembles, puis dans ces ensembles, des sous-ensembles de mots, phrases, paragraphes dans un document ?
- Faut-il éventuellement qualifier ces ensembles ? (attribution de mots-clés issus d’un langage contrôlé ou libre) ?

Saisie des données

- Quel sera le moyen de saisie pour isoler les informations ? Raisonnement en flux, en stock : bilan coût/avantage de la reprise des documents dans une optique de Record Management.

Il semble que les éditeurs de texte dans le marché soient peu satisfaisants pour la production en xml :
- Le seul qui se détache est Word 2003 version entreprise. Lors des essais, le contrôle de la saisie des informations selon une structure de données (DTD) ne se faisait qu’a posteriori : l’éditeur permet l’insertion illégale de balise mais signale quand la structure du schéma est violée.
Le contrôle de la saisie a priori n’a pu être vérifié.

- Open office enregistre effectivement les documents dans un format xml. Mais la saisie des données à partir d’un schéma à encore quelques aspects ésotériques qui n’ont pas permis de faire des essais concluants ;

- Autre outil libre, intéressant, mais dont la configuration est complexe et la présentation du texte peut rebuter : jaxe. Cet éditeur permet par exemple le contrôle a priori de l’insertion des informations selon une structure.

On pourrait substituer les éditeurs de textes à des masques de saisie. Cependant, avec la nécessité de présenter un document de manière conventionnelle, cette solution serait la moins avantageuse car elle ferait "perdre pied" aux utilisateurs habitués au traitement de texte.

De plus, les masques de saisie, pour être ergonomique, doivent prévenir la complexité... ce qui pourrait être antinomique si le recours au xml est pour structurer des documents complexes !

On revient au point précédent (structuration) : quelle serait la complexité en terme de structuration ? Si les documents n’en nécessitent pas ou peu, alors les problématiques qui viennent d’être soulevées ont une importance bien moindre.

Restitution des données

- Quelle exploitation de l’analyse structurelle d’un document : typographiques ? Pour la recherche ? Pour l’adaptabilité des données dans un contexte de sécurité (ex : dissimuler un nom, un objet, un lieu... lors la restitution depuis le fichier source) ? Les trois à la fois ?

Quel est le plus sécurisant/simple/moins coûteux ? La redondance des documents "allégés" de quelques informations ou un document unique modifié à la volée selon certains critères ? Cette dernière problématique est fortement liée à la volumétrie.

Manipulation

Le XML n’est que du texte et permet un traitement en aval direct, sans passer par des procédures techniques particulières.

Cette souplesse est-elle en réalité nécessaire ?

Faut-il/Peut-on combiner des ensembles de textes, éventuellement issus de différents documents dans un souci de reporting ?

La mise en place d’une plateforme xml, automatisant ces combinaisons, coûtera-t-elle, plus cher ou moins cher que les opérations manuelles ? Quelle est la volumétrie des traitements de ce style ?

Interopérabilité

- Quels sont les logiciels dans le système d’information nécessitant une interopérabilité ?
- Quelles sont les difficultés présentes ?
- Quelles difficultés résoudrait l’usage du xml ?

Pérennité

Le XML est reconnu pour être une solution pérenne de préservation des données, contrairement aux technologies propriétaires.

Les logiciels sont en outre de plus en plus nombreux à proposer l’exportation des données en XML, même si le fonctionnement interne de stockage des données leur est propre.

Le XML étant une "base de données" à plat, les documents peuvent être séparés "physiquement" d’une base de données. Ainsi, les données seraient toujours accessibles... peut-être trop ?

Quel est le degré de sensibilité des données ?


En espérant que ces problématiques éclaireront ceux qui partagent les mêmes réflexions.

 

Poster un commentaire



Syndication

À propos de cet article

Dernière mise à jour le :
18 mars 2005
Statistiques de l'article :
5 visiteurs aujourd'hui
2589 visiteurs cumulés
Mots-clés :
,
version imprimable
SPIP 1.9.2d [11132] | BliP 2.4 | XHTML 1.0 | CSS 2.0 | RSS 2.0 | Espace privé
Visiteurs par jour (cumul) : 1482 (102323)