Accueil > Techniques de la documentation juridique > Documentation juridique > Xml et le droit - le ’legalxml’

Xml et le droit - le ’legalxml’

Études sur les solutions NTIC à la gestion numérique des documents juridiques

dimanche 2 février 2003, par Stephane Cottin

Qu’est ce que le xml et que peut-il apporter aux documents juridiques ?

INTRODUCTION :

Qu’est-ce que c’est ? L’eXtended Markup Language n’est qu’une énième spécification (protocole de définition de document). (définition officielle ici)

Quelle est la différence avec l’HTML ? L’HTML n’est qu’un langage de description de page, comprenant une quarantaine de balises figées, qui ne servent qu’à préciser la place et la forme des portions de textes à l’écran. Le XML propose de créer une infinité de balises, nécessairement plus proches des besoins réels des utilisateurs, chacune étant capables de générer des actions spécifiques en fonction d’environnements prédéfinis.

En fait le XML est conçu à la fois pour s’adapter au plus près des besoins, tout en préservant des règles très strictes de construction (mais que l’utilisateur s’est lui-même imposé). Cette balance entre la liberté et la rigueur est source de fiabilité et d’utilité. Une fois la structure définie, une entreprise (ou mieux, un réseau d’entreprises sans forcément de point commun, hormis un besoin d’échanger des documents) peut stocker l’ensemble de ses données, mêmes les plus confidentielles en un seul endroit, et être sûr que ses interlocuteurs y trouveront exactement ce qu’ils ont l’autorisation de trouver, sans se préoccuper de la mise en forme des données.

Évidemment, ce n’est pas XML tout seul qui va gérer ces échanges et ces transformations. Tout d’abord, la structure normalisée des documents (la grammaire des balises) peut (ce n’est pas une obligation, mais c’est bien pratique) être définie dans une DTD (Document Type Definition), regroupant les règles essentielles (listes des champs, tables de valeurs, liens et jointures internes...) des données.

L’avantage est que, d’une part, on peut partager des DTD au sein de structures différentes (même concurrentes). Ce ne sont que des canevas dans lesquels vont être hébergés des données. D’autre part, la construction des DTD est suffisamment souple et simple pour être ouverte sans trop de connaissances techniques.

L’idéal est de se mettre d’accord sur les types de champs à indexer et d’uniformiser leurs balises respectives. Une fois cette normalisation effectuée, la collecte, le traitement et la redistribution des données en est grandement facilité.

En effet, après avoir défini des DTD, le XML permet de mettre au point des vocabulaires communs (DOM) ou modèles, ainsi que des canevas d’affichage des fichiers (XSL). L’intérêt de ces mises au point est qu’il est possible, à partir des mêmes données, de s’adresser à des publics ou à des machines différentes. On peut par exemple développer une XSL simplifiée à l’usage de clients non juriste, ou destinataires d’information tronquées (parce que gratuites ou confidentielles, à cause d’anonymisation par exemple), et une XSL plus complète pour les clients internes ou payants...

Tout ceci est évidemment évolutif et peut être programmé. L’avantage est que le transfert de données est sécurisé parce que le serveur XML fournit uniquement ce que la XSL lui demande, au contraire d’un produit client/serveur qui fournit toutes les données au client et qui a un programme qui les traite sur son poste, au risque de voir ces données interceptées ou craquées en local.

Ont d’ores et déjà été développés des XSL types qui sortent directement les documents en PDF, RTF ou Word... XML est en passe de devenir le format pivot de tous les échanges de données.

Les échanges de données informatisés dans le domaine de la justice

in http://www.ccomptes.fr/organismes/c..., source = Cour des comptes

- GLOSSAIRE TECHNIQUE ET JURIDIQUE

Les définitions sont issues pour l’essentiel, soit du glossaire du rapport général de l’enquête 1997, soit du glossaire du rapport de M. Lorentz, relatif au "commerce électronique".

Certaines d’entre-elles ont été enrichies des apports de Mme de La Presle, chef de la délégation française au CEFACT/ONU.

XML (Extensible Markup Language)

Sous-ensemble simplifié de la norme de langage SGML, il est en développement depuis 1997 sous l’égide de l’instance dirigeante du Web, le " W3 Consortium ". Langage en principe " ouvert ", à distinguer des démarches " propriétaire ", il pourrait, au même titre que l’a été SGML en 1986, être reconnu par l’ISO, organisme institutionnel de normalisation internationale. Toutefois, les promesses de XML impliquent à l’avenir une standardisation des formats de données suffisamment large pour permettre une véritable interopérabilité.
Langage de description et d’échange de documents structurés, XML procède d’une recherche d’un nouveau compromis entre le besoin de simplicité, pour en accroître l’interopérabilité effective dans l’application, et le besoin de puissance nécessaire à la description de structure complexes, multimédia notamment. Il vise tout particulièrement à s’affranchir des limitations imposées par HTML, le langage actuel du Web.
Parmi les extensions recherchées par XML figure l’utilisation possible d’un dictionnaire de données. Ce dernier permettrait de capitaliser la normalisation sémantique initiée préalablement au titre d’EDIFACT. Il ne permettrait certainement pas de faire l’économie de cette normalisation sémantique dans des futurs développements hors du contexte d’EDIFACT.

Les rencontres entre l’XML et le Droit

Appels à contributions :

=== ATICA (ex - MTIC) Avantages XML
http://www.atica.pm.gouv.fr/pages/d...

Message de la lettre de la MTIC du 12 avril 2001
Le répertoire de schémas XML de l’administration est en ligne.

Le CIRE du 12 octobre 2000 a confié à la MTIC le soin de réaliser et de mettre en ligne le répertoire de schémas XML de l’administration afin de favoriser d’une part l’interopérabilité entre les systèmes d’information de l’administration, d’autre part les échanges avec ses partenaires et usagers.

Le répertoire de schémas a été défini à la suite d’un appel à contributions ouvert sur notre site http://www.mtic.pm.gouv.fr/XML/presntxmlefi.shtml (lien mort : nouveau lien en 2002 = http://www.atica.pm.gouv.fr/pages/d...

Le répertoire de schémas XML de l’administration

Au fur et à mesure de l’évolution du Web, le langage XML (eXtensible Markup Language) semble devenir la lingua franca d’Internet et des intranets. XML offre en effet une richesse fonctionnelle supérieure à celle du langage HTML (Hypertexte Mark up Language). HTML n’a jamais été conçu pour répondre aux besoins auquel il fait face aujourd’hui - les échanges de données dématérialisés-. Le potentiel offert par le langage XML permet d’envisager ce langage comme un format universel d’échange des données. La grande simplicité d’utilisation d’XML ne veut pas dire qu’il soit simple de migrer vers XML ni que l’on doive abandonner HTML. Le meilleur moyen de comprendre XML est de saisir ce qui le différencie d’HTML. Chacun de ces langages est un sous ensembles épuré du SGML (Standard Generalized Markup Language) mais là ou HTML se concentre sur la forme, XML s’attache à "l’essentiel". HTML a été développé pour structurer des documents échangés à travers le réseau Internet en définissant quelques structures simples telles que les paragraphes, les entêtes, les listes et quelques objets simples pour le Web. Mais HTML est limité dans sa capacité à décrire le type de donnée affiché. Un formulaire de commande élaboré en HTML ne tient pas compte de la catégorie de données qu’il manipule, cette catégorisation étant implicite, ce qui rend difficile l’échange entre applications. XML au contraire permet de définir la structure des documents en s’appuyant sur des catégories définies par l’utilisateur ce qui facilite l’échange entre applications. Ainsi des applications peuvent extraire et s’échanger des données à travers le réseau à partir du moment où les programmes reconnaissent les mêmes catégories de données. Ces catégories de données sont matérialisées par des balises (ou tag en anglais). XML est donc un langage favorisant l’interopérabilité. Un héritage de SGML est la mise en oeuvre en standard d’un mécanisme permettant de valider le document XML : le parser. HTML est en mesure d’offrir de nombreuses fonctionnalités offertes par XML mais suppose l’utilisation de nombreux modules logiciels parfois incompatibles entre eux. HTML n’a pu s’adapter à la croissance du web qu’avec l’adoption de ce type de logiciels tiers.

Mais XML ne sonne pas le glas de HTML. XML est complémentaire d’HTML. L’évolution prévisible de HTML est XHTML, une combinaison des deux technologies qui permettra aux sites web d’incorporer du XML dans leurs pages et de garantir la compatibilité avec le parc de postes utilisateurs installé.

Les promesses d’XML

Les promesses d’XML sont les suivantes :

- un moyen simple d’échanger des données à travers le réseau,

- de nouvelles possibilité aux concepteurs de site web qui ont atteint dans leurs pratiques les limites de HTML,

- un nouveau modèle d’échange pour effectuer des requêtes à des bases de données au travers du réseau Internet ou extranet,

- une solution simple pour échanger des informations entre diverses applications sur le poste utilisateur ou à travers l’extranet ou l’Internet,

- une couche logicielle standard qui permet la mise en oeuvre à travers le réseau d’applications distribuées s’appuyant sur des objets XML.

Le plus important obstacle à l’adoption d’XML est sa caractéristique qui le rend le plus intéressant : la capacité de créer de nouvelles catégories de données (sous forme de balises). Cette possibilité permet à chaque utilisateur de personnaliser les documents XML pour qu’ils correspondent exactement à ses besoins. Mais cette caractéristique d’XML n’est utile que si ces documents ou les informations qu’il contient doivent être échangés. En effet, vous ne devriez utiliser XML que si vous publiez ou collectez des données à travers le réseau ou si vous développez un système favorisant l’interopérabilité entre systèmes hétérogènes. Vous serez donc conduit à spécifier des DTD ou "document type definition" qui sont un héritage de SGML.

La création et la publication de ces DTD permet de décrire la structure des documents et les catégories des données qui pourront faire l’objet d’échanges entre deux ou plusieurs acteurs d’une transaction.

Ainsi, un document XML faisant référence à une DTD commune permettra après son passage dans un parser de valider ou non le document en indiquant s’il est conforme à ce document de référence commun qu’est la DTD. Il est à noter qu’il existe beaucoup de collections de DTD couvrant de nombreux domaines, mais aucune d’entre elle ne peut être définie comme un standard.

XML et les DTD

La question qui se pose maintenant est de savoir comment s’organise l’échange lorsqu’on utilise XML et les DTD. Si votre application est en mesure de partager des données avant que vous n’introduisiez XML, il y a de forte chance pour que tout aille bien. Mais si les données à échanger sont incompatibles, le simple fait de les formater avec des balises XML ne le rendront pas pour autant compatibles. La meilleure solution aujourd’hui est d’effectuer une opération de translation des données (mapping de données). A cet effet, on utilise des outils permettant d’effectuer cette opération à partir de la DTD source utilisée par un système d’information vers la DTD cible utilisée par l’autre système système d’information avec lequel on désire échanger.

Mais, il faut avouer que cette utilisation ne correspond pas aux promesses d’XML. En effet, dans ce type d’échange on observera le phénomène classique où 80% des données seront communes les 20% restant devant faire l’objet d’adaptations et d’interprétations spécifiques (et coûteuses). En effet, XML est acclamé comme un moyen facile sans rupture de charge pour partager des données entre différentes applications. Lorsque vous avez un ensemble de données incompatibles à échanger entre deux systèmes et s’appuyant sur un utilitaire permettant d’obtenir une représentation commune s’appuyant sur XML, cette notion de "facilité" est relative. Dans la plupart des cas vous aurez à analyser les deux DTD et à créer ce mapping. Les utilitaires du marché n’interprètent pas les différentes DTD ; ils configurent simplement le module qui effectuera cette translation pour vous laisser ensuite traiter les exceptions en cas d’incompatibilité. Un début de réponse est apporté par les schémas XML.

répertoire de schémas XML

Il semble néanmoins que la plupart des éditeurs se soient engagés à suivre les standards du W3C une fois qu’ils auront le statut de "recommandation". La gamme de logiciels et d’utilitaires pour l’environnement XML s’étend de l’offre de développement complet au module et outils spécialisés. Ces produits peuvent être commercialisés ou distribués gratuitement par des éditeurs de logiciels ou issus de la communauté du logiciel libre. Bien que XML soit encore loin de tenir toutes ses promesses, de nombreuses réalisations utilisent ou s’appuient sur XML pour assurer les échanges entre systèmes. Parmi les réflexions en cours on notera l’initiative ebXML qui vise assurer un cadre d’échange dans le domaine du commerce électronique. Le point commun à l’ensemble de ces initiatives est la mise en commun des DTD (et bientôt des schémas) dans des répertoires accessibles publiquement.

C’est dans cet esprit que s’inscrit la mise en place du répertoire de schémas XML de l’administration qui doit contribuer à deux objectifs :

- favoriser l’interopérabilité et la dématérialisation des échanges au sein de l’administration, et des échanges qui lient l’administration à ses prestataires et à ses usagers ;

- faciliter la conservation des documents dématérialisés échangés.

Le répertoire de schémas XML de l’administration est un outil mutualisé et un outil de mutualisation, il s’agit donc de poursuivre un but de dialogue constant entre les acteurs concernés. Ce répertoire est en ligne et à votre disposition à l’adresse suivante http://www.mtic.pm.gouv.fr/XML/repertoire.shtml depuis le 12 avril 2000.
(2002) = http://www.atica.pm.gouv.fr/pages/d...

- Ministère de la Justice :

Courrier de la Chancellerie n° 46 (août 1999) présentant le travail de la COMI (Commission de l’Informatique, des Réseaux et de la Communication Electronique)

Le PAMSI : Programme d’Action Gouvernemental pour la Société de l’Information.

Repérer, en France et à l’étranger, ce qui est à la fois prometteur et pérenne, le faire connaître pour en préparer l’expérimentation, tel est l’objet de la veille technologique. Aujourd’hui, la Comi développe les thèmes d’étude suivants :

- les outils de formation à distance et d’autoformation sur Intranet,

- la généralisation sur le poste de travail du navigateur comme outil de dialogue de l’utilisateur avec les applications,

- les langages interactifs (normes XML), comme référence pour l’échange de données dans le domaine judiciaire,

- l’allégement des tâches d’indexation en fonction de l’évolution des moteurs de recherche,

- l’extension du RPVJ, comme le réseau sécurisé véhiculant l’ensemble des communications internes du ministère


=== Parlement européen

http://www.europarl.eu.int/docman/d... : Un vocabulaire commun pour le langage parlamentaire (PARL/ML)

voir la rubrique "a common vocabulary for palementiary language" plus, les autres rubriques...

A noter aussi sur le site Europa, les compte-rendus des DLM Forums (96 et 99) : http://europa.eu.int/ISPO/dlm/index.html
avec en particulier les documents de référence : http://europa.eu.int/ISPO/dlm/dlm99... et le guide : http://europa.eu.int/ISPO/dlm/docum... (version pdf)

en français s’il vous plaît :

Recherche des mots-clefs sur

xml dtd droit

donne 169 résultats au 17/11/2000 donne 471 résultats au 27/08/2001 donne 1520 résultats au 01/02/2003

xml dtd juridique

donne 43 résultats au 17/11/2000 donne 166 résultats au 27/08/2001 donne 652 résultats au 01/02/2003

- 16 mai 2000 : http://www.ccomptes.fr/organismes/c... Les échanges de données informatisés dans le domaine de la justice Voir analyse

Sur la légistique en général

- la bibliographie de l’université de Genève

- cours de légistique

Sur l’XML en général / XML et droit en français / ressources en langue étrangère

http://www.oasis-open.org/cover/legalXMLWG.html

Solutions US :

Encoded Archival Description (EAD)

United States Congress XML and Legislative Documents : et surtout http://xml.house.gov/

avec la description détaillée de tous les éléments et attributs de la DTD des lois et projets de loi US (bill.dtd) :

LEGALXML

(exemple de ’technical committee’)

- COURT E FILING

EUROPE

Lexml
Lexml aims to coordinate XML initiatives in the legal field in continental Europe. The Lexml Workgroup at Legal XML discusses matters of transatlantic interest, such as breaking language barriers and the development of a data models that bridge the gap between common law and civil law jurisdictions. The Workgroup serves as a forum for discussion between representatives of the common law an civil law.

2 Messages

  • > Xml et le droit - le ’legalxml’ Le 24 avril 2004 à 11:32, par Franck Macrez

    Bonjour,

    On oublie souvent la doctrine !
    La possibilité de traiter des thèses par xml est une perspective intéressante. Il faut pour cela produire à l’origine des documents structurés. Le projet cybertheses.org , développé par l’université de Lyon2 et les Presses de l’Université de Montréal, permet le traitement des fichiers textes des thèses.
    Je le considère, malheureusement encore comme une version bêta (voire alpha), car il est compliqué à installer et de nombreuses erreurs subsistent (à supposer que le module de base fonctionne). Mais c’est un projet à suivre...
    Sont aussi disponibles des feuilles de style facilitant la structuration de la these (ou du mémoire), et dont l’intérêt est souvent totalement inconnu des juristes : pour l’instant disponibles pour Word et StarOffice, cette dernière ne fonctionnant pas chez moi (5.2).

    Je me suis lancé (avec l’aide d’un ami plus programmeur que moi) dans l’élaboration d’un modèle LateX/BibTeX, ce qui permet de produire des documents véritablement structurés. Modèle qui a vocation à s’appliquer aux thèses et mémoires juridiques, ce qui est très particulier pour la gestion/intégration des références bibliographiques (BibTeX).
    Le tout est (sera) intégré au logiciel LyX, dit de WYSIWYM : les représentations visuelles des données ne sont utilisées que pour faciliter l’édition (What You See Is What You Mean : ce que vous voyez est ce que vous signifiez). Au contraire dans le cas WysiWyg (ex.MSWord), les représentations graphiques sont le but, le résultat de l’édition (et non son intermédiaire) : What You See Is What You Get (ce que vous voyez est ce que vous obtenez). Autrement dit : quand on écrit, on ne pense... qu’à ce qu’on écrit (et non à la mise en forme).

    Cordialement,

    Franck

  • > Xml et le droit - le ’legalxml’ = tentative de mise à jour des liens Le 16 septembre 2005 à 13:11, par Stéphane Cottin

    Cet article, mis en ligne en 2003, mais en fait issu d’une not[e plus ancienne encore, est victime de nombreux birs de liens. Un interlocuteur me l’a fait remarquer récemment et je lui ai apporté la réponse suivante, en espérant qu’elle pourrait être utile à d’autres personnes :

    La MTIC (mission interministérielle de soutien aux TIC) a été remplacée par l’ATICA en 2002, elle-même récemment remplacée par l’ADAE.

    En général, chaque nouvelle entité récupère les fichiers de l’agence précédente, sans forcément les remettre à jour.
    Donc sur l’adae, vous allez pouvoir retrouver le chapitre consacré à l’xml de l’administration française sur :
    http://www.adae.gouv.fr/rubrique.php3?id_rubrique=31

    On peut aussi retrouver le contenu des pages de la MTIC tel qu’il était lors de la disparition de l’agence avec la wayback machine :
    http://web.archive.org/web/20021015133928/www.mtic.pm.gouv.fr/XML/
    par exemple
    ou regardez sur http://web.archive.org/web/*/http://www.mtic.pm.gouv.fr/XML/

SPIP | | Plan du site | Suivre la vie du site RSS 2.0