Saturday, February 1, 2014

Le trouble des dates dans les systèmes d'information


Les systèmes d'information, les SI, innervent nos sociétés. De tout temps il a fallu les structurer pour en faciliter la gestion et l'accès.

Le règne des registres et index

Ils ont pris historiquement diverses formes, par exemple avec registres, fiches, bordereaux récapitulatifs, comme on peut les voir dans les archives de l'Etat Civil. Celui-ci s'est structuré avec le Code Napoléon, qui reste encore la base de notre réglementation actuelle.

Le Code Civil est bien organisé et permet de tracer les événements, naissances, mariages, décès, avec leurs dates et lieux de survenance.
On peut rechercher ces événements dans les "tables décennales" qui les reprennent triés par commune, première lettre du nom, et date.



On accède ensuite aux registres annuels qui regroupent les fiches d'Etat Civil par ordre chronologique, avec un récapitulatif alphabétique.

Et enfin la fiche elle-même relate l'événement et ses circonstances.

En somme, bien avant l'apparition de l'informatique, des "systèmes d'information" se sont constitués, et ont joué un rôle majeur dans nos sociétés, par exemple pour la conscription, les élections, les finances...

Les tout premiers SI de l'informatique étaient, par contrainte technique, en pratique séquentiels, à l'image des cartothèques de la mécanographie.

Source Université de Tours
Mais avec l’arrivée des mémoires de masse apparaissent des "méthodes d'accès" dont le célèbre "séquentiel indexé", avec un principe (cf schéma) proche de celui de l'Etat Civil.

Bien sûr des méthodes plus performantes et sophistiquées ont été développées, mais l'accès à l'information reste une question technique centrale.

Elle prend une ampleur nouvelle avec l'explosion des volumes (big data) et des champs sémantiques. Car la numérisation se généralise tout azimut.

Une datation approximative et désorganisée

Il est vraiment temps de prendre du recul, face à cette explosion des systèmes, sur un point particulier mais fondamental : la datation des informations.

Effet spaghetti (simplifié)
En effet la gestion des dates, pourtant indispensable dans tous les SI car ils retracent tous des réalités qui évoluent, est approximative. Certes, le besoin d'être au clair sur cette datation de l'information n'était pas explicite du temps du règne des "fichiers", car la date était implicite et déduite de celle de la version de fichier. Mais la base culturelle des informaticiens et des maîtres d'ouvrage a hérité de cette modélisation statique, et bien des SI modernes restent synchronisés sur une datation confuse. En découlent de multiples dysfonctionnements : non qualité des données, sur-coûts d'intégration des données, complexité des échanges d'information, effet spaghetti, refuge dans une paranoïa technologique, ou a contrario consolidation sur des bases technologiques surannées...

La trilogie des dates

Curieuses aberrations ! En effet les fondamentaux de la datation sont simples et universels ! Dans les SI comme dans la vie.

De quoi s'agit-il ?

  • L'information retrace toujours une situation qui vit, change à l'occasion d'un événement d'une mutation, d'une transformation : il a date du fait.
  • Ce fait peut être vu de façon anticipée (prévision, programmation,...), en vision du fait réel constaté, mais aussi en vision de recul (retour d'expérience, validation comptable,...). Il y a date de vision.
  • Mais attention cette date de vision n'est pas la date à la quelle le système technico-social a restitué l'information (date de saisie, date technique, horodatage automatique, chrono, ...) souvent mise en avant comme date "réelle" mais bien sûr source d'erreur "optique" dans la vision. Il y a date technique.
Ces dates s'appliquent à chaque "grain" d'information, au niveau élémentaire, et non dans les multiples agrégats qui ne sont que des photos partielles basées sur des compromis de datation souvent flous, implicites, et malheureusement hybrides ... donc non signifiants. C'est le "grain tri-daté" du schéma ci-dessous.
Le grain d'information tri-daté

Le débat sur la volumétrie qu'un tel triplet de dates introduirait dans le SI est complètement désuet : la désorganisation des datations, congénitale à bien des SI, crée en elle-même volumétrie par redondance et contingence des investissements applicatifs.


Voilà bien une trilogie curieusement absente des méthodologies, unanimement muettes sur le sujet. Il est grand temps d'ouvrir les yeux sur cette simple réalité, fédératrice de tous les SI, qu'ils soient internes à l'entreprise ou lui soient externes, qu'ils soient classiquement structurés ou émergeant et non structurés.

No comments:

Post a Comment