mardi 13 mai 2014

Big Data, révolution de l'accès au vivant



Un déluge signifiant ou insignifiant


On nous dit que nous sommes à l'aube d'une "révolution industrielle", avec le déluge numérique et ses dimensions mirobolantes, qui dépasseraient en volume les connaissances patiemment accumulées au cours des siècles, voire depuis l'origine de l'humanité ...

Certes, tout individu, avec ses tablettes et mobiles, avec son véhicule et toutes sortes d'objets immobiles et mobiles, est "connecté", et le sera de plus en plus. Etre connecté devient une respiration, un oxygène gratuit et naturel, une commodité qui s'est faite oublier,... bref un bien public, désormais un droit, apporté par la bienveillante "fée connexion", comme le fut la "fée électricité", en son temps imagée par Raoul Dufy.
La fée électricité par Dufy Musée d'Art Moderne Paris

La rupture, la révolution, si révolution il y a là, est-elle dans ces mirifiques volumes de données dont on mesure l'incommensurable par zettaoctets, yottaoctets ?

Hélas, ces données ne sont que traces, images éphémères de nos activités et des rythmes qui nous entourent. On pourrait aussi, dans une introspection folle, modéliser les déluges de données internes à chaque individu, car nos 100 milliards de neurones, les 100 000 synapses qui sont tissées en moyenne par neurone, sont le siège de flux d'informations vitaux, à tout instant, et nous n'en avons conscience que d'une infime part . Un simple bourdon, doté seulement d'un million de neurones, sait, pour optimiser son butinage, résoudre l'ardu problème du voyageur de commerce. Le monde vivant bouillonne de données ignorées et pourtant vitales.

La fée connexion nous révèle ces futilités : la belle affaire ... le volume est gigantesque mais la signification faible, plus nous émettons de traces, moins chacune a de sens.

Admettons un instant que ce volume soit "infini" (souvenons-nous de nos raisonnements mathématiques ...), notre vie en serait-elle changée ?

Quel est le signifiant, quel est l'insignifiant ?

Certes, dans cette dilution, on trouve du sens, la respiration connectée prouve son utilité, et sa pratique peut être salutaire. Mais le discours sur le gigantisme est un mirage, il nous leurre sur le véritable changement, lequel est d'un bien autre ordre, et ne se réduit à cette comptabilité vaniteuse. La vraie rupture est dans la découverte d'un nouveau monde, l'apparition de nouveaux territoires de connaissance, de "nouvelles frontières" de perception (voir ici ce que l'on entend par "frontière").

Les nouvelles frontières de perception


Nous avons inlassablement ici insisté, sur ce site, sur la primauté des événements et de leur organisation en cycles et parcours. Tous les mondes matériels et immatériels existent par leurs  perpétuels mouvements, où ils se transforment, opèrent, créent, régénèrent, en horlogerie de cycles complexe.

Papyrus de E. Smith Nouvel Empire Egypte XVIIe siècle avant J. C.
En réalité, jusqu'à une époque récente, chacun avait une connaissance directe de ces mouvements, immédiate, réduite à son proche environnement, à ses propres perceptions. indigence de supports matériels figés : prospectus, formulaires, bulletins, billets ... attachés à l'artifice de cycles lents et formels : paye, inscription, déclarations, souscription, ... pales et lointains reflets de la vraie vie.
Et les organisations, pour vendre, lever l'impôt, transporter, éduquer, devaient s'en remettre, au delà des cercles de présence, à l'artifice de ces supports hérités du papyrus.

Pourtant, bien en amont de ces cycles formels réducteurs, de leurs processus de prise en compte, des systèmes d'information induits, existent des événements bien réels, en quelque sorte "éternels" dans leur nature, et qui caractérisent les multiples cycles de vies : humains, organiques, biologiques, économiques, écologiques, matériels (transport, fabrication, ...) et immatériels (réglementation, brevets, sciences, éducation, ...). Ces cycles de vie préexistent à la technologie de l'information et à ses divers avatars  : l'homme a couru par nécessité, pour se défendre, chasser, s’enfuir, ... devenu oisif et sédentaire, il court maintenant pour sa forme, il est connecté, voit sa trace, analyse sa performance, bref il est en prise avec sa course, mais, au fond, ne fait que courir. Maintenant, à tout propos, on peut géolocaliser et suivre des traces. L'automate, l'application, le réseau social, accèdent à une intimité (voir par exemple ici sur l'intimité numérique) jusqu'à présent hors de portée.

L'immense majorité des systèmes d'information étaient ainsi nourris à des rythmes artificiels et décalés, ignorant les événements générateurs, et n'enregistrant que des faits induits, formels :
  • le banquier ne fait qu'opérer des mouvements de fonds, fournir des moyens de paiement, accorder des prêts, ...qui ne sont bien sûr que conséquences de décisions de consommation, de choix d'investissement, d'activité productive, de loisirs, d’aléas de la vie, ...
  • le commerçant, s'il a le contact "humain", est informé sur les motivations individuelles, mais ses processus de vente, de logistique, de référencement sont aveugles des vrais ressorts individuels, se repliant sur une connaissance statistique, sur des modèles globaux, pour anticiper la demande et limiter surplus et ruptures de stock.
  • le soignant, sauf en cas d'extrémité, ignore l'intimité des cycles biologiques, les flux et reflux hormonaux, les quotidiennes absorptions de médicaments, leurs aléas ... et tous les facteurs qui déterminent l'équilibre homéostatique. Et pourtant, à terme, des puces intelligentes pourront être implantées pour suivre et monitorer ces biorythmes qui sont fondements des organismes vivants.

La connexion généralisée, qui se met en place dans tous nos azimuts, réels et virtuels, crée de nombreuses "nouvelles frontières", et l'opportunité de "transformations" jusqu'à présent inimaginables. Ces sauts de frontière apportent aussi, ce serait naïf de l'ignorer, leurs lots de menaces. Car les "marges territoriales", ces nouveaux espaces virtuels, émergents, ne sont pas régulés, et cette jungle est le royaume des innovants comme des brigands. Il ne sert à rien d'être chagrin, menaces et opportunités vont de paire : bien des métiers, bien des relations sont fondamentalement remis en cause par l'accès direct à l'événement initiateur, cela devient la règle. Nous avons déjà expliqué le coté implacable de cette dérive (cf la dérive des continents dans le flot numérique).

Cette connexion tout azimuts, en somme technologique, s'enfle d'une caisse de résonance : la connexion "sociale", qui exploite les besoins de communication entre les individus et les groupes. Les réseaux sociaux sont ces espaces de résonance, et le monde connecté vient y déposer sa petite musique. Le connecté physique rencontre le connecté social, pour le plus futile, mais aussi le plus utile, le pratique, et les magies de la "fée connexion".

Le déluge illustré à Saint-Marc Venise
Il faut donc remettre les idées en ordre, et la musique dans son tempo : les nouvelles frontières, par la perception connectée, donnent le rythme, et l'opportunité d'adhérer à la vraie vie, de créer de nouvelles chaînes de valeur pour les transformations induites, bien en amont des territoires "fonctionnels" connus des SI actuels. La volumétrie des "Big Data" n'est que conséquence de toutes ces nouvelles intimités, qui convergent avec les intimités sociales, révélées et enflées par les réseaux sociaux, dans un déluge de bavardage mondial.

Où l'on reparle de données


Ceci dit, pour percevoir, avoir l'intelligence de ce qui se passe sur ces frontières, interpréter les signaux disponibles sur ces marges comme dans les réseaux, nous voilà bien confrontés aux données !

Comment les prendre en compte ? On a beau dire que ces données ne sont pas structurées, qu'elles sont diluées, ... Du fait même qu'elles existent, elles sont formelles ! Certes, les réseaux sociaux sont des sources dont la syntaxe est variée, mais exploitable. De plus les mobiles et objets connectés structurent très fortement le message, c'est une nécessité technique.

En réalité, il faudrait parler, outre du défi des volumes, du défi de conception de ces captures de données. Car avant même de pouvoir comparer, capitaliser, historiser, il faut bien être au clair sur la sémantique : savoir de quoi l'on parle. On aboutit nécessairement à une ontologie, une formalisation, une modélisation, ... et de fil en aiguille le brave modèle de donnée reprend tout ses droits.

Par exemple on constate que la plupart des cycles, intimes des nouvelles frontières dont il est question ici, ne sont pas modélisés. Ils sont pourtant connus, et la conscience de leur existence est commune. J'ai eu la chance de travailler (il y a 2 décennies...) pour les administrations de la circulation routière, époque d'euphorie Meurisienne, alors que le concept même d'événement de la circulation (accident, perturbation, chantier,...) n'était pas clairement défini, ce qui minait toute formalisation de l'information routière. En suggérant que ce SI fondamentalement événementiel soit fait basé sur la modélisation des événements, la définition d'un SI modernisé se mit en place rapidement... Dans d'autres domaines, devenus, par l'intimité des frontières, tout aussi événementiels, on en est encore à vouloir traiter l'information à l'image des SI existants, reflets des silos organisationnels et des flux de lots d'informations déclaratifs. Une remise en cause est nécessaire, sur la base événementielle.

Les ruptures d'architecture et de culture "informatiques"


Sur ce thème des données, "last but not least", il faut aussi être bien conscient de la rupture qui s'est produite : l'adoption par les géants du web de concepts et d'architectures qui leur permettent de traiter d'immenses volumes.

Cette rupture se produit à plusieurs niveaux :
  • technologique : la capacité de traitement n'est plus fondée sur une course à la puissance des centres de calcul, comme par le passé, mais par une multiplication de serveurs banalisés
  • logiciel : il n'y a plus un système central qui gère une base unique, mais une population de logiciels qui interagissent et se répartissent le travail comme abeilles dans une ruche
  • économique : les acteurs sur cette nouvelle niche sont mondiaux, et le savoir-faire encore peu diffusé, en rupture avec la compétence des équipes locales informatiques classiques
Les nouveaux acteurs de cette petite révolution de palais informatique ont un discours offensif, prêchant le Big Data, le NoSQL, les merveilles de l'analyse en immédiat opposées à la Business Intelligence devenue ringarde, l'analyse prédictive opposée à la régression déductive... Il reste qu'il faut maîtriser ces nouvelles architectures, dans toutes leurs composantes, y compris les plateformes de mobilité qui doivent y être intégrées (voir le principe "mobile first" par F. Charles)

L'impérieuse nécessité d'une hybridation des données


Dans le contexte de rupture actuel, de dérive des continents, de déluge des données "Big Data", on en perd son latin de l'informatique classique, de bonne vieille économie, de la relation client et de son brave multi-canal... faut-il faire le saut des technologies, parier sur ces Big Data ? Et comment s'orienter vers ces nouvelles frontières de l'intimité au vivant ?

A coté de voies de rupture, que privilégient les start-up pariant sur une des infinies innovations ouvertes par l'émergence des frontières et de leurs marges territoriales, la voie de découverte, d'expérimentation, passe par les données. Car toutes les entreprises et organisations ont des données, un historique, un savoir-faire ainsi capitalisé par delà les fluctuations de procédures, d’organisation, et les empilements applicatifs.

Chaudron de Gunterstup
La maîtrise des Big Data, et de fait des transformations et services associés aux nouvelles frontières, passe par ces données. Une première étape, rarement réalisée, est de mettre de l'ordre dans les silos, et de capitaliser sur des puits de données, au sein du patrimoine existant, pour le simplifier et préparer les migrations.
Puis, l'hybridation des données classiques avec celles qui émergent des événements intimes, est une nécessité stratégique. Elle devrait agiter les entreprises et organisations dans un projet transversal, mobilisateur et passionnant car au confluent de tous les savoir-faire et des nouveaux enjeux.

Encore une autre image vient à l'esprit : sacrifier, pour se donner des chances de belle récolte, au chaudron pour hybrider les données, un lieu où on mixe données classiques et données candidates issues des nouvelles sources, exploitant les API des réseaux sociaux,et autres avatars (Open Data, Hackathon, projets de start-up, ...), un lieu d'expérimentation, où cette mixture mijote, à l'image du chaudron de nos anciens. Une métaphore de plus ! Pourquoi pas un lac ? The Data Lake ? Voir à ce sujet l'émergence de ce concept.
Qu'importe l'image : entreprises et organisations doivent passer, du fonctionnement formel actuel, à une interaction plus intime avec les cycles de vie, à la révolution de l'accès au vivant. Cela ne se fera pas en un jour, et nécessitera cette hybridation, par l'expérimentation, puis l'industrialisation.

Chaudron de Gunterstup (détail)