Mes prédictions pour 2019 : Objets, données, mais surtout algorithmes

Au cœur du cycle objets, données, algorithmes, les données sont un composant essentiel. Mais n’oublions pas les algorithmes, dont l’explicabilité et l’auditabilité, deviendront en 2019 un élément stratégique. Une gouvernance des données, mais également de ces algorithmes ; Et quelques regards lancés à titre d’information en direction de l’informatique quantique : voici ce qui me semble important en 2019 dans le monde de la science des données.

Début d’année, période des vœux, mais également tradition des prévisions. Les éditeurs s’attellent à un exercice complexe : prévoir le futur à court terme, ou plus exactement prévoir le futur qui les arrangera, et mettra en lumière des « tendances » qui sont, comme par hasard parfaitement en phase avec les solutions qu’ils proposent. Un travail de compilation des différentes prévisions, complexe et finalement inintéressant, mettrait certainement en lumière que tout, et son contraire, est finalement prévu pour cette année 2019. Alors s’ils le peuvent, pourquoi ne partagerais-je pas moi aussi mes prédictions, ou plus modestement, ce qu’il me semble important de positionner sur sa feuille de route en 2019, et donc ce qui sera sur la mienne.

Une économie de plus en plus orientée données, donc l’importance confirmée d’une stratégie de collecte, de stockage et d’analyse des données

Aucune entreprise sérieuse ne peut en 2019 faire fi des données qu’elle est susceptible de collecter, auprès de ses clients, de ses outils de production, de son personnel, etc. Tout ou presque peut générer des données. Le développement de l’internet des objets (IoT), principalement dans sa version industrielle (IIoT) permet de « faire parler » des objets inanimés, c’est-à-dire de leur faire émettre des données ; un camion de livraison, le badge d’entrée, le parcours client… les possibilités sont infinies. Et même si l’on n’a pas encore conscience des applications possibles, le plus important est d’en collecter les données. Quitte à les mettre en attente, dans un outil adapté comme le lac de données (data lake), avant de les structurer puis de les analyser le temps venu, dans un entrepôt de données (data warehouse) classique.
Et ce n’est pas au moment où vous saurez comment les analyser que vous pourrez constater que vous n’en avez pas recueilli assez ! Cela prend du temps, et il n’y a aucun moyen de l’accélérer. Donc, en 2019, saisissez toutes les opportunités, collectez un maximum de données, organisez-les dans un lac de données, et préparez-vous à les analyser.

Ces données sont une des trois composantes d’un cycle à valeur ajoutée : objets, données, et algorithmes. Les données sont aujourd’hui essentiellement générées par des systèmes automatisés. Ils sont déjà plusieurs milliards dans le monde, ces objets connectés, essentiellement dans le monde industriel. Stockés dans des lacs de données, ces futurs Geopbytes de données doivent être analysés. C’est le rôle des algorithmes. Et ces algorithmes que certains esprits forts appellent à tort de « l’intelligence artificielle » sont en réalité des systèmes automatisés. Ils prennent des décisions complexes, programmées par des humains, mais ils les prennent à toute vitesse. Et ils transmettent ces décisions aux objets connectés, qu’ils pilotent. D’où le cycle représenté par le schéma ci-dessus.

Les algorithmes : ces êtres animés que vous comprenez mal, et c’est grave !

Mais quels sont donc ces petits êtres bizarres nommés « algorithmes ». Ce ne sont finalement que des méthodes, des processus, décrits au travers d’un langage de programmation. Rien de mystérieux donc. A condition qu’ils soient localisés, documentés, référencés, qu’on garde la trace de leur existence, et contrôle un minimum leur fonctionnement.
Rien de magique dans un algorithme, il est défini par l’Homme, et programmé par la suite (aujourd’hui par l’Homme, demain par la machine qui saura transformer un algorithme en programme). En revanche, il s’en développe beaucoup, chaque jour ou presque.
Et ils se chargent de tâches de plus en plus stratégiques : accorder ou pas un prêt à un client, valider ou refuser un investissement, calculer le taux d’un crédit, calculer une prime d’assurance, déterminer quels clients sont à récompenser pour leur fidélité, quels candidats seront reçus en entretien, etc.
Ne pas les gérer, ces algorithmes, c’est un peu comme si vous embauchiez des salariés, sans en faire la liste, sans savoir où ils sont, ce qu’ils font, comment ils le font, sans les contrôler… ce serait absurde et vous ne le feriez pas ! Donc, ne le faites pas non plus avec vos algorithmes.

En termes d’algorithmes, les mots nouveaux à intégrer dans votre vocabulaire seront :
- Cartographie : savoir quels algorithmes font quoi, avec quelles données, pour répondre à quelles questions, et prendre quelles décisions ;
- Explicabilité : savoir comment sont prises les décisions de ces algorithmes. Toute décision doit être analysable, et explicable. Ne serait-ce que pour vérifier que l’algorithme applique les règles définies par votre organisation. Souhaitez-vous que l’égalité hommes-femmes soit respectée, que certaines données ne soient pas utilisées dans une prise de décisions, etc. L’explicabilité de l’algorithme vous permettra de le vérifier ;
- Auditabilité : c’est le pendant de l’explicabilité. Votre service d’audit interne devra apprendre à auditer les algorithmes, tout comme il sait auditer les procédures manuelles ;
- Labellisation : car sans doute, pour rassurer vos clients, vous conformer à la loi, communiquer sur l’éthique et la responsabilité sociale de votre organisation, sera-t-il nécessaire que cet audit de vos algorithmes soit fait par un organisme indépendant.

En 2019, vous allez initier, si ce n’est déjà fait, une démarche de référencement, de cartographie détaillée, de l’ensemble des algorithmes de votre organisation. Cette cartographie, reliée aux données utilisées, sera un élément clef de votre gouvernance.

Cessez de voir la gouvernance sous l’angle informatique. Dans une économie de la donnée, la gouvernance dépasse largement une simple cartographie des bases de données. C’est d’ailleurs un sujet trop complexe pour être confié seulement à des informaticiens (je ne vais encore pas me faire des amis). Ils font bien sur partie du projet, mais la gouvernance des données et des algorithmes implique l’ensemble des métiers de l’entreprise, et l’informatique dans son rôle de support. C’est un projet indispensable au développement de l’économie des données, et il doit être piloté par la direction générale.

Veille stratégique à long terme : Commencez à jeter un œil sur l’informatique quantique

Aucune urgence ! Les premiers bénéfices sont attendus d’ici quatre à cinq ans, pas moins. Mais les domaines de la finance, des prédictions complexes, vont être bouleversés par les premiers développements de l’informatique quantique. C’est un sujet pour l’instant très compliqué, les premiers programmes sont proches de l’assembleur des années 70-80. Et les architectures matérielles, refroidies à proximité du zéro absolu, restent réservées aux centres de recherche de IBM ou Google.
Il n’y a donc pas urgence, mais je vous garantis que dans les années qui viennent, si les recherches se poursuivent au rythme de ces deux dernières années, l’informatique quantique viendra compléter nos systèmes actuels. Positionnés comme « services » dans le cloud, les premiers systèmes quantiques révolutionneront le chiffrage, et le déchiffrage ; mais participeront également à des algorithmes d’analyse comportementale complexe. Un exemple d’analyse qui pourrait en bénéficier, le projet KAIROS (Knowledge-directed Artificial Intelligence Reasoning Over Schemas) de la DARPA, de développement d’un système pour trouver l'ordre dans le chaos et de tenter de comprendre tant les grands que les plus petits événements mondiaux… Et même si vous ne mettrez rien en œuvre en 2019 en matière d’informatique quantique, ce que vous lirez et apprendrez, sera passionnant. Suivez donc dès maintenant l’actualité de l’informatique quantique !

Bonne année 2019 à tous, sous le signe des objets connectés, des données et des algorithmes.