Entre réalité, perceptions, attentes et inquiétudes, le Big Data (collecte et gestion des données numériques) questionne. Le grand bouleversement parfois qualifié de révolution, était au centre des réflexions à La Maison des Polytechniciens (le 28/09/16), à l’occasion d’un petit-déjeuner débat organisé par HEC Paris et l’Ecole polytechnique avec Viavoice, animé par Jean-Philippe Moinet, fondateur et directeur de la Revue Civique. Deux invités pour éclairer sur le Big Data et aller « au-delà des données » : Eric Moulines, Professeur au Centre de Mathématiques Appliquées (CMAP) de l’École polytechnique, Médaille d’argent du CNRS 2010 et Grand prix Orange de l’Académie des sciences pour ses travaux sur les statistiques, et Julien Levy, professeur associé d’HEC Paris – Directeur du Centre Digital d’HEC Paris – Directeur de la Chaire AXA Stratégie digitale et Big Data, Consultant en stratégie marketing et stratégie digitale.
…………………………………………………………………………………………………..
En introduction François Miquet-Marty, président de Viavoice, souligne le fait qu’entre aujourd’hui et 2020, « la production de données sera multipliée par 40 ». Une explosion des données qui invite aussi au recul, et qui en appelle à une demande de sens et d’éclairage pour trier ces milliards de données. Viavoice, qui publie son « Baro Eco » (en partenariat avec HEC, L’Express, L’Expansion et BFM Business), s’est penché sur cette question du Big data : Si 59% des cadres interrogés affirment que le Big data va changer notre façon de travailler, ce dernier fait aussi peur : pour 82% des cadres, il existe d’importants risques pour la protection de la vie privée et la sécurité des données personnelles. Le Big data c’est donc une réalité, mais aussi des mythes et des perceptions. Des espoirs mais aussi des inquiétudes qui se multiplient.
Il faut, d’abord, revenir sur le volume de données qui explose : Eric Moulines rappelle que celui-ci « est multiplié par 2 tous les 18 mois avec 50 To (tera octets) de données par seconde en 2015, et 3 milliards d’internautes ». Le Professeur au Centre de Mathématiques Appliquées (CMAP) de l’École polytechnique précise aussi qu’il y a deux types de données : les données d’entreprise et les données non structurées, en sachant qu’il y a des « volumes colossaux de données dans les mails, sur Facebook, Youtube, et de plus en plus d’objets connectés et encore plus de flux de données ».
Le premier obstacle à franchir
La taille des données et le fait de travailler avec des données très hétérogènes (données capteurs et données textuelles) constitue donc le premier obstacle à franchir. Avoir du Big data, c’est avoir de très grands modèles. Ce traitement de données qui s’appuie en fait sur des algorithmes sophistiqués, est confronté, selon Eric Moulines a trois autres difficultés majeures : « le multilinguisme, les problèmes de vélocité, et la question de la protection-sécurité des données ». Un défi à la hauteur des enjeux qui, eux aussi, sont particulièrement importants : maîtriser les nouvelles architectures de données de calcul passe par le développement de nouveaux outils pour le traitement de la donnée brute. Autrement dit, il faudra développer les nouveaux paradigmes d’apprentissage statistique.
Bien sûr, la donnée demeure, in fine, une étape et non une finalité, celle-ci étant de « passer des données aux connaissances » selon Eric Moulines, qui constate que « l’expression Big data est en train de baisser car on commence à parler de « Smart data », ce qui est mieux ». Pour aller au-delà des données, pour les valoriser et leur donner du sens, pour passer du big data au smart data, « il faut croiser des données structurées et la masse de données non structurées » ajoute Eric Moulines. Le Smart data permet alors de découvrir de nouvelles connaissances (à travers les signaux faibles) et offrir de nouveaux services et usages.
« C’est bel et bien à un changement de paradigme auquel nous assistons. Il ne s’agit plus d’organiser les données, mais il s’agit en réalité de les exploiter : tout transformer en données pour tout transformer par les données » témoigne le professeur à HEC Paris Julien Levy, qui constate que l’on assiste « à une numérisation du monde où les technologies numériques ont crée une capacité extraordinaire pour produire des données de tous types ». (90% de toutes les données mondiales créées ces deux dernières années selon IBM).
L’avantage concurrentiel
Le Directeur du Centre Digital d’HEC Paris illustre ce changement de paradigme et en vient à l’utilité concrète et opérationnelle du Big data en citant l’exemple de deux applications : Neoface et Futura. Neoface s’appuie sur une technologie utilisant caméras et cloud pour faire du trading et de la reconnaissance faciale. Autrement dit, numériser une foule qui entre dans un magasin. Autre exemple, celui de Futura, un logiciel de Big data qui analyse les informations émises par des machines connectées dans un système de production afin d’anticiper et prévenir les risques. Julien Levy prend aussi l’exemple de Airbnb qui, selon lui, « libère trois forces de l’économie contemporaine : les entrepreneurs individuels, Internet (collecter la Planète) et les logements qui sont souvent sous-exploités ». Même cas de figure pour Uber qui « localise l’utilisateur, anticipe la demande pour orienter les chauffeurs et gère les paiements ».
Au-delà de ces exemples, Julien Lévy dessine une cartographie générale du Big data autour de quelques grands domaines d’application : « l’innovation d’offres ou de modèles économiques, améliorer l’expérience clients, accroître la performance, adapter l’organisation interne en entreprise ». L’entreprise, une sphère où « il faut une gouvernance des données, soit une vraie politique de collecte des données » selon Julien Levy. Car pour lui « la numérisation des données en entreprises est un enjeu stratégique qui s’impose, les données étant des sources d’avantage concurrentiel pour les entreprises. A condition d’avoir les outils et les compétences adaptés, donc de bons managers pour les gérer ».
Bruno Cammalleri
Copyright Photo Jeremy Barande École polytechnique
(septembre 2016)