Qu’est-ce que le big data ? Quels sont les risques liés à l’utilisation des données personnelles ? Qu’est-ce que le RGPD ? Comment la data peut-elle transformer la place de l’humain dans la société ?

Les nouveaux outils de communication digitaux se sont imposés dans les échanges personnels et professionnels. Les marques s’en saisissent pour engager une conversation plus personnalisée et immédiate avec leurs consommateurs. La qualité de ces échanges dépend beaucoup de la précision et de la pertinence des informations transmises. Pour une marque, la connaissance client devient le centre de toutes les convoitises et les données personnelles sont une nouvelle richesse essentielle. Leur utilisation et leurs échanges soulèvent des problèmes éthiques mais remettent aussi en question le statut des humains qui ne semblent plus considérés que pour et par leurs données.

 

Qu’est-ce que le big data ?

La CNIL, Commission Nationale de l’Informatique et des Libertés, définit une donnée personnelle comme « toute information identifiant directement ou indirectement une personne physique. »1 Un nom, un numéro d’immatriculation, un numéro de téléphone, une photographie, une date de naissance, une commune de résidence ou encore une empreinte digitale sont autant de données personnelles. La CNIL rappelle que « des données que vous pourriez considérer comme anonymes peuvent constituer des données à caractère personnel si elles permettent d’identifier indirectement ou par recoupement d’informations une personne précise. »2

L’expression « big data » désigne l’ensemble des données massives ou mégadonnées. Chaque jour, 2,5 trillions d’octets sont générés et 90 % des données actuellement en circulation ont été créées au cours des 2 dernières années.3 A l’ère du big data, ces données sont issues de supports de plus en plus nombreux et divers. Le big data représente un enjeu majeur et selon la compagnie CSC, la génération annuelle des données augmentera de 4 300 % d’ici à 2020.4

L’expression « big data » apparaît pour la première fois en 1997 dans un article publié par Michael Cox et David Ellsworth.5 Ces deux chercheurs à la NASA identifient le « problème du big data » qui se manifeste « lorsque les paquets de données ne tiennent pas dans la mémoire principale, lorsqu’ils ne tiennent pas sur le disque local. La solution la plus courante consiste alors à acquérir plus de ressources. »6 La puissance des processeurs ne cesse d’augmenter, permettant des capacités de stockage supérieures. La loi de Moore énonce ainsi que le nombre de transistors par circuit de même taille double tous les 18 mois, impliquant une croissance exponentielle de la puissance des ordinateurs.7

Ces flux de données de plus en plus denses posent des questions quant à leur consommation en électricité. En 2018, le minage de bitcoin en Islande utilisera plus d’énergie que l’alimentation des foyers8 et déjà les échanges de bitcoin dans le monde nécessitent une consommation supérieure à celle de 159 pays, dont par exemple le Maroc ou la Hongrie.9

Cette explosion de données peut représenter une opportunité pour les marques afin de renforcer leur connaissance clients, à condition d’en saisir les enjeux et les contraintes.

 

Quel est l’intérêt de la data pour une entreprise ?

Les données sont une oportunité à saisir pour les marques dans l’amélioration de leur connaissance client.
En 2015, une étude de l’Ifop montre que 68 % des Français pensent que le big data fera l’objet d’une utilisation très importante à long terme par les pouvoirs publics et les entreprises et 67 % voient dans les données des avantages à court terme pour la santé et le bien-être des individus.10

En 2013, les dirigeants d’entreprise étaient déjà 46 % à considérer l’utilisation des données de leurs clients et prospects comme un enjeu important et 26 % comme un enjeu stratégique. 84 % y voyaient une opportunité de conquérir de nouveaux clients, 83 % de développer la fidélisation, 82 % de renforcer la capacité à innover, 79 % de valoriser l’entreprise et 65 % d’améliorer son image et sa réputation.11

Les possibilités offertes par la data sont vastes. Le data marketing, soit le marketing basé sur l’utilisation des données,12 favorise le ciblage comportemental et introduit des processus d’achat publicitaire automatisés et optimisés.13 Le programmatique permet notamment l’automatisation de procédures marketing. 93 % des mobinautes de 15 à 60 ans se déclarent conscients que leurs données sont utilisées pour recevoir de la publicité personnalisée.14

Les données de localisation sont aussi un atout essentiel pour affiner le ciblage géographique et améliorer les dispositifs web-to-store. Les entreprises utilisent le geofencing pour envoyer des messages ou notifications aux utilisateurs lors de leur passage dans une zone géographique précise, par exemple à proximité d’un magasin.15

Le marché du data marketing semble promis à un bel avenir, alors qu’il représentait déjà 1,7 milliards d’euros en 2016, soit une progression de 26 % en 5 ans.16

 

Quels sont les risques liés à l’utilisation des données personnelles ?

L’utilisation massive et les échanges de données personnelles posent de nombreuses questions éthiques et sécuritaires. Le sujet est sensible et les consommateurs n’ont pas confiance en l’utilisation qui est faite de leurs données personnelles. Selon une étude de RSA, ils sont 55 % à admettre avoir intentionnellement donné de fausses informations lors d’un achat.17 D’après BETC, 80 % des consommateurs avertis sont inquiets quant à l’utilisation de leurs données et 68 % pensent qu’il sera impossible de les sécuriser à l’avenir.18 Enfin, 87 % des Français se jugent mal informés sur l’utilisation des données par les entreprises et les organismes publics.19

Le risque majeur issu de l’exploitation de données personnelles est le piratage ou le vol des données. Les cas sont de plus en plus fréquents et médiatisés. Fin 2017, on apprenait qu’Uber avait caché le piratage des données de 57 millions d’utilisateurs un an plus tôt.20 En 2012 déjà, 167 millions de comptes LinkedIn avaient fait l’objet d’un vol de données.21
La France est le deuxième pays le plus ciblé par les piratages de données, derrière les États-Unis et devant la Russie, avec 85,3 millions d’éléments volés entre octobre 2015 et octobre 2016.22

Les principaux risquent concernent l’usurpation d’identité, que la CNIL définit comme le fait d’« utiliser sans votre accord des informations permettant de vous identifier, notamment pour souscrire sous votre identité un crédit, un abonnement, pour commettre des actes répréhensibles ou nuire à votre réputation. »23 Autre pratique qui cible notamment les entreprises : le rançonning, soit le cryptage de données libérables après versement d’une rançon.24
La première mesure à prendre pour se prémunir du piratage est de bien choisir ses mots de passe. Plus d’1 million d’utilisateurs de LinkedIn piratés en 2012 utilisaient le mot de passe « 123456 ».25

La centralisation des données personnelles soulève aussi de nombreux problèmes. En cause, une suprématie des GAFA : Google, Facebook, Apple et Amazon. Dans le marché de la publicité digitale, une quinzaine de médias français se sont associés pour créer l’alliance Gravity.26 L’objectif : mettre en commun leurs bases de données pour contrer Google et Facebook sur le marché du programmatique, alors qu’ils recueillent près des trois quarts des investissements digitaux des annonceurs en France.27 Le Monde et Le Figaro ont annoncé une initiative similaire, sous le nom de Skyline.28 Pour Olivier Mazeron, ancien CEO de GroupM Connect, « les entreprises ont créé leur propre dépendance à Google et Facebook, qui restent les seuls à pouvoir toucher autant de monde, de façon aussi précise et avec une telle performance. »29

Cette concentration d’un grand nombre de données pose aussi des questions sur l’influence qui peut être exercée par les détenteurs de data. Que penser des rumeurs sur les ambitions présidentielles de Mark Zuckerberg aux États-Unis quand on sait que Facebook possède des informations sur la vie privée des citoyens du monde entier ?30 Comment assurer que les détenteurs de nos données n’ont pas de mauvaises intentions ?

Face à ces risques, une contre-attaque s’organise. En France, des associations de parents d’élèves demandent un contrôle de l’usage de Google et Facebook dans un cadre scolaire et la mise en place d’espaces numériques de travail développés en interne.31 Plus largement, le sujet du big data devient un enjeu législatif sensible et la nécessité de poser un cadre légal strict se fait ressentir. Le 15 février 2018, la Commission européenne a jugé inacceptable la lenteur des mesures prises par Google, Facebook et Twitter dans la mise en conformité du traitement des données avec le droit européen.32 C’est dans ce contexte que se met en place le Règlement Général sur la Protection des Données ou RGPD.

 

Qu’est-ce que le RGPD ?

Le RGPD est un texte concernant le traitement et la circulation des données personnelles, appliqué dans toute l’Union Européenne à partir du 25 mai 2018. Il définit des règles que les entreprises utilisant les données de citoyens européens devront suivre sous peine de sanctions pouvant atteindre 20 millions d’euros ou 4 % du chiffre d’affaires annuel mondial.33 Pour la CNIL, chargée de son application en France, « le RGPD est une étape majeure dans la protection des données. Il vise à renforcer l’importance de cet enjeu auprès de ceux qui traitent les données et à responsabiliser les professionnels. »34

Parmi les mesures à prendre, la désignation d’un Data Protection Officer délégué à la protection des données. Il sera chargé d’informer et de contrôler les usages au sein de l’entreprise. Il faudra aussi produire une cartographie de l’ensemble des données collectées et établir un registre précisant les usages qui en sont effectués. Les entreprises devront aussi vérifier que tous leurs prestataires sont également en conformité avec le RGPD et revoir leurs contrats en conséquence. Documenter tous les processus mis en œuvre permettra d’attester de la bonne foi de l’entreprise et de sa démarche.35

Le consentement de l’utilisateur est aussi placé au centre du texte. Il devra être recueilli de manière explicite avant toute collecte de donnée.36 Par ailleurs, l’utilisateur pourra à tout moment demander la suppression de la totalité des données le concernant.

Ces nouvelles obligations pourront être difficiles à mettre en place. Le droit à l’oubli des données peut ainsi entrer en conflit avec l’obligation de conserver certains documents comme les factures. Surtout, les entreprises ne sont pas toujours informées précisément de l’ensemble des mesures à prendre ou ne disposent pas des ressources pour mener ces évolutions. En décembre 2017, seules 51 % des entreprises françaises s’estimaient en conformité.37
Isabelle Falque-Pierrotin, présidente de la CNIL, regrette des « moyens […] clairement insuffisants pour faire face à la marche très importante que le RGPD impose de gravir. L’an dernier, nous avions demandé des moyens supplémentaires. Nous avons obtenu deux créations de poste. […] Nous ne sommes pas au bon étiage. »38

 

Comment la data peut-elle transformer la place de l’humain dans la société ?

Dans un monde où tout est data et où les humains sont identifiés par d’innombrables données, qu’en est-il de ce qui fait leur humanité, leurs émotions, leur personnalité ?
Pour capter ces data émotions, les entreprises utilisent le neuromarketing avec des techniques comme l’eye-tracking ou la constitution de bases de données émotionnelles. Ces datas correspondent à différents comportements des individus qui sont ensuite rattachés à des émotions préalablement définies. Christophe Dané, CEO de l’agence Digitall Makers, prévoit « moins de pollution visuelle au profit d’une meilleure communication commerciale qui correspondra à nos attentes individuelles et émotionnelles. »39

L’humain apparaît comme un être déshumanisé et réduit à des données. Même ses sentiments sont traduits en informations binaires. « L’homme devient intégralement transparent, immatériel. La liberté de choisir, la créativité et l’émancipation sont désormais remplacées par l’anticipation, la prédiction et la régulation. C’est bien plus qu’une révolution numérique ; c’est un véritable projet politique qui est à l’œuvre » dénonce l’essayiste Philippe Vion-Dury dans La nouvelle servitude volontaire.40

Nos données nous échappent. « Si nous, nous oublions ce que nous avons pensé, dit ou fait dans notre passé mais que d’autres, comme Google, ne l’oublient pas, alors Google a un pouvoir potentiel sur nous. Il vous connaît mieux que vous-même. » rappelle Viktor Mayer-Schönberger, professeur à l’Oxford Internet Institute.41

Comment ne pas raviver le mythe du Big Brother, d’une machine omnisciente qui surveille nos moindres faits et gestes ?
En 2018, un assassin a été confondu grâce aux données récoltées par son compteur de pas sur Apple Health. Celui-ci a détecté un changement d’altitude lorsque le meurtrier est descendu sur la rive pour jeter le corps de sa victime dans une rivière.42 Un scénario qui fait écho à la série télévisée Person of Interest, dans laquelle une machine observe tous les individus pour prévoir les crimes potentiels.43 Les coupables sont détectés grâce à l’analyse en temps réel des données issues de leurs objets connectés mais aussi des caméras de surveillance de la ville.

Sans aller aussi loin, prédire l’avenir grâce aux données est déjà possible. C’est le principe du marketing prédictif, qui consiste à traiter et modéliser des comportements clients afin d’anticiper leurs actions futures. Le marketing prédictif utilise pour cela des techniques de datascience et de machine learning de plus en plus complexes.44
SFR détecte ainsi les abonnés susceptibles de résilier prochainement leur abonnement. L’entreprise peut alors lancer des opérations de fidélisation pour retenir ces clients avant qu’ils ne décident de changer d’opérateur.45

« Big Brother est déjà dans nos poches et les paranoïas sécuritaires numériques dans les rets d’une dictature digitale dont nous sommes les victimes actives et consentantes », affirme le paléoanthropologue Pascal Picq dans son livre Qui va prendre le pouvoir ? Les grands singes, les hommes politiques ou les robots.46 Même constat effectué par Yuval Noah Harari dans Homo Deus : « nos données personnelles sont probablement la ressource la plus précieuse que la plupart des humains puissent encore offrir, et nous les donnons aux géants de la technologie en échange de services de messagerie et de vidéos de chats. »47

Dans une interview pour Harvard Business Review, Virginia Rometty, P-DG d’IBM, considère la data comme une nouvelle source de richesse. « Nous croyons que la base de l’avantage concurrentiel dans le futur sera les données. La data est la prochaine ressource naturelle. Pensez au pétrole. L’endroit où il se trouve n’est pas nécessairement celui où se trouve la richesse. La richesse va à ceux capables de le raffiner, de le traiter et d’en faire autre chose. »48

Certains vont plus loin en voyant le big data comme une religion. Cette pensée est explicitée par Yuval Noah Harari dans son livre Homo Deus sous le nom de dataïsme. Le dataïsme est une techno-religion selon laquelle « l’univers consiste en flux de données, et sa contribution au traitement des données détermine la valeur de tout phénomène ou entité ». Tout organisme ne serait alors qu’un assemblage de données traitées différemment. « Selon le dataïsme, la Cinquième Symphonie de Beethoven, une bulle spéculative à la Bourse et le virus de la grippe ne sont que trois configurations de flux de données que l’on peut analyser avec les mêmes concepts et outils. En pratique, cela signifie que les dataïstes sont sceptiques envers le savoir et la sagesse des hommes, et préfèrent se fier au big data et aux algorithmes informatiques. »
La place de l’humain dans une telle société serait profondément remise en question. Pour les dataïstes, « les hommes ne sont que des outils visant la création de l’Internet-de-tous-les-objets. Ce système cosmique de traitement des données serait pareil à Dieu. Il sera partout et contrôlera tout, et les êtres humains sont destinés à se fondre en lui. »
Les humains pourront-ils refuser d’appartenir à un tel système ? Pour l’auteur, ils « veulent juste faire partie du flux de données même si cela signifie renoncer à leur vie privée, leur autonomie et leur individualité. » La théorie des dataïstes exige que toutes nos expériences soient connectées au flux de données, sans quoi elles n’ont aucune valeur ni pour nous-même, ni pour la société.
Le dataïsme veut remplacer la vision homocentrique de la société par une vision datacentrique. Une vision résumée ainsi par Yuval Noah Harari : « Écoutez vos sentiments ! recommandait l’humanisme. Écoutez les algorithmes, ils connaissent vos sentiments ! recommande le dataïsme. »49

 

À suivre : jusqu’où l’humain et le déshumain peuvent-ils se confondre ?

Avec l’essor du big data, les humains sont vus et identifiés à travers l’ensemble de leurs données. La data possède une valeur inestimable à l’heure de l’ultra-personnalisation des relations entre marques et individus.
Ce nouveau modèle questionne le statut de l’humain dans la société. Peut-il perdre sa valeur au profit de ses seules données ? Où poser les limites avant de considérer un humain comme un simple ensemble de données ?

A travers le big data, l’humain se déshumanise. Il semble fusionner avec des éléments déshumains, de manière consentante et insouciante. Une problématique qui rejoint la réflexion autour des humains augmentés de demain et de la fusion de l’humain et du déshumain.

 

Sources

1 « Donnée personnelle », dans CNIL.fr
2 CNRS, « Qu’est-ce qu’une donnée personnelle ? »
3 IBM, « Définition du big data »
4 CSC , « Big data just beginning to explode », 2012
5 Winshuttle,« Le big data et l’histoire du stockage des informations »
6 PRESS, Gil, « A very short History of Big Data », dans Forbes, 9 mai 2013
7 « Loi de Moore », dans Futura-Sciences
8 SYLVESTRE, Stephan, « Quand le minage de bitcoin consomme désormais plus d’électricité en Islande que les Islandais eux-mêmes : bienvenue dans la géopolitique énergétique du monde 2.0 », dans Atlantico, 14 février 2018
9 SERMONDADAZ, Sarah, « La crypto-monnaie Bitcoin consomme plus d’électricité que 159 États dans le monde », dans Sciences et avenir, 29 novembre 2017
10 Ifop, « Les Français et le big data », décembre 2015
11 Ifop, « Les dirigeants d’entreprises françaises plébiscitent une exploitation responsable et régulée des données personnelles », 19 septembre 2013
12 BATHELOT, Bertrand, « Définition : data marketing », dans Définitions marketing, 17 novembre 2017
13 BATHELOT, Bertrand, « Définition : marketing des données », dans Définitions marketing, 17 novembre 2017
14 LALOUX, Geoffrey, « Programmatique et RTB… c’est quoi la différence ? », dans Webmarketing&Co’m, 6 mars 2015
15 CHEVILLOTTE, Bernard, « Qu’est-ce que le geofencing ? », dans 1min30
16 GAVARD, Emmanuel, « Le marché de la data marketing pèserait 1,7 milliards d’euros », dans Stratégies, 9 janvier 2018
17 RSA, « Oubliez les “fake news” : les fausses données envahissent les entreprises du monde entier », 11 février 2018
18 BETC, « iLife – Bienvenue dans la vie sous algorithmes », 2018
19 Harris Interactive, « Big data : qu’en pensent les Français ? », 7 mars 2016
20 P.B., « Uber a payé une rançon pour dissimuler un piratage massif l’an dernier », dans 20 minutes, 22 novembre 2017
21 « LinkedIn victime d’un piratage d’ampleur », dans Le Monde, 6 juin 2012
22 « Vols de données personnelles en ligne : la France, pays le plus touché après les États-Unis », dans Europe1.fr, 18 octobre 2017
23 « L’usurpation d’identité en questions », dans CNIL .fr, 10 novembre 2015
24 ENGELHARD, Jean-Marc, « Cybercriminalité : comment échapper au rançonning ? », dans Le Mag experts & décideurs, 22 février 2016
25 DUMONS, Olivier, « Piratage de LinkedIn : arrestation du principal suspect », dans Le Monde, 21 octobre 2016
26 MADELAINE, Nicolas, « Publicité : les médias français alliés pour mieux contre les Gafa », dans Les Échos, 5 juillet 2017
27 «  Gravity : une alliance data pour et avec les annonceurs », sur UDA.fr, 11 août 2017
28 DELCAMBRE, Alexandre, « Les groupes Figaro et Le Monde s’allient dans la publicité », dans Le Monde Économie, 6 juillet 2017
29 FAGES, Clément, « Facebook, Google, les GAFA et moi et moi et moi », dans emarketing.fr, 28 novembre 2017
30 RONFAUT, Lucie, « Mark Zuckerberg, futur président des États-Unis ? », dans Le Figaro, 19 janvier 2017
31 RAFFIN, Nicolas, « Les données personnelles des écoliers français vont-elles échapper à Google ? », dans 20 minutes, 15 septembre 2017
32 « Les géants du web réprimandés par la commission européenne », dans Stratégies, numéro 1938, page 23, 22 février 2018
33 LAUSSON, Julien, « RGPD : 10 questions pour comprendre le nouveau règlement sur la protection des données », dans Numerama, 15 février 2018
34 « RGPD : comment la CNIL vous accompagne dans cette période transitoire ? », dans CNIL.fr, 19 février 2018
35 SEQUEIRA MARTINS, Gilmar, « Six étapes à suivre pour être en conformité avec le RGPD », dans Stratégies, numéro 1937, pages 36 à 38, 15 février 2018
36 FRAMMERY, Catherine, « Le RGPD, la révolution du consentement », dans Le Temps, 11 février 2018
37 Proofpoint, « RGPD : entre perception et réalité », 5 décembre 2017
38 DEBES, Florian, « Isabelle Falque-Pierrotin : Données personnelles : La CNIL fera preuve de souplesse et de pragmatisme », dans Les Échos, 18 février 2018
39 MOUGENOT, Pascale, « Data en quête d’émotions », dans Stratégies, 11 avril 2016
40 VION-DURY, Philippe, « La nouvelle servitude volontaire : enquête sur le projet politique de la Silicon Valley », éditions FYP, 10 octobre 2016
41 LECHNER, Marie, « Google vous connaît mieux que vous-même », dans Libération, 12 novembre 2009
42 VAAS, Lisa, « iPhone’s Apple Health data used as evidence in murder trial », dans Naked Security, 15 janvier 2018
43 NOLAN, Jonathan, « Person of Interest », 2011
44 BATHELOT, Bertrand, « Définition : marketing prédictif », dans Définitions marketing, 10 février 2017
45 MAUCHAMP, Philippe, « Marketing prédictif : une révolution portée par le big et le smart data », dans Les Échos, 24 février 2015
46 PICQ, Pascal, « Qui va prendre le pouvoir ? Les grands singes, les hommes politiques ou les robots », éditions Odile Jacob, mai 2017, pages 300 et 301
47 HARARI, Yuval Noah, « Homo Deus : une brève histoire de l’avenir », éditions Albin Michel, 30 août 2017, page 366
48 IGNATIUS, Agi, « N’essayez pas de protéger le passé, un entretien avec Virginia Ginni Rometty, P-DG d’IBM », dans Harvard Business Review France, numéro 25, page 113
49 HARARI, Yuval Noah, « Homo Deus : une brève histoire de l’avenir », éditions Albin Michel, 30 août 2017, pages 395, 396, 410, 414, 415, 416, 419 et 421