Accueil > Agences & Marques > Reportages > « Les big data : une révolution scientifique aux implications profondes », déclare Stephens-Davidowitz, avec conviction.
Reportages

« Les big data : une révolution scientifique aux implications profondes », déclare Stephens-Davidowitz, avec conviction.

big data et google dangers marseille paris
Partager

« Le prochain Marx sera un data scientist », conclut avec ferveur Stephens-Davidowitz. Ce dernier n’en doute pas une seule seconde : les big data ont érigé les sciences sociales en « vraie science » à l’instar de la physique ou des mathématiques. Les sociologues et autres politologues de l’ancien temps apprécieront. Désormais, ils devront sortir de leur bibliothèque pour plonger dans les entrailles d’internet. Objectif : recueillir des données.

 

Savez-vous que :

 

  • après un ouragan aux États-Unis, les habitants achètent plus de… biscuits à la fraise ;

  • entre 1800 et 2010, on note une utilisation croissante des mots « saucisson » et « pizza » dans les livres ;

  • on peut prédire l’occurrence d’un second rendez-vous entre un homme et une femme sur la base ce qu’ils se sont dit au cours du premier ;

  • Noël est un des jours les plus heureux de l’année.

Ces assertions sont toutes fondées sur les mégadonnées (traduction française !).

 

Au-delà de l’anecdote, toute personne désireuse de comprendre le monde et l’Homme ne peut passer à côté d’elles. Cela ne doit pas être le seul privilège des chercheurs : c’est l’affaire de tous car, en fait, la science des données s’avère extrêmement intuitive. Il s’agit de repérer des schémas et de prédire comment une variable en affecte une autre.

 

S’il ne donne pas une définition des big data, le livre permet indéniablement de mieux saisir la notion.

 

 

La vérité si je ne mens pas

 

Dans son entreprise de démystification, l’auteur défend l’honnêteté de ces données. À l’heure des « fake news », de la désinformation/réinformation/surinformation, du complotisme et autres « faits alternatifs », l’affirmation a de quoi surprendre. En fait, Google serait le nouveau confessionnal. Dans la vie de tous les jours, les gens mentent pour garder les apparences en société : c’est le biais de désirabilité sociale valable également sur internet via les réseaux sociaux comme Facebook régis par l’image et la réputation. Cette propension à mentir a même été quantifiée puisqu’on estime qu’elle prend un tiers de nos vies. Cela peut être problématique lors d’une enquête ou d’un sondage. Ainsi, au cours de la dernière campagne des élections présidentielles américaines, l’électorat pro-Trump aurait été sous-estimé de 2 %, ses composantes n’étant pas forcément enclins à afficher publiquement leur soutien. Il ne faut donc pas s’étonner du résultat final.

 

Au contraire, face à Google, chacun se confie : c’est ce que l’auteur appelle le « sérum de vérité numérique ». C’est en ligne. On est seul : personne n’est là pour nous poser des questions. Surtout, il y a des incitations à l’épanchement. Il peut être difficile d’admettre sa dépression face à quelqu’un. Mais on tape plus facilement la requête pour connaître les symptômes ou les remèdes. Plus généralement, Google a un don pour débusquer les pensées inconvenantes, celles-là même qu’on aurait du mal à dire son entourage le plus proche.

 

 

Google et préjugés

 

Par conséquent, il y aurait ungouffre entre les chiffres officiels, les croyances communes et la « vérité » des big data. En bien ou en mal. Ces derniers nous invitent à remettre en question tout ce que l’on croyait comme acquis dans une démocratie du XXIème siècle comme les États-Unis. Les données démontrent que l’homosexualité est encore mal acceptée, le racisme contre les noirs est toujours virulents et que les préjugés de genre à l’encontre des petites filles sont tenaces (et venant principalement de leurs parents).

 

Seth Stephens-Davidowitz n’hésitent pas à aller dans les recoins les plus sombres de l’activité humaine. Par exemple, si les chiffres des violences faites aux enfants baissent, les recherches Google démontrent l’inverse. Idem avec l’avortement dont les requêtes ont fortement augmenté dans les États où la législation est la plus restrictive en la matière.

 

À l’inverse, dans le domaine politique, les données sont plutôt encourageantes. L’auteur s’inscrit en faux contre la théorie de la bulle de filtre d’Eli Pariser selon laquelle les internautes ne seraient confrontées qu’aux idées avec lesquelles ils sont d’accord. Il y a 45 % de chances qu’une personne lisant la même actualité ait des opinions politiques différentes de vous. La ségrégation sur le web n’est donc pas la règle, pas plus, en tout cas, que dans la vie « hors ligne ». Cela ne devrait pas nous étonner. Le web est constitué de sites de masse qui, par définition, ont une audience diverse. Sur les réseaux sociaux, les internautes sont souvent confrontées à des idées qu’ils ne partagent pas en raison de leur grand nombre d’« amis » et du fonctionnement du fil d’actualité.

 

Pour autant, les big data ne doivent pas nous décourager. Au contraire, l’auteur juge qu’ils peuvent nous aider à améliorer nos vies. Ils démontrent que nous ne sommes pas seuls face à nos problèmes et que nous pouvons trouver des solutions.

 


Big data, big résultats (à venir)

 

C’est la promesse des big data. Au-delà de leur dimension heuristique, elles pourraient être le moteur du progrès dans la santé, l’éducation ou encore le social. Par exemple, leur précision permet de connaître les clés objectives du succès : la présence d’une grande université dans le comté, d’une grande ville, et d’immigrés.

En outre, l’utilisation des techniques de Doppelganger (profils partageant un certain nombre de similitudes) ou d’A/B Testing (le fait de tester plusieurs variantes d’un même objet et de comparer les différents résultats en terme de performance) s’avère particulièrement prometteuse pour la médecine.

 

Au final, au regard des apports et des espoirs que suscitent les big data, tout va-t-il pour le mieux dans le meilleur des mondes de Google ? Non, car il ne faut pas négliger le potentiel de nuisance de cet outil entre des mains mal intentionnées. Demain, des banques pourraient refuser de vous accorder un prêt en raison du vocabulaire que vous employez en ligne, proche de celui des mauvais payeurs. Un recruteur serait susceptible de ne pas vous embaucher car vous aimez les Harley-Davidson ce qui est le signe d’un Q.I. faible. Vous pourriez vous ruiner au casino car celui-ci aurait déterminé au préalable votre « pain point » qui est le niveau de perte au-dessus duquel vous arrêter de jouer. Et ne parlons pas des détournements possibles par les États, y compris pour les meilleures raisons du monde (comme arrêter le « criminel » avant qu’il ne passe à l’acte, façon Minority Report). On regrette d’ailleurs que Seth Stephens-Davidowitz ne fasse que survoler les méfaits du big data. Comme s’il n’y avait qu’une bonne et une mauvaise utilisation et qu’elles ne posaient pas de problème en soi, à commencer par les atteintes à la vie privée. De même, le présupposé selon lequel les recherches Google seraient honnêtes est contestable ce que l’auteur reconnaît par moment (ce n’est pas parce que vous tapez une requête horrible que vous allez vous livrer à une action horrible).

 

Un peu comme si, fasciné par son objet d’étude, il ne serait pas complètement honnête avec lui (un comble !).

 

Une révolution est en marche.

 

Seth Stephens-Davidowitz est peut-être le prochain Marx.

 

 

Article rédigé par Thierry Randretsa

Nous contacter
Les champs indiqués par un astérisque (*) sont obligatoires
Nous contacter
Les champs indiqués par un astérisque (*) sont obligatoires