Le « Big Data » séduit, bien sûr, l’homo sapiens que nous sommes, toujours à la recherche de plus de puissance, de connaissance et de contrôle sur son environnement.
Pour autant, d’autres voix s’élèvent contre cette approche jugée trop techno centrée qui se caractérise par les 3 V que sont le volume, la vélocité et la variété des données manipulées, en faisant valoir le fait que la connaissance finit par être noyée dans trop de données, que cela coûte globalement très cher pour un retour sur investissement non assuré et que le « Big Data » ne fournit en définitive qu’une vision de la réalité figée sur un moment donné et donc décorrélée de la dynamique temporelle.
Certains auteurs tels que :
- Michael Kremer, auteur de « Croissance de la population et changement technologique de 1 million d’années avant J.C. à 1990 »
- Tertius Chandler, auteur de « 4 siècles de croissance urbaine »
- ou Emmanuel Le Roy Ladurie, auteur de « L’histoire du climat depuis l’an mil »
Dans ce cas de figure, le présent n’est pas considéré comme le mètre étalon. C’est la longue durée qui est au contraire privilégiée car elle permet d’être attentifs aux process et aux interactions dans le temps, les changements s’opérant lentement et de manière imperceptibles. Il en est ainsi de la géologie, de l’astronomie ou de la biologie évolutionnaire (évolution des espèces à travers les âges)... Pour autant, il est très intéressant aussi d’identifier ce qui ne change pas (les invariants).
A titre anecdotique, Google a développé le Google Ngrams Viewer qui permet de tracer l’historique de l’usage d’un mot depuis l’année 1500 à ce jour en s’appuyant sur une analyse de tous les livres numérisés par Google Books !
L’approche « Long Data », c’est aussi ce qui fait dire à Samuel Arbesman que nous n’avons pas besoin de plus d’informations, mais de plus de sens.
>> Le Small Data, des données compréhensibles par l’homme
Rufus Pollock, économiste et fondateur de l’Open Knowledge Foundation, considère quant à lui que le « Big Data » est une fausse priorité et déclare que :
« Les discussions à propos du Big Data passent à côté d’une notion plus importante : la réelle opportunité n’est pas le Big Data, mais le Small Data. Non pas le grand cercle de données centralisé, mais les données éparses. »
Pourquoi ? Parce que le « Small Data » est mieux adapté à la compréhension des hommes et qu’il nécessite moins de moyens matériels et techniques sophistiqués et coûteux. Il connecte les gens avec des idées qui donnent du sens à leur vie et qui sont opportunes. Il utilise des bases de données limitées ou des sources locales. Les résultats, souvent présentés sous une forme visuelle, sont accessibles et compréhensibles, ce qui favorise le lancement d’actions au quotidien.
Enfin, les données accessibles via une architecture centralisée renvoient trop souvent à l’hégémonie ou au monopole d’une organisation alors qu’au contraire, la tendance va dans le sens de l’ouverture, du partage, de la collaboration et de l’intelligence collective, et donc de données accessibles via une architecture distribuée.
>> Complétons avec le « Slow Data »
Le mouvement du Slow a vu le jour avec le Slow Food qui se positionnait en contestation du Fast Food, synonyme de la mal bouffe. Aujourd’hui, il s’étend également aux données et concerne les informations qui nous inciteront à modifier nos comportements, à vouloir changer le monde et à mieux collaborer ensemble au lieu de vouloir consommer et produire toujours davantage.
Il se caractérise par les 3 S que sont le small, le slow et le sure en opposition aux 3 V du « Big Data » et nous interpelle sur le fait que disposer de plus de technologie n’est pas une garantie pour mieux appréhender et résoudre les problèmes. En ce sens, il a un point commun avec la Phase d’Empathie de la démarche Design Thinking dans la mesure où c’est l’humain qui prévaut dans la résolution des problèmes.
En conclusion, on peut affirmer qu’en matière de data, s’il est vrai que la technologie facilite l’acquisition, le traitement et l’analyse des données, elle ne remplace pas pour autant la réflexion des chercheurs et le travail des analystes. L’élargissement des débats et des échanges entre les laboratoires et les instituts de recherche sur un mode collaboratif est également très favorable à une meilleure compréhension des comportements et des usages des utilisateurs dans des domaines extrêmement variés et favorise l’évolution et l’enrichissement des sciences humaines et sociales.