En 10 ans, le journalisme de données ou « datajournalisme » est passé d’une expérience de niche à un rôle clé au sein des rédactions du monde entier. Pour comprendre comment il a changé au cours de ces dernières années, nous sommes allés à la rencontre de Simon Rogers, le fondateur du Datablog du Guardian, publié pour la première fois en 2009. Voici ce qu’il nous a expliqué de son voyage à Londres jusqu’à la Silicon Valley, où il est maintenant éditeur de données chez Google.
Cette article est initialement apparu sur le Medium de l’European Journalism Centre. Il est republié avec la permission de l’auteure.
Letizia Gambini : Comment vous êtes-vous embarqué dans le datajournalisme ?
Simon Rogers : Quand j’ai décidé d’être journaliste entre ma première et deuxième année d’école primaire, il ne m’est jamais venu à l’idée que cela impliquerait des données. Maintenant, travaillant avec la data tous les jours, je réalise la chance que j’ai. Ce n’est certainement pas le résultat d’un plan de carrière bien pensé, mais je me suis simplement trouvé au bon endroit au bon moment.
A savoir que la façon dont c’est arrivé dit beaucoup de l’état du journalisme de données en 2009, mais je crois également que ça en dit beaucoup sur ce domaine dix ans plus tard.
Adrian Holovaty, un développeur de Chicago qui avait travaillé au Washington Post et fondé Everyblock (fermé en 2013 et repris par la NBC News) , est venu donner une conférence au sein de la rédaction du centre d’éducation du Guardian, dans la Farrigdon Road à Londres. À ce moment-là, j’étais rédacteur pour le journal papier (à cette époque, le centre de gravité), j’avais travaillé en ligne et édité une section scientifique.
Plus Holovaty expliquait la façon d’utiliser des données pour raconter des histoires, mais aussi aider les personnes à comprendre le monde, et plus quelque chose se déclenchait en moi. Non seulement je pouvais le faire, mais cela reflétait aussi ce que je faisais de plus en plus dans mon travail. Peut-être que je pouvais être un journaliste travaillant avec des données, bref, un data journaliste ?
Quel était votre premier projet en tant que data journaliste ?
En travaillant comme rédacteur en chef du service graphique, j’ai accumulé beaucoup de chiffres : Matt McAlister, qui a lancé l’API ouverte du Guardian, l’a décrite comme étant « le gros lot ». Nous avions des données sur le PIB, les émissions de carbone, les dépenses gouvernementales et bien d’autres choses encore, toutes sauvegardées sur une feuille de calcul Google et prêtes à être utilisées la prochaine fois que nous en aurons besoin.
Que se passerait-il si nous publiions toutes ces données dans un format ouvert ? Pas de fichiers PDF, mais juste des données accessibles et intéressantes, prêtes à être utilisées par tous ? C’est ce que nous avons d’abord fait avec le Datablog du Guardian. D’abord, nous avons utilisé 200 jeux de données distincts : les chiffres de la criminalité, les indicateurs économiques, les détails sur les zones de guerre et même des données sur la Fashion Week ou encore les antagonistes de Doctor Who. Nous avons ainsi commencé à réaliser que les données pouvaient s’appliquer à tout.
Cependant, utiliser le mot data lors d’une séance de rédaction suscitait des ricanements. Cela pouvait-il être du « bon » journalisme?
Quand est-ce que les choses ont commencé à changer ?
L’année 2009 a été le début de la révolution des données ouvertes, du open data : la ressource data.gov du gouvernement américain avait été lancé en mai de cette année avec seulement 47 ensembles de données. Des data ouvertes commençaient à être publiées par des pays et des villes du monde entier et diverses campagnes demandaient de plus en plus d’accès.
En un an, nos lecteurs nous ont aidés à collecter des informations sur les dépenses de milliers de députés. Le gouvernement britannique a publié via son système COINS les données sur ses dépenses, et l’équipe du Guardian a créé un outil interactif pour encourager les lecteurs à explorer les deux.
Un an plus tard, l’équipe d’enquête du Guardian a tenté de maîtriser la publication massive de dossiers militaires américains en Irak et en Afghanistan : le journalisme de données était bien établi dans la salle de rédaction. À la fin de l’année 2011, l’année précédant la publication du Data Journalism Handbook, le projet Reading the Riots avait appliqué les techniques de reportage assistées par ordinateur de Phil Meyer dans les années 60 à une flambée de violence en Angleterre.
Que disent ces projets sur l’évolution du data journalisme ?
L’idée n’est pas d’énumérer les projets, mais de mettre en lumière ce qu’il s’est passé durant ces dernières années, non seulement au Guardian, mais dans toutes les rédactions du monde. Le New York Times, le LA Times, La Nacion en Argentine. Partout les journalistes découvraient une nouvelle manière de travailler en racontant, de manière innovante, des histoires basées sur des données. C’est dans ce contexte que la première édition du Data Journalism Handbook est née.
Toutefois, une tendance est apparue très clairement : chaque fois qu’une nouvelle technique était introduite dans les enquêtes, les données n’étaient pas seulement l’élément clé, les journalistes étaient également au centre de celles-ci.
En moins de trois ans, les journalistes ont trouvé des données, publié des ensembles de données, ont fait du crowdsourcing un outil de rédaction reconnu. Les journalistes ont également utilisé des bases de données pour gérer d’énormes décharges de documents et appliqué des techniques de sciences sociales quantitatives pour produire des enquêtes complexes.
Toutefois, cela ne doit pas être considéré comme un développement limité au domaine du journalisme. Il s’agissait en fait des effets de l’énorme développement de la transparence internationale, au-delà de la mise en place de portails de données ouverts.
Pouvez-vous citer quelques exemples de ces développements?
Il s’agit notamment de campagnes telles que celles lancées par Open Knowledge Foundation. Elles permettaient d’augmenter la pression exercée sur le gouvernement britannique pour ouvrir les données d’actualités à un usage public et fournir des API à tous les utilisateurs. Cela inclut aussi l’accès accru à de puissants outils gratuits de visualisation et de nettoyage des données, tels que Open Refine, Google Fusion Tables, Many Eyes (d’IBM), Datawrapper, Tableau Public, etc.
Ces outils gratuits, combinés à l’accès à de nombreuses données publiques gratuites, ont facilité la production d’un nombre croissant de visualisations et d’analyses de données orientées vers le grand public. Des salles de presse telles que Texas Tribune et ProPublica ont commencé à mettre en place des opérations basées sur ces données.
Voyez comme cela fonctionne ! Un cercle vertueux de données, un traitement facile, la visualisation des données, davantage de données, etc. Plus il y a de data disponibles, plus ils sont utilisés et plus il y a de pression pour en obtenir davantage.
Que signifie pour le journalisme de données de devenir grand public?
Lorsque j’ai eu la chance de m’installer en Californie et de rejoindre Twitter en tant que premier éditeur de données, il était évident que la data était entrée dans le vocabulaire de l’édition. Plusieurs sites de journalisme de données se sont développés à quelques semaines d’intervalle, tels que Upshot du New York Times et FiveThirtyEight de Nate Silver .
Le public du monde entier devenait de plus en plus instruit visuellement et comprenait beaucoup plus facilement les visualisations, souvent sophistiquées, des sujets complexes. Vous me demanderez quelle preuve j’ai que le monde est à l’aise avec les visualisations de données? Mon expérience se limite à produire un visuel qui suscite une grande réaction en ligne, mais qui s’avère plus difficile qu’auparavant. Là où nous avions tous l’habitude de réagir à des visualisations avec enthousiasme, il est maintenant plus difficile d’obtenir plus qu’un haussement d’épaules.
Au moment où j’ai rejoint Google News Lab pour travailler sur le journalisme de données, il était devenu évident que le domaine avait accès à des ensembles de données de plus en plus volumineux qu’avant.
Il y a par exemple des milliards de recherches quotidiennement, dont une grande part sont nouvelles. Et de plus en plus de journalistes prennent ces données et les analysent, en parallèle aux tweets et likes de Facebook. C’est comme un pot d’échappement de la vie moderne, inversé et restitué en tant qu’aperçu de la façon dont nous vivons aujourd’hui.
Le datajournalisme est également plus répandu que jamais auparavant. En 2016, les Data Journalism Awards ont reçu un nombre record de 471 inscriptions, puis près de 700 en 2018, dont plus de la moitié issues de petites rédactions, et beaucoup provenant du monde entier.
Et ces entrées deviennent de plus en plus innovantes. L’intelligence artificielle ou l’apprentissage automatique sont devenus un outil du journalisme de données, comme en témoigne le travail sur Buzzfeed de Peter Aldhous. Parallèlement, l’accès aux nouvelles technologies telles que la réalité virtuelle et la réalité augmentée permet aux concepteurs de présenter des données sous des formes nouvelles et plus intéressantes, en rendant les histoires plus réelles et viscérales pour le public.
Pour moi dont le travail consiste à imaginer comment le journalisme de données peut évoluer – et ce que nous pouvons faire pour le soutenir -, cela signifie que maintenant, tout en travaillant à raconter des histoires de données, nous créons des projets pour rendre l’utilisation de ces nouvelles technologies plus facile pour plus de journalistes – par exemple, nous avons récemment collaboré avec le studio de design Datavized pour créer TwoTone, un outil visuel permettant de transformer des données en son.
Quels sont les défis que vous prévoyez à l’avenir?
Les défis sont grands pour nous tous. Nous consommons tous de l’information de manière de plus en plus mobile, ce qui pose de nouveaux défis. Le temps de la visualisation complexe en plein écran est révolu. Désormais, plus de la moitié d’entre nous lit de l’actualité sur nos smartphones ou autres appareils mobiles (un tiers d’entre nous lit les nouvelles aux toilettes, selon l’étude de Reuters sur la consommation d’informations 2017). Cela signifie que de plus en plus, les concepteurs dans les salles de rédaction doivent produire pour des écrans minuscules et des durées d’attention réduites.
Nous avons également un nouveau problème qui peut nous empêcher de tirer les leçons du passé. Le code et les bibliothèques vieillissent et finalement, une grande partie du travail journalistique le plus ambitieux dépérit. Les bases de données de dépenses des députés, Everyblock et d’autres projets ont disparu dans une mémoire institutionnelle évanescente.
Et nous sommes confrontés à un problème plus vaste et de plus en plus alarmant: la confiance. L’analyse des données a toujours été sujette à interprétation et à des désaccords, mais un bon journalisme de données peut y remédier. À une époque où la confiance dans l’information et un ensemble de faits partagés sont chaque jour mis en doute, le journalisme de données peut nous éclairer, en mettant en lumière les faits et les preuves de manière accessible.
Récemment, nous avons lancé une nouvelle plate-forme pour les passionnés de journalisme de données: dataJournalism.com . Comment cela s’inscrit-il dans le paysage du journalisme de données 2019 selon vous?
Il est très facile pour les journalistes de données de se sentir isolés dans leur quotidien. Souvent, ils travaillent seuls, essayant de résoudre des problèmes complexes que personne d’autre dans la salle de rédaction ne comprend. Ce site aidera les débutants et les autres, du praticien solitaire au membre d’une grande équipe, à se sentir soutenus.
Il s’agit simplement d’un lieu pour voir ce qui a été fait auparavant, comment et quand il est judicieux l’imiter, ce qui fera une énorme différence pour le champ. Il est facile d’oublier que vous n’êtes pas la première personne à essayer quelque chose, mais qu’il y a tout un réseau prêt à fournir de l’aide. C’est ce que ce site fait il nous donne un chez-nous.
Cet article a été traduit de l’original par l’équipe francophone d’EJO.
Tags: data, Databolog, datajournalisme, données, Everyblock, Google, journalisme de données, the Guardian
[…] qu’est-ce qui a changé ?, European Journalism Obsevatory, 6 juin 2019, https://fr.ejo.ch/innovation-et-numerique/decennie-datajournalisme-change-guardian-google-data-donne… (consulté le 21 août […]