Fing
06/07/2010

Lift10 : Journaliste de données, c’est quoi ?

En préfiguration de Lift France, l’un des ateliers était consacré au Journalisme de données, cette “nouvelle” façon de faire du journalisme, en utilisant les données comme matériel pour construire de l’information. Qu’est-ce que le data journalisme ? Quels sont les enjeux ?

Le journalisme de données, c’est l’exploitation de données sous des formats plus ou moins structurés, explique Lideth Rodriguez Solorzano, animatrice de l’atelier. Pour Nicolas Keyser-Bril, l’un des rares journaliste de données de l’assemblée, qui travaille dans l’équipe regroupée par Owni.fr, qui regroupe statisticiens, journalistes, designers et développeurs (voir l’article de présentation d’Alice Antheaume sur l’un des blogs de Slate), le journalisme de donnée s’inspire du travail précurseur d’Adrian Holovaty et ses cartes du crime de Chicago, qui étaient l’un des premiers mashups développé via Google Maps. Le journalisme de donnée, c’est une nouvelle façon de raconter des histoires, allant du webreportage à la visualisation de données.

Une narration visuelle

Pour Caroline Goulard, qui vient de lancer le site ActuVisu, un laboratoire de la visualisation de données, ce qui définit cette nouvelle profession ce sont les données. Le travail de journaliste de données consiste à exploiter des données que ce soit en amont d’un reportage comme d’utiliser des bases de données avec de nouveaux formats de visualisation. La définition commence avec le terme de Data. Pour le journaliste traditionnel, la brique de base est l’article. Le journaliste travaille sur la narration. Avec les données, on n’est plus dans la narration verbale, mais dans une narration construite autour d’éléments grammaticaux qui appartiennent au lexique visuel. Le journaliste de donnée s’adresse à l’intelligence visuelle.

C’est un usage qui vient s’ajouter aux autres formes de journalisme, pour conceptualiser et visualiser l’information. Le but n’est pas de remplacer le journalisme, mais de trouver un angle nouveau pour traiter une question, qui entre pleinement dans la panoplie des outils du journaliste qui se demande face à un sujet comment le traiter : sous forme de brève, d’interview, d’enquête… L’angle data est un angle de traitement parmi d’autres.

Les chiffres sont aussi subjectifs que les mots

Quand on fait du datajournalisme, on apporte une vision aux données qu’on récupère ou dont on dispose, explique Nicolas Kayser-Bril, en y apportant un travail d’éditorialisation. Comme par exemple, l’agenda d’Obama développé par le Washington Post qui montre l’importance des questions qu’il aborde, explique Lisbeth Rodriguez. Ici, le but est de rendre lisible l’information en provenance de l’agenda du président américain, autrement. UUne TreeMap, une forme de visualisation qui fait apparaître les structures hiérarchiques. Mais la forme n’est pas sans critique, estime un participant. Qu’est-ce qui préside à la spatialisation de cette visualisation ? La représentation qu’offre la corte à un rôle, une valeur, un sens… Typiquement, dans cette visualisation, on remarque d’abord ce qui est au centre du tableau, ce qui est mis en valeur avec certaines couleurs plus que d’autres… La représentation, même faite par des algorithmes, n’est pas objective.

“Mais le datajournalisme ne prétend pas tout objectiver, au contraire”, rappelle Charles Nepote en charge du projet Partage de données publiques à la Fing. “Comme c’est déjà le cas avec les mots, les graphiques n’objectivent pas tout”.

Tout à fait, insiste Caroline Goulard. Un schéma est plus clair qu’une liste. Cependant, le datajournalisme est aussi subjectif qu’un article. La seule différence est que la médiation ne passe pas par les mêmes outils. Jouer avec des données, permet de construire des interprétations. Manipuler les données permet, comme les mots, de raconter une histoire. Il y a un travail important sur le sens, les couleurs, les représentations, les volumes… à la manière de ce qu’expliquaient il y a déjà longtemps les précurseurs Edward Tufte ou Jacques Bertin en France. La médiation visuelle n’est pas nouvelle. Elle s’accompagne de légendes, d’explications… Elle ne se livre jamais seule.

La visualisation… un outil relationnel

Avec le journalisme de données, on n’est pas seulement dans le registre visuel, il y a aussi la dimension de manipulation et d’interaction : on retient mieux quelque chose quand on peut manipuler les indicateurs. Cela renforce le mode d’engagement que le lecteur peut avoir avec l’information, explique encore Caroline Goulard. On n’a pas la même attention quand on doit personnaliser ses parcours, manipuler des données que quand on lit un article. C’est important dans la question de la relation avec le public, mais aussi dans le modèle économique.

Car la question du journalisme de données est bien avant tout économique. Il permet de créer un contenu à forte valeur ajouté, qui rend crédible d’autres modèles économiques : il permet de mieux exploiter le côté immersif du modèle publicitaire, il favorise le modèle de paiement direct (comme le propose aujourd’hui Blomberg avec ses tableaux d’analyses financières en temps réel…). Alors qu’il demeure difficile de valoriser des contenus facilement duplicables, comme des articles, il est peut-être plus facile de monétiser des contenus plus différenciants, comme des visualisations. Les visualisations sont des machines à pages vues, rappelle l’animateur de l’atelier. En ce sens, tout le monde voit bien l’intérêt économique pour autant que les coûts de développements ne soient pas prohibitifs même pour de petites équipes rédactionnelles. Certes, explique Caroline Goulard, le datajournalisme ce n’est pas du temps court : cela prend du temps pour apprendre, pour former. Mais l’avantage des dispositifs de data journalisme est que leur pérennité peut-être plus longue, si la base de données demeure active et à jour.

On peut raconter des histoires depuis tout types de données, s’amuse Nicolas Kayser-Bril, en prenant l’exemple d’un fichier de vente aux enchères trouvé dans les locaux de la Chambre de commerce et d’industrie de Marseille où se tenait l’atelier. A partir d’un simple listing d’objets, on pourrait observer qui a acheté le plus d’objets, quels sont les acheteurs qui les ont payés au meilleur prix, etc.

Mais la donnée est-elle de l’information ? demande Xavier de Porte. Il y a des graphiques sur la durée de possession de balle par les joueurs lors d’un match de foot, mais cela n’a aucun rapport avec les résultats du match. Oui, le journalisme doit s’emparer des données, mais pour en faire quoi ? Pour dire quoi ? Que représente-t-on et que cherche-t-on à représenter ? S’il est un processus pour lire la complexité du monde de l’information, quel nouveau processus de relation à l’information introduit-il ?

Dans le Guardian, en bas des articles en ligne, on peut souvent accéder aux données que le journaliste a collecté pour faire son article.De même, le Guardian invite les lecteurs à créer des infographies pour les publier sur un groupe Flickr. Ces exemples montre que le journalisme de données peut aussi tisser un autre rapport avec le lecteur en terme de participation et de confiance. Oui, mais rappelle Nicolas Keyser-Bril, le datajournalisme ne change rien à la confiance en soi. Il pose les mêmes question que le journalisme traditionnel, d’autant qu’on peut manipuler les données comme l’information. Un site russe a ainsi manipulé une carto des lieux de cultes en Russie en augmentant le nombre de mosquées. Reste que le recours aux lecteurs peut-être important. Nicolas Kayser-Bril, évoque le projet de localisation des bureaux de vote en France lancé par Owni, pour lequel il a fallu exploiter des données non mises en formes. Owni a construit un outil basique pour que quelque 300 internautes saisissent 13 000 adresses de bureaux de vote à la main. Un journal belge a utlisé le même système pour évaluer l’état des pistes cyclables.

Le Guardian a ains fait analyser par les internautes 60 % des 75 000 feuilles de frais des députés britanniques qu’ils ont récupérées. Saut que le crowdsourcing peut également connaître des limites, rappelle Philippe Kerignard, notamment quand il devient commercial. Il peut aussi servir à injecter de fausses données. Et de faire référence à une société commerciale qui recrute et rénumère des gens pour donner des notes aux applications iPhone et les faire évoluer dans le classement.

La donnée… une autre manière de raconter des histoires

Le journalisme de données réconte également l’essor du storytelling, car il consiste finalement à raconter une histoire d’une autre façon, à l’adapter, à la rendre plus interactive. Le but n’est pas de construire un nouveau jargon, mais bien de revenir à l’histoire, via les données.

L’assistance semble demeurer sceptique en partie. Diversifier les données et les équipes de rédaction suffit-il à faire un meilleur journalisme ? Ne risque-t-on pas d’aller vers un fétichisme du chiffre, avec des données qui peuvent être manipulées facilement ? Oui, reconnaît Caroline Goulard, le problème du traitement de l’information, de la fiabilité des sources demeure le même que dans le journalisme traditionnel. Il faut néanmoins un meilleur journalisme pour analyser les données qui sont devenus plus nombreuses. Cela ne remet pas en question l’éthique du journalisme. Le journalisme de données est un journalisme comme un autre. L’exploitation du chiffre est un éclairage aussi subjectif que l’utilisation des mots.

Néanmoins, il peut être utile pour expliquer des phénomènes complexes, à travers une représentation claire. Si le journalisme s’empart des données, c’est parce qu’elles se démultiplient à l’heure du web. Il devient un intermédiaire entre les données et le lecteur, pour l’aider à trier, à comprendre, à voir… Le journalisme de données est également porter de valeur d’investigation. Il représente les nouvelles possibilités du web appliquées au journalisme, conclut Caroline Goulard.