PICNIC 2010 : Open Data, pourquoi, comment ?

Par dkaplan - 24 septembre 2010

Lors de PICNIC, une journée entière était consacrée aux “données ouvertes”. J’y interviens - d’où le caractère un peu brut de ces notes, 100% temps réel.

Rufus Pollock

Rufus Pollock, économiste britannique et fondateur de l’Open Knowledge Foundation, introduisait cette session.

Son point de départ, comme beaucoup, est la frustration devant la difficulté d’analyser les dépenses budgétaires de son gouvernement (britannique). Celles-ci sont publiques, mais très difficiles à exploiter. Tout le monde peut lire d’énormes documents PDF (ou papier) budgétaires, mais comment analyser les données que contiennent ces documents ?

"Ouvert", ça veut dire quoi ? Pour Pollock, la liberté pour quiconque d’obtenir, utiliser, réutiliser et redistribuer les données. Cela inclut une dimension technique : les données doivent être brutes, mais aussi interopérables - c’est à dire qu’on peut les mélanger avec d’autres données.

De quelles données parlons-nous ? Budgétaires, géographiques, statistiques, réglementaires, électorales… Tout, sauf les données personnelles.

Pour quoi faire ? D’abord, découvrir l’information et la comprendre plus vite : quelle est la meilleure manière d’aller à un endroit ? Quelles actions acheter ? Quel est l’impact du réchauffement climatique ? Les données ouvertes commencent par rendre possible la création d’outils qui permettent d’utiliser ces données.

Quels bénéfices ? Innovation, productivité et confiance.

Quelle équation économique ? L’information est un bien non-rival : si je vous la donne, je l’ai encore. Qui plus est, l’information (numérique) ne coûte rien à copier.

Les données ouvertes permettent de passer à l’échelle de manière beaucoup plus efficace que des données fermées. Si elles sont brutes, on peut les diviser en atomes d’information, puis les recombiner, entre elles et avec d’autres, de multiples manières.

Ce qu’il se passera de plus intéressant avec vos données sera presque certainement imaginé par quelqu’un d’autre.

Les données ouvertes rendent possible une société read/write : tout le monde peut analyser l’information publique et contribuer.

Il y a beaucoup de manières de financer la création sans privatiser les données. D’une part, beaucoup de services (de conseil, d’analyse etc.) se fonderont sur les données. Et les données sont une plate-forme sur laquelle se créeront des services.

Comment démarrer ?

  1. Par quelque chose de rapide, petit, simple. N’attendons pas que tout soit libéré.
  2. En revanche il faut immédiatement traiter la question des licences - www.opendatacommons.org est une ressource essentielle
  3. Créer tout de suite un catalogue de données - qui ne stocke pas les données, mais les référence.
  4. Travailler sur la modularité : créer des “paquets de connaissance”, des API qui rendent la réutilisation plus simple et plus extensive
  5. Impliquer les citoyens et les développeurs : l’ouverture n’est pas une fin en soi, elle n’a de valeur que si les données sont utilisées

Julian Tait, FutureEverything

L’organisateur du formidable festival FutureEverything Julian Tait présentait ensuite le travail qu’il mène sur les données ouvertes avec la ville de Manchester, où le festival se déroule. Tout est parti d’un atelier qui se posait une question ambitieuse : comment la ville évoluerait-elle si toutes les données étaient ouvertes ?

Manchester compte 320 000 habitants, mais dans une conurbation de 2,5 millions de personnes qui pensent toutes vivre à Manchester. En revanche, la gouvernance en est profondément éclatée. Une seule décision dans le bureau d’un maire ne peut pas y accomplir grand-chose.

Pour obtenir l’ouverture des données, le premier levier a été le Freedom of Information Act, qui garantit l’accès aux données (pour des raisons de transparence), mais aux données que les citoyens demandent de manière précise - ce qui suppose qu’ils en aient connaissance… Donc cela ne suffit pas. Il faut convaincre les autorités locales de la valeur que l’ouverture des données représente pour elles, et aussi qu’il y aura de la demande pour ces données.

L’approche s’est donc fondée sur trois piliers :

  1. Créer une communauté d’utilisateurs de données. Il était important de le faire dès le départ, sans attendre qu’il y ait beaucoup de données : des hackers, des associations citoyennes, des chercheurs, des entrepreneurs… Il y a beaucoup d’outils pour le faire, des wikis, les Google groups, Twitter… Il faut vite y inclure des acteurs publics, pour que ces communautés ne se vivent plus “face” aux autorités, mais “avec”. Ce qui pourrait par exemple permettre aux collectivités de demander aux gens les données qu’ils désirent, voire de demander des conseils sur la manière d’ouvrir l’accès à certaines données.
  2. Cibler les gestionnaires de données au sein des collectivités locales. Les décideurs publics ont rarement connaissance des données que leurs services manipulent. Ce sont les informaticiens qui en ont connaissance, qui savent dans quel état elles sont, et comment elles peuvent être mises à disposition. Et on peut même obtenir d’eux qu’ils ouvrent l’accès à certaines données sans enjeux, sans attendre de décision politique.
  3. Puis il faut travailler les décideurs au corps. Pour cela, il faut construire un discours concret, un “récit” des bénéfices des données ouvertes ; et préparer des arguments, parce que les objections seront nombreuses. On peut aussi montrer quel est le coût des systèmes fermés - par exemple, le coût humain pour répondre à des questions qui n’existeraient plus si les données étaient disponibles.

Les difficultés sont essentiellement liées à la peur des autorités locales, vis-à-vis de l’opinion et encore plus de la presse. Les licences sont un problème, et les autorités ne maîtrisent pas tout : par exemple des données géographiques peuvent être construites à partir de bases de données géographiques dont la licence est très restrictive. Enfin, les autorités ne savent pas quelles données elles manipulent, ni où elles sont (sans compter que certaines sont en fait détenues par des sous-traitants privés).

Quels autres risques ? L’inquiétude que les gains en productivité se traduisent en destruction d’emplois. La crainte que l’accès aux données ne donne plus de pouvoir à ceux qui en ont déjà, à ceux qui savent qu’en faire. Nous avons une responsabilité vis-à-vis de ces questions.

Tout cela a bien fonctionné. 33% des données ouvertes du Royaume Uni viennent de Manchester !

Jarmo Eskelinen, Forum Virium

Jarmo Eskelinen, le directeur de Forum Virium Helsinki, que nous avions également invité à Lift France 10, a présenté les “3 M des données ouvertes” : Mandat, Mentalité (Mindset) et Méthodes.

L’un des arguments pour les données publiques est économique. Quelqu’un de la Commission économique a estimé la valeur potentielle des données publiques à 27 milliards d’euros. Mais cette valeur est indirecte : ce que les organismes publics peuvent obtenir en vendant leurs données est infiniment plus bas, d’autant qu’en général ils se les vendent entre eux.

Forum Virium organise chaque année un concours d’applications fondées sur les données publiques. Le gagnant de cette année est un outil mobile qui permet de scanner le code barre d’un livre pour savoir s’il est disponible dans une des bibliothèques municipales.

Et donc, les 3 M :

  • Le Mandat : la directive européenne de 2003 prescrit clairement de rendre les données publiques accessibles et réutilisables - mais elle ne dit pas à quel prix. Mais ça ne suffit pas. Il faut une pression interne.
  • La Mentalité : les deux objections des organismes publics se fondent sur la peur (qu’on fasse quelque chose des données qui leur cause du tort) et le sentiment de propriété. Comment dépasser ces blocages ?
  • Par la Méthode : derrière les peurs affichées, il y a souvent le fait que les détenteurs de données ne savent pas comment les mettre à disposition. Il faut les y aider, leur montrer que c’est bien plus aisé qu’ils ne le croyaient.

L’une des premières tâches de Forum Virium a donc consisté une plate-forme d’échange de données (Helsinki Region Infoshare) : des outils, des référentiels (de métadonnées par exemple), des licences, un annuaire des sources de données, un point de contact pour les administrations, mais aussi les réutilisateurs.

Comment présenter les bénéfices de l’ouverture pour les acteurs publics ?

  • Un meilleur accès à leurs propres données
  • Moins de redondance (tous les organismes publics ont des bases de données, des outils, des cartes… entièrement ou partiellement redondantes - et souvent peu cohérentes)
  • La capacité de créer ou co-créer de nouveaux services - et de mieux penser les partenariats avec des acteurs privés.
  • La création de participation et l’implication, tant des agents territoriaux que des citoyens.
  • Des économies (moins de redondance, moins de facturations absurdes entre départments d’une même organisation publique)
  • De meilleures données, notamment par le retour des citoyens
  • Un retour concret d’informations sur la qualité des informations et des actions publiques.

Et les bénéfices pour les acteurs privés sont… les mêmes. Il n’y a pas de conflit d’intérêt.

Ton Zijlstra

Evoquant l’ouverture des données publiques aux Pays-Bas, Ton Zijlstra (qui intervenait aussi à Lift, mais sur les Fab Labs). Son titre : “Oui„ mais… Non mais…”, deux séquences qui ouvrent beaucoup des réponses des acteurs publics aux demandes d’ouverture des données.

Comme ailleurs, il y a des lois - la directive européenne, une loi sur le droit d’accès aux informations publiques qui date de 30 ans - et la pratique, beaucoup plus restrictive. Il y a des données disponibles, mais interrogeables une à une et non réutilisable ; ou alors très chères ; ou non documentées… Dans les administrations, il y a de bons techniciens qui font d’énormes portails ; et des gens qui n’ont aucune vision technique.

Mais il y a plusieurs problèmes avec l’expression “données publiques ouvertes”. “Public”, c’est quoi ? Plein d’organismes et d’acteurs. Et les “données” ? Une donnée n’existe jamais par elle-même. Et les “réutilisateurs” ? Il faut s’intéresser à leur diversité : les citoyens, les activistes, les programmeurs, les entrepreneurs, les chercheurs… pour des besoins eux-mêmes très différents : participation, contrôle, création de services, amélioration des services publics, productivité interne, usages culturels, associatifs… Sans compter que, comme ailleurs, le plus probable est que les usages vraiment transformateurs émergeront des endroits les plus inattendus.

Donc il faut travailler avec de vrais acteurs publics, de vraies données, de vrais gens. En commençant par constater que ce n’est pas un face-à-face, mais des alliances à créer. Les fonctionnaires sont aussi des citoyens et le plus souvent, ont vraiment le service public à coeur. D’où la création de Ambtenaar 2.0, une plate-forme qui réunit quelques 4000 agents publics qui veulent échanger sur la transformation de leurs administrations.

Un bel exemple : la livraison de la base des 60 000 bâtiments qui font partie du patrimoine culturel néerlandais à Wikipedia, dont les utilisateurs se chargent de documenter les fiches. Le directeur du service qui a choisi cette option espère à la fois améliorer la qualité de l’information, et pouvoir réduire la taille de son service.

Pour le ministère de l’intérieur, l’ouverture des données doit d’abord favoriser la participation démocratique. D’où un travail sur les licences, qui vise à en abaisser les contraintes et le coût. Un projet de répertoire de données fondé sur l’outil commun C-KAN. Et une série d’initiatives en direction de communautés de réutilisateurs.

Il y a un vrai désir de la part de pas mal d’acteurs publics de s’ouvrir et d’en tirer parti. Et c’est aussi à la communauté des réutilisateurs d’apprendre à travailler avec eux.

La prochaine frontière est celle des données d’entreprises.

Pour avancer, nous devons continuer à partager nos réussites et nos expériences.

(et là, c’est mon tour…) Réfléchir aux conséquences de l’ouverture des données publiques

Après une rapide présentation de la situation française, j’ai présenté un petit exercice de “micro-prospective”, que nous aimerions poursuivre avec ceux qui le voudront, sur les conséquences possibles de l’ouverture des données publiques. Supposons que nous ayons réussi à ouvrir une très large partie des données publiques à l’accès et la réutilisation, sans trop de restrictions techniques ou économiques. Qu’est-ce que ça produit vraiment au niveau de la vie quotidienne, du contrôle et de la participation démocratiques, de l’innovation, des services au public, de la croissance, de la cohésion social, des acteurs publics eux-mêmes ? Et qu’est-ce qui fait qu’on passe du scénario tout rose que nous aimons bien décrire, à d’autres scénarios qui le sont moins ?

Les slides sont disponibles. Ce travail ne fait que s’engager. Commentaires et contributions bienvenus !

Une question intéressante issue de la discussion

Au fait, y a-t-il des cas de création de valeur économique à grande échelle fondée sur les données publiques ? Tous les intervenants, moi compris, sont encore secs. Pollock évoque les “Weather Derivatives” aux Etats-Unis. Mais pour l’instant, ce sont encore les vendeurs de pioches (les consultants, les SSII) qui font de l’argent, pas les chercheurs d’or qui achètent leurs outils.

La journée se poursuit en ateliers. Frank Kresin de la Waag Society en produira certainement un rapport.