PICNIC 2010 : Les résultats de l’atelier “données publiques ouvertes”

Par dkaplan - 24 septembre 2010

L’atelier sur les “données publiques ouvertes” de PICNIC, qui faisait suite à la conférence du matin, était particulièrement riche. Une trentaine de participants d’une bonne demie-douzaine de pays européens ont réfléchi ensemble - et démontré, chemin faisant, l’émergence d’une communauté de pensée et d’action à l’échelle européenne.

On en trouve les rapports sur ce wiki.

Merci à Frank Kresin, de la Waag Society, d’avoir organisé cette journée !

PICNIC 2010 : Open Data, pourquoi, comment ?

Lors de PICNIC, une journée entière était consacrée aux “données ouvertes”. J’y interviens - d’où le caractère un peu brut de ces notes, 100% temps réel.

Rufus Pollock

Rufus Pollock, économiste britannique et fondateur de l’Open Knowledge Foundation, introduisait cette session.

Son point de départ, comme beaucoup, est la frustration devant la difficulté d’analyser les dépenses budgétaires de son gouvernement (britannique). Celles-ci sont publiques, mais très difficiles à exploiter. Tout le monde peut lire d’énormes documents PDF (ou papier) budgétaires, mais comment analyser les données que contiennent ces documents ?

"Ouvert", ça veut dire quoi ? Pour Pollock, la liberté pour quiconque d’obtenir, utiliser, réutiliser et redistribuer les données. Cela inclut une dimension technique : les données doivent être brutes, mais aussi interopérables - c’est à dire qu’on peut les mélanger avec d’autres données.

De quelles données parlons-nous ? Budgétaires, géographiques, statistiques, réglementaires, électorales… Tout, sauf les données personnelles.

Pour quoi faire ? D’abord, découvrir l’information et la comprendre plus vite : quelle est la meilleure manière d’aller à un endroit ? Quelles actions acheter ? Quel est l’impact du réchauffement climatique ? Les données ouvertes commencent par rendre possible la création d’outils qui permettent d’utiliser ces données.

Quels bénéfices ? Innovation, productivité et confiance.

Quelle équation économique ? L’information est un bien non-rival : si je vous la donne, je l’ai encore. Qui plus est, l’information (numérique) ne coûte rien à copier.

Les données ouvertes permettent de passer à l’échelle de manière beaucoup plus efficace que des données fermées. Si elles sont brutes, on peut les diviser en atomes d’information, puis les recombiner, entre elles et avec d’autres, de multiples manières.

Ce qu’il se passera de plus intéressant avec vos données sera presque certainement imaginé par quelqu’un d’autre.

Les données ouvertes rendent possible une société read/write : tout le monde peut analyser l’information publique et contribuer.

Il y a beaucoup de manières de financer la création sans privatiser les données. D’une part, beaucoup de services (de conseil, d’analyse etc.) se fonderont sur les données. Et les données sont une plate-forme sur laquelle se créeront des services.

Comment démarrer ?

  1. Par quelque chose de rapide, petit, simple. N’attendons pas que tout soit libéré.
  2. En revanche il faut immédiatement traiter la question des licences - www.opendatacommons.org est une ressource essentielle
  3. Créer tout de suite un catalogue de données - qui ne stocke pas les données, mais les référence.
  4. Travailler sur la modularité : créer des “paquets de connaissance”, des API qui rendent la réutilisation plus simple et plus extensive
  5. Impliquer les citoyens et les développeurs : l’ouverture n’est pas une fin en soi, elle n’a de valeur que si les données sont utilisées

Julian Tait, FutureEverything

L’organisateur du formidable festival FutureEverything Julian Tait présentait ensuite le travail qu’il mène sur les données ouvertes avec la ville de Manchester, où le festival se déroule. Tout est parti d’un atelier qui se posait une question ambitieuse : comment la ville évoluerait-elle si toutes les données étaient ouvertes ?

Manchester compte 320 000 habitants, mais dans une conurbation de 2,5 millions de personnes qui pensent toutes vivre à Manchester. En revanche, la gouvernance en est profondément éclatée. Une seule décision dans le bureau d’un maire ne peut pas y accomplir grand-chose.

Pour obtenir l’ouverture des données, le premier levier a été le Freedom of Information Act, qui garantit l’accès aux données (pour des raisons de transparence), mais aux données que les citoyens demandent de manière précise - ce qui suppose qu’ils en aient connaissance… Donc cela ne suffit pas. Il faut convaincre les autorités locales de la valeur que l’ouverture des données représente pour elles, et aussi qu’il y aura de la demande pour ces données.

L’approche s’est donc fondée sur trois piliers :

  1. Créer une communauté d’utilisateurs de données. Il était important de le faire dès le départ, sans attendre qu’il y ait beaucoup de données : des hackers, des associations citoyennes, des chercheurs, des entrepreneurs… Il y a beaucoup d’outils pour le faire, des wikis, les Google groups, Twitter… Il faut vite y inclure des acteurs publics, pour que ces communautés ne se vivent plus “face” aux autorités, mais “avec”. Ce qui pourrait par exemple permettre aux collectivités de demander aux gens les données qu’ils désirent, voire de demander des conseils sur la manière d’ouvrir l’accès à certaines données.
  2. Cibler les gestionnaires de données au sein des collectivités locales. Les décideurs publics ont rarement connaissance des données que leurs services manipulent. Ce sont les informaticiens qui en ont connaissance, qui savent dans quel état elles sont, et comment elles peuvent être mises à disposition. Et on peut même obtenir d’eux qu’ils ouvrent l’accès à certaines données sans enjeux, sans attendre de décision politique.
  3. Puis il faut travailler les décideurs au corps. Pour cela, il faut construire un discours concret, un “récit” des bénéfices des données ouvertes ; et préparer des arguments, parce que les objections seront nombreuses. On peut aussi montrer quel est le coût des systèmes fermés - par exemple, le coût humain pour répondre à des questions qui n’existeraient plus si les données étaient disponibles.

Les difficultés sont essentiellement liées à la peur des autorités locales, vis-à-vis de l’opinion et encore plus de la presse. Les licences sont un problème, et les autorités ne maîtrisent pas tout : par exemple des données géographiques peuvent être construites à partir de bases de données géographiques dont la licence est très restrictive. Enfin, les autorités ne savent pas quelles données elles manipulent, ni où elles sont (sans compter que certaines sont en fait détenues par des sous-traitants privés).

Quels autres risques ? L’inquiétude que les gains en productivité se traduisent en destruction d’emplois. La crainte que l’accès aux données ne donne plus de pouvoir à ceux qui en ont déjà, à ceux qui savent qu’en faire. Nous avons une responsabilité vis-à-vis de ces questions.

Tout cela a bien fonctionné. 33% des données ouvertes du Royaume Uni viennent de Manchester !

Jarmo Eskelinen, Forum Virium

Jarmo Eskelinen, le directeur de Forum Virium Helsinki, que nous avions également invité à Lift France 10, a présenté les “3 M des données ouvertes” : Mandat, Mentalité (Mindset) et Méthodes.

L’un des arguments pour les données publiques est économique. Quelqu’un de la Commission économique a estimé la valeur potentielle des données publiques à 27 milliards d’euros. Mais cette valeur est indirecte : ce que les organismes publics peuvent obtenir en vendant leurs données est infiniment plus bas, d’autant qu’en général ils se les vendent entre eux.

Forum Virium organise chaque année un concours d’applications fondées sur les données publiques. Le gagnant de cette année est un outil mobile qui permet de scanner le code barre d’un livre pour savoir s’il est disponible dans une des bibliothèques municipales.

Et donc, les 3 M :

  • Le Mandat : la directive européenne de 2003 prescrit clairement de rendre les données publiques accessibles et réutilisables - mais elle ne dit pas à quel prix. Mais ça ne suffit pas. Il faut une pression interne.
  • La Mentalité : les deux objections des organismes publics se fondent sur la peur (qu’on fasse quelque chose des données qui leur cause du tort) et le sentiment de propriété. Comment dépasser ces blocages ?
  • Par la Méthode : derrière les peurs affichées, il y a souvent le fait que les détenteurs de données ne savent pas comment les mettre à disposition. Il faut les y aider, leur montrer que c’est bien plus aisé qu’ils ne le croyaient.

L’une des premières tâches de Forum Virium a donc consisté une plate-forme d’échange de données (Helsinki Region Infoshare) : des outils, des référentiels (de métadonnées par exemple), des licences, un annuaire des sources de données, un point de contact pour les administrations, mais aussi les réutilisateurs.

Comment présenter les bénéfices de l’ouverture pour les acteurs publics ?

  • Un meilleur accès à leurs propres données
  • Moins de redondance (tous les organismes publics ont des bases de données, des outils, des cartes… entièrement ou partiellement redondantes - et souvent peu cohérentes)
  • La capacité de créer ou co-créer de nouveaux services - et de mieux penser les partenariats avec des acteurs privés.
  • La création de participation et l’implication, tant des agents territoriaux que des citoyens.
  • Des économies (moins de redondance, moins de facturations absurdes entre départments d’une même organisation publique)
  • De meilleures données, notamment par le retour des citoyens
  • Un retour concret d’informations sur la qualité des informations et des actions publiques.

Et les bénéfices pour les acteurs privés sont… les mêmes. Il n’y a pas de conflit d’intérêt.

Ton Zijlstra

Evoquant l’ouverture des données publiques aux Pays-Bas, Ton Zijlstra (qui intervenait aussi à Lift, mais sur les Fab Labs). Son titre : “Oui„ mais… Non mais…”, deux séquences qui ouvrent beaucoup des réponses des acteurs publics aux demandes d’ouverture des données.

Comme ailleurs, il y a des lois - la directive européenne, une loi sur le droit d’accès aux informations publiques qui date de 30 ans - et la pratique, beaucoup plus restrictive. Il y a des données disponibles, mais interrogeables une à une et non réutilisable ; ou alors très chères ; ou non documentées… Dans les administrations, il y a de bons techniciens qui font d’énormes portails ; et des gens qui n’ont aucune vision technique.

Mais il y a plusieurs problèmes avec l’expression “données publiques ouvertes”. “Public”, c’est quoi ? Plein d’organismes et d’acteurs. Et les “données” ? Une donnée n’existe jamais par elle-même. Et les “réutilisateurs” ? Il faut s’intéresser à leur diversité : les citoyens, les activistes, les programmeurs, les entrepreneurs, les chercheurs… pour des besoins eux-mêmes très différents : participation, contrôle, création de services, amélioration des services publics, productivité interne, usages culturels, associatifs… Sans compter que, comme ailleurs, le plus probable est que les usages vraiment transformateurs émergeront des endroits les plus inattendus.

Donc il faut travailler avec de vrais acteurs publics, de vraies données, de vrais gens. En commençant par constater que ce n’est pas un face-à-face, mais des alliances à créer. Les fonctionnaires sont aussi des citoyens et le plus souvent, ont vraiment le service public à coeur. D’où la création de Ambtenaar 2.0, une plate-forme qui réunit quelques 4000 agents publics qui veulent échanger sur la transformation de leurs administrations.

Un bel exemple : la livraison de la base des 60 000 bâtiments qui font partie du patrimoine culturel néerlandais à Wikipedia, dont les utilisateurs se chargent de documenter les fiches. Le directeur du service qui a choisi cette option espère à la fois améliorer la qualité de l’information, et pouvoir réduire la taille de son service.

Pour le ministère de l’intérieur, l’ouverture des données doit d’abord favoriser la participation démocratique. D’où un travail sur les licences, qui vise à en abaisser les contraintes et le coût. Un projet de répertoire de données fondé sur l’outil commun C-KAN. Et une série d’initiatives en direction de communautés de réutilisateurs.

Il y a un vrai désir de la part de pas mal d’acteurs publics de s’ouvrir et d’en tirer parti. Et c’est aussi à la communauté des réutilisateurs d’apprendre à travailler avec eux.

La prochaine frontière est celle des données d’entreprises.

Pour avancer, nous devons continuer à partager nos réussites et nos expériences.

(et là, c’est mon tour…) Réfléchir aux conséquences de l’ouverture des données publiques

Après une rapide présentation de la situation française, j’ai présenté un petit exercice de “micro-prospective”, que nous aimerions poursuivre avec ceux qui le voudront, sur les conséquences possibles de l’ouverture des données publiques. Supposons que nous ayons réussi à ouvrir une très large partie des données publiques à l’accès et la réutilisation, sans trop de restrictions techniques ou économiques. Qu’est-ce que ça produit vraiment au niveau de la vie quotidienne, du contrôle et de la participation démocratiques, de l’innovation, des services au public, de la croissance, de la cohésion social, des acteurs publics eux-mêmes ? Et qu’est-ce qui fait qu’on passe du scénario tout rose que nous aimons bien décrire, à d’autres scénarios qui le sont moins ?

Les slides sont disponibles. Ce travail ne fait que s’engager. Commentaires et contributions bienvenus !

Une question intéressante issue de la discussion

Au fait, y a-t-il des cas de création de valeur économique à grande échelle fondée sur les données publiques ? Tous les intervenants, moi compris, sont encore secs. Pollock évoque les “Weather Derivatives” aux Etats-Unis. Mais pour l’instant, ce sont encore les vendeurs de pioches (les consultants, les SSII) qui font de l’argent, pas les chercheurs d’or qui achètent leurs outils.

La journée se poursuit en ateliers. Frank Kresin de la Waag Society en produira certainement un rapport.

PICNIC 2010 : Jeff Jarvis et le futur des médias

Par dkaplan - 23 septembre 2010

C’est quoi le journalisme ?, demande le Global Reporting Room, un projet qui entend “mobiliser des experts des anciens et des nouveaux médias pour mettre en perspective la valeur du journalisme pour les individus, les territoires, les Etats, la société et la culture”. Quelques vidéos introduisent la session sur “le futur du journalisme” de PICNIC - et elles ne disent pas grand-chose…

Mais l’après-midi commence vraiment avec la star : Jeff Jarvis, qui nous parle des nouvelles formes, nouvelles structures et nouvelles opportunités pour les médias.

Il y a du contenu partout. Les journalistes ne décident plus de ce qui est du contenu ou ne l’est pas. En exploitant les tweets, on peut mieux prédire le succès d’un film qu’en lisant la presse (mais depuis quand est-ce le métier de la presse de prédire le succès ?? - Ndlr).

L’information comme processus

L’information est un processus, pas un produit. Elle n’a pas de début ni de fin. L‘“histoire”, l’article, la mobilisation médiatique, n’est qu’un moment de ce processus. Wikipedia donne un aperçu de la connaissance du moment sur le sujet. Les liens pointent vers des ressources. Les blogs la commentent et la transforment… L’article est une page, et tout autour existe un flux d’informations et de discussions. L’information comme “produit” est le résultat d’un dispositif donné de production et de distribution, propriété d’un petit nombre d’entreprises, standardisé et descendant. Son standard est la perfection.

L’information comme processus s’ouvre à l’interprétation, elle se rend transparente. Elle appelle des apports extérieurs. Elle indique ce qu’elle ignore et aimerait savoir. Elle est rendue possible par des liens et elle constitue des réseaux autour d’elle. Elle se satisfait pleinement de contributions imparfaites, dès lors qu’elles se présentent comme telles.

Cette transformation franchit un nouveau cap avec les mobiles, locaux et personnels. Qu’est-ce, qui est autour de moi maintenant ? Que savons-nous de cet endroit, quelles données produit-il ? Qui parmi mes connaissances a quelque chose à dire à son propos ? Et si j’y conviais quelqu’un d’autre ?… Les médias n’ont aujourd’hui aucune compétence pour répondre à de telles questions.

Nouvelle structure

Cette transformation transforme la structure du secteur des médias. Les médias étaient des marques qui découvraient et filtraient l’information pour notre compte. Puis est venu Google. Puis les réseaux sociaux. Google produit 4 milliards de clics vers des médias ; bit.ly, l’abréviateur d’adresses web lié à Tiwtter, en produit tout autant (mais pas forcément vers des médias;..) depuis quelque temps !

Aujourd’hui la marque des médias ne constitue plus le début d’une recherche, mais son aboutissement - éventuel - d’une recherche ou d’une conversation. Cela change tout. Le défi central est celui de la capacité à impliquer les individus. Il ne s’agit pas de “créer des communautés”, mais de les aider à faire ce qu’elles veulent accomplir, par exemple en les aidant à organiser leur information.

Nouvelle économie

On passe de “l’économie de l’encre” à “l’économie de l’ancre” (traduction libre de “from the ink economy to the link economy" - Ndlr). Une information doit être cherchable pour pouvoir être trouvée. Dans une telle économie, on se focalise sur ce qu’on fait le mieux et on lie vers le reste - pour que sa contribution arrive en tête des recherches et des recommandations. Cela produit une nouvelle efficience, une nouvelle économie de l’Information.

Cette économie est distribuée. “Si une nouvelle est vraiment importante, elle me trouvera !” Il faut créer un réseau de sites que l’on aide à grandir et à obtenir, par exemple, de la publicité, pour grandir soi-même. Un tel réseau fonctionne comme un écosystème qu’on ne possède pas. On y contribue sans attendre un retour suite à chaque contribution.

Nouvelles opportunités

Dans le projet News Innovation, au sein de l’école de journalisme de l’Université de New York, Jarvis explore ces nouvelles opportunités. A nous allons d’aller y voir…

Pensons à l’internet comme un espace public, nous demande-t-il. Le contre-exemple est le débat germanique sur le droit à demander la pixellisation d’un immeuble sur Google StreetMap (Verpixelungsrecht)…

Nous disposons de cet extraordinaire outil de “publicitude” (publicness). Nous devons le défendre.

Et Jarvis de proposer sa “charte des droits dans le cyberespace" :

Nous avons un droit :

  • de nous interconnecter ;
  • de parler (et dans notre langue) ;
  • de nous assembler ;
  • d’agir ;
  • de contrôler nos données ;
  • de contrôler notre identité.

Ce qui est public est un bien public.

Tous les bits naissent égaux.

L’internet sera ouvert.

… Ce qui, effet de manche mis à part, ne nous mène pas bien loin… A chaque phrase on a envie de répondre : oui, mais ça veut dire quoi concrètement ? A quoi le proclamer est-il utile ? Et au final, ça dit quoi de l’avenir des médias ? Ce qui, au fond, signale la limite de cette intervention, peut-être pour manque de temps : l’analyse des changements est intéressante, mais les pistes de réponse sont pour le moins floues. Peut-être pour le prochain livre de Jarvis, visiblement sous presse ?

PICNIC 2010 : Instrumenter les villes - “Data Is King!”

Après plusieurs années comme chief scientist d’Amazon, pour laquelle il a contribué à inventer ses fort efficaces systèmes de recommandation, Andreas Weigend étudie en indépendant “les gens et les données qu’ils créent”.

Sa réflexion porte aujourd’hui sur ce que l’instrumentation des individus et des systèmes, à l’aide de dispositifs qui captent, produisent et partagent des données, peuvent changer (positivement, dans son esprit) à nos comportements.

La construction sociale de l’identité était un processus qui nous venait de l’extérieur. Il s’est aujourd’hui inversé, nous devenons ce que nous serons à partir de nos propres déterminants. Mais que peut-il se passer maintenant ? Une “révolution des données sociales”.

Qui crée des données ? Tout le monde. Qui les distribue ? Tout le monde. A quelles fins ? C’est toute la question.

L’enjeu des années 1990 était de connecter des pages, celui des années 2000 de connecter les gens, des années 2010 de connecter des capteurs. Le téléphone mobile est un merveilleux capteurs, y compris parce qu’il ne fait pas que mesurer des choses, il les “qualifie” par des usages, des interactions, et d’autres métadonnées. Les données de capteurs deviennent d’autant plus intéressantes qu’elles se mêlent avec d’autres, à commencer par celles qui représentent les “graphes sociaux” des individus.

Il y a 40 milliards de puces Rfid dans le monde. Mais qu’en faisons-nous ?Juste gérer des chaînes logistiques, ou offrir de nouvelles possibilités aux consommateurs ?

Weigend travaille avec la ville de San Francisco sur le projet DataSF. Bien au-delà des données publiques classiques, il essaie de repérer tout ce qui peut produire des données partageables. Par exemple les parkings ou les péages : leurs informations en disent beaucoup sur le fonctionnement de la ville, peuvent soutenir la création de services.

Ces capteurs instrumentent des changements de relations. En équipant leurs assurés de capteurs GPS, les assurances peuvent tarifer en fonction des km réellement parcourus ; mais aussi refuser de payer si un accident a visiblement été produit par une conduite imprudente… On pense aussi aux assurances santé contrôlant les moindres faits et gestes des assurés malades.

Pour éviter cette dérive, il faut outiller les individus pour leur permettre de produire des données et de faire des choses avec leurs données. Weigend finit par l’exemple de TripKick, qui enrichit les recommandations d’hôtels d’informations sur les meilleurs et les plus mauvaises chambres… On voit l’idée, mais il n’y a pas plus probant ? Dommage de conclure une intéressante intervention sur un exemple aussi limité. Sans doute parce que ce sujet de l’outillage des individus, et de ce qu’il produit réellement, est difficile pour tout le monde.

PICNIC 2010 : Changer de paradigme dans la manière de voir l’urbanisation

L’architecte Reinier de Graaf, associé de Rem Koolhas dans le cabinet OMA, nous engage dans une vaste perspective urbaine à l’échelle mondiale.

Les villes grandissent, on le sait. Surtout dans les pays en développement. Mais la croissance démographique dans le tiers-monde ne produit pas nécessairement de la croissance économique - alors que les villes occidentales forment le coeur de sa croissance. Dans la plupart des cas, les pays où les villes se développent le plus rapidement ne sont pas non plus démocratiques, ce qui a le plus souvent pour conséquence que leur croissance n’a pas à s’embarrasser de préoccupations sociales.

La croissance actuelle des villes prend place dans un vide de pensée. La pensée de l’urbanisation date pour l’essentielle des années 1970. Elle est aujourd’hui remplacée par des “visions”, issues de groupes de travail réunis par les autorités locales avec une seule mission, assurer leur développement économique. Ces groupes sont animés par des consultants internationaux plutôt que des urbanistes, qui imposent sur leur développement des critères et des indices de mesure qui n’ont pas grand-chose à voir avec les cultures et les enjeux locaux.

Ces “visions” conduisent souvent à fonder le développement d’une ville sur quelques activités économiques à la mode - on pense à la vogue de “l’économie créative” aujourd’hui. De Graaf nous emmène alors à Detroit, montrée en exemple dans les années 1950, et qui, à cause de la crise de l’automobile, a perdu les deux tiers de ses habitants, particulièrement les jeunes. Même aventure pour Essen en Allemagne.

Les villes occidentales font face à plusieurs défis : le déclin industriel, le vieillissement. Les seules villes industrielles qui croissent, comme Birmingham, le feront grâce à l’immigration. En 2030, la population de Birmingham ressemblera à celle du monde entier, en termes d’origines continentales, de religion, et de culture.

Chaque année, 2 à 3 millions de personnes émigrent officiellement, et autant le font de manière illégale - en général vers les pays les plus développés. C’est une vague irrépressible, que nous vivons comme un problème (et que, du coup, les migrants vivent comme un drame, compte tenu du coût, des difficultés, voire des dangers du voyage). Pourtant, ils sont la chance des vieilles villes européennes. Au bout du compte, les villes deviendront des reproductions miniature du monde. Plus nous attendrons avant de l’admettre et de le vouloir, plus nous nourrirons la frustration du tiers monde.