Open Data : libérer les données publiques, oui. Accompagner le décollage de la réutilisation, c'est mieux.

L'Open Data se développe dans un écosystème ouvert, où producteurs et réutilisateurs n'ont pas les mêmes contraintes opérationnelles. Tirer les bénéfices de l'Open Data en France nécessite une passerelle entre ces deux mondes.

Avec le lancement de data.gouv.fr le 5 décembre dernier, faisant suite à diverses initiatives locales et régionales lancées par Rennes, une première phase d’émergence de l’Open Data en France s’achève avec l’atteinte d’une masse critique de données réutilisables. Mais si la démarche d’ouverture est bien amorcée, c’est celle de la réutilisation qu’il faut réussir pour concrétiser les espoirs de l’Open Data.

Après avoir réclamé haut et fort l’ouverture des données publiques, la communauté Open Data se trouve désormais à la tête d’un volume significatif de données qualifiées. Jamais assez, jamais dans le bon format, diront certains. Certes. Mais l’inventivité des développeurs pour faire émerger des services a tant été vantée, porteuse de transparence mais également de potentiel économique, que l’année 2012 devrait et doit être celle des premières retombées concrètes. Trois grandes catégories d’utilisation devraient apparaître, correspondant à autant de catégories d’acteurs de la réutilisation :

  • les acteurs qui donnent du sens aux données
  • ceux qui valorisent ces données pour créer de nouveaux services, y compris des services publics
  • et ceux qui vont exploiter les données dans leur propre activité à des fins privées

le data-journalisme est une discipline en pleine expansion, grâce aux données ouvertes

La première catégorie de réutilisation visera à donner un sens et à interpréter toutes ces données désormais disponibles, dans une démarche de transparence. Quelle que soit la nature des données (statistiques, financières, environnementales …), ces données peuvent raconter une histoire, ce qui est le métier de base du journaliste : livrer une interprétation à partir d’éléments factuels, pour donner un éclairage sur une question donnée. A ce titre, le data-journalisme est en plein essor.

Autrefois (il y a quelques mois), les journalistes parcouraient le pays avec leur carnet pour glaner des informations en faisant souvent du porte à porte auprès des administrations. Demain, confortablement assis dans son bureau, le data-journliste ira scanner des jeux de données, les récoupera, leur donnera un sens. La publication sur le site de Data Publica de l’article « Cannabis vs Cocaïne : quelles drogues rapportent le plus d’interpellations ? » est une bonne illustration d’une exploitation journalistique de données statistiques.

Sur la base de statistiques très brutes du Ministère de l'Intérieur, le data-journaliste analyse l'information disponible, extrait celle qui fait sens pour lui et la transforme en information. Il est vrai qu'il ne faut pas tomber dans l'excès d'analyser uniquement ce que l'Etat donne en pature, mais il y a déjà une telle masse d'information désormais disponible qu'elle représente un grand potentiel d'analyses nouvelles. Le Guardian en Grande-Bretagne est le champion incontesté du data-journalisme en Europe. L'Express s'y essaie également avec succès.

La data-visualisation, est un débouché important de l’Open Data et apporte une grande valeur par ailleurs au data-journalisme. Elle permet de donner une interprétation visuelle et dynamique des données. On est bien loin des histogrammes et des camemberts. La compréhension visuelle d'une information et d'une analyse permet de rendre accessibles des sujets nécessitant la compréhension de rapports complexes.

La dataviz de la puissance comparée au fil des années des coureurs du Tour de France en montagne, réalisée par la jeune start-up française dataveyes en partenariat avec l'Express en est une illustration. Le quizz proposé par Orange en collaboration avec OWNI « Où habitez-vous vraiment ? » donne une autre approche de l’exploitation des données publiques dans une approche journalistique.

de nombreux services commencent à voir le jour grâce aux données publiques, terrain de jeu pour des start-up en quête d'un modèle économique

La seconde catégorie de réutilisation concerne la création de nouveaux services. Elle regorge d’un potentiel important d’innovation, et a déjà vu l’apparition d’applications très riches, notamment au service de la mobilité des handicapés comme « handimap ». Basé sur la cartographie urbaine et la géolocalisation des équipements spéciaux pour les handicapés, le service permet de définir des trajets adaptés.

D'autres services d'utilité publique, comme les horaires et les conditions de trafic des transports en commun, la localisation et la disponibilité des transports alternatifs en libre-service, font l'objet de polémiques quant à la libre réutilisation de données considérées par certains comme publiques et par d'autres comme relevant de la propriété intellectuelle.

Ces freins seront vraisemblablement passagers tant la position des organisations en question (RATP et Vélib en l'occurrence) n'est pas tenable sur le long terme. A titre d'illustration, ChechMyMetro s'est vu refuser par la RATP le droit de réutilisation du plan du métro parisien, ce qui a abouti à la création volontaire sur concours d'une centaine de plans alternatifs, à l'initiative de développeurs qui ont choisi de mettre quant à eux leur production en licence ouverte.

Que ce soit pour apporter un nouveau ou un meilleur service, de façon gratuite ou payante pour l’utilisateur, de nouveaux modèles économiques sont à créer, afin de générer un impact économique important à partir de ces données, considérées comme la nouvelle mine d’or (voir le communiqué de presse de Neelie Kroes en date du 12 décembre).

L'ouverture attendue de certaines données de sociétés privées, avec l'exemple montré dans ce domaine par la SNCF/RFF sur data.gouv.fr de la géolocalisation des gares et des passages à niveau, sera de nature à moyen/long terme à créer d'autant plus d'opportunités pour croiser des jeux de données.

l'Open Data est également une source importante de Business Intelligence

Enfin la dernière catégorie d’utilisation doit aboutir à dégager une expertise à partir de l’analyse des données ouvertes. Il est naturel de s'attendre à ce que certaines de ces données soient exploitées à des fins purement privées par certaines entreprises ou organismes.

Que ce soit à des fins de business intelligence, de recherche ou de politique publique, les résultats de l’exploitation de ces données n’auront généralement pas vocation à être rendus publics, mais ils apporteront une valeur intrinsèque aux organismes qui exploiteront les données publiques, pour à leur tour rendre un meilleur service et, par effet induit, participer à l'évolution des jeux de données qu'ils utilisent.

Prenons quelques exemples :

  • analyse des statistiques d'accidentologie ou d'épidémiologie pour les assureurs, pour fixer leurs tarifs ou établir des services spécifiques
  • suivi de la qualité de l'air ou de l'eau pour étudier le lien avec les chiffres des maladies chroniques
  • évolution démograhique ou flux de déplacement pour l'aménagement du territoire

L'Open Data en est à ses débuts, mais pour que toute cette richesse puisse voir le jour, le lien entre producteurs et réutilisateurs doit être renforcé, simplifié, fluidifié. Je reviendrai sur ce point dans un prochain article. D'ici-là, n'hésitez pas à me faire part de vos commentaires mais aussi à me remonter des exemples de services particulièrement pertinents, que vous connaissez ou que vous aimeriez voir naître.

Marc

credit photo : © AA+W - Fotolia.com

Marc Ribes

Je suis tombé dans le eGov il y a 12 ans maintenant. Voir comment les Technologies de l'Information et de la Communication peuvent impacter positivement le fonctionnement des Etats, le rôle des administrations et la relation qu'elles ont avec les citoyens est finalement passionnant. Sur la base de mes expériences en France mais aussi à l'international, j'interviens sur le sujet de l'administration électronique pour Orange Business, un des acteurs clés de ce domaine pour cette dernière décennie. Je suis somme toute un jeune bloggeur et je m'attache à donner une vision attractive d'un sujet qui peut sembler ardu. Ma dernière passion dans ce domaine : l'Open Data et les formidables promesses de transparence et d'impact économique que d'aucun nous annonce.