Canalblog
Editer l'article Suivre ce blog Administration + Créer mon blog
Publicité
Data journalism
Data journalism
Archives
28 novembre 2010

"Nosdonnees.fr" collecte les gisements d'informations latentes et propose des outils de traitement

Nos_donn_es_logo_du_siteParmi les nombreuses initiatives visant à mettre à la disposition des citoyens les bribes d'informations collectées par les administrations publiques, le site Nos données est particulièrement prometteur parce qu'il est à la fois un espace de collecte, un atelier de transformation et un lieu d'initiation.

La collecte

Elle s'effectue en mode collaboratif. Quiconque a connaissance de l'existence d'une base de données publique centrée sur un thème d'intérêt général est invité à contribuer à l'enrichissement d"un répertoire qui est à la disposition de tous.

La récolte est inventoriée quasiment en temps réel sur un wiki, système de publication qui présente pour les journalistes l'intérêt de la traçabilité: l'origine et les modifications successives des contenus sont repérables.

Le site propose de très intéressants gisements qui concernent essentiellement, pour l'instant, la fiscalité, les résultats électoraux, les importations de produits et la pollution industrielle.

Nos_donn_es_nuage

Ces "briques élémentaires" d'informations sont accessibles par des nuages de mots ou par une requête adressée à l'index du site. Chacun peut les télécharger en différents formatsNos_donn_es_formats pour les analyser en détail. Une des caractéristiques majeures de la mouvance Open Data est de favoriser la consultation des données publiques par tous les dispositifs informatiques.

Lire des mots, des noms et des chiffres dans des colonnes ne constitue pas un but en soi, même si le regard peut être "accroché" par certaines quantifications associées à certains lieux. Par exemple, le nombre de contribuables soumis à l'Impôt de Solidarité sur la Fortune dans les différentes communes de certains départements:

Nos_donn_es_ISF_Hauts_de_Seine

Le simple fait d'établir une relation de comparaison entre le chiffre attribué à Nanterre et celui qui singularise Neuilly-sur-Seine constitue l'amorce d'un traitement des données.

Le traitement

Le traitement commence avec la sélection d'éléments bruts afin de les transformer en visualisations interactives. Le site propose des outils de traitement conçus et développés par l'Open Kkowledge Fundation (1).

Nos_donn_es_visualisation_CKan

CKan (2) permet de chercher, de répertorier dans un catalogue, d'enrichir et de partager des bases de données.
Le traitement journalistique proprement dit suppose une confrontation - simple exemple - entre certaines données fiscales et certaines données électorales.

Concrètement: chercher, dans la base "Fiscalité ISF par commune", les colonnes qui recensent les communes abritant le plus grand nombre de contribuables lourdement assujettis à l'ISF et, dans la base "Résultats par commune de l'élection présidentielle de 2007, les colonnes dans lesquelles apparaissent les plus gros pourcentages de suffrages exprimés en faveur de Nicolas Sarkozy.

De la juxtaposition des colonnes de noms et de chiffres issues de deux bases différentes naît une première information visualisable sur une carte interactive: la consistance géographique et patrimoniale de l'électorat de Nicolas Sakorzy, ainsi que l'évolution de son comportement dans les scrutins successifs.

La valeur ajoutée journalistique

Un journaliste qui se veut loyal avec les infonautes - donc fiable - intégrera dans la mise en évidence des relations entre les données fiscales et électorales le fait que l'assiette de l'ISF a évolué ces dernières années et il n'hésitera pas à compléter les chiffres relatifs à l'élection présidentielle de 2007 par ceux des élections régionales de 2010, même si ces deux consultations sont de natures différentes.

La valeur ajoutée de l'information qui gît à l'état latent dans les relations entre données réside dans la qualité et l'ergonomie des visualisations interactives, mais aussi et surtout dans l'enrichissement en profondeur. Chercher, par exemple, s'il existe une corrélation entre l'évolution des sondages sur l'électorat présidentiel depuis 2007 et le comportement réel de cet électorat lors des scrutins. Réaliser une time line sur les initiatives fiscales de l'Exécutif depuis 2007.

Le résultat  journalistique sera différent de l'enquête à caractère pamphlétaire "Le président des riches" que viennent de publier deux sociologues (3) car il ne comportera que des faits officiels, publics, vérifiables par tout le monde car scrupuleusement "sourcés".

En ce sens, le datajournalism marque bien un retour vers l'investigation et le culte des faits.

L'initiation

Le datajournalism n'étant guère enseigné en France par des journalistes, une initiation est possible sur Nosdonnées.fr en fréquentant attentivement le site, des didacticiels et les liens vers des ressources (4).
Cette initiation concerne aussi un autre aspect crucial du mouvement Open Data: les régimes juridiques des bases de données, en pleine évolution et très différents selon les pays. Voire, en France, selon les villes.

Nos_donn_es_licences

    1. http://okfn.org/
    2. http://www.ckan.net/
    3. "Le président des riches. Enquête sur l'oligarchie dans la France de Nicolas Sarkozy", Michel Pinçon et Monique Pinçon-Charlot, Editions Zones / La Découverte, Paris, septembre 2010.
    4. http://wiki.okfn.org/ckan/doc/

    Sites et ressources en relation avec ce billet


    Publicité
    Commentaires
    Data journalism
    Publicité
    Publicité