Dix-huit applications en compétition pour une meilleure compréhension de l'actualité électorale.

Ce concours organisé par Google France devait inciter les développeurs, designers et journalistes à proposer des outils d'exploration et de traitement des données disponibles sur le web. Les six réalisations considérées comme les meilleures par un jury indépendant seront analysées dans ce blog, une par une, au fil des jours.

A commencer par l'application gagnante.

Mediarena accueil

Selon la note d'intention des auteurs, il s'agit de comparer les différents traitements réservés aux candidats par douze organes de de presse et de mesurer l'écho suscité sur Twitter par certains articles.

La confrontation des contenus en ligne s'effectue par un suivi en continu des flux RSS émis par les sites web des journaux. Les articles dans lesquels figurent le nom d'un candidat sont indexés. Une fonctionnalité de Twitter permet à l'application de comptabiliser le nombre de gazouillis qui mentionnent chaque article.

Facile à utiliser

La première qualité de Mediarena est suggéré dans son nom: "arène" des médias, donc confrontation. Elle s'impose visuellement dès la page d'accueil qui évoque le fronton d'un monument équilibré. Au milieu, la liste des candidats avec des barres qui actualisent leurs poids spécifiques dans les médias et sur Twitter. De chaque côté du "pilier" central, cinq indicateurs de présence médiatiques. Rien de plus intuitif que l'ergonomie de ce dispositif dont le fonctionnement global est, métaphoriquement parlant, celui de la balance, du fléau de la Justice.

Pertinence

Mediarena critèresLes critères de comparaison des contenus sont limités mais pertinents. Les auteurs ont délibérement évité de capter et de traiter des signaux plus fins comme les re-tweets ou les hashtags en partant d'une idée de bon sens: de plus en plus de citoyens s'informent sur le web mais tous ne sont pas initiés aux arcanes de Twitter. Ils ont donc privilégié des critères que tout le monde peut comprendre, avec des étiquettes explicites.  

De  cette choix d'une option grand public pour fonder la pertinence des critères de comparaisons des contenus découlent plusieurs qualités:

Une approche édifiante des relations entre la presse et les réseaux sociaux. On sait que Twitter notamment fonctionne beaucoup comme une caisse de résonance; ses utilisateurs se contentent de propager (ou de réagir à) des contenus produits par d'autres, en l'occurrence ici, des articles mis en ligne par des journalistes. Il y a dans ce phénomène, une mesure de l'intérêt - positif ou négatif - suscité par cet article. Même remarque pour les mots-clés et les thématiques.

Par ailleurs, la présence médiatique des candidats gagne à être comparée à l'intérêt que ces candidats suscitent sur le web.Ala longue, il devrait être possible de se faire une idée de la mobilisation militante au profit des différents prétendants à l'Elysée. Il sera intéressant, aux lendemains du premier tour de revenir sur ces évaluations pour voir si un candidat dont le score aurait créé la suprise a été, ou non, aidé par des internautes qui seraient, en quelque sorte, les héritiers des colleurs d'affiches.   

Mediarena presse tweets

L'application offre aussi la possibilité de croiser la prépondérance des thèmes et la présence des candidats. Ce qui confère à Mediarena une fonctionnalité d'exploration de ce qui fait la substance de la campagne électorale: les thèmes, les idées.

Enfin, le nombre d'articles cités sur Twitter fournissent des éléments d’appréciation sur ce qui intéresse le plus les internautes – ceux qui sont actifs sur Twitter – parmi les thématiques de la campagne. 

Données techniques et ma notation

 Voici, en marge de ma notation - évidemment pondérée Mediarena notationpar celles des autres membres du jury - quelques données techniques fournies par mes auteurs:

- Extraction des contenus avec Boilerpipe http://code.google.com/p/boilerpipe/.

- Moteur de captation en Clojure

- Interface en  HTML, CSS3 et Javascript

- "L'interface web s'appuie sur JQuery. Nous utilisons Boilerpipe pour l'extraction de contenu dans les pages, Compojure et Ring pour l'API qui fait l'interface entre l'interface et le moteur, Lucene pour l'indexation du texte, et H2 pour la base SQL et Jetty pour servir les requêtes web"

Je n'ai pas noté les applications sur la partie technique (langages de programmation) , domaine dans lesquels ne je suis pas (encore) assez compétent. 13 sur 15, ça 16 sur 20. Note que j'ai décidé d'augmenter d'un point, prime à sa dimension "grand public". Soit: 17 sur 20.