Le printemps de la qualité des données par data.gouv.fr

Data.gouv.fr ont sorti un premier post dans le cadre de ce qu’ils ont appelé le printemps pour la qualité des données (de mois à juin) :

Nous amorçons ce printemps de data.gouv.fr sur la question de la qualité des données.
La qualité des données est un élément essentiel du succès de l’open data : l’ouverture des jeux de données n’entraîne pas directement leur réutilisation. Ce constat s’explique notamment par les difficultés que rencontrent les réutilisateurs lorsqu’ils souhaitent s’approprier les données ouvertes.
D’ailleurs, l’analyse de l’enquête auprès des usagers (905 répondants de juin à septembre 2020) pointe une véritable attente des utilisateurs de la plateforme sur la qualité des données. Les répondants remontent des problèmes de mise à jour avec des jeux de données souvent obsolètes, une documentation insuffisante ou inexacte quand elle existe, la multiplicité de jeux de données ou encore le manque d’échanges entre producteurs et réutilisateurs de données malgré le système de commentaires de data.gouv.fr. En somme, la qualité n’est pas suffisamment au rendez-vous.
Au cours de 2020, dans le cadre de la réflexion sur la nouvelle feuille de route de data.gouv.fr, plusieurs ateliers sur la qualité et l’interopérabilité des données ont été organisés en présence de membres de l’équipe Etalab et d’une dizaine d’usagers réguliers de data.gouv.fr.
Il s’agit ici de partager les principales réflexions de ces ateliers : qu’entend-on par qualité des données ? Comment peut-elle être améliorée et quelles sont les difficultés inhérentes au sujet pour data.gouv.fr ?
La semaine prochaine, nous présenterons concrètement les travaux récents sur la qualité des données qui permettent de répondre à une partie des problématiques et opportunités présentées ici.

N’hésitez pas à lire, commenter ici et /ou sur tweeter / mastodon.