Simon Chignard a publié hier, sur son blog donneesouvertes.info, un billet très intéressant. Il s’y interroge sur la nature des données mises à disposition par les administrations sur les différents portails open data.
Il constate notamment, pour résumer, un problème dans la qualité des jeux de données. Elles souffrent, selon lui, d’un manque de contextualisation qui peut parfois rendre difficile leur interprétation et donc leur exploitation par les réutilisateurs.
D’un autre côté, il souligne le fait que de nombreux réutilisateurs ont besoin de données brutes. Les fichiers contenant autre chose que les données elles-mêmes (notamment des informations sur leur signification ou la façon de les interpréter) peuvent nuire à une exploitation peu ou prou automatisée.
Il termine en s’interrogeant sur la responsabilité de l’administration dans l’amélioration de la qualité des données mises à dispositions. Celles-ci doivent être à la fois “brutifiées” et contextualisées, les deux ne pouvant s’opposer. Sur quel maillon de la chaîne de mise à disposition ces opérations doivent-elles reposer ? Sur le service producteur, ou sur le gestionnaire du portail open data ?
Ces constats et ces interrogations ont résonné de façon particulière chez l’archiviste que je suis.









Membre du collectif SavoirsCom1