Chaine rouillée | ToNToN CoPT | CC by-nc-sa

Faire de l’archiviste le maillon fort de l’open data

Simon Chignard a publié hier, sur son blog donneesouvertes.info, un billet très intéressant. Il s’y interroge sur la nature des données mises à disposition par les administrations sur les différents portails open data.

Il constate notamment, pour résumer, un problème dans la qualité des jeux de données. Elles souffrent, selon lui, d’un manque de contextualisation qui peut parfois rendre difficile leur interprétation et donc leur exploitation par les réutilisateurs.

D’un autre côté, il souligne le fait que de nombreux réutilisateurs ont besoin de données brutes. Les fichiers contenant autre chose que les données elles-mêmes (notamment des informations sur leur signification ou la façon de les interpréter) peuvent nuire à une exploitation peu ou prou automatisée.

Il termine en s’interrogeant sur la responsabilité de l’administration dans l’amélioration de la qualité des données mises à dispositions. Celles-ci doivent être à la fois “brutifiées” et contextualisées, les deux ne pouvant s’opposer. Sur quel maillon de la chaîne de mise à disposition ces opérations doivent-elles reposer ? Sur le service producteur, ou sur le gestionnaire du portail open data ?

Ces constats et ces interrogations ont résonné de façon particulière chez l’archiviste que je suis.

Tout d’abord sur la contextualisation. Simon Chignard donne l’exemple des statistiques de fréquentation des musées de France. Mais ce que le jeu de données ne dit pas, c’est que “musées de France” n’est en réalité qu’une appellation réservée à une certaine catégorie de musées. Simon Chignard a dû faire une recherche spécifique pour trouver cette information. Elle ne figurait ni dans le jeu de données (c’est normal), ni, et c’est plus embêtant, dans sa description sur le portail open data. Or, cette lacune est susceptible de tromper le réutilisateur et d’entraîner une erreur d’interprétation.

Si cela est probablement un constat récent dans le monde des réutilisateurs, cela l’est moins pour un archiviste. Nous savons tous l’importance de la documentarisation du producteur. Plus encore, nous savons tous l’importance de connaître le contexte de production. Au point de l’avoir érigé en principe clé de notre métier.

Il est par exemple inutile de nous dire qu’une statistique de production agricole ne doit pas être interprêtée de la même façon selon si elle le fruit d’une pesée à l’entrée d’une coopérative (elle est probablement exacte), d’une déclaration pour l’obtention d’une aide (elle peut être surévaluée), ou d’une déclaration fiscale (elle peut être sous-évaluée).

L’archiviste le sait. Avec lui, l’historien le sait. Mais les réutilisateurs, cette nouvelle catégorie d’utilisateurs de documents publics, le découvrent et découvrent donc la nécessité de la description documentaire.

Cela m’amène directement au second point. Sur qui repose la charge de la documentarisation des données publiques mises à disposition ? Doit-elle reposer sur le service producteur ou sur le gestionnaire du portail open data ? La réponse me semble évidente : ni l’un, ni l’autre. Elle doit reposer sur l’archiviste.

Qui, de tout temps, a été chargé de faire l’interface entre les services producteurs et le public ? L’archiviste.

Qui, de tout temps, n’a cessé de documenté le contexte de production ? L’archiviste.

Qui, de tout temps, a œuvré pour mettre à disposition du public une information exploitable ? L’archiviste.

Et enfin, toutes ses informations publiques ont un point commun. Elles vont toutes, sans la moindre exception, à un moment où à un autre de leur vie, passer entre les mains de l’archiviste. Que ce soit pour décider de leur conservation définitive ou de leur élimination, pour en gérer le pré-archivage, voire, dans le meilleur des cas, avant même leur création.

De tous les intervenants, du producteur au public, l’archiviste est celui qui a la meilleure connaissance de l’ensemble documentaire que constituent les informations publiques.

Chaine rouillée | ToNToN CoPT | CC by-nc-sa

L’archiviste doit être le maillon fort de l’open data
(ToNToN CoPT | CC by-nc-sa)

L’archiviste doit donc être placé au cœur des dispositifs open data. Il doit en être un acteur-clé. Chaque gestionnaire de portail de diffusion de données publiques devrait intégrer dans son équipe un ou des archivistes ou, en tout cas, être en étroite collaboration avec ceux qui travaillent déjà dans l’institution.

Cela suppose bien entendu que l’archiviste s’adapte à un nouveau type de public et donc à de nouvelles attentes. Mais ce ne serait pas la première fois. Tout comme il s’est adapté à l’arrivée des généalogistes amateurs, il s’adaptera à celle des réutilisateurs et à leurs attentes propres.

Mais sur le fond, quelle est la différence entre gérer un site de diffusion de l’état civil numérisé  et un portail open-data ? Une histoire de dates et de formats de données, guère plus. Il ne s’agirait là que d’une nouvelle facette de notre métier (et encore, ce n’est même pas sûr).

Il serait bon, pour une fois, de ne pas oublier les compétences des archivistes dans les initiatives liées aux documents.

Je pense sincèrement que la prise en compte de l’archiviste est l’un des éléments indispensables à la réussite, sur le long terme, de l’open data.

Et, entre nous, après les avoir vu freiner des quatre fers pour la diffusion de leurs contenus, il y aurait quelque chose de jouissif à voir des archivistes œuvrer à l’ouverture des données publiques.

Related Posts Plugin for WordPress, Blogger...

Creative Commons License
Faire de l’archiviste le maillon fort de l’open data by Papiers et poussières, unless otherwise expressly stated, is licensed under a Creative Commons Attribution-ShareAlike 3.0 France License.



Categories:Archives
Mots-clé: , ,

13 commentaires

  1. Pingback: Faire de l’archiviste le maillon fort de ...

  2. Je plussoie à 200% cher collègue. En lisant le billet de S. Chignard hier, j’étais justement en train de faire le compte rendu du super infolab Culture qu’il avait animé deux semaines plus tôt, et je songeais « producteur », « contextualisation »…

    We shall overcome ! (un peu trop) lentement, mais sûrement !

    Et quelle chute ! chatouilleuse ;-)

    • jordi a dit :

      Il est évident que ces préoccupations ne peuvent que faire tilt chez tout archiviste qui se respecte.
      En lisant son billet, je me suis simplement dit : »hé, mais on sait faire ça, nous »

      Je ne sais plus qui a dit qu’un jour les archivistes domineront le monde…

      • Jimbo a dit :

        Ah tiens, je croyais que c’était les Bretons. :-))))

        Cette solution permettrait aussi probablement de mettre fin à tous les procès en cours entre AD et certaines sociétés commerciales. Les AD devenant dės lors, et si j’ai bien compris, des producteurs de bases de données. Donc libres d’en faire ce qu’ils souhaitent.

        • Roses d'Ispahan a dit :

          Attention, le fait de mettre en ligne des archives numérisées sur le site d’un service d’archives n’est pas la même démarche que faire de l’opendata, selon Lionel Maurel (blog S I Lex) (je peux retrouver le lien exact).

          • jordi a dit :

            Ce n’est pas la même chose dans le sens où les données numérisées ne sont pas dans un format immédiatement réutilisable, puisqu’il s’agit uniquement d’une image.
            Pour que cela soit considéré comme de l’open data, il faudrait d’abord le transcrire et diffuser, par exemple, un fichier xml ou csv qui permettrait l’interopérabilité.
            C’est ce qui fait toute la différence avec les données qui sont présentes sur les portails open data.

            Comme je le disais, la différence n’est donc qu’une histoire de format de données.

  3. Pingback: Faire de l’archiviste le maillon fort de ...

  4. Pingback: Faire de l'archiviste le maillon fort de l'open...

  5. Pingback: Faire de l'archiviste le maillon fort de l'open...

  6. Pingback: Faire de l’archiviste le maillon fort de ...

  7. Pingback: Wissen management | Pearltrees

  8. Pingback: anso218 | Pearltrees

  9. Pingback: Faire de l’archiviste le maillon fort de ...

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Suivez-moi sur Twitter Rejoignez-moi sur Facebook Abonnez-vous à mon RSS