Pourquoi un catalogue de jeux de données

La présence au sein d’un projet Open Data d’un jeu de données “Catalogue des jeux de données”, qui recense tous les jeux de données du projet, permet aux réutilisateurs de prendre la mesure en un fichier de l’étendue des jeux de données libérés. Si chacun des projets Open Data utilise le même formalisme (colonnes et types d’informations) pour créer son catalogue des jeux des données, il sera d’autant plus facile de créer un méta-catalogue à l’échelle de tous les projets Open Data. Celui-ci permettra :
de faciliter l’identification des jeux intéressants pour les réutilisateurs de faciliter le repérage des jeux de données identiques ou proches dans chacun des projets pour créer des réutilisations utilisables avec plusieurs jeux de données d’origine différente de repérer au sein des projets Open Data les jeux de données qui mériteraient également d’être normalisés pour faciliter leur agrégation de faciliter le croisement de ces données par la mise en relation des métadonnées Une normalisation ouverte aux commentaires
Les projets Open Data du Conseil général de la Gironde et de la Région Aquitaine, de la Ville de Montpellier, de la Métropole Nantaise et de la Ville de Paris ont effectué un travail de synthèse et de projection à partir de leur propre catalogue de jeux de données. Ils proposent aujourd’hui aux commentaires de la communauté une synthèse de leurs travaux qui pourrait devenir la norme de construction d’un catalogue de jeux de données comprenant :
Un nommage identique des champs utilisés Un ordonnancement identique des champs Des valeurs de champs attendues identiques
Vous trouverez le fruit de ce travail à cette adresse :
- Document de normalisation des datasets
- Nous vous invitons à découvrir et commenter ce travail essentiel pour faciliter la réutilisation des données ouvertes en France





