Les métadonnées géospatiales sont les « données sur les données » structurées qui décrivent un jeu de données spatial : ce qu'il représente, où et quand il a été collecté, son système de coordonnées de référence, sa résolution, sa précision, sa généalogie et la signification de chaque champ attributaire. Ce sont elles qui permettent à quelqu'un d'autre (ou à votre futur vous) d'utiliser un jeu de données correctement, sans deviner.

Pourquoi c'est important

Un fichier spatial sans métadonnées est un risque. Sans SCR documenté, vous ne pouvez pas le reprojeter en toute sécurité ; sans généalogie, vous ne pouvez pas juger s'il est adapté à l'usage prévu ; sans définitions d'attributs, les colonnes ne sont que des codes énigmatiques. De bonnes métadonnées font la différence entre un produit de données réutilisable et un fichier ponctuel que plus personne ne croit fiable six mois plus tard. Elles sous-tendent aussi la découvrabilité dans les catalogues et portails de données.

Exemple concret

La norme internationale est ISO 19115 (avec ISO 19139 comme ancien encodage XML), qui structure les métadonnées en sections telles que l'identification, la qualité des données, la référence spatiale et la distribution. Aux États-Unis, l'ancienne norme de contenu FGDC (CSDGM) se rencontre encore. Au niveau du fichier, un GeoTIFF intègre le SCR et l'emprise dans son en-tête (lisible avec gdalinfo), et un shapefile stocke son SCR dans le fichier annexe .prj — mais ni l'un ni l'autre ne capture la généalogie ou les définitions d'attributs, qui relèvent d'un enregistrement de métadonnées distinct.

Piège fréquent

Confondre l'information de référence spatiale intégrée au fichier (SCR, emprise, taille de pixel) avec des métadonnées complètes. Le fichier .prj ou l'en-tête GeoTIFF indique au logiciel comment placer les données, mais ne dit rien sur qui les a produites, leur précision ou la signification des champs. Un .prj manquant ou erroné est aussi une cause fréquente de couches qui atterrissent au mauvais endroit.

Pour aller plus loin