4. Données géospatiales

Les données géospatiales sont des informations qui décrivent des objets, des événements ou des phénomènes liés à un emplacement précis sur ou près de la surface de la Terre.

4.1 Données vectorielles

Les données vectorielles sont composées d’une partie géométrique, qui définit la localisation d’objets (points, lignes, polygones, etc.) à l’aide de coordonnées spatiales et d’une partie descriptive (les attributs), qui contient les informations alphanumériques liées à ces objets. Les formats ouverts recommandés pour diffuser des données vectorielles sur le portail Données Québec sont le GeoJSON (pour les fichiers légers de 150 Mo et moins) et le GeoPackage (pour les fichiers de plus de 150 Mo).

4.1.1. Format GeoJSON

Le GeoJSON est un format ouvert standardisé selon la norme officielle RFC 7946. Il est une adaptation géographique du format JSON (JavaScript Object Notation), ce qui lui donne l’avantage d’être facilement utilisable par l’ensemble des langages de programmation informatique. Il est ainsi très apprécié des développeurs. Le GeoJSON est compatible avec un grand nombre d’outils, tant les systèmes d’informations géographiques (SIG) que les applications Web. Ce format est recommandé pour la diffusion des fichiers peu volumineux (moins de 150 Mo), car au-delà de ce poids, sa performance est moins optimale.

Le format GeoJSON est fortement recommandé pour les fichiers de 150 Mo et moins.

Compression – Non recommandé

Afin de permettre un accès direct à la donnée, le fichier GeoJSON ne doit pas être compressé. Cela permet de créer des visualisations cartographiques à même le portail Données Québec.

Visualisation cartographique

Le GeoJSON doit s’accompagner d’une visualisation dans le portail Données Québec. Il est recommandé d’utiliser la visualisation à la volée au moyen du navigateur cartographique IGO de Données Québec. Voir le document Créer des visualisations cartographiques pour en savoir plus.

Exemple d’un fichier GeoJSON conforme

Le jeu de données Écocentres et points de dépôt municipaux de Recyc-Québec présente un fichier GeoJSON conforme aux lignes directrices : le fichier n’est pas compressé, ce qui permet de configurer une visualisation cartographique à même le portail Données Québec.

4.1.2 Format GeoPackage – GPKG (recommandé – fichiers > 150 Mo)

Le GeoPackage (GPKG) est un format ouvert standardisé par l’Open Geospatial Consortium (OGC). Ce format est recommandé pour la diffusion des fichiers plus volumineux sur le portail, soit de plus de 150 Mo.

Le GPKG est une base de données (BD) de format SQLite qui inclut des caractéristiques géospatiales. Le SQLite est le format de base de données le plus utilisé au monde, ce qui confère au GPKG une très grande interopérabilité. En plus d’être compatible avec les systèmes d’informations géographiques (SIG), le GPKG peut être consulté au moyen des outils et libraires informatiques qui permettent la lecture du SQLite. Il est possible d’y effectuer les mêmes opérations comme lancer des requêtes SQL, définir des clés, définir des déclencheurs sur les opérations et définir des contraintes permettant d’améliorer l’intégrité de la base de données.

Le format GeoPackage est recommandé pour les fichiers de plus de 150 Mo.

Comme il s’agit d’une base de données, le GPKG peut contenir plusieurs couches d’information géospatiale, à la fois vectorielles et matricielles. Il peut aussi inclure des tables de métadonnées liées aux couches géospatiales, des vues relationnelles, des symbologies définies et même des projets provenant de SIG non-propriétaires comme QGIS.

Nom des champs
Le standard GeoPackage de l’OGC recommande, entre autres, l’utilisation des minuscules pour nommer les tables et les champs.

4.1.3 Autres formats vectoriels (à utiliser sous certaines conditions)

Pour diverses raisons, un diffuseur de données pourrait vouloir offrir d’autres formats que le GeoJSON ou le GPKG s’il existe un besoin connu par sa clientèle pour la consommation de ces formats. Un jeu de données demeure conforme aux lignes directrices seulement si les autres formats sont offerts comme ressources complémentaires, en plus du format ouvert recommandé (GeoJSON ou GPKG). Les autres formats possibles, par exemple, sont :

  • KML-KMZ: format texte basé sur le XML (Extensible Markup Language) popularisé et utilisé par Google Earth et Google Maps.
  • GML: format texte basé sur le XML, standardisé par l’OGC. Il est avant tout un format descriptif; il n’est pas un format de performance.
  • FGDB (File Geodatabase) : format base de données dans lequel, comme le GPKG, il est possible d’inclure plusieurs couches d’information. Populaire format propriétaire, son interopérabilité est limitée en dehors de l’écosystème ESRI.
  • CSV (comprenant de l’information géospatiale) : format texte tabulaire séparé par des virgules. Si l’information géospatiale est un point, le CSV doit contenir un champ « latitude » et un champ « longitude ». Si la donnée vectorielle est d’un autre type (exemples : ligne, polygone, etc.), le CSV doit contenir un champ caractère « geom » contenant la géométrie décrite selon la nomenclature standard OGC-WKT « well known text ».
  • Consultez la liste des formats géospatiaux disponibles sur le portail Données Québec.

Outils de conversion

Certains outils peuvent être utilisés pour convertir des fichiers vers différents formats :

  • Système d’information géographique (SIG) : le logiciel QGIS dispose de nombreuses fonctionnalités, dont un outil de conversion;
  • Application Web, soit l’outil Web OGRE, qui permet la conversion rapide de fichiers;
  • L’utilitaire GDAL offre une foule de possibilités pour réaliser la conversion de formats;
  • Des logiciels propriétaires tels que FME et ArcGIS font également la conversion de formats.

Il n’est généralement pas recommandé de transformer des fichiers entre différents formats; il vaut mieux exporter directement les données sources vers le format voulu.

4.1.4 Shapefile – SHP (non recommandé)

Le format Shapefile (SHP) est un format qui a été extrêmement populaire dans l’histoire de la géomatique. Développé par ESRI au début des années 1990, il fut largement utilisé au cours de plusieurs décennies. Aujourd’hui, c’est un format obsolète dont l’utilisation n’est plus recommandée, notamment pour la diffusion sur le portail Données Québec, et ce, pour diverses raisons :

  • Sa structure entraîne des problèmes de conversion et de compatibilité avec les formats géomatiques modernes;
  • Ses extensions multiples (.shp, .dbf, .shx, .prj, etc.) nécessitent un rassemblement pouvant causer des problèmes de transfert ou de gestion des données;
  • Il ne prend pas en charge le mélange de types de géométrie ou les géométries courbes complexes;
  • L’encodage utf-8 n’est pas natif au format SHP;
  • Les noms de champ sont limités à 10 caractères et le poids total, à 2 Go;
  • La topologie est absente;
  • La gestion des types de données numériques est problématique pour les valeurs NULL, les absences/vides et les 0.

Il est recommandé de cesser l’utilisation du format Shapefile. Il n’est pas non plus recommandé de le fournir en complément des formats ouverts recommandés.

 

4.1.5 Système de coordonnées géographiques recommandé pour les données vectorielles

Le système de coordonnées géographiques recommandé pour la diffusion des données vectorielles sur le portail Données Québec est le WGS 84 (EPSG:4326). En plus d’être l’un des systèmes de coordonnées les plus utilisés au monde, c’est également celui qui offre la meilleure compatibilité avec les outils de cartographie Web, les appareils mobiles et les bibliothèques de programmation modernes. Diffuser en WGS 84 permet d’optimiser la performance d’affichage des données vectorielles, en éliminant le besoin de calculs de reprojection « à la volée » dans les systèmes d’information géographique (SIG) et les navigateurs cartographiques Web. En uniformisant les couches vectorielles en WGS 84, on s’assure que les données provenant de différents ministères ou municipalités se superposent parfaitement, sans décalage visuel. Enfin, pour le format GeoJSON, le WGS 84 est la norme officielle (RFC 7946). Utiliser une autre projection pour ce format peut causer des erreurs de lecture dans certains logiciels.

Bien que le WGS 84 soit idéal pour la diffusion et la visualisation, les utilisateurs souhaitant effectuer des mesures de précision devront convertir la donnée vers un système projeté comme le Québec Lambert. Ainsi, pour les jeux de données destinés à des analyses spatiales rigoureuses ou des calculs de précision, la diffusion dans le référentiel NAD83 (CSRS), en utilisant la projection Québec Lambert (EPSG:6622), demeure une option valable et complémentaire. Le format GeoPackage est alors à privilégier, car il gère parfaitement le WGS 84 et le Québec Lambert.

Pour les jeux de données faisant appel à un autre système de coordonnées que celui recommandé (EPSG:4326 ou 6622), le code EPSG utilisé doit être documenté à la section « Informations complémentaires » du jeu de données si celui-ci s’applique à toutes les ressources (fichiers) du jeu, ou dans la description de la ressource lorsque celui-ci s’applique pour une ressource particulière seulement.

Astuce

Il pourrait être utile d’ajouter une mention du système de coordonnées sur le nommage des fichiers.

  • Ex. nom_du_fichier_WGS84.geojson
  • Ex. nom_du_fichier_Lambert.gpkg

Cela permet à l’utilisateur de choisir la version qui lui convient avant même de télécharger le fichier.

4.2 Données matricielles (raster)

Les données matricielles (ou images géoréférencées) sont des représentations numériques d’images continues du territoire. Les données matricielles sont constituées d’une matrice de pixels, de taille variable, organisés en lignes et en colonnes (grille), où chaque pixel représente une valeur. Ces valeurs permettent de modéliser des phénomènes variés tels que la végétation, le relief, les températures, etc.

4.2.1 Format GeoTIFF (recommandé) et autres formats matriciels

Le GeoTIFF est le format ouvert recommandé pour la diffusion des données matricielles sur le portail Données Québec. Le GeoTIFF sous sa forme optimisée pour le Web, soit le Cloud-Optimized GeoTIFF (COG), est également fortement recommandé. Le JPEG2000 est aussi un format qui peut être considéré. Les formats propriétaires, par exemple l’ECW, ne sont pas recommandés du fait que leur lecture peut se limiter à des logiciels propriétaires compatibles ou nécessiter l’installation de compléments, ce qui est le cas avec QGIS ou GDAL.

Le format GeoTIFF est recommandé pour la diffusion de données matricielles.

Les images géoréférencées, qui sont généralement volumineuses, ne peuvent être téléversées directement sur le portail Données Québec. Elles doivent plutôt être déposées sur l’infrastructure du diffuseur en faisant une gestion adéquate des permissions de cet emplacement pour donner un accès Web public aux fichiers à télécharger. Il est possible de communiquer avec le pilote du portail pour discuter d’options alternatives de diffusion.

4.2.2 Système de coordonnées géographiques recommandé pour les données matricielles

Pour la diffusion de données matricielles sur le portail Données Québec, l’utilisation de systèmes de coordonnées géographiques mondiaux comme le WGS 84 (EPSG:4326) ou de projections standardisées pour le Web comme le Web Mercator (EPSG:3857), utilisé entre autres par Google Maps et OpenStreetMap, est recommandée pour maximiser l’interopérabilité et la compatibilité avec les outils de visualisation cartographique en ligne.

Toutefois, le Web Mercator entraîne des distorsions importantes de surface et de distance, particulièrement aux latitudes du Québec. Ainsi, l’usage de projections plus locales dans le référentiel NAD83 (CSRS) est encouragé pour minimiser les distorsions et préserver la précision métrique. Les diffuseurs peuvent privilégier les projections :

  • Québec Lambert (EPSG:6622) : idéal pour les données couvrant l’ensemble de la province. Bien que l’EPSG:32198 soit encore largement utilisé, l’utilisation de l’EPSG:6622 est désormais encouragée pour s’aligner sur les standards géodésiques les plus récents du Québec.
  • Mercator Transverse Modifiée (MTM, zones 3 à 10, EPSG:2945 à 2952) : recommandées pour une précision accrue à l’échelle régionale ou locale.
  • Lambert conique conforme du MTMD[1] (EPSG:3798 [sud] et 3799 [nord]) : pour les contextes spécifiques liés au transport ou aux infrastructures provinciales.

Le système de coordonnées géographiques ou la projection utilisés doit être documenté par leur code EPSG respectif à la section « Informations complémentaires » du jeu de données, si ceux-ci s’appliquent à toutes les ressources (fichiers) du jeu, ou dans la description de la ressource, lorsque ceux-ci s’appliquent à une ressource particulière.

[1] Ministère des Transports et de la Mobilité durable

Si la donnée est purement visuelle (exemple : une photo aérienne), le Web Mercator est parfait. Si la donnée est scientifique (exemple : un modèle numérique de terrain), il vaut mieux la laisser dans sa projection locale d’origine (Lambert ou MTM) pour ne pas dénaturer l’information.

4.3 Données géospatiales 3D

Dans le cas de Données Québec, le terme « 3D » est réservé aux données dont la géométrie est explicitement tridimensionnelle (volumique ou surfacique). Cela inclut les données 3D multireprésentations telles que les nuages de points, les modèles urbains structurés, le maillage 3D, etc.

Les données vectorielles incluant des coordonnées Z et les données 2.5D comme les modèles numériques de terrain (MNT) ou modèles numériques de surface (MNS) ne sont pas considérées comme des données 3D.

4.3.1 CityGML (recommandé) et autres formats 3D

CityGML, un format ouvert standardisé par l’Open Geospatial Consortium (OGC), est le format de données recommandé pour la diffusion de données ouvertes 3D sur le portail Données Québec. Il s’agit d’un format d’échange pour la représentation, le stockage et l’échange de modèles de villes virtuelles 3D. CityJSON est également un format ouvert qui peut être utilisé. L’utilisation du JSON au lieu du GML simplifie considérablement la structure des fichiers.

Le format LAS est le standard OGC recommandé pour la diffusion de nuage de points lidar (ou autres nuages de points), par exemple les Données lidar du Québec.

Le format CityGML est recommandé pour la diffusion de données 3D.

Si vous ne trouvez pas le format 3D de données que vous souhaitez publier dans la liste de formats disponibles sur Données Québec, communiquez avec le pilote du portail.

4.4 Symbologie associée (recommandé)

Dans le but de faciliter la compréhension et l’analyse des données géospatiales, il est fortement recommandé d’inclure une symbologie associée aux données. Celle-ci permet la visualisation des données de façon à bien voir des catégories, des regroupements ou des classements de toutes sortes. Il est recommandé d’ajouter une ou plusieurs ressources de données associées au format de symbologie. Contrairement aux formats de données ouverts recommandés (GeoJSON, GPKG, GeoTIFF) qui sont interopérables, peu importe le SIG utilisé pour les consulter, le format de fichier de symbologie est associé à l’outil avec lequel il est produit. Il peut donc être nécessaire d’ajouter une symbologie associée à un outil libre comme QGIS — format QML (QGIS Markup Language), ainsi qu’un format de symbologie pour les logiciels propriétaires ESRI, par exemple LYR ou LYRX (ArcGIS Pro).

Les fichiers de symbologie peuvent être intégrés directement dans les formats « base de données » comme le GPKG. Lorsque vous utilisez cette astuce, veuillez le préciser dans la description de la ressource.

4.5 Services de cartographie Web

Un service de cartographie Web peut être offert en complément aux données téléchargeables afin de permettre la consommation directe de données par certains outils cartographiques. L’URL du service Web est alors ajoutée comme ressource au jeu de données, en choisissant le type de ressources « Service Web ». Les formats de services Web ouverts internationaux de l’OGC sont à privilégier pour permettre une interopérabilité et une compatibilité maximale :

         Web Map Service (WMS);

         Web Map Tile Service (WMTS);

         Web Feature Service (WFS);

         Web Coverage Service (WCS).

Les types de services Web propriétaires, tels qu’Esri REST, ne sont pas recommandés du fait que leur lecture optimale peut se limiter à des logiciels propriétaires compatibles. Pour que ces services Web propriétaires soient interopérables, il est nécessaire de leur configurer une sortie standardisée OGC.

Le format WFS a l’avantage de pouvoir être utilisé pour alimenter directement les fichiers téléchargeables dans Données Québec au moyen d’un lien provenant du service Web. Cela garantit que les fichiers téléchargés du portail sont toujours à jour.

Exemple d’une ressource GeoJSON alimentée directement par un service Web WFS

Stations débit/niveau – Grand public – Resource GeoJSON

Lors du téléchargement de la ressource, l’URL source fait appel au service Web pour générer directement le fichier GeoJSON :

https://geoegl.msp.gouv.qc.ca/apis/mapserver-vigilance/ws/vigilance.fcgi?service=wfs&version=1.1.0&request=getfeature&typename=stations_igo2_public&outputformat=geojson&epsg:4326

Exemple d’une ressource GeoJSON alimentée directement par un service Rest ESRI Feature

Piste cyclable de la ville de Shawinigan

https://cartes.shawinigan.ca/server/rest/services/R%C3%A9seau_cyclable/FeatureServer/0/query?where=1=1&outFields=*&returnGeometry=true&f=geojson

Les données géospatiales sont plus accessibles lorsqu’elles sont visualisées sur une carte. Il s’agit d’un moyen simple pour comprendre et consulter l’information autant pour les néophytes que pour les spécialistes du domaine.

Données Québec offre l’accès gratuit à un navigateur cartographique Web qui repose sur le logiciel libre Infrastructure géomatique ouverte (IGO). Le navigateur permet de visualiser des fichiers GeoJSON et KML à la volée, c’est-à-dire que les fichiers sont importés directement dans le navigateur en temps réel pour les afficher sur une carte. Il permet également l’affichage de couches provenant de services de cartographie Web. Enfin, il est possible de combiner l’affichage d’un GeoJSON à la volée et des couches de services Web. Voir le document Créer des visualisations cartographiques pour en savoir plus.

Pour en savoir plus sur l’intégration des jeux de données au navigateur cartographique IGO de Données Québec, contacter le pilote du portail.

Exemple d’une visualisation cartographique à la volée

Le jeu de données Écocentres et points de dépôt municipaux de Recyc-Québec présente une ressource de type « Visualisation cartographique » qui permet d’afficher le fichier GeoJSON à la volée dans le navigateur cartographique de Données Québec.

Exemple d’une visualisation cartographique d’une couche de service Web

Le jeu de données Repères de crue présente une ressource de type « Visualisation cartographique » qui permet d’afficher la couche du service Web dans le navigateur cartographique de Données Québec.