Partenariat Données Québec

Données ouvertes de référence : des données pour bâtir

Objectif et bénéfices visés

Le service public de données ouvertes de référence vise des jeux liés à des caractéristiques en vue d’en favoriser la fiabilité. Ces caractéristiques concernent notamment les pratiques appliquées en matière d’identifiant unique, de qualité, d’intégrité, de disponibilité, d’interopérabilité, de métadonnées et de documentation.

  • Les utilisateurs de données : disposent de garanties sur la fiabilité des données offertes, ce qui leur permet d’investir avec confiance des ressources afin de mieux les exploiter, et ce, sans avoir à élaborer des ententes administratives.
  • Les diffuseurs : augmentent leur performance organisationnelle en réduisant les demandes ponctuelles. Ce service vise à simplifier les processus administratifs pour minimiser, voire éliminer les cas où des ententes particulières (individuelles) d’échanges de données sont privilégiées.
  • L’État québécois: une meilleure cohérence de l’information au sein de l’écosystème québécois, ce qui renforce la confiance des partenaires envers ce dernier.

L’ambition 6 de la Stratégie de transformation numérique gouvernementale propose que les données soient valorisées et redonnées aux citoyens. Comme cible de transformation, il est visé que « 60 % des organisations diffusent la majorité de leurs données à haut potentiel de réutilisation » dont notamment leurs données de références.

Afin d’appuyer l’atteinte de cette cible, la mesure 7 du Plan d’action favorisant un gouvernement ouvert 2020 – 2021 vise à offrir un service gouvernemental de données ouvertes de référence.

Un jeu de données ouvertes de référence sert à nommer ou à identifier, de manière unique, des entités (par exemple, des municipalités, des entreprises, des publications, des découpages administratifs, ou des organismes) pour y attacher des attributs officiels.

En vue de favoriser leur fiabilité, chaque jeu de données ouvertes de référence :

  • est proposé par un organisme public, validé par le dirigeant principal de l’information et encadré par une déclaration de services et des critères de qualité. Cette déclaration de services énonce clairement :
    • la portée du jeu de données,
    • la ou les sources de ces données, en assurant leur qualité, leur intégrité et leur disponibilité;
    • la licence d’utilisation;
  • est accompagné d’un profil de métadonnées et d’une documentation adéquate, incluant la communication proactive des changements.

Par ailleurs, les incidents de non-conformité, dont ceux rapportés par les utilisateurs, sont pris en charge par le diffuseur. Le cas échéant, des correctifs sont apportés aux données lorsque les utilisateurs rapportent des erreurs et des inexactitudes.

Ainsi, les données ouvertes de référence sont en adéquation avec les six caractéristiques suivantes.

Dans les données ouvertes de référence, chaque entité (par exemple, une municipalité dans le répertoire des municipalités) doit comporter un identifiant unique. Les diffuseurs appliquent les bonnes pratiques suivantes, en matière d’identifiant unique [1]:

  • Respecter le caractère unique de l’identifiant: l’identifiant doit être minimalement unique au sein du jeu de données.
  • Assurer la pérennité de l’identifiant unique: l’identifiant unique de doit pas être modifié dans le temps. Un identifiant unique déjà utilisé ne doit pas être réassigné à une nouvelle entité.
  • Prévoir des règles pour gérer les changements importants, afin d’en assurer la traçabilité : des règles simples sont prévues pour gérer des changements (fusion de deux entités, séparation d’une entité en deux nouvelles entités, etc.) afin de tracer ceux qui ont été effectués dans le temps. Par ailleurs, les changements mineurs ne devraient pas toucher l’identifiant unique.
  • S’assurer que les identifiants uniques pourront être utilisés dans une URL : pour faciliter la publication sur le Web, l’identifiant unique ne doit pas contenir des caractères réservés, tels que :  » < > % { } | \ ^ `. Au besoin, consulter la référence normative RFC 3986.

[1] Gouvernement du Royaume-Uni, Linked identifier schemes : Best practice guide

Comme indiqué dans les Énoncés d’orientations pour les données ouvertes, les données ouvertes de référence sont en adéquation avec les éléments suivants :

  • Exhaustivité : les données sont aussi complètes que possible. Dans le contexte des données ouvertes de référence, les attributs pertinents rattachés aux entités sont inclus dans le jeu de données.
  • Granularité : les données sont désagrégées le plus possible. Dans le contexte des données ouvertes de référence, les entités ne sont pas regroupées.
  • À jour : respect de la fréquence de mise à jour indiquée dans les métadonnées par l’organisme public qui est le diffuseur.

Comme indiqué dans les Énoncés d’orientations pour les données ouvertes, le service public des données ouvertes de référence est en adéquation avec les éléments suivants :

  • Intégrité : propriété d’une donnée de ne pas avoir été altérée ou détruite de façon erronée ou sans autorisation.
  • Disponibilité : le diffuseur garantit la disponibilité et documente les périodes où les données ne sont pas disponibles (par exemple, pour des maintenances ponctuelles). Afin que les données tabulaires soient interrogeables par API, le diffuseur privilégie le téléversement sur les infrastructures de Données Québec.

Pour obtenir plus d’information sur chacun des éléments mentionnés ci-dessus, veuillez consulter la section 3.4 du Guide de mise en œuvre des Énoncés d’orientations pour les données ouvertes.

Pour favoriser l’interopérabilité, les Lignes directrices sur la diffusion de données ouvertes doivent être appliquées.

En plus des métadonnées obligatoires par les Lignes directrices, les données ouvertes de référence contiennent les suivantes :

  • Métadonnées obligatoires du jeu de données ouvertes
    • Responsable : la direction générale ou son équivalent responsable de la création et de la mise à jour
    • Adresse courriel de la direction générale ou son équivalent responsable de prendre en charge les requêtes
  • Métadonnées de la ressource
    • La date de dernière modification est constamment à jour
  • Dictionnaire de données
    • La liste des attributs et leur définition
    • Les domaines de valeurs, s’il y a lieu
  • Des documents accompagnent les données afin de fournir plus d’information
    • Historique des changements
    • Les changements prévus. Ceux-ci peuvent être documentés dans les métadonnées. Une actualité peut également être rédigée
    • Méthodologie, s’il y a lieu
    • Modèle relationnel de données, s’il y a lieu

Les incidents de non-conformité peuvent être signalés aux diffuseurs. Les incidents signalés sont pris en charge, et l’utilisateur reçoit une réponse dans un délai de 72 heures :

  • Pour les incidents de non-conformité simples: l’incident est corrigé, et l’utilisateur en reçoit la confirmation. De plus, une actualité peut être diffusée afin d’en aviser tous les utilisateurs.
  • Pour les incidents de non-conformité complexes: un diagnostic est posé, et l’utilisateur est informé des prochaines étapes.

Les utilisateurs communiquent directement avec le diffuseur à l’aide des coordonnées fournies dans les métadonnées.

Les organismes publics peuvent contacter le pôle d’expertise en données ouvertes (pilote@donneequebec.ca) pour entreprendre les démarches de validation auprès du dirigeant principal de l’information.