Tutoriel d'utilisation

F. Exporter des données

  1. Choisir le format d’export
  2. Exporter au format tableur (CSV)
    1. Enregistrer le fichier compressé
    2. Ouvrir les fichiers principaux
    3. Ouvrir les fichiers associés
    4. Consulter les métadonnées
  3. Exporter au format SIG (GeoJSON)
    1. Enregistrer le fichier compressé
    2. Consulter les données
    3. Consulter les métadonnées
  4. Exporter au format WFS
    1. Intérêts du format WFS
    2. Récupérer l’adresse correspondant à la requête
    3. Ouvrir le flux dans QGIS
  5. Signification des champs
    1. Table principale
    2. Sujets d’observation
    3. Tables de rattachement
  6. Précautions concernant l’utilisation des données
    1. Non exhaustivité des données
    2. Niveau de validité des données
    3. Précision spatiale, temporelle et taxonomique

1. Choisir le format d’export

Une fois une recherche réalisée, il est possible d’exporter ses résultats sous différents formats :

  • au format tableur (CSV)
  • au format SIG (GeoJSON)
  • sous la forme de flux (WFS)
  • Les deux derniers formats sont uniquement accessibles aux utilisateurs disposant d’identifiants de connexion.

Il est également possible de choisir la projection souhaitée :

  • projection locale officielle: RGR92 / UTM zone 40S (EPSG = 2975)
  • longitude/latitude, souvent utilisée par les GPS : WGS84 (EPSG = 4326)

Pour exporter et choisir le format et la projection voulus, cliquez sur l’onglet “Exporter” du panneau “Résultats” puis sur le petit bouton situé à gauche de la loupe.

Choix du format d’export pour un utilisateur connecté

Retour au sommaire


2. Exporter au format tableur (CSV)

2.1 Enregistrer le fichier compressé

Si le format CSV a été sélectionné pour l’export des données, une fenêtre s’ouvre demandant d’ouvrir ou enregistrer le fichier export_observation.zip. Enregistrez le fichier sur votre disque dur, puis dézippez-le avec un logiciel de gestion d’archives (par exemple avec WinRAR).

Enregistrement du fichier d’export

Le dossier dézippé contient les éléments suivants correspondant à la requête :

  • st_principal__typegeometrie_.csv : données d’observation, réparties en différents fichiers selon la géométrie à laquelle elles sont associées (point, polygone, ligne, pas de géométrie). Les types de géométrie accessibles sont définis par les droits d’accès aux données. Tous les fichiers ont la même structure ce qui facilite la constitution d’un fichier unique si besoin par copier/coller.
  • st_principal.csvt : fichier système nécessaire pour gérer les champs du fichier précédent (ne pas ouvrir)
  • LISEZ-MOI.txt : métadonnées relatives à l’export
  • st_rattachement : dossier comprenant les rattachements des observations à des entités géographiques de référence ainsi que les attributs additionnels associés aux données le cas échéant (uniquement en mode connecté).

Enregistrement du fichier d’export

  • Les attributs additionnels sont des champs non prévus par le format national du SINP mais qu'il est possible de partager de manière standardisée. Ils sont souvent spécifiques à un protocole ou un type de données (ex : biométrie, nom de stations de pêche, identifiant de balise Argos, etc.) et enrichissent souvent grandement les données. Ils peuvent également résulter d'un traitement appliqué aux données source dans Borbonica (ex : calcul de l'altitude à partir du MNT de 10 m). Ils sont uniquement accessibles aux utilisateurs disposant d’identifiants de connexion.
  • Pour plus de lisibilité, il est recommandé d’ouvrir les fichiers contenus dans le dossier d'export à l’aide du logiciel Libre Office Calc (encodage : UTF 8 / séparateur : virgule).

2.2 Ouvrir les fichiers principaux

Les fichiers principaux comprennent les principaux champs décrits dans Borbonica. Leur signification est donnée dans la partie dédiée .

Lorsqu’il est renseigné (voir les modalités d’accès dans la rubrique dédiée ), le champ WKT permet d’accéder à la localisation précise de l’observation en ouvrant le fichier CSV avec un logiciel de SIG. Pour cela, dans QGIS cliquez sur Couche / Ajouter une couche / Ajouter une couche de texte délimité. Renseignez alors comme ci-dessous dans la fenêtre qui s’ouvre le chemin d’accès, les délimiteurs et choisir le format de géométrie Well known text (WKT). Validez ensuite pour ajouter la couche au projet.

Ouverture d’un fichier csv sous QGIS

2.3 Ouvrir les fichiers associés

Le dossier est composé de plusieurs fichiers :

  • st_commune : localisation à la commune
  • st_departement : localisation au département
  • st_maille_02 : localisation à la maille 2x2km
  • st_maille_10 : localisation à la maille 10x10km
  • st_espace_naturel : localisation à l’espace naturel
  • st_habitat : localisation à l’habitat naturel (non mis en oeuvre dans Borbonica pour le moment)
  • st_masse_eau : localisation à la masse d’eau
  • st_attribut_additionnel : attributs additionnels associés aux données le cas échéant. Chaque attribut est caractérisé de manière générique par un nom court, une définition, une valeur, une unité, une thématique de regroupement et un type (QTA = quantitatif / QUAL = qualitatif).

Le lien avec le fichier principal se fait via la colonne cle_obs, commune aux différents fichiers.

2.4 Consulter les métadonnées

Le fichier de métadonnées rappelle les critères de recherche utilisés pour la requête et décrit le contenu du dossier d’export.

Il précise également les conditions d’utilisation des données découlant du protocole national SINP et de la charte régionale SINP.

Retour au sommaire


3. Exporter au format SIG (GeoJSON)

3.1 Enregistrer le fichier compressé

Si le format GeoJSON a été sélectionné pour l’export des données, une fenêtre s’ouvre demandant d’ouvrir ou enregistrer le fichier export_observation.zip. Enregistrez le fichier sur votre disque dur, puis dézippez-le avec un logiciel de gestion d’archives (par exemple avec WinRAR).

Enregistrement du fichier d’export

Le dossier dézippé contient deux fichiers correspondant à la requête :

  • export_observations.geojson : données d’observation
  • LISEZ-MOI.txt : métadonnées relatives à l’export.

3.2 Consulter les données

Le format GeoJSON est un format de données géolocalisées vectorielles manipulable sous un logiciel de SIG à l’instar d’autres formats de données plus courants (ex : .shp, .tab…). Il présente l’avantage de contenir l’ensemble des informations dans un unique fichier.

Sous QGIS, l’ouverture de la couche GeoJSON s’effectue comme toute couche vecteur via le menu Couche / Ajouter une couche / Ajouter une couche vecteur ou via le bouton raccourci des barres de menu.

  • Il est également possible de « glisser - déplacer » la couche en la « jetant » sur la fenêtre carte de QGIS depuis son répertoire de stockage

Lorsque l’export contient des objets de nature différente, une fenêtre s’ouvre demandant quelle(s) couche(s) vectorielle(s) sélectionner et affiche le détail du nombre de données par type de géométrie (point, ligne, polygone). En effet, QGIS et la plupart des logiciels de SIG gèrent les objets de types différents dans des couches différentes. Si tous les types de données vous intéressent, sélectionnez toutes les couches puis cliquez sur « OK ».

Sélection du type de géométrie

La ou les couche(s) correspondante(s) s’ouvre(nt) alors dans la fenêtre carte.

Affichage des données dans QGIS

  • En cas de problème d’affichage sous SIG (décalage par rapport à un fond de carte par exemple), pensez à vérifier que la projection de la couche correspond bien à ce que vous avez choisi au moment de l'export. Pour cela, allez dans les propriétés de la couche, puis sélectionnez le bon système de coordonnées de référence.
  • Les données sont encodées en UTF8. En cas de problème d’affichage de caractères spéciaux dans les attributs (accents mal retranscrits par exemple), allez dans les propriétés de la couche, puis sélectionnez le bon encodage des données source.

3.3 Consulter les métadonnées

Le fichier de métadonnées rappelle les critères de recherche utilisés pour la requête et décrit le contenu du dossier d’export.

Il précise également les conditions d’utilisation des données découlant du protocole national SINP et de la charte régionale SINP.

Retour au sommaire


4. Exporter au format WFS

4.1 Intérêts du format WFS

Le format WFS (Web feature service) permet, au moyen d’une URL formatée, d’interroger des serveurs cartographiques distants afin de manipuler des objets géographiques (lignes, points, polygones…), contrairement au Web Map Service ou WMS qui ne permet que la production de cartes. Son utilisation requiert un accès à Internet.

Le format WFS donne accès à un flux de données récupéré en temps réel sur le serveur hébergeant Borbonica. Si de nouvelles données correspondant à la requête de l’utilisateur ont été intégrées à Borbonica entre le moment de la première requête et le moment où il se connecte, ces données lui seront donc accessibles depuis son logiciel de SIG sans qu’il ait besoin de faire une nouvelle requête sur Borbonica.

4.2 Récupérer l’adresse correspondant à la requête

Si le format WFS a été sélectionné pour l’export des données, un champ apparaît stockant une adresse URL.

Copier URL WFS

Pour visualiser les données, il faut dans un premier temps copier cette adresse, par exemple : https://www.borbonica.re/carte/index.php/occtax/wfs/?date_min=1887-05-01&code_commune=97423&service=WFS&request=GetCapabilities&version=1.0.0 .

L’URL du flux intrègre les critères de recherche utilisés pour la générer.

4.3 Ouvrir le flux dans QGIS

Ouvrez QGIS puis allez dans le menu Couche / Ajouter une couche / Ajouter une couche WFS. La fenêtre suivante s’ouvre alors :

Nouvelle connexion WFS

  • La fonctionnalité n'est pas offerte pour les versions anciennes de QGIS. Une version au moins égale à la 2.18 est nécessaire pour visualiser les flux WFS. Une version récente de QGIS peut être librement téléchargée sur le portail de QGIS https://qgis.org/fr/site/forusers/download.html.

Cliquez sur nouveau puis renseignez les identifiants de connexion ainsi :

  • Nom : nom de votre choix permettant de désigner cette connexion
  • URL : adresse copiée dans le navigateur Internet
  • Nom d’utilisateur : login qui vous a été fourni par l’administrateur Borbonica
  • Mot de passe (optionnel): mot de passe qui vous a été fourni par l’administrateur Borbonica.

Cliquez ensuite sur “OK” puis sur “Connexion”. La liste des couches accessible via le flux est actualisée. Elle comprend 4 couches :

  • export_observation_point : couches des observations de type point
  • export_observation_linestring : couches des observations de type ligne
  • export_observation_polygon : couches des observations de type polygone
  • export_observation_nogeom : couches des observations non associées à une géométrie précise (en réalité elles sont associées soit à une maille soit au département sans plus de précision).

Sélectionnez toutes les couches ou uniquement celle souhaitée, puis cliquez sur “Ajouter”. Les couches apparaissent alors dans la fenêtre carte de QGIS et sont manipulables comme toute autre couche vectorielle.

Ouvrir la couche

  • Si vous enregistrez le projet QGIS après avoir ajouté la couche issue du flux, le mot de passe sera stocké en dur dans le projet QGIS. Il est important de prendre des précautions dans le cas où le projet serait transmis à d'autres utilisateurs, qui disposeraient alors des droits d'accès qui vous sont ouverts sans qu'un mot de passe ne leur soit demandé.

Retour au sommaire


5. Signification des champs

Borbonica met en oeuvre le format standard national occurrences de taxon (version 2.0) . La signification des champs exportés aux différents formats est détaillée ci-desous. Lorsqu’il s’agit d’un champ à vocabulaire contrôlé, la liste des valeurs possibles est accessible en cliquant sur le symbole .

5.1 Table principale

La table principale comporte les observations générales relatives au taxon observé, au lieu et à la date d’observation, ainsi qu’à l’observateur. Les champs indiqués d’une * sont accessibles aux seuls utilisateurs disposant d’identifiants de connexion.

Champ

Signification

cle_obs Identifiant technique de l’observation dans Borbonica, utile notamment pour faire le lien entre les différents fichiers de l’export csv
id_sinp_occtax Identifiant unique et permanent de l’observation dans le SINP attribué par Borbonica ou la plate-forme nationale du SINP
statut_observation * Indique si le taxon a été observé directement/indirectement (indices de présence), ou bien non observé
cd_nom Code du taxon « cd_nom » de TaxRef référençant au niveau national le taxon. Autant que possible au moment de l’échange, le référentiel utilisé est celui en vigueur diffusé sur le site de l’INPN ( https://inpn.mnhn.fr/programme/referentiel-taxonomique-taxref )
nom_cite Nom du taxon cité à l’origine par l’observateur. Celui-ci peut être le nom scientifique reprenant idéalement en plus du nom latin, l’auteur et la date. Cependant, si le nom initialement cité est un nom vernaculaire ou un nom scientifique incomplet alors c’est cette information qui doit être indiquée
lb_nom_valide Nom latin du taxon de référence rattaché au nom cité à partir de Taxref
nom_vern Nom français du taxon issu de Taxref
group2_inpn Groupe taxonomique
famille Famille taxonomique
loc Statut biogéographique issu de Taxref
menace Niveau de menace sur la liste rouge UICN des espèces menacées de La Réunion
protection Statut de protection du taxon
denombrement_min * Nombre minimum d’individus du taxon composant l’observation
denombrement_max * Nombre maximum d’individus du taxon composant l’observation
objet_denombrement * Objet sur lequel porte le dénombrement (exemple : individu, couple…)
type_denombrement * Méthode utilisée pour le dénombrement (exemple : calculé, compté…)
commentaire * Champ libre pour informations complémentaires indicatives sur le sujet d’observation
date_debut Date du jour de début d’observation. En cas d’imprécision, cet attribut représente la date la plus ancienne de la période d’imprécision
date_fin Date du jour de fin d’observation. En cas d’imprécision, cet attribut représente la date la plus ancienne de la période d’imprécision. Lorsqu’une observation est faite sur un jour, les dates de début et de fin sont les mêmes (cas le plus courant)
dee_date_derniere_modification * Date de dernière modification de la donnée
ds_publique * Indique explicitement si la donnée est d’origine publique ou privée. La charte régionale du SINP 974 prévoit que les données d’origine publique soient diffusées sans floutage au grand public, sauf pour les données sensibles.
id_origine Identifiant unique de la donnée source de l’observation dans la base de données du producteur où est stockée et initialement gérée la donnée source
jdd_code Code du jeu de données dont provient la donnée source
id_sinp_jdd Identifiant permanent et unique de la fiche métadonnées du jeu de données auquel appartient la donnée. Cet identifiant est attribué par la plate-forme
organisme_gestionnaire_donnees Organisme détenant la donnée source à l’origine de la
statut_source Indique si la donnée source de l’observation provient directement du terrain (via un document informatisé ou une base de données), d’une collection, de la littérature, ou n’est pas connu
reference_biblio * Référence de la source de l’observation lorsque celle-ci est de type « Littérature », au format ISO690
sensi_niveau Indique si l’observation et à quel degré selon le référentiel de sensibilité du SINP 974
descriptif_sujet * Voir le tableau ci-dessous
validite_niveau Niveau de validité de la donnée attribué à partir du protocole régional de validation du SINP 974
validite_date_validation Date d’attribution du niveau de validité
precision_geometrie Précision de la géométrie (en m). Cette valeur peut faire l’objet d’estimations lorsqu’elle n’est pas présente dans la donnée d’origine
wkt Champ comprenant la géométrie de l’observation au format Well Known Text dans le fichier d’export au format csv uniquement. L’information n’est disponible au grand public que pour les données non sensibles d’origine publique ou dont le producteur a accepté une diffusion non floutée. Les ayants-droit accèdent en revanche aux données précises
observateur Nom, prénom, et organisme de la ou des personnes ayant réalisé l’observation. Cette information n’est pas diffusée si le producteur de données a indiqué que les personnes concernées par son jeu de données souhaitaient rester anonymes

5.2 Sujets d’observation

Les sujets d’observation sont décrits dans le champ descriptif_sujet de la table principale. Le champ comprend un item par groupe d’individus homogènes (ex : des mâles adultes, des juvéniles au sexe indéterminé…). Chaque groupe est compris entre des accolades { }. La signification des champs des différents fichiers est la suivante :

Champ

Signification

occ_sexe Sexe du sujet de l’observation
obs_technique Indique de quelle manière on a pu constater la présence d’un sujet d’observation
obs_contexte Description libre du contexte de l’observation, aussi succincte et précise que possible
occ_naturalite Naturalité de l’occurrence, conséquence de l’influence anthropique directe qui la caractérise. Elle peut être déterminée immédiatement par simple observation, y compris par une personne n’ayant pas de formation dans le domaine de la biologie considéré
obs_description Description libre de l’observation, aussi succincte et précise que possible
occ_stade_de_vie Stade de développement du sujet de l’observation
preuve_existante Indique si une preuve existe ou non. Par preuve on entend un objet physique ou numérique permettant de démontrer l’existence de l’occurrence et/ou d’en vérifier l’exactitude
url_preuve_numerique Adresse web à laquelle on pourra trouver la preuve numérique ou l’archive contenant toutes les preuves numériques (image(s), sonogramme(s), film(s), séquence(s) génétique(s)…)
occ_etat_biologique Etat biologique de l’organisme au moment de l’observation (vivant, mort, etc.)
occ_statut_biologique Statut biologique de l’individu observé (reproduction, hibernation, en vol, etc.)
occ_methode_determination Description de la méthode utilisée pour déterminer le taxon lors de l’observation
occ_statut_biogeographique Le statut biogéographique couvre une notion de présence (présence/absence), et d’origine (indigénat ou introduction). Il est similaire au statut biogéographique du guide méthodologique TAXREF mais s’applique au niveau local : il s’agit d’une information qui ne peut être renseignée que suite à une déduction à dire d’expert
occ_comportement Comportement de l’individu sur le site d’observation
denombrement_min Nombre minimum d’individus du taxon composant le groupe d’individus
denombrement_max Nombre maximum d’individus du taxon composant le groupe d’individus
objet_denombrement Objet sur lequel porte le dénombrement (exemple : individu, couple…)
type_denombrement Méthode utilisée pour le dénombrement (exemple : calculé, compté…)

5.3 Tables de rattachement

L’export csv comprend des tables de rattachement des observations à des entités géographiques de référence (voir la partie dédiée ). La signification des champs des différents fichiers est la suivante :

Champ

Signification

cle_obs Identifiant unique technique de la donnée dans Borbonica
code_maille Code de la maille à laquelle est rattachée l’observation
version_ref Version du référentiel de maille
nom_ref Nom du référentiel de maille
type_info_geo Indique le type d’information géographique (« géoréférencement » lorsque la maille est la seule information géographique disponible dans la donnée source, « rattachement » lorsqu’il s’agit d’une information déduite par croisement entre la géométrie de la donnée source et la couche des mailles)

Retour au sommaire


6. Précautions concernant l’utilisation des données

Différentes précautions sont à mettre en oeuvre pour ne pas conduire à surinterpréter ou interpréter de manière erronnée les données issues de Borbonica. Dans tous les cas, cela implique une nécessaire prise en compte des attributs des données en ne se limitant pas à la seule donnée de localisation des observations.

6.1 Non exhaustivité des données

Les données diffusées dans Borbonica reflètent l’état d’avancement à un moment donné de la mise en partage des données dans le cadre du SINP. Elles ne doivent en aucun cas être considérées comme exhaustives.

L’absence dans Borbonica d’observation d’une espèce sur un secteur donné peut en effet indiquer :

  • soit que des observations ont été réalisées mais n’ont pas été versées à Borbonica ;
  • soit que l’espèce n’a pas encore été prospectée sur le secteur ;
  • soit que l’espèce a été cherchée mais n’a pas été trouvée. Dans ce cas, il est possible d’indiquer que l’espèce n’a pas été observée via le champ statut_observation (voir plus haut ), mais ces observations sont rarement consignées par les producteurs pour le moment.

A l’inverse, l’existence d’une observation pour une espèce donnée sur un secteur donné ne signifie pas forcément que l’espèce y est toujours. En effet, l’observation peut être ancienne (regarder les champs date-debut et date-fin), ou bien il peut s’agit d’une espèce mobile (pour la faune).

6.2 Niveau de validité des données

Les données intégrées dans Borbonica font l’objet d’une validation scientifique dans le cadre du protocole de validation du SINP 974 . Cette procédure conduit à attribuer un indice de fiabilité aux données sur la base des connaissances disponibles. Chaque observation se voit donc attribuer un niveau de validité au sein d’une des catégories suivantes :

  • Certain / très probable
  • Probable
  • Douteux
  • Invalide
  • Non réalisable
  • Non évalué

En mode non connecté, seules les observations les plus fiables sont diffusées, correspondant aux niveaux “Certain - très probable” ou “Probable”. En revanche, les utilisateurs disposant d’identifiants de connexion accèdent à l’ensemble des données. Le niveau de validité est stocké dans le champ validite-niveau (voir plus haut ). Le cas échéant, il est nécessaire de filtrer ces données pour n’accéder qu’aux niveaux qui vous intéressent.

6.3 Précision spatiale et taxonomique

Les données intégrées dans Borbonica sont issues de sources variées. Selon les cas, les localisations d’observations peuvent être très précises (de l’ordre du mètre, par exemple pour les points issus de GPS) ou à l’inverse imprécises (de l’ordre de plusieurs centaines de mètres, par exemple pour les observations rattachées à des lieux-dits). Il est important de vérifier cette information dans le champ precision_geometrie.

Selon le même principe, même si la majorité des observations concernent des espèces, le rang du taxon qui fait l’objet d’observation est variable. Il peut ainsi s’étendre d’une variété (ex : Hubertia ambavilla var. taxifolia (Poir.) C.Jeffrey, 1992) à un ordre (ex : Chiroptera Blumenbach, 1779 pour une chauve-souris indéterminée). Par ailleurs, dans certains cas très précis identifiés par le protocole de validation, il peut arriver qu’une donnée signalée par l’observateur au niveau d’une espèce soit validée au niveau du genre.

Retour au sommaire