Copier ce texte
Qualification Biogéographique de données taxinomiques
Le Système d’Information Quadrige, développé par l’Ifremer, représente aujourd’hui le Système d’Information national de référence pour la gestion des données de surveillance littorale effectuée conformément à la Directive Cadre sur l’Eau de l’Union Européenne. Ce Système d’Information, associé à une Base de données du même nom, gère donc ces données de surveillance du littoral, géolocalisées, parmi lesquelles comptent des données taxinomiques, dont chaque occurrence correspond à l’observation d’un taxon à un endroit donné, à un instant t et sur un paramètre donné.
Tout processus d’acquisition de données et de bancarisation pouvant présenter des erreurs, le Système d’Information Quadrige intègre différents outils et procédures de qualification des données. Il s’agit de détecter les anomalies pour les corriger et leur attribuer un niveau de qualité (« Bon », « Douteux », « Faux ») informant les usagers de la donnée de ses limites d’utilisation. Or aucune procédure de ce type n’existait pour le contrôle de la qualité des données taxinomiques, notamment pour les informations géographique et taxinomique. Pour pallier ce manque, les travaux que j’ai menés ont permis de mettre en place une procédure de contrôle biogéographique des données taxinomiques. Les tests pertinents ont été identifiés, puis des scripts ont été développés pour effectuer ces tests sur un jeu de données ciblé (phytoplancton du réseau REPHY des années 2010 à 2020). Les résultats ont permis d’élaborer les fiches descriptives permettant de rejouer les tests à la demande, certains tests ont été intégrés dans des outils déjà en exploitation, et l’ensemble a été ordonné et documenté, constituant la procédure de qualification attendue.
Mot-clé(s)
Qualité des données, procédure, données taxinomiques, base de données, Quadrige
The Quadrige Information System, developed by Ifremer, is currently the national reference information system for the management of coastal monitoring data carried out in accordance with the European Union's Water Framework Directive.
This Information System, is associated with a Database of the same name, and manages these geolocalized coastal monitoring data, including taxonomic data. Each occurrence corresponds to the observation of a taxon at a given location, at a given time and on a given parameter.
Since any data acquisition and banking process may contain errors, the Quadrige Information System integrates various tools and procedures for data qualification. The aim is to detect anomalies in order to correct them and assign a quality level ("Good", "Doubtful", "False") providing users with a confidence level thus a relevance in using those data.
However, no such procedure existed for the quality control of taxonomic data, especially for geographic and taxonomic information.
In order to overcome this lack, the work I carried out led to a procedure for biogeographical control of taxonomic data.
Relevant tests have been identified, and scripts were developed to perform these tests on a selected dataset (phytoplankton from the REPHY network from 2010 to 2020).
Results have been used to develop descriptive sheets allowing to run the tests on demand. Some tests have been integrated into existing tools and the result has been ordered and documented to provide the expected qualification procedure.
Keyword(s)
data quality, procedure, taxonomic data, database, Quadrige
Texte intégral
Fichier | Pages | Taille | Accès | |
---|---|---|---|---|
Version officielle éditeur | 33 | 1 Mo |