Copier ce texte
Bilan des différentes approches mises en œuvre lors de l’expertise sur les données bancarisées et propositions d’harmonisation
L’amélioration continue de la qualité des données de la surveillance a pour objectif de rendre plus fiables et mieux documentées les données produites dans le cadre de la surveillance des milieux aquatiques. Ces données sont bancarisées dans des bases de données nationales (ADES pour les eaux souterraines, QUADRIGE pour le milieu marin, Naïades pour les eaux de surface) ou propres à chaque Agence ou Office de l’eau. Maîtriser la qualité de la donnée, notamment au travers des métadonnées associées, permet à la fois de faciliter leur exploitation dans le cadre d’expertises et/ou des évaluations de l’état des masses d’eau, mais aussi de mieux les comparer dans l’espace et le temps.
Depuis 2011, différentes études ont été conduites dans le cadre des programmes Aquaref, pour i) vérifier la complétude des données et identifier les erreurs de codification SANDRE ii) évaluer l’évolution des performances des méthodes analytiques employées et leur conformité au regard des exigences réglementaires (Ghestem, 2012 ; Guigues 2012), iii) identifier d’éventuels effets laboratoires (Bristeau et Ghestem, 2013, 2015 et 2016 ; Ngo et Botta, 2016) ou encore iv) estimer les incertitudes de mesure à partir de séries chronologiques (Soudant et al., 2015 et 2017).
Au travers de ces études, le constat a été fait que l’une des questions premières qui se pose lors de l’exploitation des données bancarisées concerne la manière de prendre en compte les données dites « censurées », c’est-à-dire les données inférieures à une limite (détection ou quantification par exemple). De plus, compte tenu des évolutions des exigences réglementaires et des performances des moyens de mesure, il est très courant d’avoir à exploiter des séries de données caractérisées par des limites de détection ou quantification différentes. Un autre point qu’il est important d’adresser est le choix des descripteurs statistiques (comme la moyenne, la médiane etc.) à estimer ainsi que le type d’approche en lien avec la distribution des données (par exemple paramétrique pour les données distribuées selon une loi normale, ou non paramétrique dans les autres cas) et les tests statistiques à mettre en oeuvre. Ces différents choix sont en général très dépendants du jeu de données (nombre, distribution etc.).
Les objectifs de cette note sont, dans un premier temps, de présenter les différentes études réalisées dans le cadre du programme Aquaref entre 2011 et 2018, dans un deuxième temps, de décrire les approches existantes avec leurs inconvénients et leurs avantages pour répondre notamment à la question des données censurées et des approches statistiques les mieux adaptées à mettre en oeuvre. Enfin dans un troisième temps des propositions et recommandations sont formulées pour améliorer l’exploitation des données bancarisées.
Texte intégral
Fichier | Pages | Taille | Accès | |
---|---|---|---|---|
Version officielle éditeur | 15 | 308 Ko |