Copier ce texte
Version évolutive de l’outil opérationnel de numérisation et d’analyse semi-automatique d’images de phytoplancton, utilisant le matériel FlowCAM et le logiciel ZooPhytoImage. Nouvelles perspectives
Le système couplé FlowCAM/ZooPhytoImage est devenu un outil véritablement opérationnel en 2014. Cependant, pour qu'il soit totalement adapté aux observations du phytoplancton réalisées dans le cadre du réseau d’observation REPHY, et afin de mieux répondre aux sollicitations présentes et futures concernant l'évaluation de la qualité des eaux littorales et marines dans le cadre des exigences européennes, telles que la DCE et la DCSMM, des nouvelles fonctionnalités doivent être intégrées aux outils existants. C'est pourquoi, différents axes d'évolution ont été proposés par l'UMONS et Ifremer pour adapter, à la fois l'appareil de numérisation et le logiciel ZooPhytoImage aux contraintes définies par le REPHY.
Premièrement, la version 5 de Zoo/PhytoImage contient de récentes nouveautés telles que le développement de routines pour importer et analyser les données automatiquement, et la refonte de l'interface graphique pour une meilleure ergonomie et une simplicité d'utilisation. Cette dernière a été étudiée du point de vue de son adéquation pour des traitements spécifiques liés aux besoins des principaux partenaires. En effet, il apparaissait désirable d'augmenter considérablement l'interactivité visuelle avec le logiciel, notamment au niveau de la visualisation des vignettes, des données brutes et de l'automatisation de certaines tâches. A cette fin, dans cette version du logiciel, les outils de traitement d'images et de transformation des données brutes sont appliqués implicitement. Deuxièmement, la dernière version de Zoo/PhytoImage permet d'obtenir des identifications automatiques pertinentes du phytoplancton mais sans distinguer une cellule d'une colonie. Or, même si les colonies contribuent en grande partie à la productivité annuelle, l'ensemble des estimateurs de la biomasse sont calibrés essentiellement sur l'abondance en termes de cellules par unité de volume. Dans ce rapport, la méthode proposée consiste à construire des modèles prédictifs
permettant d'estimer le nombre de cellules par colonie, en se basant sur les comptages manuels réalisés sur les particules du set d'apprentissage. Dans cette étude, des scores élevés de performance obtenus par différentes méthodes prédictives ont été mis en évidence sur six groupes taxinomiques de phytoplancton colonial de la Manche Orientale et du Sud de la Mer du Nord.
Enfin, le module de correction de l'erreur, intégré à Zoo/PhytoImage depuis la version 4, permet d'obtenir des identifications avec un faible pourcentage d'erreur par groupe, pour chacun des échantillons analysés. Nous proposons ici, d'utiliser l'information liée à la validation manuelle des vignettes par l'expert, afin d'ouvrir la voie à l'apprentissage actif. Dans ce rapport, nous montrons les intérêts de ce processus pour la reconnaissance semi-automatisée du phytoplancton, à savoir : la construction et l'adaptation automatique du set d'apprentissage permettant de partir d'un set « global » au niveau national ; l'amélioration des performances de classification automatique de nouveaux échantillons ; un gain de temps lors de la validation des prédictions automatiques dans le cadre de la correction de l'erreur.
Mot-clé(s)
Plancton, Analyse automatisée, Analyse d'image, Classification supervisée, Apprentissage actif, Dénombrement de cellules
The coupled system FlowCAM/ZooPhytoImage has become a real operational tool in 2014. However, to be fully adapted to the observations of phytoplankton performed in the context of the REPHY observation network and in order to better respond to present and future requests concerning the evaluation of quality of coastal and marine waters within the European requirements, such as the WFD and MSFD, new functionalities must be integrated into existing tools. Therefore, different axis of development have been proposed by UMONS and Ifremer to adapt both the digitization device and the Zoo/PhytoImage software to the constraints defined by the REPHY.
First, version 5 of Zoo/PhytoImage contains recent innovations such as the development of routines to automatically import and analyze data, and the redesign of the graphical user interface to improve the ergonomics and the ease of use. The latter has been studied from the point of view of its fit for specific treatments related to the needs of major partners. Indeed, it appears desirable to significantly increase the visual interaction with the software, particularly in terms of exploration of vignettes and raw data, and the automation of some tasks. For this, in this version of the software, the image processing tools and raw data transformation are implicitly applied.
Second, the latest version of Zoo/PhytoImage provides relevant automatic identifications of phytoplankton but without distinction of a cell from a colony. However, even if the colonies greatly contribute to the annual productivity, all the estimators of biomass are essentially calibrated on the abundance in terms of cells per volume unit. In this report, the proposed method consists in building predictive models to estimate the number of cells per colony, based on manual counts performed on the particles of the training set. In this study, high performance scores obtained by different predictive methods, were highlighted on six taxonomic groups of colonial phytoplankton from eastern Channel and Southern North Sea.
Finally, the error correction module, integrated to Zoo/PhytoImage since version 4, provides identifications with a low percentage of error per group for each analyzed sample. We propose here to use the information related to the manual validation of vignettes by expert to open the way to the active learning. In this report, we show the interest of this process for the semi-automated recognition of phytoplankton, such as the building and automatic adaptation of the training set allowing to use a "global" training set at national level; the improvement of clustering performances for new samples; a time saving during the validation of the automatic predictions in the context of the error correction.
Keyword(s)
Plankton, Automated analysis, Image processing, Supervised classification, Active learning, Cells counting
Texte intégral
Fichier | Pages | Taille | Accès | |
---|---|---|---|---|
Version officielle éditeur | 190 | 8 Mo |