FN Archimer Export Format PT Rapport TI Guide méthodologique. Version actualisée de ZooPhytoImage avec refonte de l’interface graphique. Action 9. FlowCam ZooPhytoImage. Livrable n°1. Rapport final OT Methodological manual. Updated version of Zoo/PhytoImage with a refactored graphical user interface BT AF GROSJEAN, Philippe AS 1:1; FF 1:; C2 UNIV MONS, BELGIQUE UR https://archimer.ifremer.fr/doc/00363/47436/47461.pdf LA French DT Report DE ;Océanographie biologique;Plancton;Surveillance côtière;Analyse automatisée;Analyse d'image;Classification supervisée;Biological oceanography;Plankton;Costal survey;Automated analysis;Image analysis;Machine learning AB Zoo/PhytoImage 4 est un logiciel « open source » basé sur R et ImageJ. Il sert au traitement d'images numériques de plancton obtenues à partir de différents appareils tels le FlowCAM, un scanner à plat, des micro- ou macrophotographies, etc. Le principe général consiste à détourer individuellement les particules planctoniques visibles sur les images, et ensuite à en extraire des mesures (appelées « attributs ») telles la taille, la forme, la répartition de la transparence, les textures, etc. Ces attributs sont ensuite utilisés par un outil de classification pour définir automatiquement le groupe taxonomique auquel appartient chaque particule. L'outil de classification est obtenu par apprentissage d'un algorithme de type « machine learning » qui établit un lien entre les attributs des particules et les groupes taxonomiques sur base d'un ensemble de particules d'identité connue (le set d'apprentissage qui est élaboré manuellement par l'opérateur sur base de quelques centaines ou milliers de particules d'exemple). Avant son utilisation, les performances de l'outil de classification sont vérifiées sur un ensemble indépendant d'autres particules connues (le set de test), ou par une méthode non biaisée d'estimation de l'erreur appelée « validation croisée ». Les résultats sont consignés dans un tableau de contingence à double entrée qui compare les identifications automatiques avec les identifications manuelles : la matrice de confusion. Zoo/PhytoImage 4 propose plusieurs outils diagnostics numériques et graphique pour déterminer si l'outil de classification offre des performances suffisantes, dont des visualisations nouvelles, comme le graphique « F-score » par groupe. Si l'outil de classification offre des performances trop faibles, Zoo/Phytoimage permet de tester divers remaniement des groupes taxonomiques pour améliorer le résultat. L'identification automatisée de particules planctoniques est un exercice difficile, et actuellement, le taux d'erreur reste trop grand pour un usage opérationnel tel quel (autour de 20-30 % d'erreur globale, mais les erreurs par groupe varient énormément et peuvent monter jusqu'à 90-100 % pour les groupes difficiles ou rares). Ainsi, une validation manuelle par un opérateur entrainé est nécessaire (reclassement sur base du visuel des vignettes). Ce travail est long et laborieux. Il limite grandement l'intérêt de l'automatisation. Un nouvelle technique de détection des particules suspectes, combinée à une modélisation et ensuite, une correction statistique de l'erreur, est implémentée dans Zoo/Phytoimage 4. Elle permet de réduire la fraction de vignettes à valider manuellement (par exemple, 20 à 40 % seulement), tout en conservant une erreur de l'ordre de 10 % maximum pour tous les groupes. Une interface graphique utilisateur améliorée est ajoutée à la version 4 pour permettre une validation partielle manuelle des vignettes avec un confort d'utilisation maximum. En plus de ce traitement, Zoo/PhytoImage 4 gère aussi les métadonnées, le stockage optimisé en espace disque et en vitesse de récupération de l'information. Enfin, ce logiciel calcule et extrait les variables dérivées d'intérêt comme les abondances, les biomasses, les biovolumes et/ou les spectres de tailles totaux et par groupe taxonomique. Il travaille en lot et est capable de traiter toute une série d'échantillons en une seule opération. Le livrable est le manuel utilisateur de la version 4 de Zoo/PhytoImage (en anglais) qui détaille tous ces outils du point de vue de l'utilisateur final. Il montre comment ces outils sont mis en pratique pour l'analyse de données, y compris sur base de petits exemples et des notes sont incluses aux endroits où des pièges dans l'utilisation du logiciel ont été identifiés. Les binaires et codes sources correspondant à cette version 4 de Zoo/PhytoImage sont mis à la disposition de l'IFREMER également. Le système couplé FlowCAM / ZooPhytoImage devient un outil véritablement opérationnel en 2014. Totalement adapté aux observations du phytoplancton réalisées dans le cadre du réseau d’observation REPHY, il permettra de mieux répondre aux sollicitations présentes et futures concernant l'évaluation de la qualité des eaux littorales et marines dans le cadre des exigences européennes, telles que la DCE et la DCSMM. Un des bénéfices immédiats sera par exemple pour l’acquisition des données nécessaires au calcul de l’indice abondance composant l’indicateur phytoplancton pour la DCE en Manche- Atlantique, indice qui est basé sur la proportion de taxons du micro-phytoplancton présents en quantité importante dans un échantillon. AB Zoo/PhytoImage 4 is an « open source » software based on R and ImageJ. It processes numerical images of plankton particles digitized using a FlowCAM, a flat-bed scanner, microor macrophotos, etc. The general concept consists in the individual outlining of particles on the pictures, followed by their measurements (so-called « attributes ») such the size, the shape, transparency, textures, etc. These attributes are then used by a classification tool to automatically predict the taxonomic group the particles belong to. The classifier is obtained after a learning stage using a machine learning algorithm and a training set of pre-identified particles. The algorithm learns to recognize the taxonomic group from the set of attributes measured on the picture. The training set is manually build from a few hundreds to a few thousands of representative items by an operator that visually identifies the candidate particles on the images. Before use, the performances of a classifier are checked on another, independent, set of known particles called the test set, or by using an unbiased technique such cross-validation. Results are collected in a two-way contingency table that compares automatic and manual classification of the particles of the test set. This is the confusion matrix. Zoo/PhytoImage 4 proposes a series of numerical and graphical diagnostic tools to assess the performances of the classifiers, including new visualizations like the « F-score » by group plot. If the performances of the classifier are too low, Zoo/PhytoImage allows to test how the reworking of the groups can possibly increase these. The automatic classification of plankton is a difficult exercise. Currently, the residual error rate still remains too high for a practical use of the fully automatic approach (typically around 20-30 % of global error, but error by group vary much and can reach 90-100 % for rare or difficult groups). Hence, a manual (visual) validation of the classification by a trained operator is required to ultimately lower the error, global and by group. This work is long and fastidious. It greatly limits the interest of the automation provided by this approach. A new technique to detect suspect particles (those with a greater probability to be wrongly classified), combined with a modeling, and then, a statistical correction of the residual error, is implemented in Zoo/PhytoImage 4. The fraction of vignettes that need to be manually validated is lower (for instance, between 20 and 40% only), while keeping residual error per group around 10 % or less. A reworked graphical user interface is added to this version 4 to facilitate partial validation of the vignettes with the higher efficiency and ease of use. In addition to this process, Zoo/PhytoImage 4 also manages metadata. It optimizes storage on the disk and the speed to gather any information back. Finally, this software computes and extracts derived variables of interest, like abundances, biomasses, biovolumes or sizespectra per total or per taxonomic group. It operates in batch and can deal with a whole series of samples in one pass. The deliverable is the user manual of Zoo/PhytoImage 4 that details all these features from the user point of view, showing how to apply these techniques for plankton analysis, including with little examples and advices where there are commonly identified pitfalls. Corresponding binaries and source code of Zoo/PhytoImage 4 has been delivered to IFREMER too. The FlowCAM / ZooPhytoImage is becoming an operational tool in 2014. Completely adapted to the phytoplankton observations performed in the context of the French monitoring network REPHY, it will allow answering more accurately to the questions of WFD and MSFD concerning the evaluation of marine water quality. For instance, the first benefit will be for the acquisition of data necessary to the calculation of abundance index, part of the phytoplankton index for WFD in Channel and Atlantic water bodies : as a matter of fact, this index is based on the proportion of micro-phytoplankton taxa which are very abundant in a water sample. PY 2014 PD FEB ID 47436 ER EF