Comptage de plantes : Le deep learning au service du phénotypage

L’analyse d’image automatisée est devenue incontournable dans le processus de la sélection variétale. Voici comment l’intelligence artificielle s’en mêle, au travers de deux cas concrets d’application : le comptage d’épis et le comptage de plantes de lin à la levée.
Le comptage des plantes robotisé

Les techniques de phénotypage(1) des cultures par capteurs de détection rapprochée (proxidétection) connaissent un intérêt croissant depuis quinze ans environ. Ces développements ont été fortement accélérés par la perspective d’applications liées à la « phénomique ». On désigne ainsi l’établissement de liens entre l’information génétique et les caractéristiques morphologiques et fonctionnelles des variétés.

Pour ce type d’application, la taille des essais (plusieurs milliers de parcelles aux stades initiaux du processus de sélection) oblige à automatiser l’acquisition des mesures. Ces techniques associent des capteurs de mesure et des programmes (ou algorithmes) de traitement. Ce second point a connu de grandes avancées ces dernières années, grâce au développement des algorithmes d’apprentissage profond ou deep learning.

Intelligence artificielle, machine learning, deep learning : de quoi parle-t-on ?

L’intelligence artificielle apparaît dans les années 1950, dès l’invention des ordinateurs. Elle permet, au moyen d’algorithmes, d’automatiser des tâches intellectuelles normalement réalisées par des humains. Sa mise en œuvre passe par l’écriture d’un ensemble de règles simples et logiques qui formalisent un savoir expert.

Le machine learning est une forme d’intelligence artificielle. Dans ce cas, l’algorithme est entraîné plutôt que programmé de manière explicite. Les règles sont le résultat d’un processus d’apprentissage au cours duquel on fournit au système des données d’entrées (par exemple, des images) et les résultats attendus (par exemple, un objet identifié). Ces règles ainsi apprises peuvent ensuite être appliquées à de nouveaux jeux de données.

Le deep learning est une forme particulière de machine learning. Son originalité tient au niveau de complexité des règles pouvant être générées. Une image, par exemple, va traverser un ensemble de couches de traitement successives qui agissent comme des filtres pour mettre en évidence des formes simples, à différentes échelles. Ces formes vont ensuite être combinées pour identifier des objets complexes. La reconnaissance automatique des chiffres a été une des premières applications opérationnelles de ces méthodes. En effet, le petit nombre de types d’objets (0 à 9) rend le problème assez simple à résoudre avec un nombre restreint de formes (lignes, courbes, extrémités…). Mais la démarche est la même pour des objets plus complexes comme des épis de blé, moyennant un modèle d’analyse plus profond.

Le deep learning est aujourd’hui la technique de référence pour de nombreuses tâches d’analyse d’images, mais aussi de sons, de textes ou toute information numérique. Deux cas d’applications en agronomie sont présentés ci-après.

Literal, l’outil de phénotypage portatif Literal* répond au besoin de moyen de mesures à la fois économique, précis et d’utilisation simple. Il est adapté au suivi d’essais en petites parcelles ou en réseau de parcelles agricoles. Ses trois caméras à haute résolution offrent une large gamme de configurations de détection s'adaptant à la spécificité des cultures. Les caméras sont connectées à un boîtier d’acquisition qui déclenche la prise de vue, stocke les données et communique avec une tablette. Les scénarios de mesures sont définis sur la tablette via une interface graphique conviviale. Le scénario de mesure décrit la configuration de chaque caméra, le plan de l'essai et le nombre de mesures à prendre dans chaque parcelle, ce qui facilite l’utilisation sur le terrain et assure le bon référencement de chaque image. Une seule batterie, assurant une autonomie d'un jour, alimente les caméras et le boîtier d'acquisition. Les variables accessibles grâce aux mesures sont nombreuses. Dans le cas du blé, il s’agit notamment de l’indice foliaire, de la fraction de couverture, de la sénescence, de la densité d’épis et de la hauteur de culture.

(*) Ce système est développé dans le cadre du projet CASDAR LITERAL (2019-2022) associant Arvalis, INRAE, Hiphen, l’ITB, Terres Inovia, le GEVES et le CTIFL.

Le comptage au champ des épis de blé…

L’estimation de la densité d’épis de blé est emblématique des limites du phénotypage traditionnel, qui consiste à compter de visu tous les épis sur un mètre carré de champ - une mesure longue, fastidieuse et assez peu précise du fait de l’échantillonnage restreint. C’est pourquoi l’automatisation du comptage par analyse d’images a fait l’objet de nombreux travaux depuis une quinzaine d’années. Cependant, la diversité de l’objet « épi », selon le génotype ou le stade du blé, ainsi que sa disposition complexe dans l’espace, avec des occlusions et des intersections, ne permettaient pas jusqu’à présent d’obtenir des performances de détection suffisantes.

Le développement des techniques de deep learning a changé la donne. Sa mise en œuvre opérationnelle repose sur un jeu d’images représentatives des données à analyser, un ensemble d’annotations identifiant les objets d’intérêt dans ces images, un modèle entraîné sur la base de ces données de référence, et enfin les nouvelles données à analyser.

Pour la détection des épis de blé au champ, une approche collaborative et participative a été adoptée (voir En savoir plus) afin de constituer rapidement un jeu de données très diversifié et de développer un modèle de détection des épis performant. Ce modèle a ensuite été appliqué à un large jeu d’images acquises par les différents systèmes de phénotypage d’Arvalis. Le passage de la détection dans l’image (photo au dessus) à une estimation de densité nécessite, de plus, une mesure de distance du capteur à la culture.

Une large comparaison a été réalisée en confrontant les résultats obtenus par analyse d’images par deep learning avec ceux réalisés par comptages visuels au champ. L’erreur moyenne obtenue est de 55 épis/m² en comparant les résultats par parcelle, sachant que les zones échantillonnées diffèrent. Les comparaisons à l’échelle de la modalité (2 à 3 répétitions selon les essais) présentent une erreur moyenne de 35 épis/m², soit du même ordre de grandeur que l’incertitude associée au comptage manuel, ce qui valide cette approche. En 2021, celle-ci sera mise en œuvre sur tous les sites de phénotypage haut débit d’Arvalis afin d’automatiser ce comptage.

Une fois les épis détectés, ils peuvent ensuite être caractérisés plus finement : dimension, sénescence, présence de maladies - toujours par deep learning.

…mais aussi celui des plantes de lin

Cette technique a également été appliquée au comptage du lin à la levée. La même démarche d’apprentissage a été mise en œuvre à partir de données acquises sur la station d’essai Arvalis de Villers-St Christophe.

Les photos des plantules sont prises à un mètre au-dessus du sol. Un modèle de détection a été entraîné en 2019 et appliqué à de nouvelles images en 2020. Les performances obtenues - une erreur relative de 9 % par rapport au comptage manuel (figure 1) - autorisent un déploiement en 2021 pour le suivi d’essais, à partir d’images acquises par le système Literal (encadré au dessus).

Ces exemples illustrent les transformations induites par l’adoption du numérique dans le domaine agricole et mettent en évidence quelques grandes tendances : la démocratisation des outils d’acquisition de données au champ par capteurs embarqués sur robots, drones ou système portables ; les performances des algorithmes de deep learning pour l’analyse d’images complexes ; et enfin l’importance de la mutualisation de données d’origines diverses.

Ces développements sont particulièrement actifs dans le domaine du phénotypage mais préfigurent certainement les futures applications dans les équipements agricoles.

Pour 2021, ces méthodes seront mises en œuvre de manière opérationnelle pour d’autres variables : estimation de l’indice foliaire, du pouvoir couvrant, et suivi de la sénescence. Concernant les développements, les priorités sont la quantification des maladies et la caractérisation des couverts complexes tels que les cultures associées et les semis sous couvert vivant. La qualité et la quantité des variables ainsi générées ouvrent la voie à des analyses d’une profondeur inédite, au service de l’amélioration génétique mais aussi du développement de nouveaux moyens de protection des plantes, ou encore de la définition de systèmes de cultures innovants.

(1) Phénotypage : action de mesurer l’ensemble des caractéristiques observables d’une plante : hauteur de tige, taille d’un grain, sensibilité ou résistance à une maladie, à la sécheresse…

En savoir plusComment a été constitué le jeu de données d’apprentissage par la collaboration internationale Global WHEAT ? Quelles équipes ont mis au point le meilleur algorithme d’apprentissage ? Vous en saurez plus sur http://arvalis.info/223.

Télécharger les documents

comptage-epis-de-ble6980373628498143780.pdf
pdf 199.09 Ko

0 commentaire

Réagissez !

Merci de vous connecter pour commenter cet article.

Se connecter
Ou connectez-vous avec
Pas encore inscrit ?
Créer un compte
Mot de passe oublié

Un email vous sera envoyé pour réinitialiser votre mot de passe.