Un exemple d’utilisation des données « agriculteur » : estimer les rendements des variétés de blé tendre

Afin d’améliorer l’évaluation variétale du blé tendre d’hiver, Arvalis a étudié la cohérence statistique de données de rendement collectées par les coopératives Terrena et Axéréal et de données d’essais « Variétés » en micro-parcelles. Les résultats sont concluants.
Les données "agriculteur" sont fiables

Depuis de nombreuses années, la recherche en agriculture repose, au moins en partie, sur l’utilisation d’expérimentations en micro-parcelles. Les principes de base de l’expérimentation (encadré), attribués à Ronald Fisher au début du XXe siècle, offrent un cadre rigoureux permettant la mise en évidence de relations de cause à effet. La connaissance ainsi produite peut ensuite être transposée à l’échelle d’une parcelle, afin d’aider les agriculteurs à prendre les meilleures décisions possibles pour conduire leurs parcelles.

Avec l’essor du numérique, des données obtenues à d’autres fins que la recherche sont rendues accessibles. Les données « agriculteur » stockées dans les bases de données des logiciels de gestion parcellaire sont ainsi une source potentiellement importante d’information. Ces données peuvent-elles être valorisées pour répondre à des questions scientifiques ? Arvalis, en partenariat avec les coopératives Terrena et Axéréal, a étudié leur intérêt pour enrichir l’évaluation variétale du blé tendre d’hiver.

26 799 données de rendement, issues d’agriculteurs répartis sur 1698 communes, ont été collectées auprès de Terrena et Axéréal en 2015, 2017 et 2018. Elles ont été « confrontées » à 4291 données expérimentales collectées sur 74 communes différentes, provenant d’essais « Variétés » réalisés par les deux coopératives et Arvalis durant les mêmes années et sur la même zone géographique (figure 1).

Dans un premier temps, les deux jeux de données ont été analysés indépendamment afin d’estimer pour chacun les effets « variété » sur le rendement. L’écart entre le rendement moyen d’une variété et la moyenne générale des rendements a ainsi été calculé pour chaque variété, avec chaque jeu de données.

Puis une analyse globale a été effectuée sur les données des deux réseaux, afin de voir si leurs effets « variétés » étaient corrélés. Les données agrégées ont été analysées au moyen d’un modèle mixte prenant en compte des effets « variété » et « type de données » (agriculteurs ou expérimentales), ainsi qu’une éventuelle interaction entre le type de données et les variétés.

L’EXPÉRIMENTATION AGRONOMIQUE EN TROIS MOTSRandomisation : elle consiste à injecter une part d’aléatoire dans la répartition des modalités expérimentales dans un essai. Elle a pour but d’éviter les biais.

Répétition : les répétitions sont nécessaires pour estimer la variabilité expérimentale et pour augmenter la précision des estimations des moyennes des modalités étudiées.

Blocking : il consiste à répartir les modalités expérimentales au sein de blocs de micro-parcelles les plus homogènes possibles, dans le but de contrôler une partie de la variabilité expérimentale.

Des données « agriculteur » plus variables, mais plus nombreuses

L’analyse séparée des deux jeux de données a permis notamment de déterminer la précision des estimateurs des effets « variété » en fonction du nombre de données disponibles par variété. Les données expérimentales conduisent à des estimations plus précises que celles obtenues avec les données d'agriculteurs. Par exemple, pour atteindre une variance d’estimations égale à 4, il faut environ 8 données d’essais contre 230 données d’agriculteurs (figure 2).

L’analyse de la variance du modèle des données agrégées indique que 86 % de la variabilité du rendement observée entre les différentes variétés de blé est commune aux deux types de données. Autrement dit, le niveau de cohérence entre les deux jeux de données vis-à-vis du classement des variétés selon leur productivité est de 86 %. L’estimation du rendement des variétés obtenue avec les données « agriculteur » est donc cohérente avec celle issue des données d’expérimentation.

Il existe cependant une interaction modérée entre les variétés et le type de données, représentant 14 % de la variabilité globale des classements variétaux. Les données disponibles n’ont pas permis d’expliquer plus précisément l’origine de cette interaction.

Les données des deux réseaux apparaissent complémentaires

Les réseaux d’expérimentation classique fournissent des données de grande qualité, notamment sur les variétés récentes non encore largement diffusées chez les agriculteurs. Toutefois, elles sont obtenues pour des pédoclimats et des conduites de culture moins diversifiés.

Les données agriculteurs, quant à elles, sont plus difficiles à exploiter car de nombreux facteurs varient entre parcelles et entre exploitations. En revanche, elles couvrent une gamme d’environnements plus large que les réseaux d’expérimentation et correspondent aux pratiques réelles des agriculteurs. De plus, ces données apportent de l’information sur les variétés plus anciennes, qui ne sont plus testées dans les réseaux expérimentaux.

La valorisation de données obtenues à d’autres fins que des fins de recherche, par exemple les données d'agriculteurs stockées dans les bases de données des logiciels de gestion parcellaire, semble être une tendance de fond. Et même si l’expérimentation agronomique reste un outil indispensable dans la production de connaissances, la question qu’il faut se poser n’est peut-être pas s’il faut essayer de valoriser ce type de données, mais comment les valoriser de manière optimale et rigoureuse.

La suite de ces travaux pourrait dès lors consister à déterminer comment combiner données « agriculteur » et données d’expérimentation, sans doute en leur accordant un poids fonction de leur précision respective, afin de répondre au mieux aux questions qui nous sont posées. L’étape suivante serait de réfléchir à la façon d’optimiser les dispositifs expérimentaux dans l’optique de combiner les résultats issus de ces différents réseaux.

Témoignage : un gisement encore sous-exploitéNous avions été particulièrement intéressés par la validation de la cohérence globale ainsi que par le niveau de précision obtenue. Les données « agriculteur » sont fiables : elles permettent d’établir un classement cohérent avec le classement obtenu depuis le réseau expérimental. Et elles sont relativement précises : 230 données « agriculteur » apportent la même précision que 8 données essais. Ce volume de donnée est finalement relativement faible au regard de l’utilisation croissante des outils (plus de 2500 agriculteurs utilisateurs chez Terrena).

Nous n’avons pas donné suite à ces travaux mais restons persuadé qu’ils peuvent nous aider à améliorer notre conseil auprès des exploitants. Une telle valorisation de leurs propres données les conforterait également dans l’utilisation des outils numériques. À poursuivre donc…

Édouard Berthelin (Responsable équipe Data & Décisions chez Terrena)

Témoignage : une plateforme qui mutualise les données numériques des agriculteurs L’usage numérique se développe très rapidement au sein de la plateforme Wiuz(1)  : le nombre de parcelles numérisées y croit de 20 % par an. Ce gisement de données ouvre de nouvelles perspectives mais encore faut-il des acteurs pour s’en emparer. Car des masses aussi importantes de données suivies dans des conditions réelles exigent des compétences et des modèles de traitement particuliers.

Cette expérience originale et réussie d’analyse de données « Variétés » à grande échelle sur des parcelles pluriannuelles est riche d’enseignement et de possibilités. Elle conforte le lien entre expérimentation et données au champ. Cela permet d’envisager que, progressivement, ces grandes quantités de données deviennent elles-mêmes une source majeure de connaissances et d’enseignements.

(1) Plus d’informations sur https://wiuz.fr

David Talec (Responsable partenaires)
Marc Hoppenot (PDG de WIUZ)

0 commentaire

Réagissez !

Merci de vous connecter pour commenter cet article.

Se connecter
Ou connectez-vous avec
Pas encore inscrit ?
Créer un compte
Mot de passe oublié

Un email vous sera envoyé pour réinitialiser votre mot de passe.