PRINCIPES D'UN TRAITEMENT ECOLOGIQUE

Ou : Comment introduire l'écologie dans un traitement numérique appliqué à des observations phytosociologiques de terrain ?

1 ) Pourquoi avoir recours à un traitement numérique lorsque l'on a effectué des observations phytosociologiques sur le terrain ?

C'est à la fois pour des raisons techniques et pour des raisons scientifiques

Raisons techniques :

Les données sont généralement nombreuses (100 relevés de 20 plantes = 2.000 observations) ; les données sont introduites sur support informatique une fois et une seule. On peut alors les contrôler et les corriger. On pourra leur appliquer de façon répétitive différents traitements.

Un lot de données est déjà un embryon de banque de données. On pourra néanmoins l'ajouter à d'autres lots précédemment rassemblés selon le même protocole.

Raisons scientifiques :

L'adjonction d'un lot de données à d'autres données préexistantes a pour but de tenir compte des observations déjà faites par nos prédécesseurs (plus de 1.500 botanistes phytosociologues en France).

Son but scientifique est de cerner du mieux possible l'écologie de chaque plante. Les plantes et les groupements végétaux ignorent les frontières administratives. C'est pourquoi la banque "SOPHY" rassemble tous les relevés disponibles effectués dans tous les milieux inventoriés par les phytosociologues.

Augmenter les gradients écologiques est une nécessité dans une banque de données phytosociologiques pour différencier des comportements de plantes qui pourraient apparaître similaires dans une région alors qu'à l'échelle du pays ils se montreraient distincts.

Mais la raison scientifique majeure est de pouvoir appliquer aux données une démarche de type écologique.

2 ) Qu'entend-on par démarche de type écologique ?

L'écologie comporte deux aspects principaux, l'un descriptif, l'autre explicatif :

- l'inventaire des êtres vivants dans leur milieu incluant l'identification, la quantification et la description de tout ce qui est raisonnablement nécessaire à la compréhension ;

- la mesure de la relation entre les êtres vivants et le milieu qui les héberge.

Contrairement à ce que l'on pourrait attendre, la plupart des études écologiques relèvent de l'inventaire des êtres vivants et de leur milieu, inventaire présenté selon différentes modalités :

Par exemple, la simple juxtaposition des variables du milieu et de la liste des êtres vivants qui s'y trouvent est-elle suffisante pour considérer que l'on a réalisé une étude écologique ? Le rassemblement de ces observations est une étape nécessaire mais non suffisante car la juxtaposition n'est pas une mesure du lien entre les deux termes de l'écologie.

De même la pratique courante qui consiste à superposer la distribution géographique d'un taxon et des variables considérées comme explicatives, par exemple, des isohyètes, aboutit à un simple constat et non à une mesure du lien. Il en est de même pour la superposition sur des graphiques tels que des climagrammes.

Un quatrième cas, qui pourrait faire illusion puisqu'il est numérique, ne comporte pourtant aucune mesure écologique : il est constitué par les graphiques factoriels sur lesquels êtres vivants et variables physiques sont superposés dans un espace particulier, l'espace des correspondances.

Dans les quatre cas évoqués, on se contente de situer des plantes, des relevés ou des variables, dans un espace graphique ou géographique, en se bornant à des explications discursives, sans procéder à la mesure de leur lien écologique. On donne la priorité aux lieux (du reste sans s'en rendre compte puisque plantes et variables sont généralement présentes simultanément) alors que l'écologie doit donner la priorité aux être vivants. Tous ces exemples montrent combien il n'est pas évident de faire de l'écologie numérique. Pourtant, il faut savoir qu'à partir des mêmes données, plantes et variables, tantôt on fera de l'écologie, tantôt on n'en fera pas.

Pour tout le monde, le point de départ d'un traitement numérique est constitué par le tableau des présences (ou des abondances) des plantes en un lieu (la station). Mais, dans un cas c'est le lieu qui est affecté des variables du milieu correspondant (il s'agit alors de géographie), dans l'autre cas ce sont les plantes qui vont être caractérisées par leur comportement écologique. C'est là que réside toute la différence entre les deux options. L'écologie commence par mesurer la relation entre êtres vivants et milieux, non par la caractérisation des milieux (cela viendra ensuite).

3 ) Qu'entend-on par relation (ou lien) entre plantes et milieux ?

Ainsi, l'étude des relations entre plantes et milieux implique que l'on donne la priorité aux plantes. Qu'est-ce qui, mieux qu'une plante, connaît le milieu qui lui convient ? En effet, les plantes ont eut tout le temps de tester depuis des milliers d'années les dits milieux. On va donc chercher à utiliser les plantes comme instruments de mesure écologiques et, pour cette raison, on parlera d'étalonnage écologique des plantes (là où d'autres parlent de "calibration"). Ceci revient à dire qu'il faut commencer par déterminer le comportement écologique des plantes.

On peut s'étonner du fait que, depuis qu'existent les ordinateurs, les banques de données (phytoécologiques ou phytosociologiques), et les méthodes numériques, personne, dans aucun laboratoire d'écologie végétale ou animale, ni dans des disciplines connexes, ni en France, ni ailleurs, n'a élaboré de catalogues (établis de façon numérique) des comportements écologiques des êtres vivants étudiés.

3.1 ) Qu'elle est donc cette mystérieuse notion de lien écologique ?

Le lien écologique est la probabilité de trouver un milieu lorsque, dans une station, on est en présence d'une plante. Cette probabilité se mesure à partir du tableau des présences des plantes dans les relevés. Elle varie de 0 à 1 (ou de 0 à 100%).

La probabilité (PRO) qu'une plante (P) indique un milieu (M) est la fréquence de la plante en présence du milieu (FRPM), divisée par la fréquence totale de la plante (FRTP).

PRO(P,M) = FRPM*100. / FRTP

Alors que la présence d'une plante dans une station est une notion concrète, la probabilité est au contraire une notion abstraite qui mesure la possibilité de trouver ou non le milieu favorable à une plante, que la plante soit présente ou non dans la station. Dans le cas de la hêtraie sans hêtre, chère à H. Gaussen, le hêtre a une forte probabilité de se trouver dans la hêtraie bien qu'il en soit absent. A l'inverse, cette probabilité peut montrer, si elle est nulle, le caractère accidentel de la présence d'une plante dans une station.

Si la plante se trouve toujours dans le même milieu, et seulement dans celui-ci, c'est qu'elle lui est fidèle : sa probabilité avoisinera 100%. Trouver la plante P impliquera de trouver le milieu correspondant.

Si la plante se trouve une fois sur deux dans un milieu donné et une fois sur deux dans des milieux différents, elle aura une probabilité de 50% d'indiquer le 1er milieu.

Si la plante ne se trouve jamais dans un milieu, sa probabilité d'indiquer le milieu sera nulle.

La probabilité dont il est fait état ici est en fait exactement la notion de fidélité de Braun-Blanquet (1932). C'est pourquoi dans la suite on parlera plutôt de fidélité.

3.2 ) Qu'entend-on par milieu en phytosociologie ?

C'est l'ensemble des conditions qui président à l'installation et au développement des plantes en un lieu : la station. Ces conditions sont de type climatique, édaphique, phytocoenotiques, etc. Mais, qu'elle qu'en soit la liste détaillée, en phytosociologie, on ne dispose pratiquement jamais, de façon systématique (dans chaque relevé) de ces informations. La seule chose que l'on connaisse concernant le milieu d'un relevé est la liste des plantes qui y sont recensées, le milieu étant aussi homogène que possible. Les plantes de ce relevé sont toutes témoin dudit milieu. De quel milieu ? on ne le sait pas. On peut seulement dire qu'elles en sont des indices de variables (IV).

Certains de ces indices de variables correspondent à des plantes calcicoles, d'autres à des plantes hygrophiles, thermophiles, etc. Cependant, ces indications ne sont pas connues explicitement pour l'ensemble des plantes de France : elles ne peuvent donc pas être directement utilisées.

A ce stade, on ne connaît encore, ni le milieu des relevés, ni le comportement écologique des plantes. On sait simplement que les plantes, considérées comme indices de variables, peuvent être utilisées pour définir le milieu.

4 ) Comment procède-t-on pratiquement pour introduire l'écologie dans un traitement numérique en phytosociologie ?

On réalise successivement deux démarches : une première démarche technique, la constitution d'une banque de données des observations phytosociologiques ; une seconde démarche d'ordre scientifique, l'introduction de l'écologie dans la banque.

4.1.- Elaboration de la banque de données phytosociologiques (BDD)

Elle comporte quatre aspects principaux :

- réalisation d'un code floristique afin de régler une fois pour toutes les problèmes nomenclaturaux ;

- une bibliographie pour connaître la source des observations ;

- le codage des observations phytosociologiques en notant les abondances-dominances des plantes, les taxons infra-spécifiques et la stratification. Ce codage se présente sous une forme aussi voisine que possible des observations originelles de façon à en faciliter le contrôle ;

- la localisation des relevés afin de permettre l'expression géographique des résultats.

L'outil technique de cette BDD est un tableau rectangulaire de 120.000 relevés et des 7.000 plantes de la banque.

En fait, les 7.000 plantes de la banque sont réparties en deux lots. Le 1er correspond aux 4.250 taxons présents qu'elle que soit leur abondance. Le second correspond aux 2.800 "plantes à seuil d'abondance" (PASA). Chaque PASA est, pour un taxon qui présente des variations d'abondance suffisantes, le sous-ensemble des stations dans lesquelles il dépasse un certain seuil d'abondance.

La création des PASA a pour but de mettre en exergue le rôle particulier de l'abondance : un taxon, lorsqu'il est abondant, est plus indicateur d'un milieu que lorsqu'il est présent avec une abondance quelconque.

4.2.- La seconde démarche, scientifique cette fois, consiste à introduire explicitement l'écologie dans la banque.

C'est à ce stade que l'on donne la priorité aux plantes. Pour chacune d'entre elles, on va mesurer sa probabilité d'indiquer le milieu convenant à chaque plante de la banque.

4.2.1. Détermination du comportement écologique des plantes

Pour chaque plante de la banque (A), on mesure sa fidélité (FID) à l'égard de chacune des mêmes 7.000 plantes de la banque, considérées ici, comme des indices de variables (B). On a seulement besoin pour cela de déterminer la fréquence de la plante en présence de chaque autre plante de la banque [FR(A,B)], puisque la fréquence totale des plantes (FRTP) est déjà connue.

FID(A,B) = FR(A,B)*100. / FRTP

Ainsi, le tableau rectangulaire initial des observations génère un autre tableau, carré cette fois, de 7.000 x 7.000 valeurs de fidélités. Chacune de ces fidélités peut être considérée comme une unité élémentaire d'écologie (UEE).

Le comportement écologique d'une plante est constitué par la série des 7.000 fidélités de la plante à l'égard des 7.000 indices de variables.

Ce qui est remarquable dans ce calcul, c'est que ce sont les plantes elles-mêmes qui servent à caractériser l'écologie des plantes. Ce procédé n'utilise qu'un seul ensemble de données : les plantes. D'où son caractère à la fois économique et général.

Le tableau des fidélités des plantes aux plantes permet d'obtenir dans un 1er temps deux résultats écologiques concernant la majeure partie de la flore tout en ayant une signification à l'échelle du pays :

- la liste des (30) plantes écologiquement les plus similaires à une plante donnée, parmi les 7.000 plantes de la banque ;

-  la liste des indices de variables les plus importants, pour une plante donnée, appelés aussi plantes discriminantes. En effet si, pour une plante donnée, Helichrysum staechas est discriminant, cela revient à dire que, pour la plante considérée, le milieu lumineux, sabloneux, méditerranéo-atlantique lui convient, tout au moins en partie, puisque chaque plante possède de 10 à 30 autres plantes discriminantes.

Le même tableau des fidélités des plantes aux plantes sert dans un second temps à la caractérisation numérique des milieux des relevés.

4.2.2. Caractérisation du milieu écologique des relevés

On vient de déterminer de façon numérique le comportement écologique des plantes de la banque. Puisque chaque plante d'un relevé est témoin de son milieu, il est logique de situer le milieu du relevé au centre de gravité des comportements des plantes qui s'y trouvent. Ce centre de gravité est la toute simple moyenne arithmétique des comportements des plantes du relevé. Ainsi, plantes et relevés sont situés dans un même espace écologique à 7.000 dimensions.

La caractérisation des milieux aboutit à un autre tableau rectangulaire de 120.000 milieux et de 7.000 indices de variables, rempli de fidélités moyennes.

La particularité de cette caractérisation est que le milieu n'est plus défini par la flore du relevé. Les milieux pourront être comparés deux à deux, même si les relevés correspondants n'ont aucune espèce en commun, même si leur richesse floristique sont très différentes. En outre rien n'empêche de comparer une plante à un relevé.

C'est du tableau sus cité que provient la flore probable qui est la probabilité de trouver une plante ou plutôt, son milieu probable, dans un relevé.

4.2.3. Nécessité de procéder à des synthèses

Devant cet afflux de résultats, 7.000 comportements écologiques de plantes et 120.000 milieux, il est nécessaire de procéder à des synthèses, évidemment numériques. Elles sont réalisées toutes deux par une classification hiérarchique ascendante (CAH).

423.1 Synthèse des comportements écologiques des plantes

La CAH définit des groupes de comportements écologiques, hiérarchisés à plusieurs niveaux de synthèse, encore appelés "éléments écologiques". La gestion de ces éléments aboutit à au moins trois résultats.

- la composition floristique de chaque élément ;

- la cartographie des éléments qui montre leurs gradients écologiques comportant notamment, le centre de l'élément, là où il est le mieux représenté, et des marges, là où il est progressivement remplacé par d'autres éléments ;

- les plantes discriminantes de l'élément résumant son comportement écologique. Elles sont généralement présentées en tableaux comparatifs plus compacts montrant à la fois les oppositions et les similitudes écologiques entre groupes jumeaux.

423.2 Synthèse des milieux écologiques

La CAH appliquée aux milieux définit cette fois des territoires écologiques, hiérarchisés à plusieurs niveaux. Leur gestion aboutit aux trois mêmes types de résultats, liste des plantes des territoires, leur localisation géographique et les plantes qui en résument l'écologie.

Dans leur forme, la nature des résultats concernant éléments et territoires, est différente. Pour un même niveau de synthèse, sur le plan géographique, les éléments écologiques s'interpénètrent alors que les territoires sont distincts ; la composition floristique d'un élément est unique alors que celle des territoires peut comporter de nombreux taxons en commun.

423.3 Des résultats partiels ont déjà été obtenus et fait l'objet de publications. Reste à faire l'application à l'échelle de toute la banque.

4.2.4. Contrôle floristique des relevés

Un sous-produit non négligeable, mais tout aussi inattendu que la flore probable, est la possibilité qui se présente de contrôler la pertinence floristique des relevés. En effet, depuis le terrain jusque dans l'ordinateur, les occasions d'introduire des données erronées sont multiples.

Pour les détecter, on peut comparer le comportement écologique des plantes d'un relevé à son milieu. Pour cela on mesure l'écart écologique à 7.000 dimensions entre le relevé et chacune des plantes qui s'y trouve. Les écarts trop importants permettront de signaler des anomalies floristiques.

5 ) Conclusion

Une seule notion élémentaire, la fidélité, proposée il y a plus de 70 ans par le père fondateur de la phytosociologie, suffit pour apporter des renseignements écologiques sur toute la flore de France et sur les milieux qui la supporte.

Braun-Blanquet a su simultanément motiver des milliers de botanistes au recensement des milieux végétaux.

Lui faisant suite, après avoir donné une signification explicitement écologique à la notion de fidélité, puis grâce à l'apparition des ordinateurs et des langages informatiques, nous avons rassemblé la véritable mine d'or constituée par la centaine de milliers de relevés publiés.

L'application de la notion de fidélité aux données ainsi rassemblées a apporté de nombreux résultats, la plupart nouveaux voire inattendus.

Les principaux résultats, mis à jour aussi fréquemment que possible, sont installés sur ce site internet à la disposition de la communauté scientifique, en premier lieu, celle des producteurs de données : les phytosociologues.

Maintenant, on peut encore mieux se rendre compte de la fécondité de la phytosociologie qui, après avoir apporté des synthèses sur les groupements végétaux, en apporte sur l'écologie des plantes et des groupements.