La banque « SOPHY » de données phytosociologiques

base de la socio-écologie végétale

(Version compacte des « Eléments de Socio-écologie végétale », avec liens hypertextes)

 

par Henry BRISSE et Patrice de RUFFRAY

Octobre 2010

 

 

RESUME

 

Cet article fait appel à la banque de données botaniques et écologiques appelée SOPHY, hébergée à l’Université Paul Cézanne de Marseille.

 

La socio-écologie est une discipline nouvelle qui fait suite à la phytosociologie et repose sur un véritable changement de paradigme en écologie végétale. Elle donne la priorité aux êtres vivants et non aux relevés ; elle caractérise l’écologie des plantes par rapport à d’autres plantes, ses co-occurrentes, et non par rapport à des caractères physico-chimiques ou climatiques, par exemple ; en statistique, enfin, elle tient compte du fait que la plante est un être vivant, alors que le relevé n’est qu’un échantillon de milieu tout à fait interchangeable : plantes et relevés ne doivent pas être traités de façon symétrique.

 

La socio-écologie produit d’abord des résultats relatifs à l’écologie des plantes, analytiques, plante par plante, puis synthétiques, c’est-à-dire en regroupant les comportements écologiques des plantes en « phytotypes ». Elle produit ensuite des résultats relatifs à l’identification des milieux des relevés qui peuvent être mis en œuvre à l’échelle d’une région ou du pays tout entier. Elle regroupe les relevés en types de milieu ou « mésotypes ».

 

Elle utilise des méthodes de classification aussi bien pour les plantes que pour les relevés. La gestion ultérieure des classifications aboutit à des résultats concrets, compréhensibles et expliqués par des listes de plantes, des indices de variables, des cartes. Elle produit des résultats qui ont un sens pour les biologistes, aussi bien à l’échelle de la France que dans les plus petits détails.

 

 

MOTS CLES

Socio-écologie, fidélité, phytotype, mésotype, changement de paradigme, plantes discriminantes

 

 

INTRODUCTION

 

Le but de la banque SOPHY est de rassembler et de fournir non seulement des données phytosociologiques mais aussi des méthodes de caractérisation écologique des plantes et des relevés à la communauté des botanistes de terrain. Elle rassemble toutes les données disponibles sur la France et les pays limitrophes : Belgique et Luxembourg, Allemagne (du sud), Suisse, Italie, Andorre et Espagne. Une partie des données figure sur notre site :

(http://sophy.univ-cezanne.fr/sophy.htm).

 

 

DONNEES

 

            Les données sont structurées entre quatre ensembles de fichiers distincts, presque tous réalisés en fichiers « format texte ».

 

            Bibliographie : Les titres des sources bibliographiques sont gérés par Dbase. Chaque document cité contient au moins un relevé phytosociologique. La base de SOPHY repose sur plus de 4500 titres auxquels on attribue un numéro à mesure de leur intégration dans le fichier bibliographique. Parmi eux, 3600 documents sont informatisés. Cette bibliographie figure sur notre site accompagnée de la localisation des stations de chaque document informatisé (version 2009) :

            (http://sophy.univ-cezanne.fr/BIBLIOGRAPHIE/HAUTRIES.HTM).

 

            Fichiers floristiques : Le fichier floristique numérique de base est celui qui correspond au formulaire floristique des végétaux vasculaires de la France (FFVVF, Brisse et Grandjouan, 1971), déduit de la Flore de P. Fournier (1963). Il a été suivi par celui de Flora Europaea (Brisse et Rasmont, 1985, non publié), puis par le Code informatisé de la Flore de France (CIFF, Brisse et Kerguélen, 1994) et enfin celui de la Base de données nomenclaturales de la flore de France (BDNFF, Bock, 2004). Chaque code comporte une liste numérotée de taxons. Ces numéros sont utilisés pour coder les relevés phytosociologiques. Un code des Bryophytes fondé sur la Flore de J. AUGIER (1966) a aussi été réalisé.

 

            Observations phytosociologiques : Les observations phytosociologiques sont rassemblées en tableaux ayant la même forme que les données sources : les données additionnelles sont ajoutées, dans le même format, à la fin du tableau. Chaque tableau comporte trois parties : un titre, le tableau et une marque de fin de tableau (une ligne de neuf : « 9999 »). Le titre comporte quatre parties : le numéro de la source documentaire, le numéro du tableau, le nombre de relevés et le titre donné par le phytosociologue (s’il y a lieu). Un relevé peut ainsi être identifié par un nombre composite comportant le numéro de la référence (Réfé), le numéro du tableau (Tb) et le numéro du relevé (Rl) soit un nombre de huit chiffres (RéféTbRl). Plus de 200.000 relevés ont été informatisés à ce jour.

 

            Localisation des relevés : Chaque relevé est localisé dans la mesure du possible. Si l’indication est précise elle est codée « 1 » : si le phytosociologue indique le nom d’un lieu-dit repérable sur une carte et non ambigu, la précision de la localisation est codée par un « 2 » : s’il s’agit du nom d’une commune, elle sera codée « 3 ». Toutes les localisations sont ramenées au système français qui prévalait à l’IGN (Institut géographique national) pendant longtemps, système qui utilise des grades et milligrades ayant Paris comme origine des longitudes. Les fichiers de localisation des relevés sont structurés de la même façon que les observations phytosociologiques : les données correspondant à un tableau comportent trois parties, le titre (identique à celui du tableau phytosociologique), les données de localisation et une marque de fin de tableau. Chaque relevé est représenté sur une seule ligne. Une ligne comporte le numéro du relevé donné par le phytosociologue, le nom de la station, le pays, les coordonnées géographiques, l’altitude, le numéro du département et celui de la commune, et enfin, le degré de précision de la localisation.

 

            Contrôle des données : Chaque type de données a des procédures de contrôle qui lui sont propres. Pour la bibliographie comme pour la flore, les relectures et corrections suffisent généralement pour obtenir des fichiers nets. Pour les données phytosociologiques proprement dites les procédures sont plus complexes mais de plus en plus automatisées. En premier lieu, à chaque adjonction de nouvelles données, l’identité de structure des fichiers phytosociologiques et des fichiers de localisation est contrôlée.

 

Pour les localisations, le codage est le plus souvent double. Les coordonnées sont enregistrées en même temps que les numéros de commune. L’écart entre la station et le centre de la commune est déterminé : s’il est trop fort (> à 10km), un message d’erreur apparaît. Lorsque seule la commune est enregistrée, l’examen des cartes permet de détecter les erreurs les plus graves.

 

            Pour les données phytosociologiques, outre les relectures, une procédure a pu être automatisée : il s’agit de mesurer l’écart entre le milieu du relevé (voir ci-dessous) et chacune des plantes de celui-ci. L’examen de la liste des écarts permet de revenir aux données sources pour vérifier s’il y a eu erreur de codage ou si la plante a de bonnes raisons de s’y trouver malgré un comportement écologique apparemment éloigné du milieu du relevé.

 

            Pour plus d’informations sur les données consultez sur notre site :

http://sophy.univ-cezanne.fr/SOCIOECO/Socioecoveg.htm

 

METHODES

 

La méthode essentielle qui différencie la banque SOPHY de toutes les autres banques analogues porte sur la caractérisation du comportement socio-écologique de chaque plante de la banque. Une fois définis ces comportements servent à définir le milieu des relevés. De ces deux types de calculs découlent une multitude de résultats.

 

La justification de cette nouvelle méthodologie comparée à celles d’usage courant est présentée dans l’article intitulé « Changement de paradigme en écologie végétale » (http://sophy.univ-cezanne.fr/paradigme.htm) ainsi que par cet autre article contenant le paragraphe suivant : « Pourquoi des probabilités en écologie du milieu naturel ? » (Grandjouan, 1998). En outre, il est tenu compte de l’abondance des plantes (Brisse et Grandjouan, 1980) du fait qu’une plante, lorsqu’elle est abondante est plus indicatrice du milieu que la même plante toutes abondances confondues.

 

1°) Caractérisation socio-écologique des plantes

 

            Le traitement proposé généralise la notion de fidélité que Braun-Blanquet (1932) a fait reconnaître comme fondamentale. Primitivement le calcul de la fidélité des plantes était appliqué à des groupements, une espèce fidèle étant inféodée à un seul ou à un petit nombre de groupements. Pourquoi alors les valeurs des fidélités n’apparaissent-elles jamais dans les publications ? Il faut dire que leur calcul nécessite implicitement l’existence d’une banque de données dès que les observations deviennent nombreuses. Avec l’apparition de l’informatique, ce calcul devenait plus réalisable. Il a été appliqué d’abord aux relations entre les plantes et les climats (Brisse et Grandjouan, 1977). Il exprimait alors la dépendance apparente de la plante à un caractère écologique, dans ce cas, à la classe d’une variable climatique.

            (http://sophy.univ-cezanne.fr/grpcli/agregat.htm).

 

Mais la phytosociologie ne dispose de façon systématique que de données floristiques, pas de données standardisées telles que le taux de calcaire dans le substrat. Elle ne peut donc pas calculer la fidélité d’une plante au calcaire. Par contre, si elle veut obtenir des indications écologiques à partir des données floristiques, elle peut calculer la fidélité d’une plante à l’égard d’une plante calcicole (Brisse et al., 1995).

 

            D’une façon générale, cette méthode considère toutes les plantes comme des indicatrices du milieu. Sans pouvoir identifier la nature du milieu de la plante, elle transforme néanmoins une caractérisation purement floristique en une caractérisation écologique implicite mais quantitative. C’était le vœu de Pavillard (1935) qui souhaitait peser toutes les plantes. Le traitement considère une même plante soit comme un comportement à caractériser soit comme l’indice d’un facteur du milieu. Il définit un espace des fidélités ayant autant de dimensions qu’il y a de plantes indicatrices, soit un tableau carré de 8003 comportements socio-écologiques de plantes et de 8003 indices de variables (note : le nombre de plantes indicatrices augmente généralement avec l’apport de nouveaux relevés). Ce tableau des fidélités constitue le « cerveau de la banque » car il permet une interprétation écologique des données phytosociologiques. Il est comparable à un dictionnaire dans lequel les mots sont définis par les mots de ce même dictionnaire. De même la définition écologique d’une plante est donnée par la série de ses fidélités à toutes les plantes.

 

 

RESULTATS concernant l’écologie des plantes

 

            Deux applications directes du tableau des fidélités des plantes aux plantes (considérées comme des indices de variable) sont obtenues 1°) la comparaison des comportements des plantes mesurée par la différence globale de leurs caractérisations dans l’espace des fidélités aboutit au Catalogue des espèces écologiquement similaires 2°) l’importance relative d’une plante indicatrice dans l’originalité globale d’un comportement, ou Pouvoir discriminant, est la distance entre ce comportement et l’ensemble des comportements recensés dans la banque. Ce calcul est matérialisé par le Catalogue des plantes discriminantes. Les deux catalogues dont présentés sur notre site :

(http://sophy.univ-cezanne.fr/PSHTM/Flrl6tis.htm).

 

            Remarque : on peut s’étonner qu’à une époque où l’on se préoccupe tant de biodiversité, bien peu de chercheurs s’investissent dans la caractérisation écologique (et numérique) des plantes sur lesquelles ils travaillent. Seuls Ellenberg (1974) et Landolt (1977) ont proposés des catalogues écologiques des plantes, réalisés néanmoins de façon empirique.

 

            Parmi les 4600 taxons (simplement présents) ainsi caractérisés beaucoup ont des comportements similaires. Il est donc nécessaire de résumer ces différents comportements de façon à les rassembler en groupes que l’on appelle des « phytotypes ». C’est l’objet de la classification présentée à l’adresse suivante :

(http://sophy.univ-cezanne.fr/Phytotypes/CLASOCPL.HTM).

 

            Les principaux phytotypes (n°s 893, 1585, 2482, 2924, 3724 et 4515) sont très séparés sur le plan écologique même si certains (n°s 2068 et 2471 [subdivisions de 2482]) paraissent très imbriqués sur le plan géographique.

 

2°) Caractérisation socio-écologique des relevés

 

            En phytosociologie, l’unité d’observation est la station. Chaque relevé effectué dans une station représente en principe un échantillon de milieu dont les plantes sont témoins. Le milieu correspondant au relevé est situé au centre de gravité des comportements des plantes qui s’y trouvent. Ainsi le milieu d’un relevé de N plantes comporte autant d’indices de variables (8003) que les plantes qui le composent : un milieu est défini par la moyenne des N plantes pour chaque indice de variable.

 

            Les 200.000 relevés du tableau initial comportent en moyenne 21 taxons (ou 32 plantes à seuil d’abondance). La transformation des relevés en milieux détermine un nouveau tableau de 200.000 milieux caractérisés par 8003 fidélités moyennes, dont en moyenne 900 ne sont pas nulles. Le fait de caractériser chaque relevé par le même nombre de valeurs numériques permet de comparer tous les milieux entre eux, qu’ils aient des richesses floristiques très différentes, ou qu’ils soient effectués dans des stations de taille différente ou par des auteurs différents : par conséquent il devient même possible de comparer des relevés n’ayant aucune plante en commun (Brisse et al., 1995). En effet la comparaison des relevés ne porte plus sur des listes de plantes mais sur les fidélités à l’égard des indices de variables. Elle n’est plus floristique, elle est devenue écologique.

 

 

RESULTATS concernant les milieux des relevés

 

Flore probable

 

            Les fidélités moyennes correspondent à la probabilité de trouver dans une station le milieu qui convient à une plante. La cartographie de ces fidélités pour un indice de variable donné montre la probabilité de trouver la plante dans la station. Les cartes de flore probable montrent d’une façon très générale des distributions plus concentrées, faisant apparaître des gradients écologiques ainsi que des stations bien plus nombreuses qui pourraient être favorables à une plante. De même, certaines stations excentriques d’une espèce peuvent être en quelque sorte gommées en raison de fidélités moyennes trop faibles :

(http://sophy.univ-cezanne.fr/gifpro/FLOBSPRO.HTM).

 

Classification de 172.000 relevés

 

            Comme pour les plantes, de nombreux relevés ont la même composition floristique ou reflètent des milieux similaires. C’est pourquoi il est nécessaire de procéder à leur classification (WPGM, Sokal et Sneath, 1963). Cependant, la classification de plusieurs centaines de mille de relevés ne peut être effectuée d’emblée. Il faut donc réduire le nombre d’objets à classer. Quelle que soit la technique utilisée, cela revient à définir des sortes de noyaux comportant des relevés écologiquement aussi similaires que possible, le but étant d’atteindre un maximum de 15.000 objets à classer (un jour de calcul). Un essai a été réalisé avec 11.365 noyaux. La classification de ces noyaux est résumée par 890 types de milieux (mésotypes) :

(http://sophy.univ-cezanne.fr/Mesons11365/DENREDUI.HTM).

 

 

CONCLUSION

 

On peut désormais assimiler la banque de données aux connaissances accumulées par les phytosociologues au cours de leur existence. Par conséquent, si la méthode correspond à leurs critères et si la banque contient leur savoir, une bonne partie du travail du phytosociologue peut être remplacée par un traitement numérique de type socio-écologique.

 

            De fait, la classification socio-écologique rejoint le souhait des phytosociologues qui consiste à fonder cette discipline sur leurs propres notions et à obtenir une hiérarchie qui tienne compte de leurs propres données. De plus, la gestion des résultats de cette classification apporte à la fois, pour les groupements obtenus, une expression géographique, l’équivalent des plantes caractéristiques (les plantes discriminantes), la liste complète des plantes qui les composent. En outre cette gestion permet de comparer les groupes de même niveau (les groupes jumeaux) pour éclairer les raisons de leur séparation, de proposer des interprétations beaucoup plus générales puisqu’elles tiennent compte des observations faites par près de 2000 botanistes, beaucoup plus précises, puisqu’elles sont numériques, plus stables, en raison de l’importance de la base de données, plus complètes, puisqu’elles traitent de différents domaines (géographiques, écologiques, floristiques, phytosociologiques). Elle propose également des critères pour définir les groupes les plus importants dans la hiérarchie (l’absence de plantes discriminantes communes entre deux groupes jumeaux) et d’autres critères pour arrêter la subdivision de la hiérarchie (le trop faible écart des valeurs discriminantes des plantes entre deux groupes jumeaux). Elle montre aussi qu’en socio-écologie végétale, il n’y a pas de limite, il n’y a que des gradients.

 

 

BIBLIOGRAPHIE

 

Floristique

 

AUGIER, J., (1966): Flore des Bryophytes. Morphologie, anatomie, biologie, écologie, distribution géographique. Encyclopédie biologique LXIV. Paris, éd. Lechevalier, 702 p., ill.

 

BOCK, B., (2004): Index de la Flore de France. Base de données nomenclaturales de la Flore de France (BDNFF). SBCO, Tela botanica, document informatisé.

 

BRISSE, H., GRANDJOUAN, G., (1971): Formulaire floristique des végétaux vasculaires de la France. Montpellier, CNRS-CEPE, 18 p.

 

BRISSE, H., KERGUELEN, M., (1994): Code informatisé de la Flore de France, suivi par les « Compléments et corrections à l’Index synonymique de la Flore de France », par M. Kerguélen. Coll. Patrimoines Naturels, Vol. n°8, Série Patrimoine Scientifique, Secrétariat de la Faune et de la Flore, M.N.H.N., Paris, 1-197.

 

FOURNIER, P., (1961): Les quatre flores de France. Paris, éd. Lechevalier, 1106 p., ill.

 

KERGUELEN, M., (1993): Index synonymique de la Flore de France, Secrétariat de la Faune et de la Flore, MNHN, Paris, 196 p.

 

Méthodes

 

BRAUN-BLANQUET, J., (1932): Plant sociology. The study of plants communities. Authorized English translation of “Pflanzen-soziologie” (1928), edited by Fuller G.D. and Connard H.S., University of Chicago, III, (USA), 438 p., 180 fig., réf., Index.

 

BRISSE, H., GRANDJOUAN, G., (1977): Etalonnage et classification climatique de 450 plantes en France. Coll. Ass. Internat. Phytosoc., Rinteln (RFA), éd. Cramer, 535-607.

 

BRISSE, H., GRANDJOUAN, G., (1980): Plantes indicatrices du climat. I. Méthode de caractérisation climatique des plantes à différents niveaux d’abondance. Bull. Soc. Bot. Fr., 127, Lettres bot., 1980 (3), 263-273.

 

BRISSE, H., GRANDJOUAN, G., HOFF, M., RUFFRAY, P. de, (1984): Utilisation d’un critère de l’écologie en phytosociologie. Exemple des forêts alluviales en Alsace. « La végétation des forêts alluviales », 9° Coll. Ass. Internat. Phytosoc., Strasbourg, 1980, éd. Cramer, 543-590.

 

BRISSE, H., RUFFRAY, P. de, GRANDJOUAN, G., HOFF, M., (1995): The Phytosociological Database « SOPHY » Part I : Calibration of indicator plants, Part II : Socio-ecological classification of the relevés. Annali di botanica, Vol. LIII, 177-190.

 

BRISSE, H., RUFFRAY, P. de, GRANDJOUAN, G., HOFF, M., (1995): La banque de données phytosociologiques « SOPHY ». Annali di botanica, Vol. LIII, 191-223.

 

ELLENBERG, H., (1974): Zeigerwerte der Gefässpflanzen Mitteleuropas, Scripta Geobotanica, Göttingen, Band 9, 97 p., summary, réf.

 

GRANDJOUAN, G., (1982): Une méthode de comparaison statistique entre les répartitions des plantes et des climats. Thèse, Strasbourg, Université Louis Pasteur, 316 p.

 

GRANDJOUAN, G., (1998): Expression probabiliste des relations écologiques en milieu naturel. Oceanis, vol. 24 n°3, 175-197.

 

LANDOLT, E., (1977): Ökologische Zeigerwerte zur Schweizer Flora. Veröff. Geobot. Inst. ETH Stiftung Rübel Zürich 64 : 1-208p.

 

PAVILLARD, J., (1935): Eléments de sociologie végétale (Phytosociologie). Actualités scientifiques et industrielles, Hermann et Cie éd., Paris, 102 p.

 

SOKAL, R.R., SNEATH, P.H.A., (1963): Principles of numerical taxonomy. San Francisco and London, W.H. Freeman and Co., 359p. 38 fig.