La Smithsonian Institution numérise et met à disposition le pollen de 18 000 espèces de plantes

Partager :
Temps de lecture : 3 min

Une équipe de chercheurs du Smithsonian Tropical Research Institute numérise actuellement des images de pollen de plus de 18 000 espèces végétales tropicales. Ces images servent à entraîner un modèle d’apprentissage automatique pour identifier les grains de pollen, une tâche qui nécessite généralement des centaines d’heures de microscopie par des experts polliniques. Un communiqué de presse publié le 1er août 2025 précise que ces images permettront également de réaliser un large éventail de nouvelles analyses polliniques. La base de données, baptisée PollenGEO, sera accessible gratuitement en ligne. 

La collection de pollen du Smithsonian, conservée au Smithsonian Tropical Research Institute (STRI) et au Musée national d’histoire naturelle du Smithsonian, contient plus de 18 000 espèces, ce qui en fait l’une des plus importantes collections de pollen au monde.

  • Impacts scientifiques et médicaux

Une base de données de référence sur les pollens, telle que PollenGEO, pourrait potentiellement remplir de nombreuses fonctions dans de nombreux domaines scientifiques et médicaux.

Elle pourrait par exemple être utilisée pour une identification rapide et précise du pollen peut aider à diagnostiquer une allergie au pollen, à déterminer la provenance des vêtements sur une scène de crime, à étudier la réaction des forêts anciennes au changement climatique et à dater les gisements d’hydrocarbures. 

  • Des centaines de millions d’années

L’intérêt du pollen en paléontologie réside dans sa durabilité : certains grains de pollen persistent des centaines de millions d’années, offrant un aperçu précis de l’histoire de la Terre dans le temps et l’espace. De plus, le pollen de chaque espèce végétale est unique et distinct de celui des autres. 

Auparavant, les spécialistes identifiaient les grains de pollen un par un au microscope, en s’appuyant sur des manuels illustrés. Ce processus est très long et peut s’avérer particulièrement complexe sous les tropiques, où l’on trouve des milliers d’espèces végétales, dont beaucoup restent encore inconnues. Identifier le pollen dans les couches rocheuses anciennes est également complexe, car de nombreuses espèces végétales qui le produisaient ont aujourd’hui disparu.  

  • L’IA facilite l’identification

Pour relever ces défis, plus de 30 chercheurs et étudiants du STRI, sous la direction de Carlos Jaramillo, palynologue, numérisent l’intégralité de la collection palynologique du Smithsonian.

Ils téléchargent plus de 40 millions de photos de grains de pollen d’espèces végétales connues afin de créer une base de données colossale. Cet ensemble de données servira à entraîner des modèles d’IA facilitant l’identification du pollen

L’entraînement d’un modèle d’IA pour exploiter cette base de données massive afin d’identifier des échantillons a nécessité la collaboration d’experts de divers domaines, de la botanique à l’informatique.

Le professeur associé Surangi Punyasena de l’Université de l’Illinois à Urbana-Champaign est en charge de la construction de l’environnement d’IA. L’équipe de Jaramillo participe au projet Trans-Amazon Drilling, un projet à grande échelle utilisant le pollen de carottes de forage prélevées dans toute l’Amazonie pour comprendre l’histoire de la forêt. Ce projet associe des chercheurs de plusieurs institutions, telles que l’Université fédérale du Mato Grosso et l’Université fédérale de l’Acre, toutes deux au Brésil, ainsi que l’Open University. 

Croton capitatus , l’une des plus de 40 millions d’images de pollen récemment numérisées provenant des collections du Smithsonian
  • 18 000 espèces de pollen

La plupart des échantillons proviennent de la collection palynologique Graham, donnée au STRI en 2008.

Elle contient environ 18 000 espèces de pollen, principalement tropical, réparties sur plus de 23 000 lames de microscope, chacune accompagnée d’une fiche descriptive.

Une centaine de bénévoles du Smithsonian Transcription Center ont contribué à la saisie des informations contenues dans la base de données. La collection comprend également la collection Joan Nowicke, la collection de l’île Barro Colorado de Dave Roubik et Enrique Moreno, la collection amazonienne de Paul Collinvaux et la collection Sian Ka’an, qui contient 650 espèces du sud-est du Mexique. De plus, environ 1 000 échantillons de pollen fossile ont été numérisés à partir des collections du Muséum national d’histoire naturelle. 

  • Une base de données ouverte

La disponibilité de PollenGEO et d’autres bases de données polliniques en ligne transformera l’identification du pollen d’une activité solitaire derrière un microscope en un processus numérique et universellement accessible.  

Le financement de ce travail provient de la Smithsonian Institution, de la Fondation Anders, de Gregory D et Jennifer Walston Johnson, du Fonds 1923, du Rubinoff Big Bet Endowment, du Smithsonian Women’s Committee et du Smithsonian Life on a Sustainable Planet Pathfinder. 

stri.si.edu/story/digital-pollen

SOURCE : Smithsonian Institution

PHOTOS : Smithsonian Institution

Date de première publication : 19/08/2025

Laisser un commentaire