Une machine à remonter le temps à faire pâlir « Doc et Marty »


In Research

Avec ses collaborateurs internationaux, Denis Baurain vient de dessiner l’arbre évolutif des vertébrés le plus complet et fiable produit jusqu’à ce jour en utilisant le supercalculateur Tier-1 financé par la Région Wallonne. C’est la première fois que ce supercalculateur est utilisé pour une recherche en biologie fondamentale. Cette étude a fait l’objet d’une publication dans la revue Nature Ecology & Evolution. 

Savoir dans quel ordre exactement les espèces sont apparues sur Terre et quels sont les liens de parenté qui les unissent ? Voilà les questions auxquelles Denis Baurain essaye de répondre grâce à la méthodologie la plus raffinée qui existe aujourd’hui et qui implique l’utilisation d’un ordinateur de calcul ultra-puissant.

Pour partir à la rencontre de nos ancêtres, Denis Baurain, bioinformaticien de l’Unité de Recherche InBioS–PhytoSYSTEMS (Faculté des Sciences) de l’Université de Liège, et ses collègues ont développé une machine à remonter le temps toute particulière. Si elle ne ressemble pas à la célèbre voiture de Doc et Marty du film « Retour vers le futur », la méthode implique l’utilisation d’un supercalculateur à faire pâlir d’envie ces deux héros. Avec une équipe internationale d’experts, Denis Baurain, tente de créer l’arbre de la vie le plus fiable possible. Il remonte ainsi la trace de nos ancêtres afin de reconstituer l’évolution des espèces depuis l’apparition de la vie sur Terre. 

Des milliers de gènes à comparer

La machine à remonter le temps que les scientifiques ont mis sur pied pour ces travaux de recherche est en réalité un protocole qui mêle génomique et supercalculateur. Jusqu’il y a peu, pour construire un arbre phylogénétique, un peu à l’image d’un arbre généalogique géant reliant les espèces entre elles, les scientifiques comparaient l’une ou l’autre régions de l’ADN chez plusieurs espèces pour les positionner les unes par rapport aux autres. Depuis une quinzaine d’années, une nouvelle variante de cette discipline est apparue : la phylogénomique. Grâce aux nouvelles méthodes de séquençage du génome, un nombre bien plus grand de gènes sont disponibles pour effectuer les comparaisons entre espèces et réaliser les études de phylogénie moléculaire.

Un tableau à millions de colonnes

Dans une étude récemment publiée dans Nature Ecology & Evolution (1), Denis Baurain et ses collègues ont par exemple travaillé sur 7000 gènes partagés par une centaine d’espèces de vertébrés. L’équipe internationale et pluridisciplinaire s’est ainsi attelée à produire les données biologiques, construire les jeux de données et réaliser les analyses de cette impressionnante masse d’information. Zoologistes et bioinformaticiens avaient chacun leur rôle à jouer dans ce défi. « Un des gros challenges de cette étude était de construire le tableau croisant les données de la centaine d’espèces et des 7000 gènes que nous voulions analyser. Chaque espèce y est représentée par une ligne et les acides aminés constituant les protéines encodées par les différents gènes étaient inscrits dans les colonnes de ce tableau », explique Denis Baurain. Ce dernier, à partir des données biologiques récoltées par les zoologistes de l’équipe et des données publiques, a créé un premier tableau ainsi que le programme informatique permettant de le compléter. Résultat : un tableau d’une centaine de lignes et de millions de colonnes ! « Une machinerie importante est nécessaire pour produire ce tableau », précise le bioinformaticien. 

Le supercalculateur à la rescousse

Et une machinerie tout aussi impressionnante est nécessaire pour analyser ensuite ce tableau. Les scientifiques ont eu recours à l’ordinateur de calcul le plus puissant de Wallonie : le supercalculateur Tier-1 qui se trouve au sein de l’aéropôle de Charleroi et acquis grâce à un subside de la Région wallonne. Aujourd’hui équipé de 13 500 processeurs, ce qui équivaut à la capacité de travail d'environ 7000 ordinateurs de bureau, « ce supercalculateur est en général utilisé pour des calculs de mécanique des fluides ou de propriétés des matériaux. C’est la première fois qu’il est utilisé pour une recherche fondamentale en biologie », s’enthousiasme Denis Baurain.

Les chercheurs ont ainsi obtenu l’arbre évolutif des vertébrés le plus complet et fiable produit à ce jour. « Au-delà de la production de cet arbre en particulier, notre objectif était de positionner notre méthodologie comme la plus raffinée pour obtenir un arbre de référence en phylogénie des vertébrés. Une méthodologie qui peut être appliquée à différentes questions de phylogénie. ».

(1) Iker Irisarri, Denis Baurain, Henner Brinkmann, Frédéric Delsuc, Jean-Yves Sire, Alexander Kupfer, Jörn Petersen, Michael Jarek, Axel Meyer, Miguel Vences & Hervé Philippe. Phylotranscriptomic consolidation of the jawed vertebrate timetree. Nature Ecology & Evolution 1, 1370–1378 (2017). doi:10.1038/s41559-017-0240-5


Pour mieux comprendre 

Supercalculateur : Ce terme désigne un ensemble d'ordinateurs interconnectés pour atteindre de très hautes capacités, notamment en terme de vitesse de calcul. Les supercalculateurs sont souvent utilisés dans le domaine météorologique, pour faire des prévisions climatiques, dans le domaine de la modélisation moléculaire ou encore dans le développement de nouveaux matériaux. 60% du temps de calcul disponible sur le supercalculateur zenobe est réservé aux chercheurs des cinq Universités de la Fédération Wallonie-Bruxelles et est attribué par le CÉCI, le Consortium des Équipements de Calcul Intensif. Pour en savoir plus sur le supercalculateur zenobe utilisé dans cette étude : https://tier1.cenaero.be/fr/zenobe et http://www.ceci-hpc.be/clusters.html#zenobe

Arbre phylogénétique : Schéma en forme d’arbre qui montre les relations de parenté entre des organismes vivants. Chaque nœud de l'arbre représente l'ancêtre commun de ses descendants. 

Phylogénie : Etude du lien de parenté entre les êtres vivants, en vue de comprendre leur évolution. Elle repose sur l'identification d’homologie, c’est-à-dire de ressemblances entre les organismes, au niveau morphologique (seul moyen de classer les espèces fossiles dont l'ADN est rarement conservé) ou moléculaire (ADN, ARN, protéines). Les résultats sont représentés par un arbre phylogénétique dans lequel chaque nœud correspond à un ancêtre commun. Deux organismes sont d'autant plus apparentés qu'ils partagent un ancêtre commun récent dans l'arbre.

Phylogénomique : discipline issue de la rencontre entre la phylogénie (étude du lien de parenté entre les êtres vivants) et la génomique (étude du fonctionnement d’un organisme à l’échelle du génome). La phylogénomique a pour but de reconstruire l’histoire évolutive des organismes sur base de la comparaison des milliers de gènes composant leur génome.

 

denis-baurain-londres-2016

 

Initialement analyste programmeur (ISL Liège, 1994), Denis Baurain a par la suite obtenu une licence en Biologie moléculaire végétale (Université de Liège, 1997) puis un doctorat dans le même domaine (Université de Liège, 2003). Bénéficiaire de deux mandats FRS-FNRS (1998–2002 et 2003–2007), il s’est d’abord consacré à la génétique moléculaire des plantes avant de se tourner vers la phylogénie et la génomique comparative, notamment au travers de deux séjours post-doctoraux (2005–2006) – à l’Université du Queensland (Australie) et à l’Université de Montréal (Canada) – suivis d’un poste de post-doc senior en génomique animale au centre GIGA-Research de l’Université de Liège (2007–2011). En 2011, il revient au Département des Sciences de la Vie (ULiège) comme Chargé de cours en Bioinformatique. En 2014, il est nommé définitivement à l’Université de Liège et, en 2016, il est élu Président du Département.

Share this news