Présentation en anglais.
- Le Jury sera composé de :
Dr Chris
BOWLER (examinateur,
ENS Paris)
Dr Marco
FONDI (rapporteur, université de Florence)
Pr Ingrid
LAFONTAINE (rapportrice, Sorbonne Université)
Dr Catherine
LAROSE (examinatrice, Université Grenoble Alpes)
Pr
Philippe LOPEZ (Encadrant, Sorbonne Université)
Dr Eric
PELLETIER (Encadrant, Université d’Evry Val d’Essonne)
La soutenance sera également accessible en distanciel
- Titre français : Identification d’homologies distantes et de gènes remodelés par des approches de réseaux.
- Résumé français :
L’augmentation toujours plus importante de données génomiques et métagénomiques appelle de nouveaux développements méthodologiques et bio-informatiques, afin de caractériser avec davantage de précision les phénomènes évolutifs dans leur ensemble. En particulier, certaines des méthodes usuelles pour étudier l’évolution des (familles de) gènes s’avèrent inadaptées lorsque la parenté entre séquences n’est que partiellement supportée. Ainsi, la définition et la reconstruction de familles de gènes se heurtent à l’obstacle de l’homologie distante, qui passe sous le seuil de détection des alignements de séquences. De même, les mécanismes d’évolution combinatoire, tels que les fusions et fissions de gènes, remettent en cause les représentations purement arborescentes de l’évolution des familles de gènes. L’application de méthodes complémentaires basées sur les réseaux de similarité de séquences permet de contourner certaines de ces lacunes, en proposant une représentation holistique des similarités entre gènes. La détection et l’analyse d’homologues très divergents de familles de gènes fortement conservées dans des jeux de données environnementaux est notamment facilitée par la recherche itérative d’homologie fondée sur les réseaux. Cette fouille itérative de métagénomes révèle une immense diversité de variants environnementaux dans ces familles, qui divergent de la diversité connue tant par leur séquence que par la structure des protéines qu’ils encodent, et elle permet de suggérer des pistes pour guider de futures explorations de la matière noire microbienne. En outre, en prenant en compte des liens d’homologie partielle entre séquences génétiques, les réseaux de similarité de séquences permettent une identification systématique des évènements de fusion et de fission de gènes. Il devient ainsi possible d’évaluer l’impact de ces processus au cours de l’évolution de lignées biologiques d’intérêt, permettant de comparer le rôle qu’ils ont joué lors de l’émergence de phénotypes multicellulaires complexes dans plusieurs telles lignées. Plus généralement, ces approches basées sur les réseaux illustrent l’intérêt de prendre en compte une pluralité de modèles pour étudier une plus grande variété de processus évolutifs.
La présentation sera suivie d’un pot en salle Colibri (en face de la C404)
––—
presentation in English
- English title: Identifying remote homology and gene remodelling using network-based approaches.
- Abstract in english :
The ever-increasing accumulation of genomic and metagenomic data calls for new methodological developments in bioinformatics, in order to characterise evolutionary phenomena as a whole with better accuracy. In particular, some of the canonical methods to study the evolution of genes and gene families may be ill-suited when the relatedness of sequences is only partially supported. For instance, the definition and reconstruction of gene families face the hurdle of remote homology, which falls beneath the detection thresholds of sequence alignments. Likewise, combinatorial mechanisms of evolution, such as gene fusion and gene fission, challenge the purely tree-based representations of gene family evolution. The use of complementary methods based on sequence similarity networks allows us to circumvent some of these shortcomings, by offering a more holistic representation of similarities between genes. The detection and analysis of highly divergent homologues of strongly conserved families in environmental sequence datasets, in particular, is facilitated by iterative homology search protocols based on networks. This iterative mining of metagenomes reveals an immense diversity of environmental variants in these families, diverging from the known diversity in primary sequence as well as in the tertiary structure of the proteins they encode. It is thus able to suggest possible directions of future explorations into microbial dark matter. Furthermore, by factoring in relationships of partial homology between gene sequences, sequence similarity networks allow for a systematic identification of gene fusion and fission events. It thus becomes possible to assess the effects of these processes on the evolution of biological lineages of interest, enabling us for instance to compare the role that they played in the emergence of complex multicellular phenotypes between several such lineages. More generally, these network-based approaches illustrate the benefits of taking a plurality of models into account, in order to study a broader range of evolutionary processes.
The presentation will be followed by a drink in the Colibri room (opposite C404)