Thèse | Arnaud Ungaro

Étude des variations de l'expression génique induites par des perturbations environnementales dans le bassin Durancien : le modèle poisson

Contexte et Objectifs

Dans le cadre de ma thèse, j'ai étudié l'impact des perturbations environnementales, telles que les pollutions chimiques et les modifications physiques des milieux aquatiques, sur l'expression génique des poissons du bassin de la Durance. Mon objectif principal était d'identifier des biomarqueurs d'exposition et de stress, afin de mieux comprendre et évaluer les effets écologiques de ces perturbations sur cette rivière, qui subit une forte pression anthropique.

Pour atteindre cet objectif, j'ai développé un pipeline bioinformatique spécifique, permettant de traiter et d'analyser les données RNA-seq des espèces étudiées. Ce travail bioinformatique a permis de révéler les mécanismes moléculaires sous-jacents aux réponses des poissons face aux stress environnementaux. J'ai ainsi pu combiner les approches écotoxicologiques et bioinformatiques pour apporter des réponses précises et innovantes sur l'impact de ces perturbations à un niveau transcriptionnel, tout en intégrant les aspects écologiques et biologiques de l'étude.

Méthodologie Générale

Pour quantifier l'expression des ARN messagers dans différents tissus de poissons, nous avons utilisé la technologie RNA-seq. Trois espèces de cyprinidés ont été sélectionnées en fonction de leur sensibilité variable aux polluants :

  • Squalius cephalus (chevesne) : une espèce ubiquiste et tolérante aux polluants.
  • Parachondrostoma toxostoma (toxostome) : une espèce endémique, plus sensible aux polluants.
  • Chondrostoma nasus (hotu) : une espèce introduite, proche du toxostome.

Les poissons ont été échantillonnés à plusieurs stations le long de la Durance, couvrant un gradient d'exposition aux perturbations anthropiques. Des stations de référence situées dans le Suran ont également été incluses pour comparer les populations non hybridées.

Techniques Employées

  1. Extraction et préparation des ARN :
    Les ARN ont été extraits à partir des tissus hépatiques et convertis en ADN complémentaire (cDNA) pour le séquençage Illumina.

  2. Séquençage RNA-seq :
    Le séquençage à haut débit a été réalisé afin d'obtenir une vue d'ensemble de l'expression génétique dans différentes conditions environnementales.

  3. Traitement bioinformatique :
    J'ai développé un pipeline spécifique, nommé "Voskhod", pour le traitement des données RNA-seq. Ce pipeline a été conçu pour surmonter les défis liés à l'assemblage de novo des transcriptomes pour des espèces non-modèles. L'assemblage a été réalisé avec Trinity, suivi d'une étape d'alignement des séquences contre des bases de données de références via BLASTn. Cette approche guidée a permis d'améliorer la qualité des annotations en identifiant et en filtrant les séquences les plus pertinentes. Ensuite, les données ont été soumises à une série de processus de nettoyage et de filtrage (FastQC, AdapterRemoval) afin de garantir la qualité des séquences. La normalisation a été effectuée en utilisant des méthodes robustes telles que le quantile, TMM et PoissonSeq, minimisant ainsi les biais et permettant des comparaisons fiables entre les échantillons.

  4. Analyse différentielle :
    Les gènes différentiellement exprimés ont été identifiés à l'aide d'analyses statistiques rigoureuses, en tenant compte des variations biologiques et techniques. J'ai utilisé le pipeline pour effectuer des comparaisons multiples entre les différentes conditions environnementales, puis j'ai réalisé l'annotation fonctionnelle des gènes afin d'interpréter les processus biologiques affectés par les perturbations environnementales. Des analyses d'enrichissement ont également été effectuées pour identifier les processus biologiques surreprésentés parmi les gènes différentiellement exprimés.

  5. Études complémentaires :
    Des analyses supplémentaires ont été menées pour évaluer les effets combinés des polluants (effet cocktail) sur l'expression génique et pour comparer les réponses entre espèces. Les hybrides ont également été étudiés pour explorer les interactions génotype-environnement, en analysant comment l'hybridation influence les réponses moléculaires face aux stress environnementaux.

Résultats Principaux

  1. Identification de biomarqueurs :
    Plusieurs gènes ont été identifiés comme potentiels biomarqueurs de stress environnemental, notamment ceux impliqués dans la réponse aux hydrocarbures aromatiques, aux métaux lourds et à l'hypoxie.

  2. Réponse à l'hypoxie :
    Les gènes liés à la réponse à l'hypoxie ont montré des niveaux d'expression significativement élevés durant les périodes de faibles débits, particulièrement dans les stations affectées par les barrages.

  3. Effet des polluants organiques :
    Les gènes de la famille des cytochromes P450, associés à la détoxification des hydrocarbures, ont présenté une régulation positive dans les stations situées en aval des rejets industriels.

  4. Impact des métaux lourds :
    Les gènes des métallothionéines ont été fortement exprimés dans les stations impactées par les rejets industriels, indiquant une exposition importante aux métaux lourds.

  5. Hybrides et adaptation :
    Les hybrides entre le hotu et le toxostome ont présenté des profils d'expression intermédiaires, suggérant des capacités d'adaptation variables selon les environnements.

Développements Méthodologiques

Le pipeline "Voskhod" a été conçu pour surmonter les défis liés à l'assemblage de novo de transcriptomes dans des espèces non modèles. L'approche guidée par BLASTn a permis d'améliorer l'identification des séquences et de maximiser la qualité des annotations. De plus, une évaluation critique des méthodes de normalisation des données RNA-seq a été réalisée afin de sélectionner la méthode la plus robuste, minimisant les faux positifs dans l'identification des gènes différentiellement exprimés. J'ai également testé diverses méthodologies d'assemblage, notamment l'assemblage hybride, et évalué leur performance sur des jeux de données simulés pour valider l'approche choisie.

Conclusion et Perspectives

Les résultats de cette thèse démontrent que l'expression génique des poissons peut servir d'indicateur sensible de la qualité de l'eau et des perturbations environnementales. Le développement de pipelines bioinformatiques spécialisés et l'analyse rigoureuse des données RNA-seq offrent des perspectives prometteuses pour le biomonitoring des écosystèmes aquatiques. Les recherches futures pourraient se concentrer sur l'élargissement de l'étude à d'autres espèces et sur la validation de ces biomarqueurs dans des contextes environnementaux variés.

Composition du Jury de Thèse

La soutenance de cette thèse a eu lieu le 17 septembre 2018 à l'Université d'Aix-Marseille, devant un jury composé d'experts reconnus en écologie et en biologie moléculaire. Le jury était présidé par Mme Christine Argillier, Directrice de recherche à l'IRSTEA et spécialiste des écosystèmes aquatiques. Les rapports de thèse ont été établis par Mme Céline Brochier-Armanet, Professeure à l'Université Lyon 1 et experte en biologie évolutive, et M. Joël Grillasca, Professeur à l'Université de Toulon spécialisé en écotoxicologie.

Le jury comprenait également :

  • M. Alain Devaux, Ingénieur de recherche à l'INRA, expert en écotoxicologie des milieux aquatiques.
  • M. Jacques van Helden, Professeur à l'Université d'Aix-Marseille, expert en bioinformatique et en analyse des réseaux de régulation génique.
  • Mme Christelle Adam-Guillermin, Chargée de recherche HDR à l'IRSN, spécialisée dans les effets des radiations sur les écosystèmes.
  • M. Jean Laroche, Professeur à l'Université de Brest, spécialiste en biologie des populations de poissons.
  • Mme Laurence Tissot, Ingénieure chercheuse chez EDF R&D.

La thèse a été dirigée par M. Rémi Chappaz, Professeur des universités à l'Université d'Aix-Marseille, avec la co-direction de M. André Gilles et M. Nicolas Pech. Le jury a apprécié la qualité du travail et a validé la thèse lors de cette soutenance publique.

Remerciements

Cette thèse, soutenue par EDF, a été réalisée sous la direction de Rémi Chappaz, avec la co-direction d'André Gilles et de Nicolas Pech. Ce travail a impliqué une collaboration interdisciplinaire, intégrant des approches écologiques, biochimiques et bioinformatiques pour une compréhension globale des impacts environnementaux sur les organismes aquatiques.