Publications

¤ 2017 Research Article: Microbiota Diversity Within and Between the Tissues of Two Wild Interbreeding Species.
Guivier Emmanuel, Martin Jean-François, Pech Nicolas, Ungaro Arnaud, Chappaz Rémi, Gilles André.
https://link.springer.com/article/10.1007%2Fs00248-017-1077-9
doi: https://doi.org/10.1007/s00248-017-1077-9

Understanding the role of microbiota as reproductive barriers or sources of adaptive novelty in the fundamental biological phenomenon of speciation is an exciting new challenge necessitating exploration of microbiota variation in wild interbreeding species. We focused on two interbreeding cyprinid species, Chondrostoma nasus and Parachondrostoma toxostoma, which have geographic distributions characterized by a mosaic of hybrid zones. We described microbiota diversity and composition in the three main teleost mucosal tissues, the skin, gills and gut, in the parental parapatric populations. We found that tissue type was the principal determinant of bacterial community composition. In particular, there was strong microbiota differentiation between external and internal tissues, with secondary discrimination between the two species. These findings suggest that specific environmental and genetic filters associated with each species have shaped the bacterial communities, potentially reflecting deterministic assemblages of bacteria. We defined the core microbiota common to both Chondrostoma species for each tissue, highlighting the occurrence of microbe-host genome interactions at this critical level for studies of the functional consequences of hybridization. Further investigations will explore to what extend these specific tissue-associated microbiota signatures could be profoundly altered in hybrids, with functional consequences for post-mating reproductive isolation in relation to environmental constraints.

 

¤ 2017 Research Article: Challenges and advances for transcriptome assembly in non-model species
Ungaro Arnaud, Pech Nicolas, Martin Jean-François, McCairns R. J. Scott, Mévy Jean-Philippe, Chappaz Rémi, Gilles André.
http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0185020
doi: https://doi.org/10.1371/journal.pone.0185020

Analyses of high-throughput transcriptome sequences of non-model organisms are based on two main approaches: de novo assembly and genome-guided assembly using mapping to assign reads prior to assembly. Given the limits of mapping reads to a reference when it is highly divergent, as is frequently the case for non-model species, we evaluate whether using blastn would outperform mapping methods for read assignment in such situations (>15% divergence). We demonstrate its high performance by using simulated reads of lengths corresponding to those generated by the most common sequencing platforms, and over a realistic range of genetic divergence (0% to 30% divergence). Here we focus on gene identification and not on resolving the whole set of transcripts (i.e. the complete transcriptome). For simulated datasets, the transcriptome-guided assembly based on blastn recovers 94.8% of genes irrespective of read length at 0% divergence; however, assignment rate of reads is negatively correlated with both increasing divergence level and reducing read lengths. Nevertheless, we still observe 92.6% of recovered genes at 30% divergence irrespective of read length. This analysis also produces a categorization of genes relative to their assignment, and suggests guidelines for data processing prior to analyses of comparative transcriptomics and gene expression to minimize potential inferential bias associated with incorrect transcript assignment. We also compare the performances of de novo assembly alone vs in combination with a transcriptome-guided assembly based on blastn both via simulation and empirically, using data from a cyprinid fish species and from an oak species. For any simulated scenario, the transcriptome-guided assembly using blastn outperforms the de novo approach alone, including when the divergence level is beyond the reach of traditional mapping methods. Combining de novo assembly and a related reference transcriptome for read assignment also addresses the bias/error in contigs caused by the dependence on a related reference alone. Empirical data corroborate these findings when assembling transcriptomes from the two non-model organisms: Parachondrostoma toxostoma (fish) and Quercus pubescens (plant). For the fish species, out of the 31,944 genes known from D. rerio, the guided and de novo assemblies recover respectively 20,605 and 20,032 genes but the performance of the guided assembly approach is much higher for both the contiguity and completeness metrics. For the oak, out of the 29,971 genes known from Vitis vinifera, the transcriptome-guided and de novo assemblies display similar performance, but the new guided approach detects 16,326 genes where the de novo assembly only detects 9,385 genes.

 

¤ 2017 Poster: Challenges and solutions for transcriptome assembly in non-model organisms with an application to hybrids
UNGARO Arnaud, PECH Nicolas, MARTIN Jean-François, MCCAIRNS R.J. Scott, CHAPPAZ Rémi, GILLES André.

Transcriptome inference for non-model organisms is based on three main approaches with room for improvement: de novo assembly, genome-guided assembly, or direct read to genome mapping (DGM). He we test the potential and limits of the Direct Genome Mapping transcriptome inference and demonstrate its performance by using simulated reads of lengths corresponding to those generated by the most common sequencing platforms, and over a realistic range of genetic divergence. Our DGM pipeline recovers 94.8% of the genes irrespective of read length at 0% divergence; however, assignation rate of reads is negatively impacted both by increasing divergence level and reducing read lengths.
We also evaluate the performance of a combined pipeline (de novo + DGM inference) via simulation and empirically, using data from two hybridizing Cyprinid fish species. Our combined de novo + DGM pipeline outperforms de novo analysis alone at all levels of divergence with a reference species and whatever the read length.
Finally, we explore the assignation of F1 hybrids reads to their parental species, and discuss the implications of erroneous assignations on gene expression studies.

 

¤ 2016 Preprint: Challenges and solutions for transcriptome assembly in non-model organisms with an application to hybrid specimens
UNGARO Arnaud, PECH Nicolas, MARTIN Jean-François, MCCAIRNS R.J. Scott, CHAPPAZ Rémi, GILLES André.
http://biorxiv.org/content/early/2016/10/28/084145
doi: http://dx.doi.org/10.1101/084145

Analyses of high-throughput transcriptome sequences of non-model organisms are based on three main approaches: de novo assembly, genome-guided assembly, or direct read to genome mapping (DGM). We describe a flexible DGM pipeline, and demonstrate its performance by using simulated reads of lengths corresponding to those generated by the most common sequencing platforms, and over a realistic range of genetic divergence. We also evaluate the performance of a combined pipeline (de novo + DGM) via simulation and empirically, using data from two hybridizing Cyprinid fish species. Finally, we explore the assignation of F1 hybrids reads to their parental species, and discuss the implications of erroneous assignations on gene expression studies. Our DGM pipeline recovers 94.8% of the genes irrespective of read length at 0% divergence; however, assignation rate of reads is negatively impacted both by increasing divergence level and reducing read lengths. Likewise our combined de novo + DGM pipeline outperforms de novo analyses alone at all levels of divergence and the read length.

 

¤ 2016 Comunication: Etude des variations de l’expression génique induites par des perturbations environnementales dans le bassin Durancien: le modèle poisson
UNGARO Arnaud, GILLES André, PECH Nicolas, CHAPPAZ Rémi
Journée des Doctorants IMBE 2016, 30 juin 2016, Marseille, France

L’objectif de ma thèse est de comparer l’expression de gènes chez des individus de référence appartenant à trois espèces de « poissons » cyprinidae provenant d’une localité de référence (Ain) à des individus (appartenant à ces trois espèces) provenant de deux localités de la rivière Ardèche et six populations échantillonnées dans les canaux d’EDF ainsi que la rivière Durance le long du gradient amont-aval.
La variabilité de l’expression génique est analysée afin d’identifier et de quantifier l’impact des facteurs environnementaux responsables de cette variation. Nous avons choisi trois espèces représentatives de la Durance: le Chondrostoma nasus, dont le nom vernaculaire est le « hotu », le Parachondrostoma toxostoma, ou « toxostome » et le Squalius cephalus le « chevesne ».
L’échantillonnage (292 foies et caudales) s’est focalisé sur la période la plus « stressante » pour les poissons, c’est-à-dire celle allant de juin à septembre, caractérisée par une température élevée et une faible quantité d’eau.
La méthodologie employée utilise des séquençages de type Illumina ainsi qu’un traitement des données réalisé à l’aide d’un pipeline développé spécifiquement pour cette étude qui nous a permis d’analyser pour le moment 375 millions de séquences. Nous avons réalisé trois assemblages qui nous ont permis d’identifier 20 000 gènes pour chaque espèce étudiée.
Notre étude pilote, portant sur le chevesne, montre que les variations d’expression des gènes sont majoritairement du à un effet tissus (5 897 gènes), puis station (800 gènes) et enfin taille de l’individu (19 gènes). Cet effet station permet d’identifier les gènes qui peuvent être impliqué dans la réponse à différents stress.
Il est ainsi possible d’identifier des variations fines de l’expression d’un très grand nombre de gènes, en réponse à de multiples stress potentiels, ouvrant ainsi la voie à un « screening » à large échelle.

 

¤ 2016 Colloque: Hybridation introgressive entre 2 espèces de barbeaux françaises : de la génétique à la génomique
GILLES André, GETTOVÁ Lenka, OLIVARI Georges, VETEŠNÍKOVÁ ŠIMKOVÁ Andrea, UNGARO Arnaud, Chappaz Rémi
Colloque Pisci-culture: 6ème édition, 27 avril 2016, Marseille, France

 

¤ 2015 Conférence: How can we better understand host-parasite interactions?
GETTOVÁ Lenka, GILLES André, UNGARO Arnaud & VETEŠNÍKOVÁ ŠIMKOVÁ Andrea
4th Workshop of European Centre of Ichtyoparasitology, 13 et 15 novembre 2015, Vodňany, République tchèque
ISBN 978-80-210-8016-4

Host-parasite interactions are formed in time as a result of the complex co-evolutionary processes between the two interacting species, i.e. host and its parasite. Defense mechanisms which are involved in host-parasite interactions are genetically encoded in the genomes of the both host and parasite. Therefore, the recent growth of interest in studying the genome-for-genome interactions has become critical to understand the host-parasite interactions at the molecular level. As a result, there has been recently a boom in the genome and transcriptome characterization of the both parasite and host species which may help us in better understanding of gene’s structure and function as well as their possible role in host-parasite interactions. In our study, we firstly aimed to study de novo the transcriptome (a set of genes transcribed in a given tissue under specific conditions) of the two non-model fish species – Barbus barbus and Barbus meridionalis. Together, four B. barbus and B. meridionalis individuals were collected on the Pertuis and Céze Rivers (southern France). The mRNA was obtained from the different tissues of each individual (i.e. brain, fin, liver, spleen, intestine and gills) to compare tissue-specific expression patterns. Subsequently, cDNA libraries were prepared for both Illumina MiSeq a HiSeq platforms. So far, high data quality sequences were obtained from Illumina MiSeq platform (Figure 1). Using the knowledge of the transcriptome structure in the Barbus fishes will help us to select different genes that play potentially an important role in the defensive mechanisms of the host immune system. Moreover, comparison of the expression level of these genes in link with the different level of parasite infection is planned for the near future. However, this will be only one piece of puzzle to better understand the host-parasite interactions since there is a need to explore the genetic mechanisms for parasite strategy to infect and survive in its host.

 

¤ 2015 Poster: Étude de la compatibilité génomique entre deux espèces de cyprinidés et son implication dans la réorganisation du transcriptome chez les hybrides.
PETIT Florence, UNGARO Arnaud, MARTIN Jean-François, ARDISSON Morgane, BARASCUD Bernard, CHAPPAZ Rémi, PECH Nicolas & GILLES André
VIe Rencontres de l’Ichtyologie en France, 24 -27 mars 2015, Paris, France.

L’hybridation introgressive est un phénomène qui reste encore sous-estimé en évolution. En effet, son rôle apparaît de plus en plus important dans la compréhension des mécanismes de spéciation ou bien dans la mise en place de la biodiversité. L’hybridation est un mécanisme qui permet une augmentation rapide de la diversité génétique et peut alors entraîner un potentiel adaptatif nouveau, grâce à un transfert (uni ou bidirectionnel) du matériel génétique entre deux espèces, correspondant au phénomène d’introgression génomique. Dans ce contexte, notre étude porte sur l’hybridation de deux espèces de poissons cyprinidés connues pour s’hybrider en milieu naturel, Parachondrostoma toxostoma (le toxostome) et Telestes souffia (le blageon). Nous avons réalisé une analyse morphométrique des deux espèces parentes ainsi que des hybrides F1, F2 et back-cross obtenus en laboratoire. L’analyse morphométrique montre que les hybrides ne présentent pas une forme intermédiaire entre les espèces parentales mais qu’au contraire, ils acquièrent leur propre morphologie, en dehors des profils parentaux, ce qui laisse entrevoir les possibilités adaptatives offertes par l’hybridation. En complément de cette approche, nous avons recherché et étudié le devenir des zones de compatibilité génomique ainsi que les zones chromosomiques d’incompatibilité où l’expression des gènes est en faveur d’une des deux espèces parentales. Pour cela, nous avons pris en compte l’ensemble du transcriptome en utilisant les nouvelles technologies de séquençage NGS MiSeq et HiSeq, après extraction d’ARN total. Sachant que les deux espèces étudiées font l’objet de mesures de conservation, nous avons souhaité tout d’abord savoir s’il était possible de réaliser notre étude à partir de fragments de nageoire caudale (méthode non-invasive) pour éviter de sacrifier les individus. Nous avons, dans un premier temps, mis au point un pipeline computationnel nous permettant l’analyse de transcriptomes d’espèces non-modèles. Dans un deuxième temps, nous avons calibré notre méthodologie sur le Danio rerio, espèce modèle appartenant à la famille des cyprinidés. Nous avons effectué une comparaison des résultats de transcriptome obtenus entre un mélange de tissus et la nageoire caudale, qui montre que ce tissu est un marqueur tout à fait pertinent pour la suite de l’étude. Dans un troisiè- me temps, l’analyse des hybrides P. toxostoma x T. souffia montre qu’il existe des zones chromosomiques d’incompatibilité entre les deux espèces, où l’expression des gènes est en faveur de l’une des deux espèces. L’étude détaillée de ces zones aura pour but d’identifier des gènes de spéciation et leur rôle fonctionnel.

Abstract_Poster_RIF_2015
 

¤ 2013 Rapport Master: Mise en place d’un pipe-line d’analyse de données pour les transcriptomes hybrides. Application aux hybrides Danio rerio X Danio roseus.
UNGARO Arnaud & GILLES André
Master Recherche, Bio-informatique, Biochimie-Structurale et Génomique (BBSG)

L’hybridation est un phénomène qui reste très souvent sous-estimé dans les études portant sur l’histoire évolutive d’une lignée ainsi que sur la naissance d’une espèce. Pourtant, les premières synthèses montrent clairement le rôle moteur de ce processus évolutif, qui conduit à la mise en place de nombreuses lignées végétales et animales actuelles. C’est un mécanisme qui permet une augmentation rapide de la diversité génétique (donc un potentiel adaptatif nouveau) grâce à un transfert horizontal (uni ou bidirectionnel) du matériel génétique entre deux espèces. L’étude génétique de l’hybridation nécessitera un ensemble d’outils « spécifiques », et surtout, dans bien des cas, adaptés aux organismes non modèles. En effet, une minorité d’espèces sont considérées comme modèles et possèdent leurs propres outils, limitant de ce fait des pipe-lines généralisables à l’ensemble des espèces et des processus évolutifs telle que l’hybridation. C’est pourquoi nous avons, au cours de cette étude, mis en place une suite logicielle (ou pipe-line) dédiée à l’analyse transcriptomique ainsi qu’à l’étude de l’expression des transcrits chez les hybrides d’espèces non-modèles. Nous avons pratiqué diverses simulations d’hybridations in silico avec plusieurs espèces de vertébrés, arthropodes et plantes afin de valider notre approche méthodologique. Pour des données « in vivo », notre outil bioinformatique a besoin comme unique pré-requis d’un transcriptome suffisamment proche de l’espèce étudiée. Nous avons choisi d’utiliser comme technologie NGS (nouvelles technologies de séquençage) le MiSeq d’Illumina © permettant d’obtenir des séquences d’environ 250 paires de bases. Ainsi, à l’aide d’un seul séquençage, nous avons pu assembler et annoter le transcriptome du Danio roseus et celui de notre propre souche de Danio rerio . Les deux transcriptomes ont été utilisés par notre suite logicielle montrant qu’il est possible d’exploiter plus de la moitié des gènes des deux espèces comme marqueurs génomiques afin de comprendre les variations de transcriptome issues de l’hybridation. Finalement, cette finesse de détection de transcriptomes hybrides nous ouvre la voie sur un large spectre d’études futures comme l’écogénomique en milieu naturel.