Analyse des données à haut débit en génomique

Notre équipe s’intéresse à l’analyse des données produites par les expériences à haut débit dans le domaine de la génomique fonctionnelle, évolutive et environnementale.

Nous travaillons actuellement sur l’assemblage de transcriptome à l’aide de données de RNA-Seq afin de créer des jeux de données génomiques de confiance chez les organismes eucaryotes non modèles. Nos objectifs sont de développer des méthodologies et des outils bioinformatiques pour aider les biologistes à réaliser l’analyse de leurs données même quand le génome de référence de leur espèce de travail n’est pas disponible.

En savoir plus...

Notre équipe « Analyse des données à haut débit en génomique » a été créée en septembre 2011. Elle a d’abord été membre du département des plateformes et du développement technologique de l’Institut de Biologie Paris Seine (IBPS) en tant qu’équipe associée ; puis a rejoins l’unité Évolution en août 2015.

Les nouvelles générations de séquenceurs à haut débit ont diffusé à travers la communauté scientifique une quantité de données en augmentation exponentielle. Dans ce contexte, le goulot d’étranglement majeur vient de l’analyse des données. Les efforts en bioinformatique pour répondre à ces besoins sont importants et visible à travers le grand nombre de logiciels disponibles. Cependant l’analyse des données nécessite des infrastructures informatiques importantes associées avec des coûts humains et de maintenance élevés.

Résultats importants

Nous avons développés plusieurs outils en collaboration avec la plateforme génomique de l’IBENS, afin d’automatiser le traitement primaire des données et d’accompagner l’utilisateur le plus loin possible dans des analyses plus élaborées. Par exemple, l’analyse distribuée des données que nous avons mis en place sur des infrastructures de « cloud computing » (Eoulsan - Jourdren et al. 2012) est l’une des premières en France appliquée à la génomique. Nous avons donc tiré avantage de cette proche collaboration pour construire les nouvelles fonctionnalités dont nous avons besoin dans la chaine d’analyse d’Eoulsan.

Projets

À l’heure actuelle, nous concentrons notre recherche sur l’assemblage de novo des données de RNA-Seq pour construire des transcriptomes fonctionnels dans différentes conditions expérimentales. Nous collaborons notamment avec la station marine de l’UPMC à Roscoff sur l’étude des transcriptomes de lignées de dinoflagellés non modèles. Nous comparons ainsi les transcrits des organismes à l’état libre avec ceux d’organismes symbiotiques avec des lignées de rhizaria non modèles. La combinaison des méthodes d’assemblage de RNA-Seq de novo, avec les techniques d’annotations des transcrits et les approches venant de la théorie des graphes, nous aide à mieux comprendre les relations entre les hôtes et les symbiontes. Nous avons implémentés nos outils dans un pipeline Python qui a été utilisé pour étudier le transcriptome d’autres organismes eucaryotes non modèles (comme par exemple les lignées d’Ostreoccocus) en collaboration avec une équipe de recherche à l’Institut Jacques Monod.

Nos outils et méthodologies sont développés spécifiquement pour aider à l’étude des eucaryotes non modèles, qui est actuellement limitée, malgré l’intérêt potentiel considérable de ces organismes d’un point de vue évolutif et écologique.

Collaborations

  • Plateforme génomique, Institut de Biologie de l’École normale supérieure (IBENS), Paris, France
  • Unité de Biologie Computationnelle, IBPS, UPMC, Paris, France
  • Plateforme ABIMS, Station marine de l’UPMC, Roscoff, France
  • Groupe Plancton UMR 7144 - CNRS et UPMC Station Biologique de Roscoff - SBR, France
  • Mitochondrie, Métaux et Stress Oxydatif, Institut Jacques Monod (IJM), CNRS UMR 7592, Université Paris Diderot/CNRS, Paris, France
  • Laboratoire d'Océanographie de Villefranche-sur-Mer (LOV), Villefranche, Station marine UPMC, Villefranche, France
  • Section Écologie et Biologie Évolutive, Institut de Biologie de l'École normale supérieure (IBENS) IBENS, Paris, France