Bioinformatique

La plateforme d'analyse bioinformatique ARTbio fournit support et environnement pour l’analyse des grands volumes de données. Nous accompagnons principalement tout type d’analyse de séquençage à haut-débit. Nous sommes également ouverts aux projets de statistique, modélisation et d’analyse d’image. L’équipe offre ses services à travers des collaborations scientifiques. Si des besoins dépassent nos domaines d’expertise, nous orienterons les chercheurs vers les plateformes ou équipes de bioinformatiques compétentes.

Nous sommes orientés “services web”, et adhérons au manifeste de développement Agile ainsi qu’au concept de livraison continue, qui impliquent de courts cycles de question/résolution et une interaction directe avec les chercheurs. En utilisant des serveurs web Galaxy, nous fournissons un accès direct aux outils bioinformatiques et aidons nos utilisateurs à mettre en place, rationaliser et exécuter des chaines d’analyses. Nous offrons des solutions pour enregistrer les analyses dans leurs moindre détails, en vue de leur partage ou publication. Nous offrons aussi des environnements en ligne pour la statistique (Rstudio) et la programmation (iPython).

La plateforme s’implique dans le développement d’outils bioinformatiques pour la biologie des petits ARN, l’assemblage de novo des transcrits et la métagénomique, ainsi que dans l’intégration d’outils dans Galaxy. Nous assurons des enseignements de bioinformatique et d’utilisation de Galaxy, à travers des sessions de formation et le développement de bases de données de connaissances et de savoir-faire.

Prestations

1. Des serveurs Galaxy maintenus en l'état de l'art. Nous garantissons une mise à jour régulière de la configuration de nos serveurs Galaxy, qui évolue continuellement grâce aux efforts de la communauté des développeurs Galaxy. Selon le même principe, nous suivons de près les progrès méthodologiques qui s'opèrent dans les domaines de l'intégration continue, les tests et déploiements automatiques, ou la virtualisation des environnements informatiques. Les utilisateurs ayant les compétences pour conduire des analyses de façon autonomes dans Galaxy bénéficient directement de notre serveur public Mississippi (https://mississippi.snv.jussieu.fr). Un autre serveur (https://lbcd41.snv.jussieu.fr) est également à disposition des personnels de l'IBPS ou des chercheurs disposant des droits d'accès appropriés.
2. Accompagnement de projets d'analyse. Nous accompagnons les projets d'analyse NGS à travers l'utilisation de l'interface Galaxy. Nous avons l'expérience de ce type d'accompagnement et saurons en outre apporter une expertise plus pointue dans les domaines de:
- Biologie des ARN et petits ARN.- Epigénétique- Détection ou caractérisation de Virus- Analyse de variations génomiques (indels, snp)- Métagénomique
3. Développement d'outils. Nous développons ou adaptons des outils bioinformatiques pour une utilisation facilitée dans Galaxy.
4. Formation. Les analyses sont mieux réalisées par des utilisateurs bien formés. Nous participons aux efforts de formation à l'utilisation de Galaxy. Nous travaillons également à l'améliorations des tutoriaux pour une utilisation optimale des outils bioinformatiques.
5. Vers une infrastructure informatique délocalisée. Nous avons fait le choix d'une infrastructure informatique légère pour la plateforme, de façon à pouvoir concentrer nos moyens sur le développement d'outil et sur les projets d'analyse des utilisateurs. Cela implique de délocaliser notre infrastructure sur les environnements "cloud" académiques, ce que nous avons entrepris avec l'aide de l'Institut Français de Bioinformatique.

Développement technologiques

Accompagnement de projets: Nous avons déjà fourni un support avancé dans beaucoup d’analyses NGS, y compris pour des études visant à comprendre les fonctions épigénétiques des piRNA (1), l’interférence par l’ARN antivirale (2) ou les roles des miRNA dans la différenciation des cellules souches (3).

Outils: Nous avons développé et rendu publique la suite d’outils mississippi pour analyse des sequences de petits ARN (4). Nous finalisons actuellement une série de pipelines informatiques pour la détection ou l’identification de nouveaux virus à partir des séquences de petits ARN (5). Un autre exemple est notre outil DockerToolFactory qui permet à tout utilisateur d’exécuter ses propres codes R, python, perl ou bash, sans quitter l’environnement Galaxy (6).

Developpement de méthodologies: Nous intégrons les progrès des nouvelles methodes d’intégration continue (utilisant les outils comme bioblend (7), Planemo (8) et nos propres développements dans les serveurs Jenkins CI (9)), de tests et déploiments automatiques et de virtualisation d’environnements (e.g. Docker (10))

1. Nature. 490, 112–115 (2012).

2. Nucleic Acids Res. (2015), doi:10.1093/nar/gkv590.

3. RNA. 18, 253–264 (2012).

4. https://testtoolshed.g2.bx.psu.edu/view/mvdbeek/mississippi_toolsuite/

5. https://toolshed.g2.bx.psu.edu/view/drosofff/suite_visitor2/

6. https://bitbucket.org/mvdbeek/dockertoolfactory

7. Bioinformatics. 29, 1685–1686 (2013).

8. https://github.com/galaxyproject/planemo

9. https://jenkins-ci.org/

10. https://www.docker.com/whatisdocker/