La KIM s’appuie sur un pôle composé d’une spécialiste de la gestion et du stockage de données, Christelle Pierkot et d’une bio-informaticienne, Sonia Tieo. Un état des lieux de la gestion et du traitement des données du vivant et de l’environnement dans la communauté MUSE a pu ainsi être réalisé par le pôle.

Afin de créer ou renforcer les liens entre les plateformes d’analyse de données et la communauté scientifique, la KIM a organisé, en janvier 2020, une journée de présentation des différentes plateformes et mis en ligne des fiches descriptives de ces plateformes ; ces fiches comportent une description de la plateforme, les services et outils proposés, les équipements associés s’ils existent, les formations mises en place, les droits d’utilisation et les contacts :

ATGC Plateforme de bio-informatique orientée vers la génomique comparative, évolutive et fonctionnelle
Bio2M Plateforme de bio-informatique et biomarqueurs orientée dans la vers le traitement rapide des données NGS
IMGT Plateforme de bio-informatique spécialisée dans les domaines de l’immunogénétique et l’immunoinformatique
MBB Plateforme de bio-informatique pour les domaines de l’évolution et de l’écologie
MGX Plateforme de bio-informatique spécialisée dans l’offre des technologies de pointe de la génomique
PPM Plateforme technologique spécialisée dans l’analyse protéomique
SouthGreen Plateforme bio-informatique pour l’analyse des ressources génomiques appliquée aux plantes méditerranéennes et tropicales
StatABio Plateforme de bio-statistiques offrant des services en traitement statistique des données biologiques

La KIM a créé le Réseau des bio-statisticiens de Montpellier (Montpellier Bio-Stats, MBS) qui regroupe actuellement 166 membres affiliés à divers laboratoires et unités de Montpellier, représentant de nombreuses institutions : CHU, CIRAD, CNRS, IRD, Inserm, Inrae, Université de Montpellier.

Le profil des membres est varié : bio-statisticiens, bio-informaticiens, biologistes, informaticiens, statisticiens. Les domaines d’activités et de compétences des membres du réseaux sont très larges : données de séquençage, données de santé / essais cliniques, observations terrain / comptages, images, données spatio-temporelles, spectrales, audios, climatiques, météorologiques, biométriques.

L’objectif du réseau est de fédérer et mettre en relation les acteurs scientifiques ayant des expertises ou besoins complémentaires pour partager leurs compétences et possiblement nouer des collaborations.

Le réseau propose une animation scientifique autour des méthodes de machine learning appliquées à la biologie : 2 workshops sur les Random Forests et le Deep Learning ont été organisés en 2019.

En 2019, plusieurs sessions de formation d’une journée R pour les débutants tenues par des formateurs du réseau ont été organisées. Elles ont permis à 130 participants au total d’apprendre les bases d’un logiciel incontournable de traitement de données.

 Pourquoi faire une formation R ?

Dans le cadre du réseau MBS, après avoir sondé la communauté des sciences du vivant et de l’environnement, un grand besoin est ressorti: découvrir R ou améliorer ses compétences pour ce langage.

Ce langage de programmation clé pour la Data Science offre de multiples fonctionnalités comme la collecte, la manipulation, la transformation, l’analyse statistique, la modélisation, la visualisation et la communiquer autour de la donnée.

Grâce aux présentations faites dans le cadre du réseau MBS, les novices pourront apprendre R et les autres pourront bénéficier de la présentation des quelques outils qui font la puissance de R.

Formation R débutant 2020

24 septembre 2020

R-Débutant anglais : Benjamin Viart , IGH-CNRS

Formations R avancé 2020

29 septembre – matin

R-Markdown : Jean-Michel Marin, IMAG-Université de Montpellier

29 septembre –  après-midi

R Shiny : Ghislain Durif, IMAG-CNRS

8 octobre – matin

R-Mardown : David Kaplan, MARBEC-IRD

8 octobre – après-midi

R-SIG : David Kaplan, MARBEC-IRD

9 octobre – matin

R ggplot : Thibault Nidelet, SPO-INRAE

13 octobre – après-midi

R Shiny : Ghislain Durif, IMAG-CNRS

15 octobre – après-midi

R ggplot : Sandra Cortijo, BPMP-CNRS

Les formations auront lieu en présentiel sur le campus Triolet de l’université de Montpellier à l’IMAG (salle 109).

La KIM Biomarkers & Therapy considère que les biomarqueurs sont essentiels non seulement pour confirmer les diagnostics, mais aussi pour définir les sous-types de pathologie et établir des liens avec la réponse au traitement. Une bonne exploitation de ces données est impérative. Le développement de nouveaux outils bioinformatiques et mathématiques est donc indispensable, la KIM Data & Life Sciences peut ainsi venir en appui de la création d’un outil d’extraction automatisée de données patients à partir de bases de données distribuées entre les différents systèmes informatiques des établissements de santé (CHU de Montpellier, CHU de Nîmes et Institut du Cancer de Montpellier).
Des réunions mensuelles pour les Ingénieurs de Recherche et d’Etude dans les domaines du traitement et du stockage des données, seront consacrées aux méthodologies et algorithmes.