Dans un contexte où la science nécessite de plus en plus de travailler avec des données, l’Université de Montpellier, grâce au soutien financier de la Région et de la Métropole, met à disposition de la communauté scientifique un espace de stockage mutualisé. Plus performant, plus sécurisé et plus écologique, il participe d’une dynamique régionale à laquelle l’Inserm s’associe. Explications avec Anne Laurent, vice-présidente déléguée à la science ouverte et aux données de la recherche.

L’Inserm et l’Université de Montpellier viennent de signer une convention de coopération portant sur la mise en place d’un environnement mutualisé de gestion des données. Pourquoi est-ce important ?
C’est important parce que pour faire de la science et pour produire des résultats scientifiques, les ingénieurs, les chercheurs, les enseignants-chercheurs, les doctorants et doctorantes s’appuient de plus en plus sur de la donnée. C’est un matériau que l’on stocke, que l’on manipule, que l’on exploite, que l’on enrichit ; or tout ceci nécessite d’énormes espaces de stockage et de traitement qu’il devient indispensable de mutualiser. Ce sont ces espaces que nous mettons en place pour nos communautés scientifiques avec Meso@LR.

Qu’est-ce que c’est Meso@LR ?
C’est une sorte de gigantesque ordinateur séparé en deux parties : le calcul intensif et le stockage. Côté calcul, on trouve d’énormes processeurs. Côté stockage, Meso peut être comparé à un super disque dur ou plutôt deux supers disques durs placés dans deux salles différentes pour doubler la sécurité. C’est ce super disque dur qui, progressivement, est en train d’être mis à disposition de la communauté scientifique pour travailler. Cette convention est un peu le signal de lancement de cette construction collective à laquelle tous et toutes sont invités à se joindre.

Et ces gros disques durs, ils ont quelle capacité de stockage ?
L’infrastructure de données Meso@LR permet de stocker 15 pétaoctets, c’est énorme ! 15 pétaoctets, cela correspond à 15 millions de milliards d’octets. C’est l’équivalent d’environ un million de clés USB !

Cette plateforme sera ouverte à tous les partenaires de Muse ?
C’est plus large que cela. C’est une brique d’une construction qui est régionale. Meso@LR est une structure gérée par l’Université de Montpellier mais qui a vocation à couvrir tous les besoins informatiques de la recherche sur l’Occitanie Est. Elle est co-financée par la Région et la Métropole, l’UM de son côté assume depuis le début l’hébergement, les moyens humains, l’électricité etc.

La convention avec l’Inserm est donc la première d’une série ?
Oui, l’INSERM est le premier organisme à signer mais nous travaillons effectivement avec d’autres partenaires. Et cette coopération est renforcée par le rôle de premier ordre joué par l’Inserm dans la construction de l’Institut de Science des Données de Montpellier (ISDM).

Et que prévoit-elle exactement ?
L’Inserm dispose désormais sur Meso@LR d’une tranche de stockage de  2 pétaoctets dans laquelle ils vont pouvoir construire leur offre et leurs services vers les communautés scientifiques associées à l’Inserm. Ils en ont les clés et ils l’administrent grâce aux compétences de leurs équipes informatiques.

L’UM n’a pas accès à leur espace de stockage. Ce n’est pas du partage de données ?
Non, l’Inserm définit sa politique de partage des données et ces données sont et restent la propriété de l’établissement porteur.  Il existe d’autres infrastructures pour le partage et l’ouverture des données dans le contexte national.

Et qu’ont-ils à y gagner ?
En mutualisant ces infrastructures dans des environnements très sécurisés, nous permettons aux équipes d’informaticiens de travailler plus sereinement, en réduisant les craintes de problèmes, de climatisation par exemple, en permettant l’acquisition d’équipements de tout premier plan, en partagent leurs expériences et leurs compétences. Nous pouvons ainsi développer des projets encore plus ambitieux.

Et pour les utilisateurs ?
Des services à valeur ajoutée, des environnements de manipulation de la donnée plus aisés, plus performants.  C’est un changement de paradigme, c’est comme ne plus avoir ses outils chez soi mais en avoir de meilleurs, il y a tout à y gagner. De plus les projets scientifiques réunissent des unités mixtes, Meso vise à proposer une réponse harmonisée à des questions que se posent tous les chercheurs.

Quel type de services pourra être proposé ?
Pour citer un exemple, l’offre cloud qui est en train d’être construite permettra de proposer des « machines virtuelles ». Au lieu de devoir installer les équipements, les logiciels d’accès ou d’exploitation des données sur chacun de nos ordinateurs, ils seront mutualisés dans cet espace. En plus cela fait gagner en performance et en sécurité.

D’ailleurs qui gère techniquement Meso ?
C’est une équipe d’ingénieurs top niveau, j’insiste parce que c’est vraiment impressionnant, notre modèle est très regardé. Là aussi c’est un travail collectif et mutualisé, chaque partenaire a accepté de mettre à disposition des ingénieurs, à 20 ou 30% de leur temps, parfois plus. Sur ces sujets-là, plus personne ne peut faire seul, il faut vraiment travailler collectivement, sans cela on ne pourrait pas avancer.

Et sur le plan écologique il y a un intérêt à mutualiser ?
On sait aujourd’hui que placer ces environnements dans des bâtiments dédiés, à très haute performance énergétique, permet de faire baisser l’impact. Mais ce gain va également dépendre de l’utilisation que nous allons en faire à l’échelle individuelle et collective. Moi la première, j’ai rempli mon disque dur parce que j’avais la place, c’est comme les placards ! Nous devons apprendre à tuer, à supprimer nos données quand elles n’ont pas d’utilité. En cela, le travail mené pour l’accompagnement est primordial, un projet associant plusieurs directions est d’ailleurs mené à l’UM sur cette question.

Justement en créant un nouvel espace de stockage alors que les laboratoires disposent déjà de leurs propres solutions, n’y a-t-il pas un risque de doubler le stockage ?
L’idée c’est qu’au fur et à mesure, on puisse débrancher les solutions locales qui coûtent de l’énergie en temps humain et en électricité, sauf quand il y en a besoin et parfois il y en a besoin. C’est aussi pour cela que nous l’indiquons dans la convention.

Un coût de 300 000 euros. A quoi correspond-il ?
C’est le coût complet : électricité, moyens humains, hébergements du stockage correspondant à cette tranche de l’Inserm sur 5 ans. L’Inserm apporte de son côté également des moyens humains et des compétences, ce qui est très précieux pour offrir un service de qualité.

Il y a des liens entre Meso@LR et l’Institut de la science des données ?
Oui, nous sommes convaincus que la science des données et les données de la science vont être au cœur de la science. Et cela pose de grands défis pour rendre ces données faciles à trouver, accessibles, interopérables et réutilisables (FAIR). Pour gérer et exploiter ces données, il faut des compétences, il faut de l’accompagnement…C’est une des missions de l’ISDM. Ces questions sont aussi pour certaines encore des sujets de recherche sur lesquels les laboratoires du site de Montpellier sont très actifs et reconnus.

Et comment avoir accès à ces services d’accompagnement ?
Le groupe interdirection pour la science ouverte de l’UM est fait pour cela, associé à l’ISDM, à Méso@LR et à tous les partenaires de Muse. Cet accompagnement est accessible au travers du catalogue de services dans l’ENT. Nous travaillons actuellement ensemble pour en renforcer la visibilité et les services.

L’ouverture des données est un objectif ?
On dit parfois : « la donnée : aussi ouverte que possible, aussi fermée que nécessaire. » Encore une fois, il faut laisser le temps aux chercheurs de les exploiter et de les valoriser et Meso est justement conçu pour la science en train de se « FAIR » si j’ose dire. Ce n’est ni un entrepôt, ni un portail de données. Pour autant la gouvernance des données est une réflexion qu’il faut mener pour construire collectivement des environnements qui eux, auront vocation à aller jusqu’au partage et à l’ouverture. Nous voulons faire de Montpellier un endroit où on produit de la donnée scientifique mais aussi où on l’exploite voire, quand cela est possible, où on la partage comme un bien commun.