Décideurs it

L’INRAE s’initie au cloud public avec une migration

Par Bertrand Lemaire | Le | Cas d’usage

En séparant un portail d’accès aux données de recherche de son SI interne, l’INRAE a découvert le cloud public chez Scaleway avec l’appui de l’ESN FGtech (Les Filles et Les Garçons de la Tech).

Hervé Toureille est responsable informatique à l’INRAE, en charge du projet. - © INRAE
Hervé Toureille est responsable informatique à l’INRAE, en charge du projet. - © INRAE

Etablissement public à caractère scientifique et technologique, l’INRAE (Institut national de recherche pour l’agriculture, l’alimentation et l’environnement) est né le 1er janvier 2020 par la fusion de l’Institut national de la recherche agronomique (INRA) avec l’Institut national de recherche en sciences et technologies pour l’environnement et l’agriculture (IRSTEA). Il comporte 14 départements de recherche et 18 centres de recherche engagés dans 33 campus universitaires. En tout, il regroupe 22 unités de services, 202 unités de recherche, 8229 agents titulaires (dont 2005 chercheurs, 3179 ingénieurs et assistants ingénieurs et 3045 techniciens) et 2798 agents contractuels. La fusion de 2020 s’est accompagnée, évidemment, d’une fusion des deux DSI.  L’IT y est fortement marquée par l’activité de recherche et le développement du portail d’accès aux données de recherche Recherche.data.gouv.fr a été l’occasion d’une initiation aux clouds publics souverains pour l’établissement public.

La DSI de l’INRAE est unique mais ses effectifs sont répartis sur l’ensemble du territoire national. . Chaque site dispose d’un service informatique d’appui régional et chaque unité peut, en plus, se doter d’informaticiens. Des services partagés, opérés au niveau national, existent tout de même. Ils sont principalement hébergés dans deux datacenters : le premier est situé à Toulouse et l’autre en Île de France. La DSI met également en œuvre des plates-formes qui permettent d’accueillir les applications développées par les équipes de recherche et d’appui. Pour cela, elle propose un service d’hébergement de serveurs virtuels sous VMware et un service cloud OpenStack interne. Jusqu’en 2023, la DSI de l’établissement public de recherche ne recourait pas aux services des clouds publics.

L’INRAE est né le 1er janvier 2020 par la fusion de l’INRA et de l’IRSTEA. - © INRAE
L’INRAE est né le 1er janvier 2020 par la fusion de l’INRA et de l’IRSTEA. - © INRAE

Une migration vers un cloud public souverain

Le Ministère de l’Enseignement Supérieur et de la Recherche (MESR) a confié à la direction pour la science ouverte de l’INRAE et à ses partenaires (le CNRS, l’Université Grenoble Alpes, l’Université de Lille, l’Université de Strasbourg, l’Université de Lorraine, l’Université Paris-Cité et l’Université Paris-Nanterre) la mise en place d’un portail d’accès aux données de recherche françaises. Parmi les composants de ce service figure le portail d’entrée, de présentation et de communication, recherche.data.gouv.fr. Celui-ci a été mis en œuvre, dans un premier temps, sur les infrastructures propres de l’INRAE. Afin de garantir une haute disponibilité et de bénéficier d’une meilleure flexibilité, un projet de migration du portail vers le cloud public a été initié fin 2022.

L’INRAE et ses partenaires ont souhaité un accompagnement pour ce projet « move to cloud ». Sur la base d’un cahier des charges, un appel à candidature a été lancé fin 2022. Après analyses des propositions commerciales et de la rencontre des candidats, c’est l’ESN FGTech (Les Filles et Les Garçons de la Tech) qui a été retenue.  « Nous ne regrettons pas notre choix, nous sommes pleinement satisfaits de l’accompagnement des Filles et des Garçons de la Tech. Nous avons particulièrement apprécié l’expertise et les qualités humaines des intervenants » Hervé Toureille, responsable informatique à l’INRAE en charge du projet. Début 2023, le cloud provider souverain Scaleway (groupe Iliad) a été choisi. La mise en production a été réalisée fin mai 2023. Hervé Toureille explique : « il s’agissait bien de faire d’une pierre deux coups : migrer le service vers des infrastructures résilientes et hautement disponibles, et apprendre à opérer les services proposés par des clouds publics ». Pour ce portail, l’INRAE utilise des clusters Kubernetes et des bases de données qui font partie du catalogue de services cloud de Scaleway. A terme, un service spécifique doit être créé pour porter le projet en le reliant au projet européen homologue

Un projet de référence

La DSI de l’INRAE souhaite accélérer sa transformation DevSecOps et donc accroître sa maîtrise des environnements cloud, privés internes ou publics souverains. « Bien entendu, il ne s’agit pas de se contenter de basculer l’hébergement dans le cloud mais aussi de maîtriser les spécificités liées à l’exploitation de ces plateformes, notamment sur des sujets tels que la cybersécurité, l’automatisation des déploiements, le maintien en conditions opérationnelles et la mise en place de PCA/PRA » note Hervé Toureille. 

Les services d’infrastructures et d’exploitation déployés pour l’hébergement du portail recherche.data.gouv.fr feront office de référence dans le cadre de futures projets « move to cloud » avec une approche DevSecOps. Mais le projet recherche.data.gouv.fr est loin d’être terminé. En effet, l’INRAE et ses partenaires vont entreprendre la migration de l’entrepôt de données. Ce service, basé sur le logiciel Dataverse, n’est pour le moment pas conteneurisé, mais l’étude d’une nouvelle architecture est d’ores et déjà en cours. Le service cible sera opéré sur des plateformes IaaS communautaires mutualisées, proposées par des acteurs de l’enseignement supérieur et de la recherche.